チベット語をデジタル世界の一級市民にするための技術革新
- BDRCは、チベット語をデジタル世界で一級市民にするための技術革新を推進している。最近、LibreOfficeがチベット語の重要な特徴である非常に長い段落をサポートするようになったことは、大きな成果だ。
- チベット人は、8世紀に仏教が導入されて以来、執筆、革新、技術に多くのエネルギーを注いできた。チベット文字は、仏教経典をサンスクリット語と中国語からチベット語へ翻訳するために発明された。
- 14世紀には木版印刷技術を採用し、チベット語に翻訳された経典や、ヒマラヤの著者たちが自ら書いた仏教テキストを大量生産した。
- 近年では、チベット語コンピュータフォントの開発が、デジタル世界におけるチベット語の進化において大きな飛躍となった。特に、チベット語が、世界の文字体系向けコンピュータフォントコードを標準化したUnicode標準に含まれたことは注目に値する。
- しかしチベット語には、いまだにすべてのツールやアプリケーションでサポートされていない重要な特徴がある。そのひとつが、非常に長い段落だ。チベット語テキストにはヨーロッパ言語のような段落の概念がなく、長い連続テキストとして扱う必要がある。
- 一般的なワードプロセッサソフトウェアは英語テキストを念頭に設計されており、比較的短い段落を前提としている。しかしチベット語では段落がほぼ無限に続き、空白もほとんどないため、この種のソフトウェアはチベット語テキストを開くときに性能が大きく低下する。
- LibreOfficeは無料で提供される成熟した安定版オープンソースワードプロセッサのひとつであり、チベット研究とチベットのコミュニティにとって重要だ。商用ソフトウェアは高価で、アジアの多くの地域では海賊版が使われている。
- 2015年にBDRCのCTOであるElie RouxがLibreOfficeにこの問題を報告したが、コードへの介入は大規模なプロジェクトだった。しかし最近、開発者Jonathan Clarkがこの問題を解決した。LongchenpaのYishindzöのような長大なテキストも、いまでは高速に開いて編集できるようになった。
- BDRCはこの革新に小さく貢献しており、Jonathanのすばらしい仕事と、チベット語向けオープンソース出版ツールの強化を喜んでいる。
- 非常に長い段落のサポートは、2024年9月27日にリリースされたLibreOffice 24.8.2に統合された。チベット語編集に関する意見を送ってほしいと呼びかけている。
GN⁺のまとめ
- この記事は、チベット語をデジタル世界でよりよく支援するための技術革新について述べている。LibreOfficeのアップデートにより、チベット語テキストの長い段落を処理できるようになり、大きな前進となった。
- チベット語のデジタル統合は文化保存と研究に重要な役割を果たし、オープンソースソフトウェアの発展はコストの問題を解決する助けとなる。
- この記事は、チベット語のような少数言語に対するデジタル支援がなぜ重要なのかを示しており、他言語のデジタル統合に向けたモデルにもなりうる。
- 類似の機能を持つ他のプロジェクトとしては、Google DocsとMicrosoft Wordがある.
2件のコメント
Hacker Newsの意見
韓国語に分かち書きがなかったら大変だったでしょうね。