1 ポイント 投稿者 GN⁺ 2024-10-15 | 2件のコメント | WhatsAppで共有

チベット語をデジタル世界の一級市民にするための技術革新

  • BDRCは、チベット語をデジタル世界で一級市民にするための技術革新を推進している。最近、LibreOfficeがチベット語の重要な特徴である非常に長い段落をサポートするようになったことは、大きな成果だ。
  • チベット人は、8世紀に仏教が導入されて以来、執筆、革新、技術に多くのエネルギーを注いできた。チベット文字は、仏教経典をサンスクリット語と中国語からチベット語へ翻訳するために発明された。
  • 14世紀には木版印刷技術を採用し、チベット語に翻訳された経典や、ヒマラヤの著者たちが自ら書いた仏教テキストを大量生産した。
  • 近年では、チベット語コンピュータフォントの開発が、デジタル世界におけるチベット語の進化において大きな飛躍となった。特に、チベット語が、世界の文字体系向けコンピュータフォントコードを標準化したUnicode標準に含まれたことは注目に値する。
  • しかしチベット語には、いまだにすべてのツールやアプリケーションでサポートされていない重要な特徴がある。そのひとつが、非常に長い段落だ。チベット語テキストにはヨーロッパ言語のような段落の概念がなく、長い連続テキストとして扱う必要がある。
  • 一般的なワードプロセッサソフトウェアは英語テキストを念頭に設計されており、比較的短い段落を前提としている。しかしチベット語では段落がほぼ無限に続き、空白もほとんどないため、この種のソフトウェアはチベット語テキストを開くときに性能が大きく低下する。
  • LibreOfficeは無料で提供される成熟した安定版オープンソースワードプロセッサのひとつであり、チベット研究とチベットのコミュニティにとって重要だ。商用ソフトウェアは高価で、アジアの多くの地域では海賊版が使われている。
  • 2015年にBDRCのCTOであるElie RouxがLibreOfficeにこの問題を報告したが、コードへの介入は大規模なプロジェクトだった。しかし最近、開発者Jonathan Clarkがこの問題を解決した。LongchenpaのYishindzöのような長大なテキストも、いまでは高速に開いて編集できるようになった。
  • BDRCはこの革新に小さく貢献しており、Jonathanのすばらしい仕事と、チベット語向けオープンソース出版ツールの強化を喜んでいる。
  • 非常に長い段落のサポートは、2024年9月27日にリリースされたLibreOffice 24.8.2に統合された。チベット語編集に関する意見を送ってほしいと呼びかけている。

GN⁺のまとめ

  • この記事は、チベット語をデジタル世界でよりよく支援するための技術革新について述べている。LibreOfficeのアップデートにより、チベット語テキストの長い段落を処理できるようになり、大きな前進となった。
  • チベット語のデジタル統合は文化保存と研究に重要な役割を果たし、オープンソースソフトウェアの発展はコストの問題を解決する助けとなる。
  • この記事は、チベット語のような少数言語に対するデジタル支援がなぜ重要なのかを示しており、他言語のデジタル統合に向けたモデルにもなりうる。
  • 類似の機能を持つ他のプロジェクトとしては、Google DocsとMicrosoft Wordがある.

2件のコメント

 
GN⁺ 2024-10-15
Hacker Newsの意見
  • Jim Woolseyはチベット語のデジタル化に重要な役割を果たした初期のコンピュータハッカーだった。彼の献身的な取り組みは多くの人々に感銘を与えた
  • 文書の段落が短いというのは、プログラマーがテキストについて誤解していることの一つである
  • 長い段落を扱うことはワードプロセッサーにとって難しい場合がある。しかし作家や出版社はそれを管理する方法を知っているはずだ
  • チベット語の発音を教える古いHyperCardスタックがある
  • ベンガル語とアッサム語はチベット文字を使う。チベット語との類似性について疑問を呈する意見がある
  • 言語は学びやすかったり、複雑な概念を伝えたりできる道具である。チベット語がそのどちらに属するのか気になるという意見がある
  • 長い段落をサポートする方法の詳細を知りたがっている意見がある
  • チベット人の革新は"The Nine Billion Names of God"でも言及されている
  • EyalはLibreOfficeプロジェクトのボランティアで、チベット語の性能改善を実装したJonathan Clarkに感謝を表した
    • LibreOfficeで見つかるバグのほとんどは一般的なものであり、特定のスクリプトに限られない
    • チベット語やモンゴル語のような、あまり使われないスクリプトに関する問題も存在する
    • ユーザーが少ないため、バグ報告も少ない可能性がある
    • 開発者の時間が確保できれば、こうした問題を解決したいという関心がある
  • LibreOfficeを使っていてバグを見つけたら、BugZillaに報告することが勧められている
  • The Document Foundationを財政的に支援することを検討してほしいという呼びかけがある
    • LibreOfficeは多くのユーザーを抱える大規模なFOSSプロジェクトである
    • 大企業の投資なしに、個人寄付によって運営されている
 
kayws426 2024-10-15

韓国語に分かち書きがなかったら大変だったでしょうね。