共通音声技術
(commonvoice.mozilla.org)Mozilla Common Voiceプロジェクトの紹介
- Mozilla Common Voiceは、機械が実際の人々の話し方を学べるように支援するプロジェクトです。
- 音声技術を利用可能にするために、開発者は膨大な量の音声データを必要とします。
- データの大半は大企業によって利用されており、多くの人々はアクセスできず、それがイノベーションを妨げていると考えています。
音声データの記録と検証の現状
- 現在までに29,000時間の音声が記録され、そのうち18,000時間が検証されています。
多様な言語のサポート
- Common Voiceプロジェクトは世界中の多様な言語をサポートしており、ユーザーは自分の言語で貢献できます。
高品質な公開データセット構築の支援
- プロフィールを作成しなくても貢献できますが、匿名の人口統計データを提供することで、提出されたデータをより豊かにできます。
- プロフィール情報は、音声認識の精度を訓練するために使われる音声データの質を向上させます。
- ユーザーは複数の言語にまたがって自分の進捗状況と指標を追跡できます。
- 世界中のほかの貢献者と進捗状況を比較できます。
- 個人およびプロジェクト目標に対する進捗状況を確認できます。
- 希望すれば、プロジェクトの更新や新しい情報に関するメールリストに任意で登録できます。
GN⁺の意見
この記事で最も重要なのは、Mozillaが音声認識技術を開発しようとする開発者に必要な大規模音声データを提供するため、Common Voiceプロジェクトを開始した点です。このプロジェクトは、技術革新を促進しようとするMozillaの取り組みを示しており、世界中の多様な言語を支援することで、多くの人が技術発展に貢献できる機会を提供しています。これは技術の民主化を追求するMozillaの哲学を反映しており、多くの人々にとって興味深く魅力的なイニシアチブとなるでしょう。
1件のコメント
Hacker Newsのコメント