1 ポイント 投稿者 GN⁺ 2023-12-08 | 1件のコメント | WhatsAppで共有

Mozilla Common Voiceプロジェクトの紹介

  • Mozilla Common Voiceは、機械が実際の人々の話し方を学べるように支援するプロジェクトです。
  • 音声技術を利用可能にするために、開発者は膨大な量の音声データを必要とします。
  • データの大半は大企業によって利用されており、多くの人々はアクセスできず、それがイノベーションを妨げていると考えています。

音声データの記録と検証の現状

  • 現在までに29,000時間の音声が記録され、そのうち18,000時間が検証されています。

多様な言語のサポート

  • Common Voiceプロジェクトは世界中の多様な言語をサポートしており、ユーザーは自分の言語で貢献できます。

高品質な公開データセット構築の支援

  • プロフィールを作成しなくても貢献できますが、匿名の人口統計データを提供することで、提出されたデータをより豊かにできます。
  • プロフィール情報は、音声認識の精度を訓練するために使われる音声データの質を向上させます。
  • ユーザーは複数の言語にまたがって自分の進捗状況と指標を追跡できます。
  • 世界中のほかの貢献者と進捗状況を比較できます。
  • 個人およびプロジェクト目標に対する進捗状況を確認できます。
  • 希望すれば、プロジェクトの更新や新しい情報に関するメールリストに任意で登録できます。

GN⁺の意見

この記事で最も重要なのは、Mozillaが音声認識技術を開発しようとする開発者に必要な大規模音声データを提供するため、Common Voiceプロジェクトを開始した点です。このプロジェクトは、技術革新を促進しようとするMozillaの取り組みを示しており、世界中の多様な言語を支援することで、多くの人が技術発展に貢献できる機会を提供しています。これは技術の民主化を追求するMozillaの哲学を反映しており、多くの人々にとって興味深く魅力的なイニシアチブとなるでしょう。

1件のコメント

 
GN⁺ 2023-12-08
Hacker Newsのコメント
    • FF の TTS は、使いやすいテキスト読み上げシステムを求める人にとって重要なプロジェクトである。ブラウザに組み込まれているため、コンソールで簡単なコードを実行してさまざまな TTS の例を聞くことができる。ブラウザによってはオフラインでも利用できるが、別のブラウザではクラウドベースの TTS システムを使っている。
    • Common Voice Android は、プロジェクトに貢献したい人にとって有用なアプリである。ユーザーは自分が話せる言語で音声を録音し、他のユーザーの貢献を検証できる。公式ウェブサイト版よりもユーザーフレンドリーなデザインになっている。
    • 裁判所が OpenAI のような企業の行為はフェアユースに当たらないと判断した場合、クラウドソーシングされたデータセットが基盤モデルを構築する唯一の方法になるかもしれない。そのようなシナリオが起こる可能性は低くないと見ている。
    • このデータセットは、最近の音声モデルが訓練されたものよりはるかに小さいが、自己教師あり学習ではなく教師あり学習向けのものであり、特定言語に対するモデル性能を向上させるためのファインチューニングには依然として有用である。
    • AI とディープフェイク技術の最近の出来事を考えると、このようなプロジェクトに「自分の声を寄付する」ことに同意する前に、何らかの保証が必要である。プロジェクトが音声認識のためのものなのか、生成のためのものなのかが明確ではない。
    • Mozilla が関連する音声テキスト変換ソフトウェアを中止したり、別の会社に移管したりしたことがあったのか気になる。あるいは、それは別のものだったのだろうか?
    • Linux 版 Firefox のリーダーモードにあるテキスト読み上げ機能は、なぜあんなにひどいのか? スティーヴン・ホーキングのテキスト読み上げよりもずっと悪い。
    • OpenAI が本当にオープンであってほしいと思っていたが、今では Microsoft の操り人形となって企業利益の目標を追求している。これや HuggingFace のようなプロジェクトを見るのは好ましく、HuggingFace が GitHub のように Microsoft に買収されないことを願う。
    • ここにいる人の中で、「読書用の声」と普段の会話の声が違う人はどれくらいいるのだろうか? 学習データの大半が「台本読み」のように聞こえるなら、会話モデルを訓練できるのだろうか?
    • 関連ニュースへのリンクも提供されており、Mozilla Common Voice プロジェクトの進捗状況や音声データセットの拡張に関する情報を提供している。