- Issenは、パーソナライズされたAIベースの言語チューターを提供
- ユーザーは対話型の方法で語学学習を体験できる
- AIシステムは、個々のユーザーの目標と弱点に合わせて学習ルートを設定
- 既存の語学学習アプリとは異なり、リアルタイムフィードバックと自然な会話機能が特長
- スタートアップやIT人材にとって、迅速かつ効率的に外国語能力を向上させる方法として注目されている
サービス紹介
- Issenは、Y Combinator F24に選ばれたスタートアップで、個人ごとに最適化されたAI言語チューターを提供
- ユーザーは会話ベースのインターフェースを活用し、英語などさまざまな外国語を自然に練習できる
- AI言語チューターは、ユーザーの発音・語彙・文法の弱点を把握し、個別最適化された質問とフィードバックを即座に提供
- 従来の講義型教育とは異なり、リアルタイムの双方向会話と適応型学習ルートを組み合わせることで、学習者の主体性を高める
主な特徴
- 対話型チャットボットAIが、学習者の目標とレベルをもとにパーソナライズされた語学学習プランを提案
- リアルタイムの文法修正、語彙の提案、発音フィードバックなど、即時応答システムを提供
- 教材ベースの学習ではなく、実生活やビジネスで役立つカスタマイズされた会話シナリオを支援
- 学習データと進捗状況を分析し、目標到達度と弱点改善を継続的にモニタリング
差別化ポイントと期待効果
- 既存アプリが提供する定型的な練習や反復学習の代わりに、実際の言語使用環境に近い会話体験を提供
- 語学学習者が自分の不足している部分を素早く把握し、効率的に集中トレーニングできるよう支援
- スタートアップやグローバルIT人材が、海外進出や多様な業務環境で迅速に言語能力を高められるソリューションとして注目されている
1件のコメント
Hacker Newsのコメント
語学学習にはイノベーションが必要だという点には共感すると伝えたい。
Webアプリでギリシャ語の初級学習を試してみたが、ChatGPTやGeminiの音声モードよりは良い体験だった。
ただ、5分ほどするとAIチューターが自分専用の学習計画や自分の苦手を把握していないことに戸惑いを感じた。
たとえば趣味を聞いた直後に、山でハイキングする長いギリシャ語の文をいきなり話してきた。
完全な初心者の自分にはこの文に答えることもできず、繰り返すことすら難しかった。
今自分が何をすればいいのかさえ分からない。
本物の先生なら文の一部を繰り返し、訳したり説明を添えたりしてくれただろう。
しかしAIチューターは、こちらが何か話すのを待つだけで、的外れにビーチ休暇の話へ展開してしまった。
それでも既存のAIよりは良いと感じたので、もう一度試すつもりだ。
ChatGPTの高度な音声モードと大差なく、こちらが会話を主導しなければならないので、全体的に場当たり的だと感じた。
結局は慣れた話題ばかりになり、かえって練習の意味が薄れてしまう。
もっと体系的に新しい領域や実力を広げてくれるガイド型の学習プランを期待していた。
何年もかけて人間の講師が体系的にカリキュラムを設計してきたので、何よりも論理的だ。
特にギリシャ語講座が素晴らしく、広告もなく完全無料。
自分が使った中で最高の語学学習ツールだと自信を持って勧められる。
https://www.languagetransfer.org/
英語が母語だと嘘をついたら正常に進んだ。
ただし入力した自分の名前ではなく、Antonという名前で呼ばれた。
自分がどもったり困っていたりするニュアンスが、テキスト変換の過程で完全に失われてしまう。
スクリプト形式の授業は素晴らしかったが、AI会話モードは授業で学んだ語彙・文法レベルを忘れたかのように慣用表現で会話してきた。
結局興味を失い、使うのをやめた。
Duolingoはゲーミフィケーションが強すぎてとても使えなかったが、このアプリはその点が抑えられていてありがたい。
自分の母語と目標言語を自然に切り替えられるのか、会話中に英語で質問してもよいのか気になる。
グローバル最適化に関する論文まで出ているほどだ。
学習指標やコンテンツ生成は簡単でも、個別学習者に本当に合わせるループは誰も作れていない。
Duolingoでも「練習」を押しても上達はなく、毎回同じような Bread and water(ありきたりな内容)ばかり出てくる。
語学学習でTTS(音声合成)を完全には信用できない。
発音を誤って内面化してしまうかもしれないのに、それに気づけない。
Duolingoの日本語コースで実際の録音だと思っていたら、
oyoguがoyNHYAOguのように妙に合成されて聞こえた。初心者ならこうした誤りをそのまま真似してしまうのではないかと不安になる。
もちろん間違いは学習時間が長くなれば修正できるが、最初から誤って覚えるとより大きな努力が必要になる。
特に日本語のようにピッチアクセントが重要な言語では、多くの教材や人がそれを無視している。
例:
imaは2音節目の高低によって「今」と「居間」で意味が変わる。この問題は、日本語のように漢語が多い言語ほどさらに大きくなりうる。
一部の日本語チューターにその声を適用しており、ピッチアクセントもほぼ完璧だ。
時々漢字や読み間違いもあるが、ふりがなが違えばすぐ分かる。
自分も語学学習アプリを作りながら複数ベンダー(11labs、OpenAI、play.ht、Azure、Google、Pollyなど)のTTSを試したが、3文に1文はエラーがあった。
直すのに1週間ほどかかり、今はエラーのない状態だ。
この現象は日本語で特にひどく、ほとんどの声調言語はトーン自体は合っている。
自然さを評価する資格は自分にはないが、日本語ほど深刻なズレは経験していない。
しかしTTSは依然として大半の言語で品質不足だ。
言語ごとに音節の強調の仕方は異なる。
スペイン語は母音の長さ、アイスランド語は音量、英語は長さ+音量、スウェーデン語/日本語は高低が重要だ。
英語でもストレスの置き方を誤ると意思疎通できない。
日本語は同音異義語が多く、ピッチによって意味が変わるのでさらに特殊だ。
正確な高低が切実に必要だ。
このアプリは本当に最高の体験だった。
アルゼンチンの人との会話が非常に自然に続いた。
ブエノスアイレスに18年以上住んでいて、発音やイントネーションもかなり良い方だ。
基礎文法が不足していて穴が多かったのだが、このアプリはそうした部分を精密に整えてくれた。
iOSのUXでは、設定モーダルを開いたときに閉じるボタン(CTA)が見えにくいのが惜しい。
設定ボタンのクリック状態と非アクティブ状態の色がほとんど同じだ。
解決策: 右上に閉じるXボタンを追加し、クリック時の色変化を入れる必要がある。
UXフィードバックをもっと欲しければ連絡してほしい。visualsitemaps.com
ベトナム語を学ぼうと試したが、授業の品質はかなり低く、誤情報もあった。
男性が自分を指すとき
Anh mệtは正しいが、Em mệtが女性用だという説明は誤りだ。Anhは年上の男性を意味し、Emは性別に関係なく年下なら使う。多くの女性は実年齢より若く見られたくて
Emを好むが、若い男性でもEmは使える。良いチューターなら年齢や関係性を基準に文脈を説明する。
英語の文をベトナム語訛りで読んでしまう誤りもあった。
自分のレベルより難しすぎる文を出されたり、要望すると焦点がずれたりした。
一般的には南部ベトナム語の方が広く使われるが、チューターは北部ベトナム出身だった。
音声認識(STT)も、発音が間違っていても寛容すぎたり、英語とベトナム語を区別できなかったりする。
例:
Phaiをbyeと認識する。ずっと安く、スケジュールなしで学べるので期待していたが、正確性は信頼しにくい。
今はベトナム人チューターに1回20ドル、月160ドル払っている。
問題提起に感謝する。
良い語学学習プラットフォームが切実に必要だ。
フィードバックが核心を突いていることに共感する。
基礎文の練習を助けるツールを作ったので、フィードバックをもらえたらうれしいという提案。 https://envn.app
日本語で試してみたが、かなりもどかしい。
初心者なのにチューターが日本語だけで話し、自分が理解できないと何度言っても同じだった。
英語から徐々に日本語へ移ってほしいと頼んでも、1文だけ英語で言ってすぐ日本語に戻る。
十分な実力のある中級者以上には会話練習として有用かもしれないが、完全な初級者向けの体験はもっと必要だ。
モデルがマルチモーダル対応なのだから、視覚資料も積極的に活用するとよい。
記録した日本語をローマ字(rōmaji)ですぐ表示するとさらに良いという提案。
正直に言うと、今の焦点はB1以上の学習者だ。
完全初級者の0→1段階の学習が必要なら、従来型の教材(特に聞く・話すことの比重が低いもの)を使う方がよいだろう。
ChatGPTモバイルアプリのハンズフリー音声会話モードはかなり使える。
ただ、話題がないと会話が単調で、いつもありきたりな話にとどまる。
そこで自分はニュース記事全文と関連リンクをコピーして、「このテーマで語学練習をしよう」と伝えて進めている。
こうしてスペイン語で1時間ずつ散歩しながら実践練習している。
望めばChatGPTには自分の母語でだけ質問し、相手(チャットボット)には目標言語だけで答えさせることで、聞き取りに集中した訓練もできる。
Issenがこの体験をどれだけ改善したのか気になる。
音声モデルの進化速度も速い。
語学学習に特化した全体体験(個別カリキュラム、プロンプト、正確な認識用AIモデル、フラッシュカード/辞書など)が必要だと感じる。
ハンズフリーモードも提供しており、スラング・話す速さ・目標言語の使用率などさまざまな要素をカスタマイズできる。
ロシア語で練習してみたが、練習自体は良かったものの、すべての語学学習アプリに共通して足りないのは、自分の発音ミスを検知して修正する機能だ。
だいたいそれっぽく話すだけで自動認識(STT)が通してしまう。
AIが実際に自分の発音を「聞いて」、どこを間違えたのかを正確に漏れなく指摘してくれる時代が来てほしい。
今はアクセントの問題だけでなく、格語尾や単語アクセントなども検知できない。
AIが正しいイントネーションや形で言い直してくれると矯正の助けにはなるが、実際の人間教師が与える自信までは与えてくれない。
製品提案: トランスクリプション(字幕)をオフにできる機能を入れてほしい。
特に一部の言語では文字が見えるとかえって邪魔だったり、初級者には近道になってしまったりするからだ。
最後に、場当たり的で方向性のない会話(例: 「AIのどんな点が最も興味深いか?」)より、もう少し目標志向の会話構造があるとずっと面白い。
ゲーミフィケーションがなくても、討論形式(「このテーマで私を説得してみて!」)や具体的な経験につなげる形(「今年の仕事で最も重要な目標は何?」)など、実質的な意見や経験を引き出す方法を提案したい。
これまで見た中で実際に使いそうだと思えた初めての製品で、称賛を送りたい。
音声→音声モデルが成熟すれば本当に楽しみだ。
OpenAI/Geminiでも大きな進展があり、近く取り入れる予定だ。
最初の再生後、ログインしないと見られない動画がなぜわざわざロックされているのか気になる。
このアプリがB1以上を想定しているというフィードバックは見たが、デモ動画はA1〜C1までさまざまだ。
A1〜C1の範囲すべてを必要とするユーザーは稀で、各レベルごとに明確な市場が別にあるのだから、区分が必要だ。
フランス語TTS(音声合成)はChatGPTの標準音声より自然さで劣る。
ユーザーレベル別のワンクリック課題(ニュースを読む→討論する、ニュアンス・推論など)を導入すれば非常に人気が出そうだ。
特に多くのユーザーは自分の発話に結束性(cohesion)が不足していることを認識していないので、そうした能力が threshold proficiency の核心だと示す構造は実際に役立つはずだ。
アプリがよくできていると褒め、すでに10人ほどに勧めた。
いくつか気になる点:
最も人気のある言語を中心にテストと調整を行った。
ユーザーフィードバックに応じて問題の多い言語は実際に削除もしており、まだ確認できていない言語もある。
TTSサービス(Openi、11labs、minimaxなど)の品質によって声の種類が決まる。
一部サービスは男性音声がなかったり、女性音声だけが良かったりする。
今後さらに多様な音声を追加する予定だ。
Sesameではユーザー自身の実際の声をTTSに入れて、ユーザーの雰囲気やトーンに合わせられるが、こちらはまだ既製のTTSしか使っていない。
Sesameはレイテンシも非常に短いが、その点は語学学習ではむしろ欠点でもある。
今後は成熟した音声-to-音声モデルに基づく体験を提供するのが目標だ。