「ChatGPTにアップロードすればいいだけじゃないんですか?」
(correresmidestino.com)- フリーランス翻訳は文書をAIに入れるだけの単純な変換ではなく、文脈の理解、ローカライズ、用語調査、一貫性の確認が必要な専門業務である
- ChatGPTは翻訳文書を出力できるが、書式の問題が起こる可能性があり、翻訳品質にも疑問が残ることがある
- AIはスペルチェック、文章修正の提案、スタイルガイドの確認、専門用語の抽出といったツールとして使えるが、すべての結果を再確認する必要がある
- AIは略語や組織名を作り出し、文全体を抜かし、与えられた用語を無視し、要点を取り逃すことがあるため、継続的なコーチングが必要である
- AIが存在するという理由だけで翻訳者・ライター・編集者のような専門職の報酬が下がってはならず、AIは他人の仕事には十分だと見なしながら自分の業務には不安定だと見る矛盾が露呈している
ジムで始まった質問
- 毎週火曜の夜にボクシングと「body sculpt」のクラスを続けて受けているが、ある日午後4時から翻訳依頼が3件入り、どれも翌朝締め切りだったため、2つ目のクラスをキャンセルした
- クラスを抜ける理由を尋ねられた相手に、フリーランス翻訳者で、翌朝までに3件の締め切りがあると答えた
- 相手は「文書をChatGPTにアップロードすればいいのでは」と尋ね、翻訳業務はそんなふうには成り立たないという説明が続く
翻訳は文法的に正しい文への変換ではない
- ChatGPTは技術的には翻訳された文書を吐き出せるが、まず書式の問題が起こりうる
- さらに重要なのは、翻訳の品質に疑問が残る可能性があることだ
- 翻訳とは、ある人間が言おうとしていることを別の人間が理解できるように移し替える作業であり、文法的に正しい別言語の文を作るだけではない
- 翻訳者は原文のメッセージが自然で意味のある形で伝わるように適応、ローカライズ、表現の選択を行う
- 専門用語を調査し、文書全体で用語が一貫しているか確認する作業も翻訳業務に含まれる
AIは代替ではなくツール
- AIは仕事を代替できないが、有利に活用できるツールにはなりうる
- 15年前に翻訳を始めた当時も、Google Translateに難しい文を入れて別の言い回しを参考にしており、その後はDeepLも同じように活用してきた
- 専門家はツールを使うものであり、会計士がExcelの数式を使い、管理職がPowerPointの書式を活用し、飲食店が流行のレシピを検索するのと同じ範疇である
- この文章自体は自分で書いたが、スペルチェックはAntidoteで行え、Claudeに意見を求めて有用な提案があれば反映できる
- 段落の削除や文の明確化のような賢い提案は受け入れられるが、最終判断は人間が行う
実際の活用例と限界
- ある顧客企業は、引用文の書式や脚注の挿入方法まで定めた500ページのスタイルガイドを複数持っている
- ChatGPTにスタイルガイドを入れて最終チェックに使えば、規則違反をある程度は指摘できる
- AIを使って参考文書から専門用語を抽出し、独自の用語集を作ることもでき、この方法はCtrl+Fより速く、ストレスも少ない
- AIの結果はすべて二度三度確認しなければならず、AI活用は魔法のボタンではなく、別の作業方法にすぎない
- AIは略語や組織名をでっち上げ、文全体を翻訳せず、与えられた用語を繰り返し要求しないと無視し、ときには要点を完全に取り逃す
報酬と信頼性の矛盾
- AIが存在するという理由だけで翻訳者、ライター、編集者、その他の専門職の報酬が下がってはならない
- それは、ハンマーを使う屋根修理工に対して、素手で作業していないからといって支払いを減らさないのと同じ理屈である
- 相手は「AIは常に良くなっている」と言ったが、自分の業務でAIを多く使うのかと尋ねると、信頼性が十分ではないので使えないと答えた
- 相手の肩書きは人事・企業サービス担当Director Generalで、現在はWorkforce Planning and Resources Managementの代行職も務めている
- AIは他人の仕事には十分に見える一方で、自分の業務には十分信頼できないと受け止められるとき、専門職の価値は簡単に過小評価されてしまう
1件のコメント
Hacker Newsのコメント
結びが本当に強いポイントになっている。大半は次の二点に同意しているようだ。AIは自分にできないことに対しては大きな恩恵であり、自分の専門分野でなければ成果物の欠陥を見抜きにくく、人間に金を払って待つ必要も減る。
その一方で、AIは自分を置き換えるにはお粗末だとも見ている。自分の技術水準は高すぎて、自分が報酬を得て行っている仕事の90%を置き換えられるほど良くなる可能性はほとんど理論上の話にすぎず、せいぜい道具だということだ。
だから私は医療の質問にAIを使い、医者はソフトウェアを書くのにAIを使い、互いに相手が得ている品質を見て苦笑することになる。
たとえば大量の「エージェント」を立ち上げて、セキュリティ責任者や品質責任者のような性格を与える。実質的には、セキュリティレビューや品質チェックのためのLLMセッションを開く、不必要に複雑で予測不能なやり方だ。
また、自分のアプリにバグが山ほどあると分かっていながら、バグが出るたびにAIに直させればいいと考える人たちもいる。こうした人たちはまだセキュリティ侵害やデータ損失バグを経験しておらず、Claudeが中央揃えになっていないdivを直したり、たまに出るエラーコードを処理したりする程度のものとしか考えていない。
まだどう定式化すべきかは分からないが、Peter PrincipleやGell-Mann効果のAI版の系のようなものがありそうだ。「AIは利用者の無能さのレベルまで昇進する」とか、「AIの出力に対する確信は、それを検証する能力に反比例する」といった感じかもしれない。
私は知的に demanding だと見なされる教授で、NLP/AI研究をしている。近い将来にAIが私の中核的な知的業務を置き換えるとは思っていないが、その中核業務が自分の時間の10%すら占めていないとも思う。
大半は官僚的な報告書作成、研究費申請書の作成と推敲、試験や課題の採点、ポスター設計、ある年度の講義日程の計画、スライド用の図の作成、課題や試験の作成、講義調整会議への出席といった仕事だ。こうしたものは自動化できるし、そうあるべきだ。
同じ講義を何度目かで繰り返し教えることも、客観的には自動化可能だろう。動機づけに関わる人間的要因のせいで続けるだけで、人間が行う講義が知的に優れているからではない可能性が高い。
最先端モデルが良くなるたびに、AI懐疑派が突然信奉者に変わる波を目にする。「去年はAIはコーディングできなかったのに、今は何にでも使っている!」といったことを言う。
興味深いのは、その発言をした人のコーディング能力が、転換点の Claude Opus 4.5 あるいは当時の最先端レベルだと分かることだ。
一方で残りの人たちは、記事中の人物のようにAIを単なる道具として使い続ける。コンピュータが私よりプログラミングをうまくできるようになったとき、私も転向するまでどれくらいかかるのか気になる。
現時点で、自分がAIとまともに競争できる仕事が一つでも思い浮かばない。自分の実力が足りないのか、他の人たちが自信過剰なのか分からない。私のように感じている人たちは、たぶん大声では言わないだけなのかもしれない。
翻訳の話に少し脇道へそれると、The Master and Margarita を二つの翻訳で読んだことがある。一つ目はあまりに退屈で、第1章が終わる前に読むのをやめざるを得なかった。翻訳者名も見つけられなかったが、ロシア語の愛称をすべて翻訳してしまっている版だった。
ずっと「homeless」という男の話をしているので、ただのひどい本だと思って何年も無視していた。なぜこの本がそんなに話題なのか理解できなかった。
その後、Diana Burgin と Katherine Tiernan O'Connor の翻訳に偶然出会い、ロシア語は分からないが、これなら最高に近い出来だと思った。本当にものすごい仕事だった。
Yevgeny Zamyatin の We の機械翻訳でも同じ効果が見られる。政府を「United State」と訳すと「United States」と簡単に混同してしまうが、「One State」と訳した翻訳のほうがずっと良かった。
本当に人間が書いた文章なのに、em dash がやたら多い。AIのせいではなく、文章が自然に流れるように磨く代わりに、人が em dash に頼って書いたのだと思うと、ほとんど涙が出るほどだ。
この em dash は実際の話し方のリズムに合っている。「毎週火曜の夜にクラスを二つ続けて受けるんだ、ボクシングと『body sculpt』。名前、変だよね」と言うだろう。
文の流れの一部がぎこちないのは事実だが、それは em dash のせいではない。文法主義者なら、余分な語を足さずに別文にはできないし、あれこれ理由をつけてコンマでつなぐのも不可だと言うかもしれない。だから em dash がある。
文を書き直しても、より自然になるどころか、かえって不自然になる可能性が高い。
更新: はっきりしないといけないので付け加えると、すまない。我慢できなかった。
2024年にChatGPTが大学院レベルの数学を手伝えると言ったら笑われただろうが、今年はAIモデルが単純なプロンプトで、以前は解けなかったErdos問題を解いている
人間の知能とAIの間に何らかの根本的な壁があり、AIは人間にできる多くのことを絶対にできないと想像するのは愚かに見える。意図の推論、感情の把握、文化的価値の反映など、人間にはできるがAIにはできないとされるものも、十分な文脈が与えられれば今のAIでできる
さらに重要なのは、そうしたことが人間の頭蓋骨の中でだけ起こる魔法ではなく、情報処理の産物だという点だ。コンピュータに得意にさせるのが難しかった種類の情報処理にすぎず、これまでのところAIは進歩し続けているように見える
人間の特別な価値が、有用な作業をこなす能力に結び付いていないという点には全面的に同意する。だが、AIモデルの能力を否定するのは多くの人が犯すありがちな誤りに見え、残念ながら現実は彼らが感情的に準備できる前に追いついてしまう
「十分な文脈が与えられれば」という文で、文脈を「ドル」に置き換えてもよいという点は指摘しておく価値がある。こうした印象的な成果のかなりの部分は、そこから来ているように見える
いつものことだが、最近のブレークスルーはどれも「もっと考えさせる」系に見えるので、モデルがさらに良くなりつつ、なおかつ安くなるのかは不透明だ。翻訳の場合、成果物の単価への期待を考えると、「もっと考える」LLMが役に立つのかかなり疑わしい
同意するが、脳、特に人間の脳がとてつもなく大きいことと、個々のトークンが個々のごく小さな筋肉のけいれんよりはるかに多くの意味を担っていることは覚えておくべきだ
そのため、極めて原始的な「認知」でさえ、実際よりずっと多くのことをしているように見えることがある
「2024年にChatGPTが大学院レベルの数学を手伝えると言ったら笑われただろうが、今年はAIモデルが単純なプロンプトで以前は解けなかったErdos問題を解いている」のなら、気になるんだが、数学の大学院学位ってあるのか?
その通り。まるでAIが永遠にLLMのままで、現在状態の評価、動的な次状態予測、因果推論、オブジェクト永続性などを含む世界モデルを発展させないと思っているかのようだ
私はAI業界にいるわけではないが、こちらの研究や取り組みは間違いなくかなり進んでいるはずだと思う
正直、Fableはかなり怖かった。実際のコーディングではなく別の側面で、また一段大きく跳ねた感じだ
「実装は君がやって、メタ作業と方向修正は私がやる」という状態にはかなり安心していたが、今や方向修正もいらないし、メタ作業もいらない。バックログはここにあるから、終わったら知らせてくれ、私はレビューと仕上げが必要になるまで芝生でもいじっていればいいのか、という感じだ。たぶん明日には?
2023年ごろ、コーディングエージェントが課題をよろよろ解決するのを初めて見て、「これはまずい」と感じたときのことを思い出す。初期のGPTが実際にそこそこ通じるジョークを作り始めたときも似た感覚だった
古典的な「greentext作って」の最新版を書くとこうだ。私はシニアソフトウェアエンジニアで、チケットが実際に実装されるよう責任を持っている。たまにIDEを開いて自分でコードを書くこともある。ある日IDEを開いたら、チケットがもう閉じていた。エージェントが一晩で処理していた。方向修正もレビューのメモも、やることもない。distress.jpg。マネージャーに何をすればいいか聞くと、「高レベルアーキテクチャに集中して」と言われる。「どんな高レベルアーキテクチャですか?」と聞くと、「知らないよ、君はシニアエンジニアだろ」と返される。rage.jpg。退職する。プロンプトエンジニアになる。何を作るか簡単に伝えればいいだけだ。初日にプロンプトを書こうと座ったら、AIがすでに書いていた
筆者がAIより翻訳がうまいこと自体には疑いはないが、AI翻訳があまりにも良くなってきていて、翻訳の仕事があとどれくらい残るのか、あるいは結局監修作業中心になるのかは分からない
たとえば最近、Lawrence Ellsworth訳のThe Three Musketeersをとても楽しく読んだ。私はフランス語を話せないし読めもしないが、Ellsworthの翻訳はこの作品のより正確な翻訳の一つと見なされていると理解している
気になって、フランス語の原書版The Three MusketeersをClaude Fableに入れ、正確に翻訳しつつ原文の愉快なトーンを保ち、何も検閲しないように頼んだ。全部は読んでいないが、いくつかの章をEllsworth訳とFable訳で比較してみた
正直、驚くほど似ていた。私にはEllsworth訳とFable訳のあいだに実質的な違いは見当たらなかった。Ellsworth訳の文章のほうが少し良いとは思うが、Fableの文章も十分に読めるものだった
繰り返すが、私はフランス語が分からないので断言はできない。ただ、Fable版を読んでいてもEllsworth版と大きく違う体験にはならなかった気がする
ただし、これはある程度自己充足的である可能性が高い。FableはEllsworth訳で学習していて、そのためかなり直接的に写したのかもしれない。私は英語以外の言語が分からないので落とし穴がある。翻訳の正確さを比較するには別の翻訳と比べる必要があるが、別の翻訳があれば結果に影響している可能性が高く、翻訳がなければ監修する方法がない
それでも続編は引き続きEllsworth訳で読むつもりだ。そちらのほうがより定本らしく感じられるし、文章も少し上だと思うからだ
しかも、自分でそのテストが完全に役に立たないほど欠陥があると認めておきながら、品質について大げさなことを言っている
LLMは有名な本を全部暗記している。うまく誘導すれば、ほぼ単語単位で暗唱させることもできる
翻訳は難しい。特定の言語からの翻訳をよく読んでいると、機械翻訳特有のにおいがあって、説明しにくいが確かにある。良い翻訳は機械翻訳よりはるかに上だ
最新のLLMの翻訳能力がより高い可能性はあるが、現時点では全体として概してひどい。ごく短い文章なら使えるかもしれないが、長いコンテンツにはまったく向かない
昨日出版されたフランス小説なら、どれほど上手く訳せるだろうか。原作小説も翻訳版もまだ学習セットに入っていないかもしれないし、翻訳版そのものが存在しないかもしれない
この週末、スロベニア語で書かれた手紙をChatGPTに翻訳させてみたが、全体の趣旨はつかんでいたものの、ニュアンスをかなり取りこぼしていた。類義語の選択一つで多くの情報を伝えるような細かな語調の仕掛けを、完全に見落としていた
興味深い見方だ。翻訳は、私の聞くところでは (a) AIのせいで最初に仕事を失う職業の一つであり、(b) LLMやAI生成アートに懐疑的な人たちが「許容できる」AIの例としてよく挙げる分野でもある
しかし他人のために翻訳するとなると、より多くの注意と人間の判断が必要になる。特に、取扱説明書のように表現の悪さで誰かがけがをしかねない場合はなおさらだ
少なくとも原文が英語の場合、LLMはこの国で従来出版されてきた平均的な小説翻訳より上手いと自信を持って言える。字幕付きの映画を見るたびに、明らかに間違ったセリフがいつもある
手早いメッセージやメールでは誤字や文法ミスが大事にならなくても、広告コピー、履歴書、医薬品ラベルのような出版物に誤字があると非常に見栄えが悪いのと、概念的にはかなり似ている
最新水準がどうなっているかはよく分からないが、トースターの説明書や一般的な文言の翻訳は、まもなく自動化されうるという見方には納得できる
自分の投稿がここで議論されていると今知ったので、当然来るしかなかった
時間を割いて記事を読んでくれたのだから、私もスレッドをちゃんと読んでみようと思う。読むのは本当に好きだし、AIについてみんながどう考えているのかも気になる
記事中の逸話は実話だ。肩書きだけ変えた
AIについて、「これはさすがに自分には影響しないだろう」から「AIは馬鹿だ」に移り、実際には馬鹿だったのは自分で、プロンプトをどう書けばいいのか分かっていなかったのだと気づいた。今はどうやって自分に役立つものにするかという段階にいる
それでも、雇用主や顧客、そして世の中全体が、これが魔法のボタンではないと気づいてほしいと思っている
どれほど不安定になりうるかには気が狂いそうになる。もちろん、何が書いてあるのか大まかに教えてくれるという意味では翻訳できる。だが、それが良い翻訳だという意味ではない。例はいくらでも挙げられる
純粋なコーディングでは、私にはそれが起きた。絶対にありえないと思っていたことだ
この不安定さは、一時的な初期段階にすぎないようにも見える
興味があって、このスレッドを見る数分前に読んでいたフランス語の記事をChatGPTに貼り付けて、英語に翻訳してくれと頼んでみた。機能的には間違いなく実用的だったし、自分の知らない言語の記事を翻訳するのに使うことはためらわないと思う
ただし、専門家レベルではなかった。フランス語の文法を誤って訳している箇所がいくつかあり、文章も事務的だった。各文を文字どおりに移すだけで、もともと英語で書かれた記事のように自然に流れるようにする工夫はなかった
こういうふうに書かれた記事を読むかと聞かれれば、短い文章なら読む。小説は絶対に無理
芸術的な翻訳に居場所があるのと同じように、急ぎの翻訳にも居場所がある
LLMが利用者の少ない言語の翻訳者を置き換えられるとは思えない
東欧の2つの言語のあいだで翻訳する人を知っているが、仕事によっては専門辞書が必要になる。そういう場合にLLMを使うのは非常に信頼しにくく、最初からきちんとやるより、確認して直すほうがかえって手間がかかるだろう
そのうえ、アメリカの技術企業が「たった」600万人しか使わない言語でLLMを学習させているのかどうかもかなり疑わしい
娯楽の分野でも、東欧で海賊版映画の鼻にかかった単調な吹き替えや機械翻訳されたゲームを見て育った人なら、それらが体験をどれほど損なうかよく知っている。もちろん「AIならもっとうまくできる」と言うことはできるが、一貫性を保ち、文化的ニュアンスや慣用句などを捉えられるだろうか?
「ジムの服を着ると、私たちはたいていみんな似たように見える」
自分の脳が筆者とは違う働きをしているのかは分からないが、この文章には驚いた。ジムウェアは自分にとって認識に影響しない。顔、体つき、姿勢が重要で、服はあまり入ってこない。自分にはあまりにも納得しがたく、疑わしいくらいだ
人間中心の観点から見て悲しいのは、誰かを見分けられないことではなく、たぶんもう二度と会わないのだから覚える価値がないと考えていることだ。共同体がない状態だ。共同体と人とのあいだの対人的な関係は、今でも私たちが大切にしているものだ
そして私は、やり取りしない人を見分けるのが本当に苦手だ。鏡の前に黒いレギンスをはいた50人がいるところを想像してみればいい