スクリーンショットに(修正後の)例文が見える: "Sometimes I still make mistakes with articles and prepositions, but my grammar is getting better every day I practice" という文がある。アメリカ英語/簡略化された英語ではこの文は文法的に正しい。しかし、いわゆる "full fat" なイギリス英語では practice は名詞で、practise が動詞だ。たとえば "I go to my practice to practise medicine" のように使う。このウェブサイトの問題は、周辺的な論点ばかりに注目している点だと思う。製品が私のプライバシーを尊重すること、性能が良いこと、インターネット接続を要求しないこと、さまざまなアプリで動くこと、価格が透明であること――これらはすべて良い。だが、私が本当に重要だと考えるのは、この製品が常に正しい文法を適用するかどうかだ。このウェブサイトはその点についてまったく納得させてくれない
つまり結論として、このツールは American English 側に偏っていて、practise のような非標準語を colour のようにスペルミスとして扱う。もしアメリカ人向けの文章でそういう単語を使い、しかもあなたが英連邦出身でないなら、かえって尊大に見えるかもしれない
American English を "簡略化された(simplified)" 英語と呼ぶのは、典型的な誤った言語学だ。単に別の方言であるだけで、本質的により単純でも複雑でもない
言いたいことはよく分かる。"full fat" 英語という表現に関連して言えば、英語そのものがもともとかなりごちゃ混ぜで、新しい国々で広く使われるようになるにつれてさらに複雑になってきた。文章がきちんと書かれていて、明確に理解できるなら、15ドルの製品としては十分だと思う。この製品の目的は contemporary Oxford English に完璧に従うことではないはずだ
"Look Dick. See Jane. Jane run home. I says you go home to. They eats dinner." という文で試してみた。LanguageTool は期待どおりに動いた。Harper はそうではなかった。どちらも文末のピリオド後にスペースを 2 つ入れることについては指摘した
私たちは Chrome の組み込み LLM を使って、ローカルで動作する文法チェック拡張を作っている。ここで試せる。LLM は文の誤りだけでなく、たとえば "The first US President was Ben Franklin" を "George Washington" に直すこともできる
Apple ではネットワーク接続を行うには network client entitlements を付与する必要があるが、サンドボックス化されていなければこの制約は適用されない。私は自分のマシンで直接ビルドしたものか、Mac App Store から入手したサンドボックスアプリしか使わないようにしている 関連ドキュメント
1件のコメント
Hacker Newsの意見
スクリーンショットに(修正後の)例文が見える: "Sometimes I still make mistakes with articles and prepositions, but my grammar is getting better every day I practice" という文がある。アメリカ英語/簡略化された英語ではこの文は文法的に正しい。しかし、いわゆる "full fat" なイギリス英語では
practiceは名詞で、practiseが動詞だ。たとえば "I go to my practice to practise medicine" のように使う。このウェブサイトの問題は、周辺的な論点ばかりに注目している点だと思う。製品が私のプライバシーを尊重すること、性能が良いこと、インターネット接続を要求しないこと、さまざまなアプリで動くこと、価格が透明であること――これらはすべて良い。だが、私が本当に重要だと考えるのは、この製品が常に正しい文法を適用するかどうかだ。このウェブサイトはその点についてまったく納得させてくれないつまり結論として、このツールは American English 側に偏っていて、
practiseのような非標準語をcolourのようにスペルミスとして扱う。もしアメリカ人向けの文章でそういう単語を使い、しかもあなたが英連邦出身でないなら、かえって尊大に見えるかもしれないAmerican English を "簡略化された(simplified)" 英語と呼ぶのは、典型的な誤った言語学だ。単に別の方言であるだけで、本質的により単純でも複雑でもない
言いたいことはよく分かる。"full fat" 英語という表現に関連して言えば、英語そのものがもともとかなりごちゃ混ぜで、新しい国々で広く使われるようになるにつれてさらに複雑になってきた。文章がきちんと書かれていて、明確に理解できるなら、15ドルの製品としては十分だと思う。この製品の目的は contemporary Oxford English に完璧に従うことではないはずだ
以前 anthony_franco が書いたとても良いコメントを思い出した。多くのオープンソース代替ソリューションは、「コンテンツ提供者」だけのために問題を解くことに集中している。実際のユーザーはコンテンツそのものに関心がある。Product Hunt の代替を目指した OpenHunt も同じだった。さまざまなサービスの「自由で、オープン」な版を作ろうという試みはあるが、大多数のユーザーは実のところあまり気にしていない。voat(Reddit 代替)、app.net(Twitter)、Diaspora(Facebook)、ycreject.com(Y Combinator 代替)などはいずれも、実ユーザーのニーズや体験の面で不足していた。もし無料でオープンであることに加えて、既存の代替品よりも優れた体験を提供できるなら、大きく成功できる。しかし大半はその部分で失敗する 関連コメント
たとえば "Is there a educational discount?" という文があるが、正しくは "an educational discount" だ。このツールがこうした誤りをきちんと検出できるのか気になる
別製品の LanguageTool や Harper と比較した経験がある人はいるだろうか。LanguageTool はローカルホスティングができ、Harper は拡張機能として動く。スペルや文法チェックのレベルが比較的どうなのか気になる
どちらのソリューションも FOSS(自由でオープンソースのソフトウェア)だ。参考までに LanguageTool と Harper のリンクを置いておく
私は何年も前から LanguageTool Server を ngrams オプション付きで使っている。ngrams を使うと本当に優秀で、ないとまあまあ程度だ。英語専用の ngrams データには 15GB ほどのストレージが必要になる。Windows のタスク スケジューラで、以下のようなバッチファイルから起動すればよい
参考: n-gram データの活用法
"Look Dick. See Jane. Jane run home. I says you go home to. They eats dinner." という文で試してみた。LanguageTool は期待どおりに動いた。Harper はそうではなかった。どちらも文末のピリオド後にスペースを 2 つ入れることについては指摘した
私たちは Chrome の組み込み LLM を使って、ローカルで動作する文法チェック拡張を作っている。ここで試せる。LLM は文の誤りだけでなく、たとえば "The first US President was Ben Franklin" を "George Washington" に直すこともできる
ソフトウェアがときどき keylogger のように振る舞ってしまう可能性を完全に排除することはできない。もしそういうことが起きたら(意図的でなくても)、著者が直接責任を負うべきではないかと思う。法的に見ると、プライバシー保護の責任を負う実体そのものが存在しない。だから信頼する理由が乏しいと思う privacy policy
技術的にも信頼する理由がない。このアプリはサンドボックス化されていない。CLI で以下のように確認できる:
Apple ではネットワーク接続を行うには network client entitlements を付与する必要があるが、サンドボックス化されていなければこの制約は適用されない。私は自分のマシンで直接ビルドしたものか、Mac App Store から入手したサンドボックスアプリしか使わないようにしている 関連ドキュメント
実際のところ、こうしたリスクはあらゆるソフトウェアに当てはまる。たとえば Grammarly もすでにデータをサーバーへ送信できる
誰かがまさにこういう製品を作ってくれるのを待っていた。最初に使ってみた感触ではかなりよく動く。複数の言語が混ざっていても良い修正提案をしてくれる。fluency の提案はやや期待外れだった。文の前後に引用符を入れろといった妙な提案も多い。Refine が動作しているとテキスト入力がときどき止まったり、修正案を選ぶとアプリが 0.5 秒ほど固まったりするなど、応答性の問題がある。こうした問題は Grammarly や LanguageTool では起きない。そして Refine が見逃す文法ミスもある(例: 動詞の一致の問題)。それでも初回リリースとしては非常に印象的で、今後が楽しみだ
LanguageTool はオープンソースのスペル/文法チェックツールだ。Grammarly と違って AI よりもルールベースで動作する。私はこの 2 つを併用している。セルフホストの方法は ここで紹介されている
私は Linux ユーザーだが、こういう「一般向けツール」なら Windows を先に出す方が自然だと思う。macOS 専用リリースでは、かえって市場全体の 15% 未満にしか対応できない(米国基準でも 30% 未満)。開発者だけを狙うとしても、Mac、Windows、Linux の 3 プラットフォームの中でいちばん損な選択だ 市場シェア参考 StatCounter
LanguageTool は docker container としてローカルで使える LocalLanguageTool GitHub リンク
本当に多くの人が些細なことを複雑にしすぎている気がする。LanguageTool を動かすのに docker(Linux ベースの技術)まで使う必要はなく、単に Java アプリとして実行すればいい。次のように簡単に起動できる
多くの人は docker コンテナを扱うより、15ドル払う方を好む
Flatpak でも簡単にインストールできる Eloquent by sonnyp。Flatpak(GNOME Cgroups、Namespaces などによる制限)によって権限が制限されている:
Flatpak パッケージ自体が大きいのは Java の問題だ。Java はサーバーには向いているが、個人用 PC にはいまひとつだ。もし C、C++、または Rust で作られていたなら、すでに LibreOffice ベースに載っていたはずだ。Sonny Piers は有名な GNOME 理事会出身のパッケージャーだ
「ローカル AI モデルベース」であることで、AI 盗用検出器(Turnitin など)に自分の文章が引っかかるリスクが高まらないか心配だ。十分なテストがないなら、そのリスクは負えない
私はそのリスクは大きくないと思う。このツールは文章を代筆するのではなく、単に文法だけを修正する方式だからだ。自分で 99% 書いていて、文法だけを直すのであれば、検出に引っかかる理由はないと思う。ただ、LLM 導入後の学校環境に実際にいたわけではないので断言はできない
句読点を正しく使うと、かえって AI が書いたものとして検出されるリスクが高まるという話もある。だから私は絶対に句読点をきちんと使わない
FAQ に "Apple Intelligence Writing Tools との相対比較" への言及がまったくないのは妙だ。refine の方が優れている、あるいは機能が多いのかもしれないが、Mac のシステムレベル機能が存在すること自体をページで認めていないのは惜しい
別の代替として Harper に触れる価値もある Harper リンク
a/anのような不定冠詞の欠落、そしてdon;tのような明白なタイプミスさえ検出できない