- オープンソースの文法チェッカー。著名な商用サービスである Grammarly の代わりに使える製品
- 誰でも無料で利用でき、コードとアルゴリズムが透明性をもって公開されている
- 英語テキストの文法、スタイル、スペルの問題を自動検出・修正する機能を提供
- 開発者、作家、学生など幅広いユーザー層に適しており、自由なカスタマイズが可能
- サーバーのセルフホスティングやローカル実行が可能なため、プライバシーとデータ保護の面で利点がある
Harperの紹介
- Harper は Grammarly に似た機能を提供するオープンソースの文法・スタイルチェッカー
- 完全無料で提供されており、誰でも自由にソースコードを確認して活用できる
- スペルチェック、文法エラーの検出、スタイル改善の提案など、英語テキスト校正機能を実装
- ユーザーは Harper をローカルサーバーまたは自前のインフラに導入して、データプライバシーを強化できる
- 拡張性とカスタマイズ性に優れており、各自のニーズに合わせたアルゴリズム修正や機能追加が容易
主な機能と利点
- オープンソースプロジェクトなので、サービス依存なしに内部のアイデア管理や改善が可能
- 英語に最適化されているが、今後は多言語対応へ拡張できる可能性もある
- コミュニティによる支援が活発で、フィードバックや機能改善が盛んに行われている
- サーバーベース、または直接インストール方式で高い柔軟性を提供
想定ユーザーと活用例
- ソフトウェアエンジニア、技術文書作成者、学生など、英語ライティングの品質向上に関心のあるユーザーに適している
- 個人情報を外部サービスにさらさず、自前で文書校正プロセスを構築したい組織に有利
- カスタムルールやワークフロー統合など、高度なカスタマイズが必要な環境で効果的
2件のコメント
Hacker Newsのコメント
ほとんどの文書で Harper が 10ms 以内に提案を返せるという点について、10l や 10kg は慣れた単位として受け入れられるのに、なぜ 10ms には抵抗感があるのか不思議だという声
文法ルールがオープンソースのプログラムにハードコードされていて自分で修正できる方式のほうが、プロンプト調整や LLM の学習データに暗黙的にハードコードされている方式よりずっと好ましいという意見 Neovim 向けの LSP 設定がかなり良さそう Neovim 統合ドキュメント こういうツールこそ未来だと思う Automattic はこうした点をホームページで強調すべきだという提案
個人的には LLM を使っていないことが大きな利点だと感じる Grammarly は AI 機能が追加されてからますます不安定になり、1 時間前にはコンマを外せと言っていたのに、その次にはまた入れろと案内するなど、一貫性を失っている
LLM ベースの一般的なモデルは実際、句読点でしばしば混乱する。これがどれほど明確な欠点かは経験済みで、Grammarly のようなサービスがこの現象をそのまま放置しているのは不思議だ
この 1 年ほどで Grammarly と gboard の予測結果は非常にひどくなってしまった
LLM ベースで開発された似たようなツールがあるのか気になる LLM が常に優れているわけではないが、両方式の違いを比較してみるのは興味深い
句読点に関する提案が刻々と変わる様子は英語教師たちに似ている、という冗談めいた反応
LanguageTool(Grammarly の競合)もまたオープンソースで、ローカルで直接実行できる GitHub, Docker イメージ 自分は主に Docker コンテナでローカルに LanguageTool を動かしている Harper は詳しく使ったことはないが、以前から存在は知っていた。選択肢がいろいろあるのはうれしい Harper のウェブサイトでも、競合ツールの一つがローカルでも動作可能だという説明を明確に書いてほしいという希望
“Me and Jennifer went to have seen the ducks cousin.” でエラーがまったく検出されない状況 このように、ルールをもっと補強しないと Grammarly レベルには近づけないだろうという指摘
最初は印象的だったが、いろいろ試した結果、かなり基本的な誤りも拾えず、性能にばらつきがあるという結論
同様に “My name John. What your name? What day today?” も文法エラーとして検出されない
こうしたテスト文が何を意味しているのか疑問だという声
ダウンロードや拡張機能のインストール前に、デモやテストができるウェブサイトがあれば本当に便利だという意見 Firefox 拡張は このページ に誘導されるが、長いテキストを貼り付けるとハイライトが正常に動作しない問題がある
言語学習ツールに、なぜ LLM を活用しないのか気になる 言語の問題は LLM に 100% 任せられると思う ChatGPT が英語のミスをするのを見たことがないのか、という問い
Grammarly は AI 機能が強化されてから、“wasn't” を分割して “was trulyn't” のような奇妙な文まで提案するようになった 関連画像
LLM のミスは十分な頻度で目にしており、ときにはかなり突飛な提案もある もちろん大半は非常によく動くが、決して「信頼できる」水準にまでは達しておらず、むしろユーザーのミスをそのままなぞってしまう傾向すらある
この種の言語学習ツールは本質的に、言語を「実際に学ぶこと」を避けるために使われることが多いという指摘
Grammarly のターゲット市場が誰なのか気になる 英語を第 2 言語として使う専門職が対象なのだろうか、という疑問
コードコメントの文法チェックまで処理できる優れた LSP サーバーが提供されているという紹介 LSP ドキュメント
Automattic 製品である以上、成功したら Matt が利益のために台無しにするのではないかと心配で使うのをためらう様子
オープンソース(FOSS)なので、最悪の事態になっても最後の良いバージョンをコミュニティがフォークして開発を続けられるという反論
その事実(Automattic の製品であること)だけで使わないとする断固とした立場
ああっ、10lじゃなくて10L!