3 ポイント 投稿者 GN⁺ 2024-03-17 | 1件のコメント | WhatsAppで共有
  • ダウンロード

    • TextSnatcherは、画像から簡単にテキストをコピーし、数秒でOCR処理を実行できるアプリケーション。
  • 特徴

    • 多言語対応。
    • 画像上をドラッグしてテキストをコピーする機能。
    • あらゆる画像の上でドラッグして貼り付け可能。
    • 高速で使いやすい。
    • 文字認識にTesseract OCR 4.xを使用。
    • Tesseractについてさらに詳しく知り、Tesseractプロジェクトにスターを付けて支援できる。
  • スクリーンキャスト

    • textsnatcher-eng.mp4
    • textsnatcher-tamil.mp4
  • スクリーンショット

    • アプリケーションのスクリーンショットを提供。
  • 支援する

    • 開発者を支援する方法を案内。
  • ソーシャルメディア投稿

    • LinkedInで、TextSnatcherを作った理由についての投稿を共有。
  • 依存関係

    • アプリケーションをインストールして実行する前に必要な依存関係の一覧を提供。
      • 実行時の依存関係: scrot, tesseract-ocr, tesseract 言語データ
      • ビルド時の依存関係: granite, gtk+-3.0, gobject-2.0, gdk-pixbuf-2.0, libhandy-1, libportal-0.5
  • インストール、ビルド、実行方法

    • GitHubリポジトリからTextSnatcherをクローンし、Mesonを使ってビルドおよびインストールするコマンドを提供。
  • インスピレーション

    • TextSnatcherのReadMe、アプリケーション構造、そしてMacOSアプリケーションであるTextSniperから着想を得ている。
    • Linuxのために❤️で作られている。

GN⁺の見解

  • TextSnatcherは、画像内のテキストを抽出する手軽なツールであり、特にLinuxユーザーにとって有用と思われる。
  • OCR技術を使う他のアプリケーションと比べても、Tesseract OCRエンジンを採用することで、高い認識率と多言語対応という利点を提供している。
  • オープンソースプロジェクトとして、開発者がコードをレビューし貢献できる機会を提供し、コミュニティの支援を受けて継続的に改善されうる。
  • ユーザー自身でビルドしてインストールする必要がある点は、一部の非技術系ユーザーには参入障壁となりうるが、これはLinuxコミュニティではよく見られる慣行でもある。
  • この技術を導入する際には、依存関係の管理とシステム互換性を考慮する必要があり、オープンソースであるためセキュリティと安定性に関する継続的なアップデートも期待できる。

1件のコメント

 
GN⁺ 2024-03-17
Hacker Newsのコメント
  • スクリプトの使用と修正に関するコメント:

    • あるユーザーによると、Dibby053 が StackOverflow からコピーしたスクリプトを使っており、KDE、GNOME、Wayland、X11 で動作するよう調整したとのこと。状態通知機能も追加したという。
    • このスクリプトは tesseract-ocrimagemagick などの依存関係があり、ユーザー環境に応じて異なるツールでスクリーンショットを撮り、画像品質を高めてテキスト認識率を向上させたうえで、クリップボードにコピーする流れだという。
  • Tesseract の有効性に関するコメント:

    • あるユーザーは、Tesseract が本当に最先端技術なのか疑問を呈し、特に低解像度のスキャン画像では英語以外のテキストを正確に変換できないという経験を共有したという。
    • 別のユーザーは Windows ユーザー向けに Microsoft PowerToys のスクリーンショットツールを勧め、便利なショートカットキーを強調したという。
    • あるユーザーは、過去に Tesseract を使った際の経験が期待外れだったとして、手動の後処理がほとんど不要なほど技術が改善されたのか気になっていると述べたという。
    • あるユーザーは Flatpak アプリとして試してみて、結果は完璧ではないものの、きれいなテキストであればたいてい問題なく認識されると評価したという。
  • 他プラットフォームにおける類似ソリューションに関するコメント:

    • macOS ユーザー向けの OCR ツールと、その開発者に対する肯定的な評価があったという。
    • iOS には、スクリーンショットを撮ってテキストを抽出し翻訳するショートカットを使う解決策があるという。また、最新の iOS バージョンでは写真アプリ内で画像中のテキストを直接選択してコピーできるという。
  • Linux デスクトップ向けソリューションに関するコメント:

    • あるユーザーは Flatpak アプリに言及し、すべての Linux ディストリビューションが Flatpak をサポートしているわけではないが、Fedora の仮想マシンで試してみるつもりだと述べたという。Tesseract を活用するさまざまなツールはあるものの、画像にノイズが多かったりテキストが歪んでいたりすると性能は良くないと評価したという。