5 ポイント 投稿者 GN⁺ 2024-01-04 | 1件のコメント | WhatsAppで共有
  • MacでCLIまたはPythonを使って無料でOCRを実行する方法についての読者の質問に回答している。
  • Macでターミナル、CLI、Pythonを通じてローカルOCR「サービス」を無料でセットアップする方法を共有している。
  • Shortcuts アプリを開いて新しいショートカットを作成し、"Extract Text from Image" アクションをドラッグして画像からテキストを抽出するよう設定する。
  • "Shortcut Input" を選択し、"Copy to Clipboard" アクションを "Extract text from ..." アクションの下に配置する。
  • ショートカットに名前を付け、ターミナルで shortcuts run ocr-text -i <画像パス> コマンドを使ってOCRを実行できる。
  • Pythonでは subprocess モジュールを使ってOCRを実行し、結果を出力する。

GN⁺の意見

  • この記事は、MacユーザーがOCR機能を無料で使える方法を提供しており、文書作業の効率を高められる有用な情報を含んでいる。
  • ショートカットアプリを使った簡単な設定で画像内のテキストを抽出できるため、プログラミング知識のないユーザーでも簡単に利用できる。
  • Pythonによる自動化プロセスの実装方法も示しており、開発者にとっても魅力的な内容となっている。

1件のコメント

 
GN⁺ 2024-01-04
Hacker Newsの意見
  • AppleのVisionフレームワークに関する印象的な経験

    • 元の投稿者(OP)は、数万枚のスプレッドシートのスクリーンショットをOCR処理してPostgresデータベースに取り込む個人プロジェクトでAppleのVisionフレームワークを使用した。
    • macOSとNvidiaに互換性がないため、ほかのOCRのCPUベースの手法も試したが、Tesseractのようなツールはしばしば誤った結果を出した。
    • Visionフレームワークは、本人が見た中で最も高品質な結果を提供し、計算リソースの使用量も最も少なかった。
    • フレームワークの安定性には問題があったが、これはユーザーの実装方法によるエラーかもしれない。
    • RHetTbullのvision.pyとocrmacを組み合わせて使っており、i7 6700k Hackintoshでの性能に満足している。
    • プログラマーではないが、十分な時間があれば問題は解決できるものの、多くの時間がかかる。
  • Windowsでの類似した体験とMicrosoft PowerToysのOCRツール

    • 別のユーザーはWindowsで似た作業を試み、すでにインストールされていたMicrosoftのプロジェクトであるPowerToysに非常に優れたOCRツールが含まれていることを発見した。
    • Win+Shift+Tを押してスキャンする領域を選ぶと、テキストがクリップボードにコピーされる。
  • 無料で提供されるオープンソースOCRツール

    • あるユーザーが、CLIとUIの両方を提供する無料のオープンソースOCRツールを開発した。
  • Macアプリケーションの自動OCR機能

    • Safari、Preview、Notesなど、多くのMacアプリケーションは画像に対して自動でOCR処理を行い、画像内のテキストを簡単に選択して別の場所へコピー&ペーストできることを、あるユーザーが見つけた。
  • Mac向けの小さなOCRツールへの高評価

    • あるユーザーは、brew経由でMacbookにインストールした小さなOCRツールの熱烈なファンである。
  • Windows向けのおすすめOCRツール: PowerToysのText Extractor

    • WindowsユーザーにPowerToysのText Extractorを勧めるコメント。
  • macOS Venturaの標準OCR機能

    • macOS Ventura以降では、画像キャプチャUIに標準のOCR機能が統合されており、AirPrint対応スキャナーを使ってPDFにスキャンする際、右側のパネルにOCRチェックボックスが表示される。
  • PyXAを使ったテキスト抽出ソリューション

    • PyXAはVisionフレームワークを使って、一度に1枚以上の画像からテキストを抽出するソリューションを提供する。
    • パッケージの一部にすぎないため、一度きりの作業には大げさかもしれないが、選択肢として提示されている。
  • Raycastの画像内テキスト検索およびコピー機能

    • RaycastはmacOS専用で、画像内のテキストを検索し、そのテキストをコピーできる機能を備えている。
    • 公式デモ動画へのリンクが提供されている。
  • Apple Visionの「Copy Subject」機能に関する類似技術への問い合わせ

    • あるユーザーはApple Visionの「Copy Subject」機能に大きく依存しており、この機能の利用可能性が非常に限定的だと感じ、類似の技術について尋ねている。