- LlamaCloud: 新世代のマネージド型パーシング、収集、検索サービス。LLM と RAG アプリケーションに本番環境向けのコンテキスト拡張(Context-Augmentation)を提供するために設計されています
- LlamaParse: 表や図などのオブジェクトを含む複雑な文書をパースする技術。LlamaIndex と統合し、複雑かつ半構造化された文書に対する検索を構築できるようにします
- 管理型収集・検索 API: データを簡単に読み込み、処理、保存して、どの言語からでも利用可能な API を提供します。LlamaHub、LlamaParse、および統合されたデータストアを基盤に動作します
RAG はデータの質に依存する
- LLM の核心は、構造化されていないデータソースに対する知識検索、統合、抽出、計画の自動化にあります
- そのためにデータを読み込み、処理、埋め込み、ベクトルデータベースに読み込む新しいデータスタックとして Retrieval-Augmented Generation(RAG)が登場しました
- RAG スタックは従来の ETL スタックとは異なり、LLM システムの精度に直接影響します
- 始めることは簡単ですが、プロダクションレベルの RAG を構築するのは難しいです
- 満足のいく結果を生成しない
- 調整すべきパラメータが多すぎる
- PDF はフォーマットが崩れやすく、特に問題
- 継続的に更新されるデータの同期は非常に困難
- LlamaCloud と LlamaParse は、RAG アプリケーションをより迅速にプロダクションに導入するためにデータパイプラインとして構築されています
LlamaParse
- LlamaParse は、複雑な PDF 文書に含まれる表やチャートを RAG で解釈できる最先端のパーサーです
- 従来のアプローチでは不可能だった複雑な文書への質問に回答できるようになります
管理型収集・検索 API
- LlamaCloud のもう一つの主要製品として、優れたパフォーマンスのデータパイプラインを簡単に定義し、LLM アプリケーションにクリーンなデータを提供できます
- エンジニアリング時間の削減、パフォーマンス向上、システム複雑性低減の利点を提供
発表パートナーおよび協力パートナー
- LlamaParse は、DataStax、MongoDB、Qdrant、NVIDIA など、LLM および AI エコシステムのデータスタッ クとコンピューティングのパートナーシップを、複数のパートナーと連携して構築しています。
FAQ
- LlamaCloud はベクトルデータベースと競合しておらず、データのパースと取り込みに焦点を当てています。40 を超える有力なベクトル DB と統合されています
- 検索層は既存の保存システム上のオーケストレーションです
次のステップ
- LlamaParse は本日から公開プレビューで利用可能で、LlamaCloud は限定されたエンタープライズ設計パートナー向けにプライベートプレビューとして提供されます
1件のコメント
Hacker Newsの意見
LlamaParse開発チームの一員として、以前に複数のPDFから構造化テキストを抽出するツールを開発した経験がありますが、LlamaParseには他の抽出器よりも改善された点があります。文字抽出ではOCRとPDFの文字抽出を組み合わせ、文書再構成にはヒューリスティックと機械学習モデルを組み合わせて使用しています。再帰的な検索戦略と組み合わせることで、複雑なテキストに対する質問応答で最良の結果を得ることができます。
LlamaParseは、複雑な表を含むPDFを非常によく構造化されたMarkdown形式でパースする、かなり優れた独自のパースサービスを作成しました。オープンソースプロジェクトがコミュニティ貢献と注目を得た後、プロジェクトリーダーがVC資金を受けて独占的なものを作るのは問題ではありませんか?
Mediumに投稿する理由がわかりません。Mediumはもう読めなくなっているので、誰でもアクセスできるブログ記事があるべきです。
LlamaParseはunstructured.ioと直接比較するとどうでしょうか。
LlamaParseの初期体験はあまり良くありませんでした。メールでの登録時に無限リダイレクトの問題があり、Googleでサインインした後はPDFパーサにがっかりしました。すでにたくさんの選択肢があるのに、なぜこのサービスが必要なのかは疑問です。
LlamaParseは難しい問題を解決しようとしているようです。多くの企業ユーザーがPDFファイルをパースして正確にデータを抽出する必要があります。インターフェースがやや混乱しています。LlamaParseは表の数値を抽出できますが、出力は表形式で提供されず、質問応答を介してのみ数値にアクセスできるようです。
AWS Textractがやっていることと似ていないですか?テーブルやフォームから情報をパースしてクエリする機能があります。LIにはワークフローとRAG向けに検索履歴をユーザーにとって使いやすくしてくれますが、なぜ車輪を再発明するのか疑問です。
LLMSを使って最初から適切な形式でデータ抽出を行えるのになぜこれを構築する必要があるのでしょうか。コスト面では短期的には意味があるかもしれませんが、長期的にはLLMSで一般的に解決できる問題です。
LlamaParseはRAGで繰り返し直面していた問題をまさに解決しています。非構造化データから構造化された情報を取り出すのは難しいです。
価格はどうなるのか?