DeepEval - LLMのためのユニットテスト

xguru · 2023-08-19T10:03:01+09:00

基本理念は「Pytest for LLM」本番移行に向けて、LLMパイプラインに対するオフライン評価を実行するPythonらしい方法を提供 Pythonのユニットテストを書くように、LLMアプリケーション（RAGなど）向けのテストを作成可能 assert_llm_output を通じて、entailment / exact / bertscore などのメトリクスで回答を評価カスタムメトリクスの設定や既存メトリクスの修正も可能

(github.com/mr-gpt)

4 ポイント投稿者 xguru 2023-08-19 | まだコメントはありません。 | WhatsAppで共有

基本理念は「Pytest for LLM」
本番移行に向けて、LLMパイプラインに対するオフライン評価を実行するPythonらしい方法を提供
Pythonのユニットテストを書くように、LLMアプリケーション（RAGなど）向けのテストを作成可能
assert_llm_output を通じて、entailment / exact / bertscore などのメトリクスで回答を評価
カスタムメトリクスの設定や既存メトリクスの修正も可能

DeepEval - LLMのためのユニットテスト

関連記事

まだコメントはありません。