1 ポイント 投稿者 GN⁺ 2023-11-16 | 1件のコメント | WhatsAppで共有

GPT の構成方法

  • GPT は ChatGPT の名前付き設定で、名前、ロゴ、短い説明を含む。
  • GPT の振る舞いを指示するカスタム指示が含まれ、これは「システムプロンプト」と同等である。
  • 会話を始めるために使える最大 4 つの例示プロンプトを任意で提供できる。
  • 追加のコンテキストを提供し、回答生成を助けるために複数のファイルをアップロードできる。
  • Code Interpreter、Browse モード、DALL-E 3 を有効または無効にできる。
  • GPT が呼び出せる API エンドポイントである任意の「Actions」を設定できる。

GPT ビルダーの動作方式

  • GPT ビルダーは、ユーザーとの会話を通じて GPT を自動生成するチャットボットである。
  • 「Create」タブは、ユーザーが会話を通じて GPT を生成できるようにするが、実際には「Configure」フォームを自動入力している。
  • 多くの人が、最初の GPT を作成した後は「Create」タブを避けることを勧めている。

GPT の興味深い例

  • Dejargonizer: 専門用語を解釈してくれる GPT で、テキストを分析して専門用語を定義する。
  • JavaScript Code Interpreter: JavaScript コードを実行できる GPT で、Deno ランタイムを添付して使用する。
  • Dependency Chat: GitHub プロジェクトの依存関係ドキュメントを分析し、関連する質問に答える。
  • Add a walrus: 画像にセイウチを追加する GPT で、GPT-Vision と DALL-E を使う。
  • Animal Chefs: 動物シェフが個人的な話とともにレシピを提供する GPT。
  • Talk to the datasette.io database: SQL クエリを実行して質問に答える GPT。
  • Just GPT-4: すべての追加機能を無効化し、純粋な GPT-4 体験を提供する GPT。

GPT の知識機能

  • ファイルを GPT に添付すると、そのファイルを使って質問に答えようとする。
  • Retrieval Augmented Generation(RAG) の実装とみられる。
  • OpenAI はこの機能について詳しい情報を共有しておらず、ユーザーは効果的に使うのに苦労している。

GPT の課金モデル

  • GPT は月額 $20 の ChatGPT Plus 加入者のみが利用できるため、配布に制限がある。
  • ユーザーが自分の API キーを提供しなくても、OpenAI プラットフォームを基盤としたプロジェクトを公開できる。

プロンプトのセキュリティと公開の重要性

  • ユーザーが十分に工夫すれば、GPT に追加された文書やプロンプトが漏えいする可能性がある。
  • プロンプトは漏えいするものと想定し、むしろ公開したほうがよい。

今後の GPT への期待

  • 知識機能のよりよいドキュメント化、API アクセス性、非加入者にも GPT を提供できる方法、予算上限の設定などを含む改善が期待される。

GN⁺ の意見

この記事で最も重要なのは、GPTs の新しい機能と可能性を探っている点であり、これはソフトウェアエンジニアリングと人工知能分野に携わる人々にとって興味深いテーマである。ユーザーが自分専用の GPT を作成し、他のユーザーと相互作用できる機能は、カスタムな対話型インターフェースを構築する新しい方法を提示している。また、コード実行、文書検索、画像生成など多様な機能を統合して、ユーザー体験を向上させられる可能性を示している。

1件のコメント

 
GN⁺ 2023-11-16
Hacker Newsの意見
  • GPTユーザーとして、プロンプトを見られないならGPTは使いたくないのだと気づいた。見知らぬ誰かが、私の知識なしに奇妙な挙動を注入できるChatGPTを使いたくはない。
    • OpenAIにはGPTに「ソースを表示」オプションを追加してほしい。デフォルトで「オン」であるべきだと思うが、これは不人気な判断かもしれないとも想像している。
  • GPTベースのチャットボットは避ける傾向がある。自分の知らないカスタム指示に従って微妙に操作されるのは望まない。
    • 「ソースを表示」オプションの追加は、この機能を「いまひとつ」から「お金を払う価値があるもの」へ変えるだろう。
    • ほとんどの時間をKagiの利用に費やしているのでGPT Plusを解約することを検討しているが、こうした変更があれば購読を続ける気になるだろう。
  • OpenAIの新機能を知る方法:
    1. Twitterで大げさに新しいものを発表する見出しをざっと眺める
    2. Twitterのインフルエンサーたちから、その件についての圧倒的な数のツイートを受け取る
    3. 無視して、simonwが説明するまで待つ
    4. simonwがすでにさまざまな方法で機能を試し、明快な説明と批評を書いたブログ記事を読む。するとすべてがすぐ理解できる。
  • 「単にChatGPTに事前プロンプトがあるだけ」というのは事実だ。
    • 「単にUIの良いCustom Instructions」だというのも事実だ。
    • しかし、「良いUI」が世界を変えるほどの影響を持つことを決して過小評価してはいけない。GPT-3は何年も前から利用可能だったが、良いUIが作られるまでは、ほとんど誰もそれを知らず、気にも留めていなかった。
    • これはユーザビリティ上の「小さな調整」のように見えるが、同様に「量子的飛躍」級の影響を持っている。
  • GPT/AIについてよく意見を求めてくる人がいる。使ったことがあるのかと聞くと「いいえ」。 「無料だと知っていますか?」 「はい」。こうした態度は理解しがたい。未知への恐れなのか? 怠惰なのか? 何かを試す前に社会的証明を求めているのか?
  • OpenAIのプロンプトは見ることができず、おそらく作者も見られないのだろうが、それでもOpenAIのGPTを使いたい。
    • ここにはかなり大きな信頼の飛躍がある。OpenAIが信頼性や一貫性に向けた具体的なロードマップを持っているのか気になる。
  • Custom GPT Builderのプロンプト全文を持っている: [GitHubリンクあり]
  • simonwがこれらすべてをリアルタイムで文書化し、理解しやすくアクセスしやすいツール群(llmコマンドラインなど)を作ってくれたことへの感謝を表したい。
    • 検索APIが適切な引用を出せず、うまく機能していないように見えたが、自分だけではないと分かってよかった。
  • OpenAIがRAGの「知識ベース」機能をどう実装したのか、もっと知りたい。ただ、詳細が足りない。
    • grugbrain.devの全文をアップロードして、とても理にかなったgrug brainと会話できた: [OpenAIチャットリンクあり]
  • 最近「synbiogpt」を作っていて、そこでcustom GPTの限界に気づいた。
    • 生物学的シーケンスデータは通常とても長い。ファイル内のデータは問題ないが、高度な機能(たとえばコドン最適化)のためにAPIとやり取りする必要がある場合、このデータをネットワーク経由で送らなければならない。するとAPI呼び出しのコンテキストウィンドウがシーケンスデータで埋まり、失敗してしまう。
    • 依存関係を注入できない。ときどきGPTは独自実装を試みるが、多くの場合それは間違っている。
    • GPT-4が自分は何について話しているのか分かっていると思い込むと、検索APIはしばしばファイルを開けない。遺伝子の一部について話すとき、GPT-4が想定している部分ではなく、自分のライブラリ内の特定の部分について非常に具体的に扱いたい。
    • 独自のluaスクリプト環境を作ることで、問題の大半を解決した(生物学的機能はgolang側にあり、lua環境の実行にはgopher-luaを使っている)。スクリプト機能の使い方を示すluaの例と、現在の小さな遺伝子部分ライブラリを注入し、与えられたファイルに対して特定の処理を行うluaを生成するよう依頼する。GPT-4はファイルをまったく見ず、内部のgolangアプリがスクリプト化されたluaを実行する。この方法は非常にうまく機能し、custom GPTよりはるかに高速だ。
    • 現在最大の問題はフロントエンド部分だ。添付ファイルを取り出せて、初期ユーザー入力を編集できるオープンソースのChatGPTクローンが欲しい。今のところ良い選択肢は見つかっていない。
  • RAGを使ってより良い結果を得る方法について。
    • これに関してはいくつか成功している。
    • Assistant APIを使っているが、これはGPTとは同じではないと考えている。Webインターフェース経由でこれを試した。
    • TesseractでOCR処理した100個以上のPDFファイルを持っている。その後、ChatGPTに、レイアウトを保ったまますべてのファイルを単一のtxtファイルに結合するスクリプトを書かせた。
    • ファイルをアップロードして質問を始めた。ファイルには英語ではない建築規則に関する非常に技術的なデータが含まれており、モデルはその種の言語に慣れていないはずだ。
    • それでも結果は驚くほど良かった。質問への回答は可能で、その答えも良かった。回答の出典に注釈を付ける必要があるが、それはうまく機能しなかった。
    • PDF、JSONファイル、CSVなどをアップロードしてみた。今のところ、生のテキストが最もうまく機能する。
  • 「知識」RAG機能についてのメモは興味深い。
    • 会話や経験から、人々はRAG検索がビジネスやデータモデルに非常に強く依存していることを見いだしている。ここに万能な解決策はない。CMSにおける顧客の次のステップは、スキーマを基にSQLを生成することとは異なるし、ECカタログで買い物をすることとも違う。
    • 基本的には検索に関する問題だ。実際にはもっと難しい。こうした問題は悪名高いほど難しい。