- ChatGPT APIを使って、Hacker News(HN)のスレッドから書籍推薦を抽出する記事
- 著者は、タイトルに
bookという単語を含み、他ページへのリンクがないHNの約200件の投稿を分析
- 著者はGPT APIを使ってデータを分類し、情報をJSON形式で出力
- データはHacker News APIから取得し、著者はChat Completions APIを呼び出してテキストから書籍タイトル、著者、URLを抽出
- 上位50件の書籍推薦が一覧化され、AbelsonとSussmanの「Structure and Interpretation of Computer Programs」が最も多く推薦された
- APIが有効なJSONを返さないことが時々あり、特にChatGPTが
thanksというコメントに応答したり質問したりするときに見られた
- 著者はタイトルのない応答を破棄するようプロンプトを設計した。これは、ChatGPTが時々特定の書籍のタイトルなしで著者への言及だけを含めるため
- 5万7千件のコメント処理にはGPT 3.5 Turbo APIを使用し、費用は約40ドル発生
- 著者は、温度を0にしてもGPTの結果が呼び出しごとに異なり、以前のGPT-3モデルと比べて変動性が大きいことを発見
- 著者は、GPTがテキスト内のリンクを識別できる一方で、URLではなく切り詰められたリンクテキストを選ぶのを防ぐため、HTMLタグを削除する必要があることを発見
- 著者は、ChatGPTによるJSON出力と、この作業で使ったプロンプトの例を共有
- GPTによって生成された生データは、タイトル順にソートされ、追加分析のために共有された
- 著者は学習用の練習として、表のAmazon URLにAmazonアフィリエイトリンクを追加した
1件のコメント
Hacker Newsの意見
booksというキーワードを使ってHacker Newsで書籍推薦情報を検索し、プラットフォームで見つかった推薦情報の品質を称賛