3 ポイント 投稿者 GN⁺ 2024-02-07 | 1件のコメント | WhatsAppで共有
  • LLMを活用して何を作っているのかという質問
  • 質問者は
    • Chrome拡張機能を開発中: YouTube動画でスポンサー区間をスキップするため、字幕を読む機能を実装
    • さまざまなプログラミング言語で関数呼び出しチェーンを説明する実験: MakeFile、Python、Bashを使い、LLMによる説明を試行
    • Telegramボットを運用: 税金関連の支援など、特定のコマンドを実行するようプロンプトを設定

1件のコメント

 
GN⁺ 2024-02-07
Hacker Newsのコメント
  • 営業が苦手なあるユーザーは、実際に近い形でコールドコールの練習ができるAIと通話できる電話番号を用意した。

    • このAIは営業電話をシミュレーションする。
    • そのユーザーは、AIとのハンズフリー通話が便利だと分かり、一般的な用途にも使っている。
    • 現在はオフラインだが、スタックとデプロイ情報を含むコードはGitHubで公開されている。
    • すべては35ドルのRaspberry Pi上で動作している。
  • 別のユーザーは、祖母のレシピをもとに料理本を「書く」作業を手伝った。

    • 祖母の100歳の誕生日に合わせて、父親が長年かけて集めた250ページ以上のレシピを復元した。
    • 一部はタイプライターで打たれ、別の一部は祖母の手書きだった。
    • 父親はタイプされたレシピをスキャンし、手書きのレシピは「口述」した。
    • Google OCRでスキャンしたレシピを処理し、GPT-4で整っていないレシピをきちんと整理されたMarkdown形式に変換した。
    • タイポやGoogle OCRの誤りも修正できた。
    • 整理されたテキストをすべてGoogleドキュメントに貼り付け、画像を追加した。
    • OpenAIの画像生成機能を使って、250以上のレシピの画像を生成した。
    • 一部は手作業でキュレーションする必要があり、特にメキシコ料理ではその傾向が強かった。
    • その結果、本はとても見栄えのよいものになり、家族にデジタルコピーを配布したところ皆が驚いた。
  • あるユーザーは、Apple Shortcutsを使ってOpenAIにHTTP POST API呼び出しを行い、MacOS上で作業を実行する「スタック」を構築した。

    • 各タスクはショートカット、またはAlfred経由のSpotlight入力で起動される。
    • YouTube URLの要約、テキストの文法やスタイルの修正、音声入力の代わりにOpenAI Whisperを使うことなど、さまざまな機能が含まれている。
    • そのユーザーは、LLMを繰り返し使う作業を見つけるたびにApple Shortcut化して、MacOSの機能のようにワークフローへ統合している。
  • 別のユーザーは、複数のハードウェア + LLMプロジェクトに取り組んでいる。

    • 実在するポケモンを認識するポケモン図鑑を作った。
    • オフィスで良いコメントをフィルタリングして印刷する仕組みを作った。
    • 古いインターホンに汎用チャットアシスタントを組み込んだ。
    • これらのプロジェクトは特別に実用的というわけではないが、どれも楽しい。
  • あるユーザーは、自分の経験やスキルについて質問できる対話型の履歴書AIチャットボットを作った。

    • バックエンドはPython FastAPIを使い、ChromaDBに履歴書とQ&Aペアを保存し、OpenAIとAirtableでリクエストとレスポンスを記録している。
    • UIにはSveltekitを使用している。
    • 現在は別のツールも作っており、Airtableの代わりにLangSmithを使う予定だ。
    • Substackの記事も執筆中で、これはブランド構築を助けるための #buildinpublic の取り組みの一環だ。
    • そのユーザーは9月から失業中で、市況が厳しい中、上記の取り組みに集中して雇用や契約を得たいと考えている。
  • 別のユーザーは、都市や町を巡る自律型ガイドツアーとオンライン宝探しの作成プロセスを自動化しようとしている。

    • 誰でもツアーを作って販売できる完全なマーケットプレイスを目指している。
    • ツアー作成のプロセスが非常に煩雑だからだ。
    • GPT-4に地域情報を与え、質問と多肢選択式の回答を作らせている。
    • フロントエンドにはReact Typescript、バックエンドには Linux 上の Net Core Web API、MySQL、EF Core、さらにGPT4とStripeの統合を使っている。
    • treasuretours.org でホスティングされている。
    • コストの問題から、現在AIツールにアクセスできるのはスーパーユーザーのみだが、一部AI生成の事前作成済みハントは試すことができる。
  • あるユーザーは製品づくりを始めたが、最終的にはLLMベース製品向けの開発プラットフォームを作ることになった。

    • 最初は株式分析ツールを作っていた。ユーザーが比較したい企業と期間を自然言語で書くと、グラフに株価が表示されるものだった。
    • 開発の過程で独特の課題を見つけ、製品は公開せず、開発プラットフォームの作業へ切り替えた。
    • 「LLM structured tasks」を使ってユーザー入力に対する処理を行い、バックエンドで扱えるJSONを出力している。
    • プロンプトは脆く、プロンプトやモデル設定の小さな変更でも簡単に壊れてしまう。
    • そこで、その助けになるプラットフォームを開発した。入力コレクション全体に対してプロンプトのバージョンとモデル設定をテストし、開発過程で問題が起きないようにしている。
    • promptotype.io で確認できる。
  • あるチームは、LLMを基盤にしたさまざまなデータツールを作っており、主力製品のリブランディングとローンチを進めている。

    • sketch、datadm、julyp など、さまざまなツールや製品を開発している。
    • さまざまなスタックやツールを使い、自前のツールも作ってきたが、最近はロジックを直接書いて製品に適用している。
    • 主力製品のコードはnextアプリにあり、vercelでデプロイされている。
  • あるユーザーは、コード生成用ボットを含め、いろいろなものを構築した。

    • 現在はAI模擬面接に取り組んでいる。LeetCode対策が嫌いで、対話を通じて学ぶほうが自分には合っていると感じている。
    • comp.lol はAI主導の模擬コーディング面接を提供している。アルファテスターを募集しており、無料枠ですべて動かしているため読み込みが遅いかもしれない。
  • 別のユーザーは、初期スクリーニングを行い、候補者情報を収集し、職務に関する質問に答え、複数の行動面接の質問をするAI採用アシスタントを作った。

    • VercelとOpenAIを使って1日で構築した。
    • Googleログインの設定が最も難しかった。
    • 何十人もの候補者が利用し、多くの時間を節約でき、会話を優先する助けになっている。
    • 昨日、短い記事を書いた。