ハルオンギ - AI音声感謝日記
(play.google.com)こんにちは。
AI技術が人々の日常に前向きな変化をもたらす、温かな道具になってほしいと願う開発者です。
日々の小さな記録と内省が積み重なって人生を変えるという思いから、
誰でも簡単に、そして継続して書ける感謝日記アプリ 『ハルオンギ』 を開発しました。
世の中にはすでに優れたAI日記アプリがたくさんありますが、単にテキストだけで慰めを得ることには限界があると感じました。
本当に友だちが隣で話しかけてくれるような 「声」 が必要でした。
そのため、最新のGeminiモデルを活用し、自然な音声フィードバックを実装しました。
[サービス紹介]
ハルオンギは、感謝日記を書くと、自分が選んだAIキャラクターがすぐに 「音声」 で共感と励ましの返信を届けてくれるアプリです。
[主な機能]
-
AI友だちからの音声返信:
日記を書いた直後に内容を分析し、音声でフィードバックを生成します。 -
個性豊かな3人のAI友だち:
-
明るくて温かい友だち 「ソナ」: 前向きなエネルギーが欲しいとき
-
落ち着いていて優しいメンター 「ヒョンジュン」: 成長のための助言が必要なとき
-
いつでも味方でいてくれる、ぬくもりあふれる 「スンジャおばあちゃん」: 温かい慰めと共感が必要なとき
-
-
データプライバシー:
- ユーザーが書いた日記の内容は AES256暗号化 を適用して安全に保管されます。
[技術スタック & 開発経験]
-
AI Model: Google Gemini 2.5 Flash Native Audio Preview
- テキスト生成後にTTSをつなぐ方式よりも、Native Audioモデルのほうがイントネーションや間(Pause)の面ではるかに自然でした。
- 特に 「スンジャおばあちゃん」 キャラクターの、温かくゆっくりした話し方を実装するのに効果的でした。
- プロンプトを調整しながら、各キャラクターのペルソナ、話速、間、口調、感情表現を細かく制御し、狙いどおりのキャラクター音声を作り出すことができました。
- OpenAIのGPT Realtime APIも検討しましたが、コスト効率($20.00 per 1M tokens)を考慮し、最終的にGeminiへ統合しました。
-
Cost Optimization:
- 音声出力トークンのコストはテキストより大幅に高いため($12.00 per 1M tokens)、システムプロンプトで応答の長さを制御する最適化プロセスが必要でした。
-
UI Workflow: Figma Dev Modeで開発効率を高めました。
- AIにFigmaのデザイン案やアセット情報をコンテキストとして一緒に渡すことで、UI実装作業がかなりスムーズになりました。
-
Backend: Supabase (DB, Auth), Railway (Fastify), Cloudflare R2 (File Storage)
-
Frontend: React Native (Expo), TypeScript
-
Dev Tools: Claude Code (Main), Cursor (Sub)
[締めくくり]
今日一日、少し心が疲れていると感じたら、ぜひ一度立ち寄ってみてください。
現在はAndroidでのみ利用できます。
ありがとうございます。
3件のコメント
App Storeでもリリースされました!
https://smplu.link/F8JwF
似たようなサービスを作って一人で使っているので、応援したくなります! 良いプロダクトになるといいですね。Native Audioに変えて、もう一度開発してみようと思います。
応援ありがとうございます(笑) Native Audioモデルの音声はかなり自然なので、使ってみると良い体験になると思います