25 ポイント 投稿者 xguru 2025-10-18 | 2件のコメント | WhatsAppで共有
  • SwiftUIで実装されたネイティブmacOSアプリで、画面を 1 FPSで記録し、15分ごとにAI分析を行って自動で タイムラインと要約 を生成
    • タイムラプスを再生して、1日の流れを視覚的に見直すことが可能
  • 25MBのアプリサイズ~100MB RAM<1% CPU 使用を目標に、軽量・低負荷を志向し、分散要素のないローカル中心のUX を提供
  • AIは Gemini(自身のキーを入力) および ローカルモデル(Ollama・LM Studio) を選んで処理可能
  • 録画データは 3日間保管後に自動整理 され、リソース管理の最適化とプライバシー保護を実現
  • Coming Soon
    • 無限にカスタマイズ可能なダッシュボード : 任意の質問を投げると、結果をタイル化して継続的に追跡可能
    • デイリージャーナル : ハイライトの振り返りガイドプロンプトの反映、スクリーンショットとノートをタイムラインとともに記録
  • 動作方式
    • Capture: 画面を 1 FPS15秒断片 単位で録画
    • Analyze: 15分ごとに 最近の断片を 選択したAIプロバイダー に送って分析を実行
    • Generate: 活動の 要約カード を生成して時系列のタイムラインを構成
    • Display: 視覚的タイムライン UIで1日の流れを表示
    • Cleanup: 3日経過した録画の自動削除 で保存領域を管理

2件のコメント

 
oh3vci 2025-10-21

ローカルで使ってみていますが、韓国語はうまく解析できていないようでした。記録される内容を見ると、英語で書かれていた部分だけが記録されているようでした。

 
GN⁺ 2025-10-18
Hacker Newsの意見
  • この製品は、弁護士や時間単位で請求する専門職に売ると良い反応が得られそう。1日の中で見落とした業務を復元して、請求漏れを防げるため、高い価格を支払う可能性がある

    • 一方で、これを使うと弁護士が実際には時間のわりにどれだけ働いていないかも明らかになるかもしれないと思う
    • 私もソフトウェア契約者として、こういう機能をずっと求めていた。今Linuxで簡単なプロトタイプを作っている
    • イギリスでは時間単位ではなく、6分単位で請求する。職業文化がよく表れている
  • 良い製品だと思う! 私は今、PCでの作業追跡にActivityWatchを使っている
    こういうソフトウェアに期待する点は次の通り

    • 注意散漫の起点を見つける機能。たとえば、特定のメールを確認しようとしてメールウィンドウを開いたのに、関係ないメールまで見てしまって5〜15分ほど脱線することがある。この情報があれば、注意散漫を減らすための行動につながる。たとえばYouTubeのおすすめ動画を隠すプラグインを入れたら、実際に気が散ることが減った。使っていないウィンドウを全部閉じて、他のことに目が向かないようにもしている
    • 繰り返し発生する業務とその周期の把握。たとえば、特定の例外ケースについて毎週1回、ほぼ同じやり方で請求書を手作業で作っているなら、自動化できないか考えられる
    • 作業の前・最中・後の気分状態を記録すること。これが最も広くて定義しにくい問いだが、先延ばしの改善や仕事の着手を容易にするうえで大きな可能性があると思う
    • 人それぞれの注意散漫パターンを理解する助けになる機能があると本当に良い。私も同じくYouTube拡張機能を使っている
  • こういう製品はADHDのある人にも大きく役立ちそうだとすぐに思った
    何が注意散漫を引き起こすのか、どんな反復パターンがあるのか把握できる(例: git commitのたびにHacker Newsを開いて15分無駄にする)
    自動で記録してくれた履歴を振り返れるのが本当に大きい。以前、TimeRescueで顧客向けの作業時間を正確に測るのに大きな成功体験があった
    ただ、手動入力が必要なツールは、いつも集中を妨げるか、使うのを忘れてしまって長続きしない
    もう一歩進めて、リアルタイムで(処理遅延は考慮するとして)自分が脱線していることを知らせてくれる機能があればいいと思う。ユーザーが脱線の定義を自分で決めたり、フィードバックで徐々に賢くなったりする仕組みも考えられる
    製品としてとても魅力的だと思うし、Windows Recallのようなアイデアは好きだったので、プライバシー重視のこの製品は好ましい

  • 製品コンセプトはとても気に入っているが、開発者のGitHubがほぼ空だった状態から、突然、簡単にスパイウェアにもなり得るアプリを出したのは心配だ。特にパスワードなどセキュリティ面が気になる

    • すでにGitHubにソースがあるなら、プロフィールを気にするより、直接コードを確認すれば懸念は簡単に解消できる
  • 私は銀行情報やパスワードなどの機密データをGeminiに送るのは抵抗がある
    ローカルモデルを使ったときにパフォーマンスがどれくらい違うのか気になる

    • 自分の経験と評価に基づいて等級を付けるなら、Gemini 2.5 proはA-、qwen2.5vlはB-/C+くらい。結果が常に決定的ではないので、品質保証が難しい
      最新の論文を見ると、distillation手法によってローカルモデルでもSOTA性能が可能らしいので、その方向で自分でも実験する予定だ
    • エンタープライズ版ではない通常のGeminiを使うなら、プロンプトと応答に含まれる機密情報は100%Googleに露出する
    • Googleはすでに私のメール、ブラウザ、スマートフォンOS、一部のパスワードまで持っているので、実質的に私の機密データはすべて抜かれている前提だ
    • 本来、パスワードは画面に表示されず、パスワードマネージャーから直接マスクされた入力欄に入るので、画面上には出ないはずだ
  • screenpipeと似たコンセプト。screenpipeのほうがカスタマイズ性は高い
    github.com/mediar-ai/screenpipe

    • screenpipeの創業者です。こういう製品がもっと増えるのは歓迎したい。OSSで、ローカルで、ベンダーロックインがなく、API/MCPフレンドリーなのが理想
      惜しいのは今のところmacOSしか対応していないこと。私は最近ほとんどWindowsを使っている
  • 素晴らしいプロジェクト! Rewindで似たような体験をしたことがあり、プライバシー面の懸念があった
    参考までに、RewindはOCRをローカルで処理して、テキストデータだけを送信する
    macOSに集中するなら、VNRecognizeTextRequestを活用して複雑なOCR工程を省ける
    特にクラウドベースのAIを使うなら、BERTのような軽量モデルで機密情報を検出してマスキングできる

    • VNRecognizeTextRequestは知らなかったが、本当にすごい。紹介してくれてありがとう
  • Zoomやビデオ会議中に、録画ではなくキャプチャをする場合、法的に「録画」していることを通知する必要があるのだろうか
    ライブ字幕や文字起こし機能があっても法的要件が変わるのか知りたい

    • 私の州では、自分が録画していることを知らせずにZoom画面をキャプチャするのは、おおむね違法だ。正確ではないかもしれないが、要点はAI要約かどうかではなく、1fpsの動画保存に当たるかどうかだ
  • この製品は本当に良い。従来のタイムトラッカーを自分で使うより、はるかに認知負荷が低い
    ローカルオプションとBYO key(自前キー持ち込み)オプションがあり、プライバシー面の選択肢があるのも気に入っている
    こういう形の製品はもっと早く出ていてもよかったと思うし、今回は本当にうまく作られている感じがする

  • 私もローカルモデルだけで使うつもりだ。本当に素晴らしい製品

    • 友人たちと私は、ローカル派とクラウド派が半々くらい。それぞれのプライバシー志向に応じて、品質かプライバシーかを選べるのが良い