実際の人のようにテストを実行するSaaS
(windflow.run)こんにちは。以前の論文執筆に続いて、今回は開発関連で Show GN にまた投稿することになりました。
まず、このサービスを開発することになったきっかけを説明すると、私は8年以上ゲーム業界に従事しており、主にクライアント開発を進めていましたが、2024年末からは LLM TF チームで AI 関連の業務を行い、今年1月に退職しました。
おそらく私以外の方々もそうだと思いますが、私の場合は開発がとても好きで、会社の仕事をすること自体にも大きな楽しさを感じるほど良い会社でした。ただ、AI 関連の作業を多く進めるうちに作ってみたいアイデアがたくさん生まれ、新しい試みをしてみたくなって退職を決心しました。特に最近は、小規模で始めても十分に生産性が高くなったと考えています。
退職後に最初にリリースしたのが、今日ご紹介する Windflow です。
ゲーム会社では特に QA チームを専門的に運営しており、クライアント開発者も開発を進めるたびに毎回ビルドを行い、実環境でテストを繰り返し実施しなければならない苦労がありました。実際、開発よりテストのほうを多く行うほどでした。
新機能を開発したりバグを修正したりすると、毎回ストーリーボードを作成し、実際のリリース前に既存の重要機能に問題がないかを毎回確認する手順が非常に大変に感じられました。この問題は昔から解消しようとしてさまざまな方法を試してきました。TDD から、内部的にトリガーを注入してマクロ方式でテストを実行できるワークフローを書いたりもしました。
この問題を解決するために Windflow という SaaS を開発し、Windflow の特徴をご説明したいと思います。
Windflow で現在中核的に提供している機能は、大きく3つあります。
Autopilot、Focus Insights、Persona Builder です。
Autopilot は自然言語で動作するテストツールですが、selector/DOM ベースでは動作しません。
実際の画面を VLM が認識し、画面を制御すること自体もすべて LLM ベースで動作します。このコアがあるため、単に Web ページをテストするだけでなく、WebGL ベースの Web ゲームから、同じコアを使って Android/iOS のアプリやゲームも同様にテストを実行できます。
Focus Insights は VLM ベースで、実際の人の視線がどこに向くかを画像分析で示してくれるツールです。
Persona Builder は、上記2つの機能に注入可能な仮想ペルソナで、上記のテストシミュレーションを実行する仮想的な消費者主体を設定する機能です。
まだ至らない点が多く、磨き込むべき部分もたくさんあります。
この機能にご関心のある方は、elik@windflow.run までご連絡ください。実際にご利用いただいたうえでフィードバックをくださる方には、Basic プラン1か月無料クーポンをお送りします。
製品の利用とは別に、VLM ベースの画面認識、制御や仮想ペルソナといったテーマに関心のある方も、ご連絡いただければうれしいです。
site: https://windflow.run
まだコメントはありません。