◀ 前年 | ◁ 前月 | << 前週 | < 前日 | 2026-02-18 | 翌日 > | 翌週 >> | 翌月 ▷ 21 SkillsBench: 多様なタスクにおけるエージェントスキルの性能を評価するベンチマーク (arxiv.org) LLMエージェント向けベンチマーク「SkillsBench」は、11分野84タスクでスキルの有効性を評価し、キュレーション済みスキルが平均16.2ポイント性能を改善する一方、自己生成スキルにはほぼ効果がないことを示した。 3 ポイント 投稿者 GN⁺ 2026-02-18 | 1件のコメント 22 Triforceの復活 (dolphin-emu.org) DolphinがGameCubeベースのアーケード基板Triforceを正式対応し、SegabootやJVS I/O、マルチキャビネットネットワークまで再現した。 5 ポイント 投稿者 GN⁺ 2026-02-18 | 2件のコメント