#ai2 のAIニュース
3件の記事
Artificial Analysis が Ai2 の IFBench 評価指標を採用する理由
Artificial Analysis は、複雑な多段階のユーザー指示をモデルが確実に実行できるかという現実的な能力を捉えられるため、Ai2 が公開した IFBench 評価指標を利用している。
Allen AI (AI2)·5月11日·★★★★
AI2の完全オープンなウェブエージェントMolmoWeb、スクリーンショットのみでウェブを操作
AI2は、スクリーンショットのみでウェブサイトを操作する完全オープンなウェブエージェント「MolmoWeb」を発表した。40億および80億パラメータの小型モデルながら、標準ベンチマークで多くの大規模専有システムを上回った。
The Decoder·3月26日·★★★★
AI2のコンピュータ利用エージェントがオンラインで操作を実行可能に
AI2が開発したオープンソースのAIエージェントが、ユーザーの代わりにオンラインタスクを実行できるが、制限もある。
AI Business·3月25日