#ビジョン言語モデル のAIニュース
3件の記事
コスト最適化されたドキュメント処理のために Amazon Nova 2 Lite と Claude を組み合わせる方法
AWS は、Amazon Nova 2 Lite と Anthropic の Claude Sonnet 4.6 を組み合わせて、スキャンした年鑑ページから写真と名前を正確に抽出し、関連付ける効率的なドキュメント処理ソリューションを発表しました。
AWS Machine Learning Blog·6月30日·★★★★
AI2の完全オープンなウェブエージェントMolmoWeb、スクリーンショットのみでウェブを操作
AI2は、スクリーンショットのみでウェブサイトを操作する完全オープンなウェブエージェント「MolmoWeb」を発表した。40億および80億パラメータの小型モデルながら、標準ベンチマークで多くの大規模専有システムを上回った。
The Decoder·3月26日·★★★★
ビジョン言語モデルを用いたデータアノテーションの拡張による物理AIシステムの強化
Bedrock RoboticsはAWSと連携し、建設現場の映像を分析・ラベル生成するビジョン言語モデルを活用し、物理AIシステムのデータアノテーション効率を向上させています。
AWS Machine Learning Blog·2月24日·★★★★