#vision language model のAIニュース
3件の記事
Google Search が thrift ショッピングとヴィンテージショッピングを向上させる5つの方法
Google は、検索機能を活用して thrift ショッピングやヴィンテージショッピングの質を高めるための5つの具体的な方法を発表した。
Google AI Blog·6月3日
Gemini がボルボの外部カメラを活用して駐車標識を解釈
Google とボルボは、I/O コンファレンスで発表し、AI アシスタント「Gemini」が次期 SUV「EX60」の外部カメラにアクセスできるようになると発表した。これにより、車両周囲の状況や駐車標識を所有者に説明・解釈する機能が追加される。
The Verge AI·5月20日·★★★★
エッジ環境におけるローカルVLMを用いたセキュアOCR:文法制約による構造化出力の実現
ABEJAの伊藤祐希氏が、エッジ環境でVision Language Modelを使用し、文法制約(JSON Schema)を適用することで、セキュアな構造化データ抽出が可能であることを検証した。
ABEJA Tech Blog·3月23日·★★★★