真にオープンな基盤上でアクセシビリティツールを構築する
Allen AI は、キーボードユーザーの視点でウェブページをナビゲートし、実際の画面内容を検証する「PointCheck」という独立プロジェクトを通じて、Molmo や Olmo 3 などのオープンソースモデルを活用したウェブアクセシビリティツールの構築事例を発表しました。
Allen AI は、キーボードユーザーの視点でウェブページをナビゲートし、実際の画面内容を検証する「PointCheck」という独立プロジェクトを通じて、Molmo や Olmo 3 などのオープンソースモデルを活用したウェブアクセシビリティツールの構築事例を発表しました。
重要度スコアの内訳、キーポイント、影響分析、編集コメントをプレミアムで公開中。
続きを日本語で読む
無料登録で1日5記事まで読めます。プレミアムなら無制限。
7日間の無料トライアル ・ いつでもキャンセル可能
関連記事
ホーム向け Gemini でサービスプロバイダーとハードウェアパートナーを支援
Google は、高度なカメラ知能や自然言語クエリ機能を統合したフルスタックの Gemini AI オファリングを開始し、スマートホームエコシステムを拡大する。これにより、サービスプロバイダーやハードウェアメーカーは、ブランド付きの予防的サービス構築に必要な参考設計と API を利用できるようになる。
[AINews] Google I/O 2026:Gemini 3.5 Flash、Omni(動画用 NanoBanana)、Spark(背景エージェント)、Antigravity 2.0 の発表
Google は I/O 2026 で、音声・動画・画像処理に特化した新モデル「Gemini Live」「Omni」「Pics/Flow」や背景エージェント「Spark」、および「Antigravity 2.0」を発表し、業界をリードする多モーダル技術の進展を示した。
メタ、音声モードとメガネ搭載の「Muse Spark」を公開へ
メタは自社サービス全体で基盤モデル「Muse Spark」を活用し、音声応答の高速化やスマートなショッピング支援、カメラによるリアルタイム視覚認識機能を追加する。この機能はまず米国とカナダのユーザー向けに展開される。