#多言語ai のAIニュース

12件の記事

QIMMA：品質重視のアラビア語LLMリーダーボード

開発チームは、アラビア語大規模言語モデルの性能を品質基準で評価するリーダーボード「QIMMA」を公開した。同ボードは、モデルの正確性と信頼性を最優先し、アラビア語処理能力を比較する。

研究者が合成データを活用して、高速で多言語対応の光学文字認識（OCR）モデルを開発した。この手法は、従来のデータ収集の課題を克服し、複数言語でのテキスト認識の効率化を実現している。

通義実験室が主催したイベントで、5人の開発者がAIを活用した実例を紹介した。具体的には、AIによる病歴管理ツール開発、農業育種への応用、多言語対応モデル「SEA-LION」、障がい者のコミュニケーション支援、高齢者向けAI教育など、多様な分野での実践事例が示された。

マイクロソフトがMAI-Transcribe-1を発表した。このモデルは、25言語で背景ノイズがあっても正確に音声をテキストに変換し、前モデルより2.5倍高速で1時間あたり0.36ドルのコストで動作する。マイクロソフトは既に自社製品でこのモデルを使用している。

Google AIチームは、24のアフリカ語に対応するオープン音声データセット「WAXAL」を公開し、低リソース言語の音声認識・合成モデル学習データを補完した。

研究者らは、14言語で検証可能な推論問題を手続き的に生成する「多言語推論ジム」を発表した。94のタスクテンプレートを10言語でネイティブ話者検証し、言語的自然さを確保した。

通義実験室が、自然言語指令で自由な表現を生成できる音声モデル「Fun-CosyVoice」を発表した。従来の固定ラベル制限を突破し、ユーザーが詳細な表現を直接指示できる新方式を導入した。

インドのAI企業Sarvamは、Indus AIチャットアプリをリリースした。同社はインド市場でOpenAIやAnthropicなどのグローバル勢と競争している。

NVIDIAのハードウェアとソフトウェアの協調設計により、Sarvam AIの主権AIモデルの推論性能が大幅に向上した。

AI企業Anthropicがインド・バンガロールにオフィスを開設し、インド全域で新たなパートナーシップを結ぶことで、同国での事業拡大を図っています。

研究者らが、アラビア語大規模言語モデル（LLM）のエミレーツ方言理解能力を評価するための堅牢なベンチマーク「Alyah」を開発した。

Anthropic社は、Claudeの思考回路を追跡する「回路トレーシング」技術を開発し、言語に翻訳される前に推論が行われる共通の概念空間を発見した。これにより、モデルが一つの言語で学んだことを別の言語に適用できる可能性が示唆された。