#多言語ai のAIニュース
12件の記事
QIMMA:品質重視のアラビア語LLMリーダーボード
開発チームは、アラビア語大規模言語モデルの性能を品質基準で評価するリーダーボード「QIMMA」を公開した。同ボードは、モデルの正確性と信頼性を最優先し、アラビア語処理能力を比較する。
合成データを用いた高速多言語OCRモデルの構築
研究者が合成データを活用して、高速で多言語対応の光学文字認識(OCR)モデルを開発した。この手法は、従来のデータ収集の課題を克服し、複数言語でのテキスト認識の効率化を実現している。
AI時代の本音5選、どの言葉があなたの心に響きましたか?
通義実験室が主催したイベントで、5人の開発者がAIを活用した実例を紹介した。具体的には、AIによる病歴管理ツール開発、農業育種への応用、多言語対応モデル「SEA-LION」、障がい者のコミュニケーション支援、高齢者向けAI教育など、多様な分野での実践事例が示された。
マイクロソフトのMAI-Transcribe-1、前モデルより2.5倍高速で1時間あたり0.36ドルで音声文字起こしを提供
マイクロソフトがMAI-Transcribe-1を発表した。このモデルは、25言語で背景ノイズがあっても正確に音声をテキストに変換し、前モデルより2.5倍高速で1時間あたり0.36ドルのコストで動作する。マイクロソフトは既に自社製品でこのモデルを使用している。
Google AI、自動音声認識およびテキスト読み上げモデルの学習用マルチリンガルアフリカ語音声データセット「WAXAL」を公開
Google AIチームは、24のアフリカ語に対応するオープン音声データセット「WAXAL」を公開し、低リソース言語の音声認識・合成モデル学習データを補完した。
多言語推論ジム:手続き的推論環境の多言語スケーリング
研究者らは、14言語で検証可能な推論問題を手続き的に生成する「多言語推論ジム」を発表した。94のタスクテンプレートを10言語でネイティブ話者検証し、言語的自然さを確保した。
一言で自由に生成!音声二重モデルがリリース
通義実験室が、自然言語指令で自由な表現を生成できる音声モデル「Fun-CosyVoice」を発表した。従来の固定ラベル制限を突破し、ユーザーが詳細な表現を直接指示できる新方式を導入した。
インドのSarvam、競争激化する中でIndus AIチャットアプリをリリース
インドのAI企業Sarvamは、Indus AIチャットアプリをリリースした。同社はインド市場でOpenAIやAnthropicなどのグローバル勢と競争している。
NVIDIAの極端なハードウェア・ソフトウェア協調設計がSarvam AIの主権モデルに大規模な推論向上をもたらした方法
NVIDIAのハードウェアとソフトウェアの協調設計により、Sarvam AIの主権AIモデルの推論性能が大幅に向上した。
Anthropicがバンガロールオフィスを開設し、インド全域で新たなパートナーシップを発表
AI企業Anthropicがインド・バンガロールにオフィスを開設し、インド全域で新たなパートナーシップを結ぶことで、同国での事業拡大を図っています。
Alyah ⭐️: アラビア語LLMにおけるエミレーツ方言能力の堅牢な評価に向けて
研究者らが、アラビア語大規模言語モデル(LLM)のエミレーツ方言理解能力を評価するための堅牢なベンチマーク「Alyah」を開発した。
大規模言語モデルの思考を追跡する
Anthropic社は、Claudeの思考回路を追跡する「回路トレーシング」技術を開発し、言語に翻訳される前に推論が行われる共通の概念空間を発見した。これにより、モデルが一つの言語で学んだことを別の言語に適用できる可能性が示唆された。