マイクロソフト、新たな音声・画像モデルでLLMを超える取り組みを発表
Microsoftは、音声と画像を扱う新たなAIモデルを発表し、自社開発AIシステムへの注力を強め、LLMを超えるマルチモーダルAIへの展開を示した。
キーポイント
LLMを超えるマルチモーダルAIへの展開
Microsoftが音声と画像を扱う新たなAIモデルを発表し、テキスト中心の大規模言語モデル(LLM)から、より幅広いマルチモーダルAIへの展開を進めている。
自社開発AIシステムへの注力強化
新モデルの発表は、Microsoftが自社開発のAIシステムへの取り組みを強化していることを示しており、外部依存からの脱却や独自技術スタックの構築を目指している。
競争優位性の構築
音声と画像のAIモデル開発により、Microsoftは競合他社との差別化を図り、AI市場での競争優位性を高めようとしている。
実用性の高いAI応用への道筋
音声と画像を扱えるAIモデルは、より実用的なアプリケーション開発につながり、ビジネスや消費者向け製品への応用可能性を広げる。
影響分析・編集コメントを表示
影響分析
この発表は、MicrosoftがAI競争において自社技術スタックの強化に本格的に乗り出したことを示しており、AI業界の多様化と競争激化を促す可能性がある。特に、音声と画像の統合は、より自然な人間-AIインタラクションの実現に向けた重要な一歩となる。
編集コメント
Microsoftの自社AI開発への本格的なコミットメントを示す重要な動向。音声と画像の統合は、実用的なAI応用の幅を大きく広げる可能性がある。
Microsoft、新たな音声・画像モデルでLLMsの先へ
新しいAIモデルは、Microsoft開発のAIシステムへのさらなる推進力を示すものです。
原文を表示
2 Min ReadMicrosoft on Thursday unveiled three new AI models, marking an expansion beyond typical large language models to multimodal, in-house capabilities.The models were introduced under the Microsoft AI (MAI) division.The release includes MAI-Transcribe-1, a new speech-to-text system, as well as voice generation and image models MAI-Voice-1 and MAI-Image-2. All three are the first models of their kind for Microsoft and are available on Microsoft Foundry and the MAI Playground.MAI-Transcribe-1 is Microsoft’s first dedicated transcription model, designed to convert audio into text across 25 languages. Potential applications include video captioning, meeting transcriptions and voice-enabled agents.According to Microsoft, the model can operate at speeds up to 2.5 times faster than its existing Azure Fast transcription model. MAI-Voice-1, meanwhile, is designed for high-quality speech generation. The model can generate up to a minute of audio in a single second, with an emphasis on natural, emotional tone and speaker personality.Related:The Real AI Shift Isn’t New Models. It’s Control.The third release, MAI-Image-2, represents the second generation of Microsoft’s in-house image model. The company says it offers at least twice the generation speed of its predecessor while providing more realistic details, such as skin tone, lighting and textures.The model is targeted for use in the creative industries, and is already being rolled out across Microsoft products, with integrations planned for the Bing search engine and PowerPoint.Early customers include marketing and communications firm WPP, Microsoft said.“MAI-Image-2 is a genuine game-changer,” Rob Reilly, global chief creative officer at WPP said in a MAI blog post on the launch. “It’s a platform that not only responds to the intricate nuance of creative direction, but deeply respects the sheer craft involved in generating real-world, campaign-ready images.”In the post, Microsoft said the updates come as it pursues a more "humanist" AI.“We have a distinct view when creating our AI models -- putting humans at the center, optimizing for how people actually communicate, training for practical use,” the company said.The launches also reflect a broader strategic shift as Microsoft looks to diversify its AI portfolio and reduce reliance on external partners such as OpenAI. It is also aiming to strengthen its competitive standing against rivals such as Google and Amazon, both of which have been investing heavily in proprietary AI stacks.About the AuthorContributing WriterScarlett Evans is a freelance writer with a focus on emerging technologies and the minerals industry. Previously, she served as assistant editor at IoT World Today, where she specialized in robotics and smart city technologies. Scarlett also has a background in the mining and resources sector, with experience at Mine Australia, Mine Technology and Power Technology. She joined Informa in April 2022 before transitioning to freelance work.
関連記事
マイクロソフトがAzure Copilot Migration Agentを発表、クラウド移行計画を加速
マイクロソフトは、Azureポータルに組み込まれたAIアシスタント「Azure Copilot Migration Agent」を発表した。このエージェントは、移行計画の自動化、エージェントレスなVMwareの検出、ランディングゾーンの作成を行う。ただし、移行の実行はできず、レプリケーションと切り替えは手動タスクのままである。
マイクロソフト、Copilot Coworkを拡大展開し、AIモデル同士の相互チェック機能を導入
マイクロソフトがCopilot Coworkを拡大展開し、AIアシスタントがワークフロー全体を自律的に処理できるようにした。また、複数のAIモデルが互いの作業をチェックする新機能も導入した。
マイクロソフト、Copilot Researcherに新たなAI機能を導入
マイクロソフトはCopilot Researcherに新たなAI機能を追加し、企業ワークフローの正確性と信頼性を向上させた。