#生成ai のAIニュース
296件の記事
Sakana AI、「Ultra Deep Research」を立ち上げ、数週間分の戦略作業を自動化
Sakana AIは、最大8時間自律的に調査し完成した分析を提供するビジネス顧客向けAIアシスタント「Sakana Marlin」を発表した。このツールは数週間分の戦略作業を数時間に圧縮することを目的としており、現在ベータテスト中である。
マイクロソフト、3つの新しい基盤モデルでAIライバルに挑む
マイクロソフトは、音声をテキストに変換し、音声や画像を生成できる3つの新しい基盤モデルを発表した。同社は6か月前に結成されたグループを通じてこれらのモデルをリリースした。
Rocket CloseがAmazon BedrockとAmazon Textractで住宅ローン書類処理を変革
Rocket Close社は、Amazon BedrockとAmazon Textractを活用し、住宅ローン書類処理の手動プロセスを効率的な自動化ソリューションに変革した。
Perplexity AI、MetaとGoogleへの個人データ共有疑惑で集団訴訟に直面
Perplexity AIが、ユーザーのチャットデータをMetaとGoogleと共有した疑いで集団訴訟を起こされた。訴訟はBloombergが報じた。
OpenAIが巨額資金調達ラウンドとChatGPTスーパーアプリを正式発表
OpenAIが1,220億ドルの資金調達を8520億ドルの評価額で完了し、ChatGPTスーパーアプリを正式発表、企業向けへの本格転換を示した。
バイトダンス、2027年卒向け大規模言語モデル人材の新卒採用を開始(インターン含む)
バイトダンスが、2027年卒の学生を対象に、大規模言語モデル分野の人材採用を開始した。同社は「知能の限界に挑戦する」と掲げ、新卒・インターン採用を実施している。
Soohoon Choiの引用
Soohoon Choiは、経済的インセンティブによりAIモデルが優れたコードを書くようになると主張する。優れたコードは生成・維持コストが低く、AIモデル間の競争が激しい中、信頼性の高い機能を迅速に提供できるシンプルで保守性の高いコードを生成するモデルが勝者となるため、市場の力学が優れたコードの普及を促すと述べている。
OpenAIが非公開のまま、小口投資家から30億ドルを調達し、総額1,220億ドルの巨額資金調達を実施
OpenAIはアマゾン、NVIDIA、ソフトバンクが主導する最新の資金調達で、AI研究所の評価額を8,520億ドルに引き上げ、IPOに近づいている。
GoogleのVeo 3.1 Liteが動画生成コストを半減以上削減
GoogleがAI動画生成モデル「Veo 3.1 Lite」を発表し、従来の最安値モデルと同等の速度を維持しながら、コストを半額以下に削減した。
フロンティア・レーダー #2:ベンチマークと損益計算書の間で失われるAI生産性の理由
同記事は、生成AIが多くの作業で測定可能な時間節約をもたらす一方、作業速度の向上と測定可能な経済的影響の間に隔たりがあると指摘する。検証のオーバーヘッド、限定的な指標、組織の慣性が、ベンチマークの成果をより広範な生産性向上につなげることを妨げていると分析している。
独占: Runway、AIスタートアップ向けに1000万ドル基金とビルダープログラムを開始
Runwayは、AIビデオモデルを活用する企業を支援するため、1000万ドルの基金とスタートアッププログラムを開始し、インタラクティブなリアルタイム「ビデオインテリジェンス」アプリケーションの開発を推進する。
AIの次の段階を加速
OpenAIが1,220億ドルの新規資金を調達し、フロンティアAIの世界的拡大、次世代コンピューティングへの投資、ChatGPT・Codex・企業向けAIの需要増に対応する。
RingがAmazon Bedrock Knowledge Basesでグローバルカスタマーサポートを拡張する方法
Amazonのホームセキュリティ子会社Ringは、Amazon Bedrock Knowledge Basesを活用し、多言語対応のRAGシステムを構築することで、グローバルなセルフサービスサポートの拡張を実現した。
OpenAIのSora、記録的な速さでユーザーの半数を失いながら1日100万ドルを消費
OpenAIは、動画生成アプリSoraを、1日約100万ドルの計算コストを消費し、短期間でユーザーの半数を失ったため、事業の負債となったと判断し、サービスを終了する。同社は、よりビジネス可能性の高いコーディング、企業向け、エージェントベースのAI製品にリソースを再配分する。
AI生成の恋愛番組がTikTokで1話あたり1000万回再生を記録
AIが生成した恋愛番組「Fruit Love Island」が、TikTokで1話あたり平均1000万回以上の再生回数を獲得している。
大規模データ更新・削除を「安全に分割実行」するための汎用ツール
DBREチームが、大規模なUPDATE/DELETE操作を安全な単位に分割して実行できる汎用ツールを実装した。このツールは、SQLに近い形で操作を記述しつつ、実行中の制御や監視機能を備え、運用リスクを低減する。
OpenAIがSoraを本当に停止した理由
OpenAIは、公開からわずか6カ月でAI動画生成ツール「Sora」を停止した。ユーザーが自身の顔をアップロードできる機能があったため、データ収集が目的ではないかとの疑念が生じている。
Soraの終了はAIビデオに対する現実的な見直しの契機となり得る
OpenAIがSoraの終了を検討していることは、AI生成ビデオ分野における企業戦略の見直しや、業界全体の後退を示唆する可能性がある。
Naverの「ソウル・ワールド・モデル」、実在するストリートビュー・データを用いてAIによる都市全体の幻覚生成を防止
韓国のインターネット大手Naverが、自社の100万枚以上のストリートビュー画像から都市の実在する幾何学データに基づいたビデオ・ワールド・モデルを構築した。このモデルは、追加の調整なしに他の都市にも一般化できる。
マット・ウェブの引用:エージェント的コーディングについて
マット・ウェブは、AIエージェントがコーディング問題を解決する際に、効率的で保守性・適応性・構成可能性のある方法を求めるべきだと指摘している。
OpenAI、Soraの段階的終了を発表:アプリは2026年4月、APIは同年9月に終了
OpenAIは、AI動画生成ツール「Sora」を2026年4月から段階的に終了する。これは、創造的AIツールからコーディングや企業向け製品への戦略的転換を示す。
STADLERが230年の歴史を持つ企業でナレッジワークを再構築
STADLERはChatGPTを活用してナレッジワークを変革し、650人の従業員全体で時間を節約し生産性を加速させている。
Cohere、音声認識ベンチマークでトップのオープンソースモデルをリリース
Cohereがオープンソースの音声認識モデルを発表し、ベンチマークでOpenAIのWhisperを含む全ての競合を上回った。
Anthropicのリークにより、従来モデルを「劇的に上回るテストスコア」を持つ新モデル「Claude Mythos」が明らかに
Anthropicがセキュリティミスにより、従来モデルよりもテストスコアが劇的に高い新AIモデル「Claude Mythos」を公開した。OpenAIも次世代モデルを準備中で、両社は上場前に最先端技術を競っている。
Suno 5.5、ユーザーが自身の声でAI生成曲を歌えるパーソナライズド音声機能を追加
Sunoがv5.5アップデートを発表し、ユーザーが自身の声でAI生成曲を歌えるパーソナライズド音声機能を追加した。ユーザーは自身の歌唱スタイルでモデルをトレーニングでき、結果は自動的に好みに合わせて調整される。
ChatGPTでmRNA生成の可能性
Sam AltmanがChatGPTとLLMを活用したmRNA生成の会議について言及
エージェント能力を強化し長文脈対応のABEJA-Qwen3-14B-Agentic-256k-v0.1を公開
ABEJAは、経済産業省とNEDOのプロジェクト「GENIAC」3期で開発した大規模言語モデル「ABEJA-Qwen3-14B-Agentic-256k-v0.1」を公開した。同モデルは、長文脈処理性能とエージェントとしての能力向上に重点を置いている。
AIで1日でJSONataを書き直し、年間50万ドルを節約
Reco.ai社がAIを活用してJSONataのJSON式言語を1日でGo言語で再実装し、年間50万ドルのコスト削減に成功した。
アジア太平洋(ニュージーランド)地域でAmazon Bedrockによる生成AI推論を実行可能に
AWSは、ニュージーランドの顧客が自国のAWSリージョンからAmazon Bedrockの基盤モデルにアクセスできるように、アジア太平洋(ニュージーランド)リージョンで同サービスを提供開始した。
ウィキペディア、記事執筆におけるAIの使用を規制
ウィキペディアが、AI生成コンテンツの品質問題に対処するため、記事執筆におけるAIの使用を制限する方針を導入した。
IPO前のOpenAIとAnthropic:異なる貸借対照表により比較が困難
OpenAIとAnthropicは両社とも急成長しているが、クラウドパートナーシップの会計処理方法が異なるため、収益数値の比較は困難と報じられている。
Amazon Bedrock Guardrailsで年齢対応・文脈認識AIを構築
Amazonは、生成AIアプリケーションの安全性と信頼性を高めるため、ユーザーの年齢や文脈に応じた適切な応答を保証する「Bedrock Guardrails」を開発した。
Gemini Live 3.1 Flash 提供開始
Google AIがGemini Live 3.1 Flashの提供を開始。AI開発者向け新機能。
Gemini 3.1 Flash Live リリース
Google AIがGemini 3.1 Flash Liveを本日リリース、開発者向け新機能
Gemini Live 3.1 Flash 公開
Gemini Liveの新バージョン3.1 Flashが利用可能に
ByteDanceの新AI動画生成モデル「Dreamina Seedance 2.0」がCapCutに搭載
ByteDanceがAI動画生成モデル「Dreamina Seedance 2.0」をCapCutに搭載した。同モデルは実在人物の顔や無許可知的財産からの動画生成に対する保護機能を内蔵している。
VercelがJSON-Renderをリリース:AI駆動のインターフェース構築のための生成UIフレームワーク
Vercelが、自然言語プロンプトから構造化されたユーザーインターフェースをAIモデルが生成できるフレームワーク「json-render」をオープンソース化した。Apache 2.0ライセンスで公開され、複数のフロントエンドフレームワークをサポートし、開発者が定義したコンポーネントカタログを備えている。
スピードを落とすことについての考察
Mario Zechner氏が、現在のエージェント工学のトレンドについて、過度なスピード追求と規律の欠如を批判している。
Google、権利を有するデータで学習したAI音楽生成モデル「Lyria 3 Pro」を発表
GoogleがAI音楽生成モデル「Lyria 3 Pro」を発表した。同モデルは最大3分間の楽曲を生成でき、権利を有するデータで学習している点が特徴で、著作権問題を抱える競合他社と差別化している。
OpenAI、企業戦略のためにSoraを削減する必要があった
OpenAIは、企業ベンダーとしての戦略を強化するため、計算リソースを過度に使用するプロジェクトを整理し、Soraの削減を決定した。
GoogleがLyria 3 Pro音楽生成モデルを発表
GoogleがLyria 3 Proを発表した。このアップグレードされた音楽モデルは、より長く、よりカスタマイズ可能なトラックを生成し、Gemini、企業向け製品、その他のサービスでAI音楽ツールを拡大する。
MinerU-Diffusion論文発表
文書OCRを拡散デコードによる逆レンダリングとして再考する新手法
Lyria 3 Proモデル公開
Google AIがLyria 3 Proモデルのアクセス方法を発表
Google AIがLyria 3をリリース
テキスト、画像、動画から歌詞付きトラックを作成可能に
Lyria 3 Pro API公開
Google DeepMindがLyria 3 ProのAPIを開発者向けに提供開始
Lyria 3 Proで長尺トラック作成可能に
Google DeepMindのLyria 3 Proが長尺音楽トラック作成機能を追加
Lyria 3 Pro:構造認識により長いトラックを作成可能に
GoogleはLyria 3 Proを発表し、構造認識機能により長い音楽トラックの生成を可能にした。また、Lyriaをより多くのGoogle製品やプラットフォームに導入する。
Harveyが110億ドルの評価額を確認:Sequoiaが3倍の投資を実施
AI法務テックスタートアップのHarveyが110億ドルの評価額を確認した。Sequoia、Andreessen Horowitz、Kleiner Perkins、Elad Gilなどの投資家が同社に継続して投資している。
Granolaが1億2500万ドルを調達、評価額15億ドルに到達、会議メモ作成から企業向けAIアプリへ拡大
Granolaが1億2500万ドルの資金調達を実施し、評価額が2億5000万ドルから15億ドルに上昇した。同社は会議メモ作成サービスから企業向けAIアプリケーションへの拡大を進めており、ユーザーの要望を受けてAIエージェントのサポートを強化している。
Meta、InstagramとFacebookでの買い物を容易にするためにAIを活用
Metaは、自社アプリ内で買い物をする消費者により多くの商品・ブランド情報を提供するため、生成AIを活用している。