#生成ai のAIニュース

296件の記事

Sakana AI、「Ultra Deep Research」を立ち上げ、数週間分の戦略作業を自動化

Sakana AIは、最大8時間自律的に調査し完成した分析を提供するビジネス顧客向けAIアシスタント「Sakana Marlin」を発表した。このツールは数週間分の戦略作業を数時間に圧縮することを目的としており、現在ベータテスト中である。

The Decoder·4月3日

マイクロソフト、3つの新しい基盤モデルでAIライバルに挑む

マイクロソフトは、音声をテキストに変換し、音声や画像を生成できる3つの新しい基盤モデルを発表した。同社は6か月前に結成されたグループを通じてこれらのモデルをリリースした。

TechCrunch AI·4月3日

Rocket CloseがAmazon BedrockとAmazon Textractで住宅ローン書類処理を変革

Rocket Close社は、Amazon BedrockとAmazon Textractを活用し、住宅ローン書類処理の手動プロセスを効率的な自動化ソリューションに変革した。

AWS Machine Learning Blog·4月2日·★★★★

Perplexity AI、MetaとGoogleへの個人データ共有疑惑で集団訴訟に直面

Perplexity AIが、ユーザーのチャットデータをMetaとGoogleと共有した疑いで集団訴訟を起こされた。訴訟はBloombergが報じた。

The Decoder·4月1日

OpenAIが巨額資金調達ラウンドとChatGPTスーパーアプリを正式発表

OpenAIが1,220億ドルの資金調達を8520億ドルの評価額で完了し、ChatGPTスーパーアプリを正式発表、企業向けへの本格転換を示した。

The Decoder·4月1日·★★★★★

バイトダンス、2027年卒向け大規模言語モデル人材の新卒採用を開始(インターン含む)

バイトダンスが、2027年卒の学生を対象に、大規模言語モデル分野の人材採用を開始した。同社は「知能の限界に挑戦する」と掲げ、新卒・インターン採用を実施している。

字节跳动Seed·4月1日

Soohoon Choiの引用

Soohoon Choiは、経済的インセンティブによりAIモデルが優れたコードを書くようになると主張する。優れたコードは生成・維持コストが低く、AIモデル間の競争が激しい中、信頼性の高い機能を迅速に提供できるシンプルで保守性の高いコードを生成するモデルが勝者となるため、市場の力学が優れたコードの普及を促すと述べている。

Simon Willison Blog·4月1日

OpenAIが非公開のまま、小口投資家から30億ドルを調達し、総額1,220億ドルの巨額資金調達を実施

OpenAIはアマゾン、NVIDIA、ソフトバンクが主導する最新の資金調達で、AI研究所の評価額を8,520億ドルに引き上げ、IPOに近づいている。

TechCrunch AI·4月1日·★★★★

GoogleのVeo 3.1 Liteが動画生成コストを半減以上削減

GoogleがAI動画生成モデル「Veo 3.1 Lite」を発表し、従来の最安値モデルと同等の速度を維持しながら、コストを半額以下に削減した。

The Decoder·4月1日·★★★★

フロンティア・レーダー #2:ベンチマークと損益計算書の間で失われるAI生産性の理由

同記事は、生成AIが多くの作業で測定可能な時間節約をもたらす一方、作業速度の向上と測定可能な経済的影響の間に隔たりがあると指摘する。検証のオーバーヘッド、限定的な指標、組織の慣性が、ベンチマークの成果をより広範な生産性向上につなげることを妨げていると分析している。

The Decoder·4月1日

独占: Runway、AIスタートアップ向けに1000万ドル基金とビルダープログラムを開始

Runwayは、AIビデオモデルを活用する企業を支援するため、1000万ドルの基金とスタートアッププログラムを開始し、インタラクティブなリアルタイム「ビデオインテリジェンス」アプリケーションの開発を推進する。

TechCrunch AI·3月31日

AIの次の段階を加速

OpenAIが1,220億ドルの新規資金を調達し、フロンティアAIの世界的拡大、次世代コンピューティングへの投資、ChatGPT・Codex・企業向けAIの需要増に対応する。

OpenAI News·3月31日·★★★★

RingがAmazon Bedrock Knowledge Basesでグローバルカスタマーサポートを拡張する方法

Amazonのホームセキュリティ子会社Ringは、Amazon Bedrock Knowledge Basesを活用し、多言語対応のRAGシステムを構築することで、グローバルなセルフサービスサポートの拡張を実現した。

AWS Machine Learning Blog·3月31日

OpenAIのSora、記録的な速さでユーザーの半数を失いながら1日100万ドルを消費

OpenAIは、動画生成アプリSoraを、1日約100万ドルの計算コストを消費し、短期間でユーザーの半数を失ったため、事業の負債となったと判断し、サービスを終了する。同社は、よりビジネス可能性の高いコーディング、企業向け、エージェントベースのAI製品にリソースを再配分する。

The Decoder·3月30日·★★★★

AI生成の恋愛番組がTikTokで1話あたり1000万回再生を記録

AIが生成した恋愛番組「Fruit Love Island」が、TikTokで1話あたり平均1000万回以上の再生回数を獲得している。

The Decoder·3月30日

大規模データ更新・削除を「安全に分割実行」するための汎用ツール

DBREチームが、大規模なUPDATE/DELETE操作を安全な単位に分割して実行できる汎用ツールを実装した。このツールは、SQLに近い形で操作を記述しつつ、実行中の制御や監視機能を備え、運用リスクを低減する。

Mercari Engineering·3月30日

OpenAIがSoraを本当に停止した理由

OpenAIは、公開からわずか6カ月でAI動画生成ツール「Sora」を停止した。ユーザーが自身の顔をアップロードできる機能があったため、データ収集が目的ではないかとの疑念が生じている。

TechCrunch AI·3月30日

Soraの終了はAIビデオに対する現実的な見直しの契機となり得る

OpenAIがSoraの終了を検討していることは、AI生成ビデオ分野における企業戦略の見直しや、業界全体の後退を示唆する可能性がある。

TechCrunch AI·3月30日

Naverの「ソウル・ワールド・モデル」、実在するストリートビュー・データを用いてAIによる都市全体の幻覚生成を防止

韓国のインターネット大手Naverが、自社の100万枚以上のストリートビュー画像から都市の実在する幾何学データに基づいたビデオ・ワールド・モデルを構築した。このモデルは、追加の調整なしに他の都市にも一般化できる。

The Decoder·3月29日·★★★★

マット・ウェブの引用:エージェント的コーディングについて

マット・ウェブは、AIエージェントがコーディング問題を解決する際に、効率的で保守性・適応性・構成可能性のある方法を求めるべきだと指摘している。

Simon Willison Blog·3月28日

OpenAI、Soraの段階的終了を発表:アプリは2026年4月、APIは同年9月に終了

OpenAIは、AI動画生成ツール「Sora」を2026年4月から段階的に終了する。これは、創造的AIツールからコーディングや企業向け製品への戦略的転換を示す。

The Decoder·3月28日·★★★★

STADLERが230年の歴史を持つ企業でナレッジワークを再構築

STADLERはChatGPTを活用してナレッジワークを変革し、650人の従業員全体で時間を節約し生産性を加速させている。

OpenAI News·3月28日

Cohere、音声認識ベンチマークでトップのオープンソースモデルをリリース

Cohereがオープンソースの音声認識モデルを発表し、ベンチマークでOpenAIのWhisperを含む全ての競合を上回った。

The Decoder·3月28日·★★★★

Anthropicのリークにより、従来モデルを「劇的に上回るテストスコア」を持つ新モデル「Claude Mythos」が明らかに

Anthropicがセキュリティミスにより、従来モデルよりもテストスコアが劇的に高い新AIモデル「Claude Mythos」を公開した。OpenAIも次世代モデルを準備中で、両社は上場前に最先端技術を競っている。

The Decoder·3月28日·★★★★

Suno 5.5、ユーザーが自身の声でAI生成曲を歌えるパーソナライズド音声機能を追加

Sunoがv5.5アップデートを発表し、ユーザーが自身の声でAI生成曲を歌えるパーソナライズド音声機能を追加した。ユーザーは自身の歌唱スタイルでモデルをトレーニングでき、結果は自動的に好みに合わせて調整される。

The Decoder·3月28日·★★★★

ChatGPTでmRNA生成の可能性

Sam AltmanがChatGPTとLLMを活用したmRNA生成の会議について言及

X: Sam Altman·3月27日

エージェント能力を強化し長文脈対応のABEJA-Qwen3-14B-Agentic-256k-v0.1を公開

ABEJAは、経済産業省とNEDOのプロジェクト「GENIAC」3期で開発した大規模言語モデル「ABEJA-Qwen3-14B-Agentic-256k-v0.1」を公開した。同モデルは、長文脈処理性能とエージェントとしての能力向上に重点を置いている。

ABEJA Tech Blog·3月27日·★★★★

AIで1日でJSONataを書き直し、年間50万ドルを節約

Reco.ai社がAIを活用してJSONataのJSON式言語を1日でGo言語で再実装し、年間50万ドルのコスト削減に成功した。

Simon Willison Blog·3月27日

アジア太平洋(ニュージーランド)地域でAmazon Bedrockによる生成AI推論を実行可能に

AWSは、ニュージーランドの顧客が自国のAWSリージョンからAmazon Bedrockの基盤モデルにアクセスできるように、アジア太平洋(ニュージーランド)リージョンで同サービスを提供開始した。

AWS Machine Learning Blog·3月27日

ウィキペディア、記事執筆におけるAIの使用を規制

ウィキペディアが、AI生成コンテンツの品質問題に対処するため、記事執筆におけるAIの使用を制限する方針を導入した。

TechCrunch AI·3月27日

IPO前のOpenAIとAnthropic:異なる貸借対照表により比較が困難

OpenAIとAnthropicは両社とも急成長しているが、クラウドパートナーシップの会計処理方法が異なるため、収益数値の比較は困難と報じられている。

The Decoder·3月27日

Amazon Bedrock Guardrailsで年齢対応・文脈認識AIを構築

Amazonは、生成AIアプリケーションの安全性と信頼性を高めるため、ユーザーの年齢や文脈に応じた適切な応答を保証する「Bedrock Guardrails」を開発した。

AWS Machine Learning Blog·3月27日·★★★★

Gemini Live 3.1 Flash 提供開始

Google AIがGemini Live 3.1 Flashの提供を開始。AI開発者向け新機能。

X: Google AI·3月27日

Gemini 3.1 Flash Live リリース

Google AIがGemini 3.1 Flash Liveを本日リリース、開発者向け新機能

X: Google AI·3月27日·★★★★

Gemini Live 3.1 Flash 公開

Gemini Liveの新バージョン3.1 Flashが利用可能に

X: Google AI·3月27日

ByteDanceの新AI動画生成モデル「Dreamina Seedance 2.0」がCapCutに搭載

ByteDanceがAI動画生成モデル「Dreamina Seedance 2.0」をCapCutに搭載した。同モデルは実在人物の顔や無許可知的財産からの動画生成に対する保護機能を内蔵している。

TechCrunch AI·3月27日

VercelがJSON-Renderをリリース:AI駆動のインターフェース構築のための生成UIフレームワーク

Vercelが、自然言語プロンプトから構造化されたユーザーインターフェースをAIモデルが生成できるフレームワーク「json-render」をオープンソース化した。Apache 2.0ライセンスで公開され、複数のフロントエンドフレームワークをサポートし、開発者が定義したコンポーネントカタログを備えている。

InfoQ·3月26日

スピードを落とすことについての考察

Mario Zechner氏が、現在のエージェント工学のトレンドについて、過度なスピード追求と規律の欠如を批判している。

Simon Willison Blog·3月26日

Google、権利を有するデータで学習したAI音楽生成モデル「Lyria 3 Pro」を発表

GoogleがAI音楽生成モデル「Lyria 3 Pro」を発表した。同モデルは最大3分間の楽曲を生成でき、権利を有するデータで学習している点が特徴で、著作権問題を抱える競合他社と差別化している。

The Decoder·3月26日·★★★★

OpenAI、企業戦略のためにSoraを削減する必要があった

OpenAIは、企業ベンダーとしての戦略を強化するため、計算リソースを過度に使用するプロジェクトを整理し、Soraの削減を決定した。

AI Business·3月26日

GoogleがLyria 3 Pro音楽生成モデルを発表

GoogleがLyria 3 Proを発表した。このアップグレードされた音楽モデルは、より長く、よりカスタマイズ可能なトラックを生成し、Gemini、企業向け製品、その他のサービスでAI音楽ツールを拡大する。

TechCrunch AI·3月26日·★★★★

MinerU-Diffusion論文発表

文書OCRを拡散デコードによる逆レンダリングとして再考する新手法

X: AK·3月26日

Lyria 3 Proモデル公開

Google AIがLyria 3 Proモデルのアクセス方法を発表

X: Google AI·3月26日

Google AIがLyria 3をリリース

テキスト、画像、動画から歌詞付きトラックを作成可能に

X: Google AI·3月26日

Lyria 3 Pro API公開

Google DeepMindがLyria 3 ProのAPIを開発者向けに提供開始

X: Google DeepMind·3月26日

Lyria 3 Proで長尺トラック作成可能に

Google DeepMindのLyria 3 Proが長尺音楽トラック作成機能を追加

X: Google DeepMind·3月26日

Lyria 3 Pro:構造認識により長いトラックを作成可能に

GoogleはLyria 3 Proを発表し、構造認識機能により長い音楽トラックの生成を可能にした。また、Lyriaをより多くのGoogle製品やプラットフォームに導入する。

Google DeepMind·3月26日

Harveyが110億ドルの評価額を確認:Sequoiaが3倍の投資を実施

AI法務テックスタートアップのHarveyが110億ドルの評価額を確認した。Sequoia、Andreessen Horowitz、Kleiner Perkins、Elad Gilなどの投資家が同社に継続して投資している。

TechCrunch AI·3月26日·★★★★

Granolaが1億2500万ドルを調達、評価額15億ドルに到達、会議メモ作成から企業向けAIアプリへ拡大

Granolaが1億2500万ドルの資金調達を実施し、評価額が2億5000万ドルから15億ドルに上昇した。同社は会議メモ作成サービスから企業向けAIアプリケーションへの拡大を進めており、ユーザーの要望を受けてAIエージェントのサポートを強化している。

TechCrunch AI·3月25日·★★★★

Meta、InstagramとFacebookでの買い物を容易にするためにAIを活用

Metaは、自社アプリ内で買い物をする消費者により多くの商品・ブランド情報を提供するため、生成AIを活用している。

TechCrunch AI·3月25日