#生成ai のAIニュース
296件の記事
AI基盤の未来再定義
オープンソースモデルと次世代技術の相乗効果によるAIインフラの再定義
意見:島から生態系へ:相互運用性がエージェントAIのスケールを可能にする理由
AIエージェントは単独では企業を変革できない。協働することで真の力を発揮し、相互運用性が拡張の鍵となる。
Spotify、AI搭載の「Prompted Playlists」を英国などで展開
SpotifyがAIを活用した「Prompted Playlists」機能を英国、アイルランド、オーストラリア、スウェーデンの有料会員向けに試験的に提供開始。
Metaの故人シミュレーションAI特許が示す『幽霊労働』の危険性
Metaが故人のユーザーをAIでシミュレーションする特許を取得。研究者は『AI復活』の転換点と指摘し、倫理的懸念を提起。
OpenAI、新たなEVMbenchでステーブルコイン市場を目指す
OpenAIがEVMbenchを発表し、ステーブルコイン市場の成長に注目。AIベンダーとして収益拡大の機会を提示。
生成AIは詐欺だったことが判明
生成AIはこれまで言われていたほど優れたものではなく、非常に遠い存在であることが明らかになった。
Google Pomelli Photoshoot新機能
Google PomelliがPhotoshoot機能を発表、ブランドに合った画像生成が可能に
Gemini 3.1で都市建設
Demis HassabisがGemini 3.1を都市建設ツールとして使用する夢を実現
Google Unified Latents発表
Googleが新しい潜在変数モデル「Unified Latents」を発表
Gemini 3.1 Pro リリース
Gemini 3.1 ProがGeminiアプリとGoogle AI Studioで利用可能に
Claude PowerPoint機能拡張
ClaudeのPowerPoint機能がProプランで利用可能に、コネクター対応も追加
AI Gatewayによる動画生成
AI Gatewayが動画生成機能を追加し、写真のようにリアルな画質と同期した音声を持つ映画的な動画を作成できるようになった。AI SDK 6を通じて、テキストや画像と同じインターフェースでプログラム的に動画を生成可能。
Geminiで創造的なプロンプトをインタラクティブなXR体験に変える
Android XRチームはGeminiのCanvas機能を活用し、没入型拡張現実(XR)体験の作成を簡素化しています。
DeepMind、Lyria 3音楽モデル発表
Google DeepMindが最高性能の音楽生成モデルLyria 3を発表
LWiAIポッドキャスト #234 - Opus 4.6、GPT-5.3-Codex、Seedance 2.0、GLM-5
AI技術の最新動向を紹介するポッドキャスト。Opus 4.6、GPT-5.3-Codex、Seedance 2.0、GLM-5などの新モデルやアップデートについて議論。
Google I/O 2026の準備を始めよう
Google I/Oが5月19日から20日に開催され、Android、AI、Chrome、Cloudの最新情報がライブストリームで配信されます。
Next Tokyo 26 スピーカー募集:あなたのGoogle Cloudと生成AI活用事例を共有しませんか?
GoogleがNext Tokyo 26カンファレンスで、Google Cloudと生成AIの活用事例を発表するスピーカーを募集している。
オープンソースの「永遠の9月」へようこそ。メンテナー向けの計画をご紹介
オープンソースは「永遠の9月」を迎え、貢献の摩擦が減少する中、メンテナーは新たな信頼指標やトリアージ手法、コミュニティ主導の解決策で対応しています。
Seedance 2.0 正式リリース
バイトダンスが多モーダル音声・映像連合生成モデル「Seedance 2.0」を発表し、複雑な動き表現でSOTAを達成した。
生成AIの利活用事例に関するLT会を開催しました! Hacking Fest 2025 Winter 開催レポート
有志の集まりが2026年1月21日に「Hacking Fest 2025 Winter」を開催し、自部署での生成AIの利活用事例を共有した。
Claude Enterprise、セルフサービスで利用可能に
Claude Enterpriseがセルフサービス形式で提供開始され、企業がより簡単に導入できるようになりました。
Anthropicが3800億ドルの評価額でGシリーズ資金調達300億ドルを実施
AI企業AnthropicがGシリーズで300億ドルを調達し、調達後の企業価値は3800億ドルに達した。
GenAI.milにChatGPTを導入
OpenAI for GovernmentがGenAI.milにカスタムChatGPTを導入し、米国防チームに安全なAIを提供することを発表しました。
Amazon Nova AIチャレンジが復活、競合チームにNova Forgeアクセスを提供
学生が最先端AIモデルをカスタマイズして信頼性の高いソフトウェアエージェントを構築できる初の学術コンペ。
構築、研究、共有学習を通じてAIコミュニティを活性化
AIの進歩には画期的なモデルだけでなく、実験や知識共有を行う構築者・研究者のコミュニティが不可欠であり、Amazonはこの考えに基づき開発者・研究者との関わりを深めている。
GoogleのAI優位性:公正なインターネットのためにはクローラーの分離が唯一の道
Googleの二重目的クローラーは不公平なAI優位性を生み出している。出版者保護と競争促進のため、英国競争市場庁は検索とAIのクローラー分離を義務付けるべきと主張。
AIワークフォース事業部SREの現状と将来展望
LayerXのAIワークフォース事業部でSREを担当する筆者が、入社1年を振り返り、現在のチーム体制と今後のサイト信頼性エンジニアリングの方向性について語っています。
LWiAIポッドキャスト #232 - ChatGPT広告、Thinking Machinesのドラマ、STEM
OpenAIがChatGPTに広告を導入する試験を開始。Thinking Machines社の内部問題と、STEM(埋め込みモジュールによるトランスフォーマーの拡張)技術について議論。
PLaMo 2.2 Primeをリリースしました
Preferred Networksが純国産生成AI基盤モデルPLaMoの最新バージョンPLaMo 2.2 Primeをリリースした。同モデルでは社内外からのフィードバックをもとに事後学習データを追加している。
Claude Teamのアップデート
Claude Teamの新機能や改善点が発表され、チームでのAIアシスタント活用が向上します。
JFBench:実務レベルの日本語指示追従性能を備えた生成AIを目指して
Preferred NetworksのPLaMo事後学習チームは、純国産生成AI基盤モデルPLaMo 2.2 Primeをリリースし、実務レベルの日本語指示追従性能を評価するベンチマークJFBenchを開発した。
AI週間レビュー #333 - ChatGPT広告、智譜AI+華為、Thinking Machinesのドラマ
OpenAIがChatGPTで広告テスト開始、Zhipu AIが米国チップ依存脱却、Thinking Machinesの内部対立がシリコンバレーで注目。
AI週報 #328 - DeepSeek 3.2、Mistral 3、Trainium3、Runway Gen-4.5
DeepSeekがGPT-5やGemini 3 Proに対抗する新たな推論モデルを公開し、より高速・低コスト・高性能なAIモデルを提供した。
拡散モデルを用いた結晶構造の対称性を考慮した条件付き生成
石井孝憲氏が、拡散モデルを用いて結晶構造の対称性を考慮した条件付き生成手法を研究した。材料探索における結晶構造予測の効率化を目指す。
社内AIヘルプデスク RAG精度改善の軌跡 〜自動評価システムの構築とマネージドRAGへの移行〜
DeNAが社内AIヘルプデスクのRAG精度向上に向けて、自動評価システムを構築し、マネージドRAGへの移行を実施した取り組みを紹介している。
Flux.1-dev人気急上昇
Hugging FaceでFlux.1-devがDeepseek R1に次ぐ人気モデルに
OpenAI DevDayに参加しました
吉田真吾氏がGenerative Agents社の仲間と共にOpenAI DevDayに参加し、Sam Altmanが発表したChatGPT内でサービスを利用可能にする「Apps in ChatGPT」などの新リリースを報告した。
Grok 4
xAI社がGrok 4を発表した。同社は世界で最も知的なモデルと主張し、ネイティブツール使用とリアルタイム検索統合を特徴とする。SuperGrokおよびPremium+購読者とxAI APIで利用可能で、最強版のGrok 4 Heavyを含む新SuperGrok Heavy階層も導入した。
Expo最新情報!クラウドとAIの未来を探求しよう
Google Cloud Next 2025 Tokyoイベントで、GoogleがクラウドとAI技術の最新動向を発表し、開発者向けの新機能やツールを紹介した。
【Next Tokyo】待望のプログラム公開!ビジネスと技術の未来を掴もう!
Next Tokyoがビジネスと技術の未来に関するプログラムを公開した。
Gemini APIで利用可能なGemini 2.5 FlashおよびPro、Live API、Veo 2
GoogleがGemini APIでGemini 2.5 FlashとProモデル、リアルタイム処理のLive API、動画生成モデルVeo 2を提供開始した。
xAIが60億ドルのシリーズC資金調達を実施
xAIがA16Z、ブラックロック、フィデリティ、セコイア・キャピタルなど複数の投資家から60億ドルの資金調達を完了した。
GPT連携アプリ開発の必須知識、RAGをゼロから解説する。概要&Pythonコード例
著者のわいけいは、生成AIアプリ開発で低予算で使えるRAG(Retrieval-Augmented Generation)技術を、自然言語処理の観点から解説し、Pythonコード例を交えて実装知見を共有する。
HEROZ ASK: HEROZが新SaaS型プロダクト開発に挑戦する理由
HEROZの開発チームが、生成AIの登場を背景に、新SaaS型プロダクト「HEROZ ASK」の新バージョンをリリースし、そのビジネス的意義を説明している。
500件の検索クエリでChatGPTとGoogleを評価
研究者が500件の検索クエリでChatGPTとGoogleを比較した結果、ChatGPTはコーディング分野でGoogleを圧倒し、一般情報では互角の性能を示した。これは検索体験に最適化されていないにもかかわらず達成された。
生成AIの評価:Astral Codex TenはAI進歩に関する賭けに勝利したのか?
Astral Codex TenがAI進歩に関する賭けに勝利したかを検証するため、SurgersがDALL・EとImagenをScottの5つの構成性プロンプトで評価した。