#generative ai のAIニュース

70件の記事

Google の新「何でもから何でも」AI モデルは驚異的

The Verge AI が、Google が発表した汎用的な画像生成 AI モデルについて報じた。このモデルはテキストや画像などあらゆる入力から任意の出力を生成できる能力を持ち、著者が子供の人形を旅行中の姿に合成した実験事例も紹介している。

The Verge AI·5月23日

大規模な事前学習済みモデルの提供に向けた、現実的な 3D 医療画像の合成

NVIDIA は、データ不足やプライバシー制限という課題を克服し、高品質な 3D 医療画像データを大規模に合成する手法を発表した。これにより、放射線科 AI の基盤となるデータの確保が可能になる。

NVIDIA Developer Blog·5月23日·★★★★

ディープフェイクが高校を分断した理由

ペンシルベニア州のラドナー高校で、生徒が作成したディープフェイク動画によるいじめが発生し、学校コミュニティに深刻な亀裂が生じた。

404 Media·5月21日·★★★★

Google の「バイブコーディング」で Android アプリが驚くほど高速に作成された体験

The Verge の記者は Google の AI ツールを使用し、ブラウザへ148語の入力を行うだけで、わずか10分以内に実際に動作する Android アプリを3つ作成した。

The Verge AI·5月21日·★★★★

SpaceX の S-1 提出書における言及

SpaceX は、自社開発の AI アプリケーション(例:現在 COLOSSUS II で訓練中の Grok 5)に計算リソースを活用しつつ、Anthropic PBC などの第三者顧客にも計算容量の一部を提供する契約を 2026 年 5 月に締結したと発表した。

Simon Willison Blog·5月21日·★★★★★

10 トークン/秒は本当に速いのか?

マイク・ヴェーマン氏が作成した Web アプリにより、5〜800 トークン/秒の LLM 出力速度をシミュレーションできる。30 トークン/秒と advertised されたモデルが実際にどの程度に見えるかを確認する際に有用である。

Simon Willison Blog·5月21日

グーグルの未来は、何でもこなす検索ボックスである

The Verge AI は、グーグルが単に検索するだけでなく、検索ボックスからすべてのタスクを代行しようとしていると分析した。

The Verge AI·5月20日·★★★★

Amazon Nova Sonic を用いたスケーラブルな音声エージェント設計:マルチエージェント、ツール連携、セッション分割

AWS は、遅延やリアルタイム音声管理などの課題に対処するため、Amazon Nova Sonic を活用したスケーラブルな音声エージェントの設計パターンを公開し、複数のエージェント協調やセッション分割手法を紹介した。

AWS Machine Learning Blog·5月20日·★★★★

ソニー、AI カメラアシスタントの誤解を解くために説明を試みる

ソニーは、Xperia 1 XIII で公開した AI カメラアシスタント機能について、画像を編集するものではなく、照明や被写体に基づいて撮影オプションを提案するだけだと説明し、誤解を解こうとしている。

The Verge AI·5月17日

Google、AI を「操作」する試みをスパムとみなすルールを更新

Google は検索結果や AI オーバービューにおいて、自社の AI モデルを操作しようとする行為をスパムとして扱うポリシーを更新した。

The Verge AI·5月16日·★★★★

Amazon Lex の Assisted NLU でボットの精度を向上させる

AWS は、顧客の自然な発話や曖昧な表現に対応する新機能「Assisted NLU」を Amazon Lex に追加し、チャットボットの認識精度を高めることを発表した。

AWS Machine Learning Blog·5月15日·★★★★

Datasette の公式ブログ開設のお知らせ

データセット分析ツール「Datasette」の開発者が、今後の発表を伝えるため公式ブログを開設した。開発者は OpenAI Codex を使用してブログを構築し、そのセッション記録も公開している。

Simon Willison Blog·5月14日

Amazon Finance が AWS の生成 AI を活用し規制対応を効率化

Amazon の財務技術チームは、AWS で構築した生成 AI システムを用いて、各国の当局から届く複雑な規制問い合わせへの対応プロセスを自動化・効率化している。

AWS Machine Learning Blog·5月13日·★★★★

AI の濫用が人間の脳を破壊している

ジャーナリストのジェイソン・コエブラーは、オンライン上の AI 生成文章が溢れ、フィルタリングに精神的負担がかかり、人間の文章スタイルまで歪み始めていると指摘し、「ゾンビインターネット」という概念を提唱した。

Simon Willison Blog·5月12日·★★★★

ニューヨーク・タイムズが誤ってAI生成の発言を引用したと訂正

ニューヨーク・タイムズは、保守党指導者ピエール・ポイリエ氏の発言として誤ってAI生成の要約を引用していたことを認め、記者がAIツールの出力を検証しなかった過ちを謝罪し、記事を更新した。

Simon Willison Blog·5月11日·★★★★★

ハルバートン、Amazon Bedrock と生成 AI を活用して地震データ処理ワークフローを強化

エネルギー探査の重要要素である地震データ分析において、ハルバートンはクラウドネイティブアプリ「Seismic Engine」に Amazon Bedrock と生成 AI を導入し、従来 100 以上の専門ツールを手動で設定する必要があった複雑なワークフロー作成を効率化しました。

AWS Machine Learning Blog·5月8日·★★★★

メタ、Hatch AI エージェントを待機リスト付きで準備、ソーシャルスキル強化へ

メタは、画像・動画生成やショッピング機能を Instagram や Facebook に統合した消費者向け AI エージェント「Hatch」を開発中。6 月の内部テストを経て、待機リスト経由で広くリリースする計画であり、Q4 には Instagram 専用のショッピングツールも導入予定だ。

TLDR AI·5月8日·★★★★

Velox:4D 幾何形状と外観の表現学習フレームワーク

研究者らは、非構造化動的点群から物体の幾何形状と外観を忠実に捉える潜在表現を学習する「Velox」フレームワークを発表した。この手法は時空間カラー点群を圧縮し、下流タスクの効率化に寄与する。

Apple Machine Learning·5月8日·★★★★

マルチビュー撮影から大規模高品質 3D ガウス頭部再構築手法「HeadsUp」を提案

研究者らは、多数のカメラからの入力画像を圧縮し、中性頭部テンプレートに固定された UV パラメータ化された 3D ガウシアンとして復元するスケーラブルなフィードフォワード手法「HeadsUp」を発表した。この手法は、入力画像の数や解像度に関わらず 3D ガウシアンの数を独立させられる。

Apple Machine Learning·5月8日·★★★★

LLM-Gemini 0.31 リリース:Gemini 3.1 Flash-Lite がプレビュー終了

開発者 Simon Willison が公開したツール「llm-gemini」のバージョン 0.31 をリリースし、Google の AI モデル「Gemini 3.1 Flash-Lite」が正式に一般利用可能になったことを発表した。

Simon Willison Blog·5月8日

Amazon SageMaker AI で MLflow v3.10 がサポートされ、生成 AI 開発が効率化

Amazon は Amazon SageMaker AI の MLflow Apps にバージョン 3.10 を導入し、生成 AI 開発のワークフローを簡素化し、実験追跡機能を強化したと発表した。

AWS Machine Learning Blog·5月6日·★★★★

Granite 4.1 3B SVG ペリカンギャラリー

IBM は数日前に Apache 2.0 ライセンスの LLM「Granite 4.1」ファミリー(3B、8B、30B)を公開した。本記事は同モデルの学習プロセスや、SVG ペリカンのギャラリーを紹介している。

Simon Willison Blog·5月5日

自然言語プロンプトからダッシュボードを生成する Amazon Quick の新機能

Amazon は、自然言語による指示だけで複数シートのダッシュボードを数分で自動生成する「Amazon Quick」を発表した。これにより、データ分析や経営報告の準備時間が大幅に短縮される。

AWS Machine Learning Blog·5月5日·★★★★

Redis に配列データ型が追加される見込み

Redis の開発者であるサルバトーレ・サンフィリッポ氏が、新しいデータ型として「配列」を追加するプルリクエストを提出した。これにより、ARCOUNT や ARINSERT などの新コマンドが利用可能になる。

Simon Willison Blog·5月5日·★★★★

iNaturalist の観測記録を時系列で可視化するツール「Sightings」の紹介

開発者のサイモン・ウィルソン氏が、2 つのアカウントから得た iNaturalist の観測データを時系列ごとにグループ化して確認するため、Claude Code for web を活用しスマートフォン上で独自に構築した CLI ツールを紹介している。

Simon Willison Blog·5月2日

正規化フローを用いたエンドツーエンド動画生成モデル「STARFlow-V」の発表

研究チームは、計算コストが高い動画生成領域において拡散モデルに代わる手法として、正規化フローに基づく新しい動画生成モデル「STARFlow-V」を発表した。

Apple Machine Learning·4月30日·★★★★

LaDiR:潜在拡散モデルがLLMの推論能力を強化する新フレームワーク

研究者らは、既存の大規模言語モデル(LLM)に潜在拡散モデルの特性を組み合わせた「LaDiR」という新たな推論フレームワークを開発しました。この手法は多様な推論経路を並列生成し、計画と修正を包括的に行うことで、精度や解釈性を向上させます。

TLDR AI·4月30日·★★★★

AI動画は序章に過ぎないか?RunwayのCEOが「世界モデル」を次世代と指摘

ニューヨークの企業RunwayのCEOは、生成AI動画が単なる novelty から創造的ツールへ急速に進化したと述べ、同社がGoogleやOpenAIと競合する中、次世代技術として「世界モデル」への移行が必要だと主張している。

TechCrunch AI·4月30日·★★★★

AI に備えたデータ構築:バンガードのバーチャルアナリストへの道

投資管理大手のバンガードが、全投資家への公平な対応を目的に、独自の投資家所有構造のもとで AI 活用に向けたデータ基盤整備とバーチャルアナリズムの実践を開始した。

AWS Machine Learning Blog·4月29日·★★★★

Amazon Nova 2 Sonic を用いたテキストエージェントから音声アシスタントへの移行

AWS は、ユーザーのリアルタイムな自然な対話ニーズに応えるため、Amazon Nova 2 Sonic を活用し、金融や医療などの業界向けにテキストエージェントを音声アシスタントへ移行する手法を発表した。

AWS Machine Learning Blog·4月29日

Amazon Quick Flowsで反復作業を自動化

AWSは「Amazon Quick Flows」を発表し、AIワークフローを用いてデータコピーやレポート作成などの反復業務を自動化する。これにより、チームの戦略的作業に割く時間を確保できる。

AWS Machine Learning Blog·4月28日

ポプサがアマゾン・ノバを活用し、パーソナライズされたタイトル提案で顧客にインスピレーションを与えた方法

写真書籍サービス「ポプサ」は、アマゾンの大規模言語モデル「ノバ」を用い、ユーザーの写真ライブラリから意味のある記憶を掘り起こし、パーソナライズされたタイトル提案を通じて共有可能な体験を提供している。

AWS Machine Learning Blog·4月28日

Gemini 3.1 Flash TTS:表現豊かな次世代AI音声の登場

Googleは、Gemini 3.1 Flash TTSを全Google製品で提供開始した。この新技術は、感情豊かな自然な音声合成を実現し、ユーザー体験を向上させる。

Google AI Blog·4月16日·★★★★

フォルクスワーゲングループが生成AIでマーケティングを再構想

フォルクスワーゲングループが、生成AIを活用してマーケティング業務を革新する取り組みを発表した。同社は2025年1-9月期に660万台の車両を販売する世界有数の自動車メーカーであり、AI技術の導入によりマーケティング効率の向上を目指している。

AWS Machine Learning Blog·3月31日

ジェームズ・マニカとLL COOL JがAIと創造性について語る

Googleのジェームズ・マニカがラッパーLL COOL Jと対談し、AI技術と創造性の関係性について議論した。このセッションは「テクノロジーと社会に関する対話」シリーズの一環として公開された。

Google AI Blog·3月27日

AWS AIリーグ:AtosがAI教育へのアプローチを微調整

AtosとAWSは、AI人材育成の課題解決に向け、従来の研修に加えて実践的な学習プログラム「AWS AIリーグ」を提供している。

AWS Machine Learning Blog·3月18日

コーダーの後のコーディング:私たちが知るコンピュータプログラミングの終わり

ニューヨーク・タイムズ誌のクライブ・トンプソン記者が、Google、Amazon、Microsoft、Appleなどの70人以上のソフトウェア開発者に取材し、AI支援開発がプログラミングの本質を変えつつあると報告した。

Simon Willison Blog·3月13日·★★★★

FIFA、世界サッカー運営をAIで再構築中。ワールドカップは最初の試験に過ぎない

FIFAは、2026年カナダ・メキシコ・アメリカ開催の48チーム・104試合のワールドカップ運営を、従来の現地組織委員会に依存せず直接AIで管理する。

AI News·3月12日·★★★★

『自由トラック』を訪ね、PragerUのAI生成コンテンツ制作者に会う

記者がPragerUのAI生成コンテンツ制作者に会うため『自由トラック』を訪問し、AI生成のジョージ・ワシントンがアメリカ独立戦争について語る様子を観察した。

404 Media·3月9日

GeminiのAIモード「Canvas」が米国Google検索で利用可能に

Googleは、AIアシスタントGeminiの「Canvas」機能を米国のGoogle検索に段階的に展開し、ユーザーが検索結果をAIで編集・カスタマイズできるようにした。

AI Business·3月6日

モジュラーディフューザーの紹介 - 拡散パイプラインのための構成可能なビルディングブロック

研究チームが、拡散モデルパイプラインのための構成可能なビルディングブロック「モジュラーディフューザー」を発表した。この技術は、画像生成AIの開発効率と柔軟性を向上させることを目的としている。

Hugging Face Blog·3月5日·★★★★

ポッドキャスト: AIの自律性がアーキテクチャを再定義 - 境界が最も重要に

ジェスペ氏が、生成AIが単なる自動化層ではなく自律性への移行であると指摘。AIを従来の手順的ワークフローに組み込むことはできず、自律性導入によりシステムは予期せぬ挙動を示すと説明。

InfoQ·3月4日·★★★★

ディープフェイクを打ち負かす:ラップトップファームと内部脅威を阻止する

セキュリティ業界は、ネットワークのゼロトラストモデルを採用しているが、リクエスト背後にいる人物への暗黙の信頼が残っている。ディープフェイク技術により、この信頼が武器化され、ラップトップファームや内部脅威が深刻化している。

Cloudflare Blog·3月4日·★★★★

LendiがAmazon Bedrockを使用したエージェントAIで顧客の借り換えプロセスを16週間で刷新

Lendi Groupは、Amazon Bedrockを活用したエージェントAIを導入し、住宅ローンの借り換えプロセスを16週間で刷新した。同社は、金利変動や個人事情の変化に対応しにくいという顧客の課題を解決した。

AWS Machine Learning Blog·3月4日·★★★★

物理的AIの導入がカスタマーサービスの投資収益率を向上

KDDIとAVITAは、人型ロボットを導入することで複雑な業務課題を解決し、デジタル知能と人間的な物理的相互作用を融合させてカスタマーサービスの投資収益率を向上させている。

AI News·3月3日

Google副社長が警告、2種類のAIスタートアップは生き残れない可能性

生成AIの進化に伴い、LLMラッパーとAIアグリゲーターは利益率の縮小と差別化の難しさから存続が危ぶまれるとGoogle副社長が指摘。

TechCrunch AI·2月22日·★★★★

AIとシミュレーションによる科学の加速

ラファエル・ゴメス・ボンバレリ准教授は、AIを科学発見に応用し、現在が転換点にあると指摘。

MIT ML News·2月12日·★★★★

Painkiller RTXが生成AIを活用してゲームアセットを大規模に近代化する方法

NVIDIAは、Painkiller RTXで生成AIを統合し、小規模チームが限られたリソースで大規模なビジュアル向上を実現する新基準を設定した。

NVIDIA Developer Blog·2月5日·★★★★

プロジェクト・ジーニー:無限でインタラクティブな世界を実験中

米国のGoogle AI Ultra加入者は、世界を作成・探索できる実験的研究プロトタイプ「Project Genie」を試用できます。

Google DeepMind·1月30日·★★★★

UniRG:マルチモーダル強化学習による医療画像レポート生成のスケーリング

UniRGは強化学習を用いて、異なる報告様式に対応した医療画像レポート生成AIの性能を向上させる手法です。

Microsoft Research·1月28日·★★★★