#generative ai のAIニュース

203件の記事

このスタートアップは、ロボット工学がまさに ChatGPT のような転換点を迎えると考える

あるスタートアップ企業が、ロボット工学分野が ChatGPT の登場のような画期的な転換期に差し掛かっていると主張している。

TechCrunch AI·7月9日

Amazon Bedrock を活用してメールボックスを自動的にソート・優先順位付けする

AWS は、公共セクター向けに Amazon Bedrock を使用した AI によるメール管理機能を発表し、緊急度や部署の関連性に基づいてメールを自動分類・ルーティングするシステムを提供します。

AWS Machine Learning Blog·7月9日

AWS財務チームがAmazon QuickSightで数百時間を節約した方法

AWSの財務チームは、複数のシステムからのデータ収集や集計に毎月数百時間を費やしていた。彼らはAmazon QuickSightを導入することで、この業務を自動化し、時間とリソースを大幅に削減することに成功した。

AWS Machine Learning Blog·7月8日·★★★★

メタ AI、画像生成モデル「Muse Image」と動画生成モデル「Muse Video」を発表

メタ AI は、高品質な画像と動画を生成する新しい AI モデル「Muse Image」「Muse Video」を正式に発表した。これにより、クリエイティブ分野での生成能力が強化される見込みである。

Meta AI·7月7日

MT-EditFlow：フローマッチングを用いた多ターン画像編集のための強化学習手法

Apple Machine Learning は、ユーザーがモデルの出力に基づいて画像を反復的に修正する多ターン編集において既存モデルが失敗する課題に対し、強化学習とフローマッチングを組み合わせた「MT-EditFlow」を発表した。

Apple Machine Learning·7月7日·★★★★

Google の新 CM が建国の父たちを AI に頼る姿として描き、批判を浴びている

Google は Workspace と Gemini を使用して独立宣言起草を支援する建国の父たちの架空の姿を描いた新 CM を公開したが、その内容が不自然で批判を招いている。

The Verge AI·7月5日

Google、AI を活用して独立宣言書を作成する商業広告を発表

Google は、AI の支援を受けて独立宣言書が作成される様子を描写した新しい商業広告を公開しました。

TechCrunch AI·7月5日

Josh W. Comeau が AI をオンラインコース販売の減少要因と指摘

開発者向け教育者の Josh W. Comeau は、自身のオンラインコースの販売数が前年比で大幅に減少したと報告し、その最大の理由として生成 AI の普及を挙げている。

Simon Willison Blog·7月4日·★★★★

Anthropic、自社製薬の開発を計画

AI企業アントロピックは科学者向け作業環境「Claude Science」を発表し、断片化されたツールやデータセットを統合して図表を生成する機能を備えた。同社は既存の強力なAIモデルとコーディングツールの成功を背景に、この新発表を通じて製薬分野への参入を示唆している。

The Verge AI·7月3日·★★★★

武田薬品、Insilico Medicine と AI 創薬で 6 億ドル契約を締結

武田薬品は香港の Insilico Medicine と戦略的提携を結び、同社の AI プラットフォーム「Pharma.AI」を活用して新薬開発の初期段階を加速させる。

AI News·7月3日·★★★★

残差コンテキスト拡散言語モデル（2 分読了）

最先端のブロック別拡散大規模言語モデルが、自信のあるトークンのみを復号し他を破棄する仕組みに対し、破棄されたトークンの情報を残差として次ステップに注入する新モジュール「Residual Context Diffusion」を開発した。

TLDR AI·7月3日·★★★★

Amazon Bedrock が生成 AI を利用したフィッシング攻撃を検知する方法

AWS は、生成 AI で作成された高度なフィッシングメールのリスクに対処するため、Amazon Bedrock の機能を活用して検知する仕組みを発表しました。

AWS Machine Learning Blog·7月3日·★★★★

拡散言語モデルにおけるアンマスキングポリシーの学習

Apple Machine Learning は、拡散型大規模言語モデル（dLLMs）の推論効率を高めるため、トークンのアンマスキング順序を決定する新しい学習手法を提案した。これにより、サンプル品質と処理速度の向上が期待される。

Apple Machine Learning·7月2日·★★★★

VideoFlexTok：柔軟な長さの粗から細への動画トークン化手法

Apple Machine Learning は、動画を時空間グリッドで表現する既存手法を改善し、柔軟な長さに適応できる粗から細への動画トークン化技術「VideoFlexTok」を発表した。

Apple Machine Learning·7月2日·★★★★

AI の雇用への影響を再考：企業レベルの AI 支出と workforce 調整に関する新研究

Ramp と Revelio Labs が共同で実施した調査では、米国の 21,000 社以上を対象に、生成 AI への積極的な投資を行った企業が、導入後 2 年間で全体の雇用者を 10.2%、初級職を 12% 増加させたことが明らかになった。

TLDR AI·7月2日·★★★★

Inscribe が Amazon Bedrock を活用して数秒で文書詐欺を検出する方法

Inscribe は、Amazon Bedrock を利用し、AI 生成による偽造文書の急増に対応して、金融機関向けに数秒以内に文書詐欺を検出する仕組みを提供している。

AWS Machine Learning Blog·7月2日·★★★★

LLM の拡散研究ではない、最も興味深い拡散研究とは？Genesis Molecular AI の Evan Feinberg と Sergey Edunov

Latent Space が、創薬分野のスタートアップ「Genesis Molecular AI」の共同設立者であるエバン・ファインバーグ氏とセルゲイ・エドゥノフ氏を招き、大規模言語モデル（LLM）ではなく拡散モデルに関する最新の研究について議論した。

Latent Space·7月1日·★★★★

AI を活用した検索の知能化を推進

クラウドフレアは、ウェブ上の発見プロセスを支える検索機能を AI で強化し、コンテンツ作成者や商売人の見つけやすさを向上させる取り組みを発表しました。

Cloudflare Blog·7月1日·★★★★

Google は優れたスマートスピーカーを構築したが、Gemini はまだ準備ができていない

The Verge AI は、過去数年間苦戦してきたスマートスピーカー市場において、Google が新ハードウェアを発表したものの、AI 機能である Gemini の完成度が不足しており、厨房のカウンターに置く正当な理由付けがまだ不十分であると報じている。

The Verge AI·7月1日

Nano Banana 2 Lite の紹介

Google DeepMind が発表した画像生成モデル「Gemini 3.1 Flash Lite Image」は、速度と規模に最適化された最も高速かつ低コストな Gemini 画像モデルである。

Simon Willison Blog·7月1日

Google、より高速かつ低コストな画像生成モデル「Nano Banana 2 Lite」を発表

Google は、画像生成の速度向上とコスト削減を実現する新モデル「Nano Banana 2 Lite」を正式に発表した。

TechCrunch AI·7月1日

Google の新画像生成モデル「Nano Banana 2 Lite」は最速かつ最安値

Google DeepMind は、Gemini 3.1 フラッシュライト画像として公開された新モデル「Nano Banana 2 Lite」を発表した。同社は、このモデルが品質と速度のバランスに優れ、既存の大型モデルよりも大幅に高速で低コストな画像生成を実現できると説明している。

Ars Technica AI·7月1日·★★★★

Amazon Bedrock と LLM ゲートウェイを用いたレジリエンスパターンの実装

AWS は、生成 AI ワークロードが実験段階から大規模な本番環境へ移行する中で、LLM 推論の可用性・応答性・コスト効率を維持するため、Amazon Bedrock と LLM ゲートウェイを活用したレジリエンスパターンの実装方法を発表した。

AWS Machine Learning Blog·7月1日·★★★★

Outpost VFX が AWS を活用して VFX 向け AI モデル学習を加速した方法

Outpost VFX は、AWS インフラストラクチャを活用することで、VFX 制作における AI モデルの学習時間を従来の 8 倍に短縮し、納期遅延のリスクを大幅に削減しました。

AWS Machine Learning Blog·7月1日·★★★★

データ駆動型美学を超えて：MIT の展示会が探る計算と創造の融合

MIT アーキテクチャ出身の研究者アレクサンドロス・ハリディスが、哲学や数学、機械学習システムを物理インスタレーションに変換する展覧会を開催し、コンピューティングを創造的表現の媒体とする試みを検証している。

MIT ML News·6月30日

RAG パイプラインは役に立たない可能性が高い。より良い代替案とは

KDnuggets は、従来の RAG（検索拡張生成）パイプラインが多くの場合無効であるとし、その課題を解決する新たな代替アプローチを紹介している。

KDnuggets·6月29日·★★★★

DiScoFormer：分布をまたぐ密度とスコア推定のための単一トランスフォーマー

Allen AI は、有限のサンプルから1回の順伝播で密度とスコアの両方を推論できる「DiScoFormer」というトランスフォーマーベースの手法を発表した。このモデルは古典的なカーネル密度推定を一般化し、再学習なしで高次元や分布外データでも高精度に動作する。

Allen AI (AI2)·6月29日·★★★★

LLM は学習曲線がないという考えへの反論

Simon Willison が Timothy B. Lee の発言を紹介し、大規模言語モデル（LLM）を使ってもスキルや学習が必要ないとする考えは誤りだと指摘した。

Simon Willison Blog·6月27日

2,000人が私のAIアシスタントのハッキングを試みた結果

フェルナンド・イララザバル氏が運営する「OpenClaw」テストインスタンスに対し、6,000回の試みと500ドルのトークン使用が行われたが、秘密情報の漏洩は発生しなかった。

Simon Willison Blog·6月27日·★★★★

NVIDIA ACE を活用した KRAFTON の共演可能キャラクター「PUBG Ally」の構築方法

ゲーム開発会社 KRAFTON は、NVIDIA の AI 技術プラットフォーム「ACE」を活用し、プレイヤーと対話可能な共演可能キャラクター「PUBG Ally」を PUBG に実装した。

NVIDIA Developer Blog·6月26日·★★★★

Gemini を活用して Google スプレッドシートを作成する方法

Google が提供する AI モデル「Gemini」を用いて、ユーザーが直接 Google スプレッドシートを生成・操作する機能の利用方法について解説している。

KDnuggets·6月26日

AI を駆使した説明と実験による脳理解の探求

マイクロソフト研究所は、大規模言語モデルを用いて人間の脳の言語反応を高精度に予測する手法を開発したが、その性能の根拠となるパラメータ群は解読不能である。同所は大学と連携し、生成因果テスト（GCT）という新たなアプローチでこの黒箱問題を解決しようとしている。

Microsoft Research·6月26日·★★★★

動画拡散潜在変数からの三角形スプラット生成（5 分読了）

研究チームが、動画拡散モデルの潜在表現から三角形スプラットを直接生成する手法を発表し、3D 再構築の効率化を実現した。

TLDR AI·6月25日·★★★★

スナップの AI スペックス：笑えるほど奇妙な体験

404 Media は、チャールズ国王の肖像画を背景に、巨大で重たい Snap Specs を装着した際、デジタル版が実像に重ねられ、ナレーターが蝶に触れるよう指示する奇妙な体験を紹介している。

404 Media·6月24日

2026 年版生成 AI コーディングツール比較：16 の最良ツールと特徴、最適な用途

MarkTechPost は、ソフトウェア構築を再定義した生成 AI ツールの中から、2026 年に最も優れた 16 のツールを選定し、各機能や開発者への適合性を比較して紹介している。

MarkTechPost·6月24日·★★★★

Omio、OpenAI モデルを活用して旅行製品開発を加速

多言語・多モーダルな旅行プラットフォーム「Omio」は、エンジニアリング業務全体に OpenAI のモデルを導入し、47 カ国で 3,000 以上の交通事業者と連携する予約インターフェースの迅速な立ち上げを実現した。同社は単なる技術追加を拒否し、全社内機能で業務実行フレームワークの根本的再設計を推進している。

AI News·6月24日·★★★★