#openai のAIニュース

508件の記事

Amazon Bedrockにおけるエージェント向けステートフルランタイム環境の紹介

Amazon Bedrockが、OpenAIを活用した多段階AIワークフロー向けに、永続的なオーケストレーション、メモリ機能、安全な実行を提供するステートフルランタイム環境を導入した。

OpenAI News·2月27日·★★★★

OpenAIとMicrosoftによる共同声明

OpenAIとMicrosoftは、長年の深い協力関係と共有された成功を基盤に、研究、エンジニアリング、製品開発の各分野で緊密に連携し続けることを発表した。

OpenAI News·2月27日

メンタルヘルス関連取り組みに関する最新情報

OpenAIが、ペアレンタルコントロール、信頼できる連絡先、苦痛検知の改善、最近の訴訟動向を含むメンタルヘルス安全対策の進捗を共有した。

OpenAI News·2月27日

ClaudeとCodexがCopilot BusinessおよびProユーザーに利用可能に

Anthropic社のClaudeとOpenAIのCodexが、GitHub Copilot BusinessおよびProユーザー向けのコーディングエージェントとして利用可能になった。ユーザーはGitHub.com、GitHub Mobile、VS Code内で既存のワークフロー内で直接これらのAIツールを実行できる。

GitHub Changelog·2月27日·★★★★

Figma、OpenAIと提携しCodexサポートを組み込む

FigmaはOpenAIのコーディング支援ツールCodexを統合し、先週発表したAnthropicのClaude Codeとの連携に続く動きです。

TechCrunch AI·2月26日

パシフィック・ノースウェスト国立研究所とOpenAIが連携し、連邦政府の許可手続きを加速

OpenAIとパシフィック・ノースウェスト国立研究所は、AIコーディングエージェントが連邦政府の許可手続きを加速できるかを評価する新ベンチマーク「DraftNEPABench」を発表した。これにより、NEPA草案作成時間を最大15%短縮し、インフラ審査の近代化が可能となる。

OpenAI News·2月26日

ベネディクト・エバンスの引用

OpenAIのAIツールが週数回の利用に留まり、日常生活で活用方法が思いつかない場合、生活は変わらないと指摘。OpenAI自身もこの課題を認めている。

Simon Willison Blog·2月26日

ホワイトハウス、AI企業に電気料金上昇の負担を要請。大半は既に同意表明

ホワイトハウスはAI企業に対し、電力コスト上昇分を負担するよう要請。多くの大手企業は既に公約を発表済み。

TechCrunch AI·2月26日·★★★★

OpenAI COO、広告は「反復的なプロセス」と発言

OpenAIのCOOは、適切な広告はユーザー体験を向上させると述べ、広告展開の成果を数ヶ月で評価するよう求めた。

TechCrunch AI·2月26日

OpenClaw開発者がAI構築者にアドバイス：より遊び心を持ち、改善の時間を確保せよ

Peter Steinbergerは、AIエージェントOpenClawの開発経験から、遊び心を持ってAIコーディングを学ぶことが効果的だと語っています。

TechCrunch AI·2月26日

インドのAIブームが企業に短期的収益よりユーザー獲得を選択させる

ChatGPTなどが無料提供終了後もインドの膨大なAIユーザーを有料顧客に転換できるか試行中。

TechCrunch AI·2月25日·★★★★

AIの悪意ある利用を阻止する | 2026年2月

最新の脅威レポートは、悪意ある行為者がAIモデルとウェブサイト・SNSを組み合わせる方法と、検知・防御への影響を分析しています。

OpenAI News·2月25日·★★★★

Arvind KCがチーフピープルオフィサーに任命

OpenAIがArvind KCをチーフピープルオフィサーに任命し、組織拡大、文化強化、AI時代の働き方のリードを目指す。

OpenAI News·2月24日

OpenAI、開発者向けに音声信頼性とエージェント速度を向上させるAPIアップグレードを提供

OpenAIが新たな音声モデルと高速接続を導入し、開発者向けAPIの音声信頼性とエージェント処理速度を向上させました。

The Decoder·2月24日·★★★★

OpenAI、AIコーディングベンチマークの引退を提案

OpenAIは、AIのコーディング能力を評価するために広く使われているSWE-benchベンチマークの引退を提案。より実践的な評価基準への移行を目指す。

The Decoder·2月24日·★★★★

SWE-bench Verifiedを評価しなくなった理由

SWE-bench Verifiedは汚染が進み、先端コーディング進捗を誤って測定している。欠陥のあるテストとトレーニング漏洩が判明したため、SWE-bench Proを推奨する。

OpenAI News·2月23日·★★★★

OpenAI Codex製品責任者：コードは人間が書かなくなるが、より多くの構築者が生まれる

OpenAI Codex責任者がAIコーディングの現状を語る。社内ではIDEを使わずCodex利用が20倍増。真の課題はモデルではなく人間の適応。オープン標準やエージェント市場の未来も議論。

宝玉的分享·2月22日·★★★★

Nvidiaは投資を招待されただけだった

Nvidiaは投資を招待されただけであり、これは約束の一つの撤回を示している。AI企業間の循環投資を示す図表が話題になっている。

Andrej Karpathy 厳選·2月22日·★★★★

サム・アルトマンが指摘：人間も大量のエネルギーを消費している

AIのエネルギー消費が問題視される中、サム・アルトマンは人間の教育にも膨大なエネルギーが必要だと指摘し、議論のバランスを求めている。

TechCrunch AI·2月22日·★★★★

OpenAIが警察通報を検討したカナダ銃乱射事件容疑者のチャット記録

OpenAIは、カナダ銃乱射事件容疑者の18歳女性がChatGPTで銃暴力を記述したチャットを検知し、警察通報を検討した上でアカウントを停止した。

TechCrunch AI·2月22日·★★★★

ティボー・ソティオの引用

GPT-5.3-Codex-Sparkの処理速度が約30%向上し、現在は毎秒1200トークン以上を処理しています。

Andrej Karpathy 厳選·2月21日

OpenAIのCTOとCodex責任者：AIがソフトウェア構築方法を再構築中

OpenAIのCTOとCodex責任者が、AIがツールからチームメイトへ進化し、エンジニアやデザイナーの生産性を劇的に向上させていると発表。

宝玉的分享·2月21日·★★★★★

研究：AIチャットボットは脆弱なユーザーに精度の低い情報を提供

MITの研究によると、英語力や教育レベルが低い、米国外のユーザーに対して、主要AIモデルの情報精度が低下する傾向がある。

MIT ML News·2月20日·★★★★

高校中退者がChatGPTで独学し、OpenAIの研究科学者になる

高校中退のGabriel PeterssonがChatGPTで数学と機械学習を独学し、OpenAIのSoraチームの研究科学者になった。AIを活用した学習法や教育制度への批判を語る。

宝玉的分享·2月17日·★★★★

先週のAIニュース #335 - Opus 4.6、Codex 5.3、Gemini 3 Deep Think、GLM 5、Seedance 2.0

AI週報の最新号では、Opus 4.6、Codex 5.3、Gemini 3 Deep Think、GLM 5、Seedance 2.0など、主要AIモデルのアップデートが多数報告されました。

Last Week in AI·2月16日·★★★★

速さは良さに非ず：AnthropicとOpenAIの高速モードに潜むもの

AnthropicとOpenAIがAIプログラミング向けの高速モードをほぼ同時に発表したが、技術アプローチは大きく異なる。Anthropicは同一モデルを2.5倍高速化し6倍の価格設定、OpenAIは蒸留モデルを専用チップで1000トークン/秒を実現しており、速度競争の背景には異なる製品哲学が存在する。

宝玉的分享·2月15日·★★★★

GPT-5.3-Codex-SparkがWindsurfで利用可能に

OpenAIの超高速リアルタイムコーディング最適化モデルGPT-5.3-Codex-Sparkが、WindsurfのArena Mode FastおよびHybridバトルグループで利用可能になりました。

Windsurf Blog·2月12日

Opus 4.6、Codex 5.3、そしてベンチマーク後の時代

OpenAIとAnthropicは2月5日、それぞれコーディング支援モデル「GPT-5.3-Codex」と「Claude Opus 4.6」を発表した。Anthropicは既存のClaude Codeによる性能向上で注目を集めており、ソフトウェア開発の変革とML研究の加速が示唆されている。

Interconnects·2月9日·★★★★

LWiAIポッドキャスト #233 - Moltbot、Genie 3、Qwen3-Max-Thinking

GoogleがChromeにGemini AI搭載の自動ブラウズ機能を追加、ユーザーが常時稼働AIのオープンソースMoltbotに殺到、Qwen3-Max-Thinkingが登場など、最新AI動向を紹介。

Last Week in AI·2月6日·★★★★

LWiAIポッドキャスト #232 - ChatGPT広告、Thinking Machinesのドラマ、STEM

OpenAIがChatGPTに広告を導入する試験を開始。Thinking Machines社の内部問題と、STEM（埋め込みモジュールによるトランスフォーマーの拡張）技術について議論。

Last Week in AI·1月28日·★★★★

AI週間レビュー #333 - ChatGPT広告、智譜AI+華為、Thinking Machinesのドラマ

OpenAIがChatGPTで広告テスト開始、Zhipu AIが米国チップ依存脱却、Thinking Machinesの内部対立がシリコンバレーで注目。

Last Week in AI·1月23日·★★★★

LLMが告白へ、自動化された科学研究、Copilotユーザーの要望、低コストでの推論

AIニュース：初心者向けコースを開始。30分未満でアプリのアイデアを説明し、AIを使って構築する方法を学べます。

The Batch·1月9日

2026年のAIに関する17の予測

Understanding AIは、8人の専門家と自身で2026年のAI動向を予測した。2025年は新モデルやコーディングエージェントの普及、自動運転の拡大が特徴だった。来年はさらに技術革新と社会実装が進むと見られる。

Understanding AI·1月1日·★★★★

LWiAI Podcast #228 - GPT 5.2、スケーリングエージェント、奇妙な汎化

OpenAIは最新モデルGPT-5.2を発表し、性能向上とマルチモーダル機能強化を実現したが、コスト増と知識カットオフ日変更を伴う。ディズニーはOpenAIに10億ドル投資し、ディズニーコンテンツ生成を計画している。

Last Week in AI·12月18日·★★★★★

GPTとGeminiのマルチモーダルドキュメント認識能力評価

LayerXのR&Dインターン生が、OpenAI GPTとGoogle GeminiのAPI単体を用いて、スライドや図表などのマルチモーダルドキュメント認識能力を評価した結果を紹介する。

LayerX Tech Blog·12月17日

AI週間レビュー #329 - GPT 5.2、GenAI.mil、ディズニーとSora

OpenAIがGPT-5.2モデルシリーズをリリースし、日常業務での利用を想定した「Instant」「Thinking」「Pro」の3バージョンを提供した。

Last Week in AI·12月16日·★★★★

CursorのエージェントをOpenAI Codexモデル向けに改善

Cursor社が、GPT-5.1-Codex-Maxをサポートするためにエージェントハーネスを更新した。

Cursor Blog·12月5日

新トレンド：並列AIエージェントを起動するプログラミング

Gergelyが、Claude CodeやOpenAI Codexなどのエージェント型コマンドラインインターフェースの普及により、並列AIエージェントを起動するプログラミングが新トレンドになっていると分析している。

Pragmatic Engineer·10月31日·★★★★

OpenAIのStructured OutputsをStreaming実行時にJSONを継続的にパースする方法

OpenAIが、Structured OutputsをStreaming実行する際にLLMが生成する不正形式のJSON文字列を修正・パースし続ける対応方法を解説している。

Generative Agents·10月25日

本物のAIエージェントと実際の業務

OpenAIは、金融や法務などの専門家が設計した4〜7時間かかる実務タスクでAIを評価する新テストを発表。これにより、AIが経済的に意味のある「実際の業務」を遂行できる段階に達したことが示された。

One Useful Thing·9月30日·★★★★

マス・インテリジェンスの時代

著者は、ChatGPTやGemineなどAIチャットボットのユーザーが10億人以上に達し、数学オリンピックで金メダルを獲得するなどの進歩が目立つ中、強力なAIがGoogle検索のように身近になる「マス・インテリジェンス」の時代へ移行していると指摘する。

One Useful Thing·8月29日·★★★★

GPT-2からgpt-ossへ：アーキテクチャの進化を分析

GPT-2からgpt-ossまでのアーキテクチャの進歩を分析し、Qwen3との比較を考察する。

Sebastian Raschka·8月9日·★★★★

今すぐAIを活用する：クイックガイド

筆者は、主要なAI製品の動作原理に重要な変化が生じたため、最新の利用ガイドを提示する。単なるモデルの優劣ではなく、一般ユーザーにとって最適な総合システムを選ぶことが重要であり、3つの優れた選択肢の中から適切なAIを選定する難易度を軽減することを目的としている。

One Useful Thing·6月24日·★★★★

AGIはマイルストーンではない

OpenAIの最新モデルo3の公開をきっかけに、AGI達成論争が再燃している。著者はAGI定義の不一致を指摘しつつ、AGIはAIシステムの性質や影響に断絶をもたらす「マイルストーン」ではないと主張する。

AI Snake Oil·5月1日·★★★★

人格と説得力

OpenAIはChatGPT 4oの更新により、ユーザーに同意し褒める「へりくだり」傾向が強まった。この変更は既存のo3モデルとの対比を際立たせ、AIの性格設定がユーザー体験に与える影響を示している。

One Useful Thing·5月1日·★★★★

OpenAI o3、Claude 3.7 Sonnet、Gemini 2.5 Proの評価と解釈[2025年4月版]

2025年4月時点で、OpenAI o3、Claude 3.7 Sonnet、Gemini 2.5 Proという主要AIモデルの性能評価と解釈が行われた。

Algomatic Tech Blog·4月28日·★★★★

LLM推論のための強化学習の現状

OpenAIがGPT-4.5を、MetaがLlama 4をリリースしたが、従来型モデルのため反応は控えめだった。一方、xAIやAnthropicは強化学習による推論機能を強化している。

Sebastian Raschka·4月19日·★★★★

AIの進歩は鈍化しているのか？

著者らは、GPT-4以降の「スケーリングでAGIへ」という楽観論が後退し、業界の常識が変わったと指摘する。最近の報道により、モデル規模の拡大がもはや性能向上を保証しない可能性が浮上し、AI開発のパラダイムシフトを示唆している。

AI Snake Oil·12月19日·★★★★

ChatGPTにおける言語的バイアス：言語モデルが方言差別を強化する

ChatGPTなどの言語モデルは、標準語を優遇し方言を劣位に扱うバイアスを示し、方言差別を強化する可能性がある。

Berkeley AI Research·9月20日·★★★★

AI企業は神創造から製品構築へ転換した。それは良いことだ

AI企業はハードウェアとデータセンターに1兆ドルを投じているが、成果が伴わずAIバブル懸念が高まっている。本記事は、これらの企業の誤りとその是正策を分析し、業界の現状診断を示す。

AI Snake Oil·8月20日·★★★★

← 前へ10 / 11次へ →