#openai のAIニュース
508件の記事
Amazon Bedrockにおけるエージェント向けステートフルランタイム環境の紹介
Amazon Bedrockが、OpenAIを活用した多段階AIワークフロー向けに、永続的なオーケストレーション、メモリ機能、安全な実行を提供するステートフルランタイム環境を導入した。
OpenAIとMicrosoftによる共同声明
OpenAIとMicrosoftは、長年の深い協力関係と共有された成功を基盤に、研究、エンジニアリング、製品開発の各分野で緊密に連携し続けることを発表した。
メンタルヘルス関連取り組みに関する最新情報
OpenAIが、ペアレンタルコントロール、信頼できる連絡先、苦痛検知の改善、最近の訴訟動向を含むメンタルヘルス安全対策の進捗を共有した。
ClaudeとCodexがCopilot BusinessおよびProユーザーに利用可能に
Anthropic社のClaudeとOpenAIのCodexが、GitHub Copilot BusinessおよびProユーザー向けのコーディングエージェントとして利用可能になった。ユーザーはGitHub.com、GitHub Mobile、VS Code内で既存のワークフロー内で直接これらのAIツールを実行できる。
Figma、OpenAIと提携しCodexサポートを組み込む
FigmaはOpenAIのコーディング支援ツールCodexを統合し、先週発表したAnthropicのClaude Codeとの連携に続く動きです。
パシフィック・ノースウェスト国立研究所とOpenAIが連携し、連邦政府の許可手続きを加速
OpenAIとパシフィック・ノースウェスト国立研究所は、AIコーディングエージェントが連邦政府の許可手続きを加速できるかを評価する新ベンチマーク「DraftNEPABench」を発表した。これにより、NEPA草案作成時間を最大15%短縮し、インフラ審査の近代化が可能となる。
ベネディクト・エバンスの引用
OpenAIのAIツールが週数回の利用に留まり、日常生活で活用方法が思いつかない場合、生活は変わらないと指摘。OpenAI自身もこの課題を認めている。
ホワイトハウス、AI企業に電気料金上昇の負担を要請。大半は既に同意表明
ホワイトハウスはAI企業に対し、電力コスト上昇分を負担するよう要請。多くの大手企業は既に公約を発表済み。
OpenAI COO、広告は「反復的なプロセス」と発言
OpenAIのCOOは、適切な広告はユーザー体験を向上させると述べ、広告展開の成果を数ヶ月で評価するよう求めた。
OpenClaw開発者がAI構築者にアドバイス:より遊び心を持ち、改善の時間を確保せよ
Peter Steinbergerは、AIエージェントOpenClawの開発経験から、遊び心を持ってAIコーディングを学ぶことが効果的だと語っています。
インドのAIブームが企業に短期的収益よりユーザー獲得を選択させる
ChatGPTなどが無料提供終了後もインドの膨大なAIユーザーを有料顧客に転換できるか試行中。
AIの悪意ある利用を阻止する | 2026年2月
最新の脅威レポートは、悪意ある行為者がAIモデルとウェブサイト・SNSを組み合わせる方法と、検知・防御への影響を分析しています。
Arvind KCがチーフピープルオフィサーに任命
OpenAIがArvind KCをチーフピープルオフィサーに任命し、組織拡大、文化強化、AI時代の働き方のリードを目指す。
OpenAI、開発者向けに音声信頼性とエージェント速度を向上させるAPIアップグレードを提供
OpenAIが新たな音声モデルと高速接続を導入し、開発者向けAPIの音声信頼性とエージェント処理速度を向上させました。
OpenAI、AIコーディングベンチマークの引退を提案
OpenAIは、AIのコーディング能力を評価するために広く使われているSWE-benchベンチマークの引退を提案。より実践的な評価基準への移行を目指す。
SWE-bench Verifiedを評価しなくなった理由
SWE-bench Verifiedは汚染が進み、先端コーディング進捗を誤って測定している。欠陥のあるテストとトレーニング漏洩が判明したため、SWE-bench Proを推奨する。
OpenAI Codex製品責任者:コードは人間が書かなくなるが、より多くの構築者が生まれる
OpenAI Codex責任者がAIコーディングの現状を語る。社内ではIDEを使わずCodex利用が20倍増。真の課題はモデルではなく人間の適応。オープン標準やエージェント市場の未来も議論。
Nvidiaは投資を招待されただけだった
Nvidiaは投資を招待されただけであり、これは約束の一つの撤回を示している。AI企業間の循環投資を示す図表が話題になっている。
サム・アルトマンが指摘:人間も大量のエネルギーを消費している
AIのエネルギー消費が問題視される中、サム・アルトマンは人間の教育にも膨大なエネルギーが必要だと指摘し、議論のバランスを求めている。
OpenAIが警察通報を検討したカナダ銃乱射事件容疑者のチャット記録
OpenAIは、カナダ銃乱射事件容疑者の18歳女性がChatGPTで銃暴力を記述したチャットを検知し、警察通報を検討した上でアカウントを停止した。
ティボー・ソティオの引用
GPT-5.3-Codex-Sparkの処理速度が約30%向上し、現在は毎秒1200トークン以上を処理しています。
OpenAIのCTOとCodex責任者:AIがソフトウェア構築方法を再構築中
OpenAIのCTOとCodex責任者が、AIがツールからチームメイトへ進化し、エンジニアやデザイナーの生産性を劇的に向上させていると発表。
研究:AIチャットボットは脆弱なユーザーに精度の低い情報を提供
MITの研究によると、英語力や教育レベルが低い、米国外のユーザーに対して、主要AIモデルの情報精度が低下する傾向がある。
高校中退者がChatGPTで独学し、OpenAIの研究科学者になる
高校中退のGabriel PeterssonがChatGPTで数学と機械学習を独学し、OpenAIのSoraチームの研究科学者になった。AIを活用した学習法や教育制度への批判を語る。
先週のAIニュース #335 - Opus 4.6、Codex 5.3、Gemini 3 Deep Think、GLM 5、Seedance 2.0
AI週報の最新号では、Opus 4.6、Codex 5.3、Gemini 3 Deep Think、GLM 5、Seedance 2.0など、主要AIモデルのアップデートが多数報告されました。
速さは良さに非ず:AnthropicとOpenAIの高速モードに潜むもの
AnthropicとOpenAIがAIプログラミング向けの高速モードをほぼ同時に発表したが、技術アプローチは大きく異なる。Anthropicは同一モデルを2.5倍高速化し6倍の価格設定、OpenAIは蒸留モデルを専用チップで1000トークン/秒を実現しており、速度競争の背景には異なる製品哲学が存在する。
GPT-5.3-Codex-SparkがWindsurfで利用可能に
OpenAIの超高速リアルタイムコーディング最適化モデルGPT-5.3-Codex-Sparkが、WindsurfのArena Mode FastおよびHybridバトルグループで利用可能になりました。
Opus 4.6、Codex 5.3、そしてベンチマーク後の時代
OpenAIとAnthropicは2月5日、それぞれコーディング支援モデル「GPT-5.3-Codex」と「Claude Opus 4.6」を発表した。Anthropicは既存のClaude Codeによる性能向上で注目を集めており、ソフトウェア開発の変革とML研究の加速が示唆されている。
LWiAIポッドキャスト #233 - Moltbot、Genie 3、Qwen3-Max-Thinking
GoogleがChromeにGemini AI搭載の自動ブラウズ機能を追加、ユーザーが常時稼働AIのオープンソースMoltbotに殺到、Qwen3-Max-Thinkingが登場など、最新AI動向を紹介。
LWiAIポッドキャスト #232 - ChatGPT広告、Thinking Machinesのドラマ、STEM
OpenAIがChatGPTに広告を導入する試験を開始。Thinking Machines社の内部問題と、STEM(埋め込みモジュールによるトランスフォーマーの拡張)技術について議論。
AI週間レビュー #333 - ChatGPT広告、智譜AI+華為、Thinking Machinesのドラマ
OpenAIがChatGPTで広告テスト開始、Zhipu AIが米国チップ依存脱却、Thinking Machinesの内部対立がシリコンバレーで注目。
LLMが告白へ、自動化された科学研究、Copilotユーザーの要望、低コストでの推論
AIニュース:初心者向けコースを開始。30分未満でアプリのアイデアを説明し、AIを使って構築する方法を学べます。
2026年のAIに関する17の予測
Understanding AIは、8人の専門家と自身で2026年のAI動向を予測した。2025年は新モデルやコーディングエージェントの普及、自動運転の拡大が特徴だった。来年はさらに技術革新と社会実装が進むと見られる。
LWiAI Podcast #228 - GPT 5.2、スケーリングエージェント、奇妙な汎化
OpenAIは最新モデルGPT-5.2を発表し、性能向上とマルチモーダル機能強化を実現したが、コスト増と知識カットオフ日変更を伴う。ディズニーはOpenAIに10億ドル投資し、ディズニーコンテンツ生成を計画している。
GPTとGeminiのマルチモーダルドキュメント認識能力評価
LayerXのR&Dインターン生が、OpenAI GPTとGoogle GeminiのAPI単体を用いて、スライドや図表などのマルチモーダルドキュメント認識能力を評価した結果を紹介する。
AI週間レビュー #329 - GPT 5.2、GenAI.mil、ディズニーとSora
OpenAIがGPT-5.2モデルシリーズをリリースし、日常業務での利用を想定した「Instant」「Thinking」「Pro」の3バージョンを提供した。
CursorのエージェントをOpenAI Codexモデル向けに改善
Cursor社が、GPT-5.1-Codex-Maxをサポートするためにエージェントハーネスを更新した。
新トレンド:並列AIエージェントを起動するプログラミング
Gergelyが、Claude CodeやOpenAI Codexなどのエージェント型コマンドラインインターフェースの普及により、並列AIエージェントを起動するプログラミングが新トレンドになっていると分析している。
OpenAIのStructured OutputsをStreaming実行時にJSONを継続的にパースする方法
OpenAIが、Structured OutputsをStreaming実行する際にLLMが生成する不正形式のJSON文字列を修正・パースし続ける対応方法を解説している。
本物のAIエージェントと実際の業務
OpenAIは、金融や法務などの専門家が設計した4〜7時間かかる実務タスクでAIを評価する新テストを発表。これにより、AIが経済的に意味のある「実際の業務」を遂行できる段階に達したことが示された。
マス・インテリジェンスの時代
著者は、ChatGPTやGemineなどAIチャットボットのユーザーが10億人以上に達し、数学オリンピックで金メダルを獲得するなどの進歩が目立つ中、強力なAIがGoogle検索のように身近になる「マス・インテリジェンス」の時代へ移行していると指摘する。
GPT-2からgpt-ossへ:アーキテクチャの進化を分析
GPT-2からgpt-ossまでのアーキテクチャの進歩を分析し、Qwen3との比較を考察する。
今すぐAIを活用する:クイックガイド
筆者は、主要なAI製品の動作原理に重要な変化が生じたため、最新の利用ガイドを提示する。単なるモデルの優劣ではなく、一般ユーザーにとって最適な総合システムを選ぶことが重要であり、3つの優れた選択肢の中から適切なAIを選定する難易度を軽減することを目的としている。
AGIはマイルストーンではない
OpenAIの最新モデルo3の公開をきっかけに、AGI達成論争が再燃している。著者はAGI定義の不一致を指摘しつつ、AGIはAIシステムの性質や影響に断絶をもたらす「マイルストーン」ではないと主張する。
人格と説得力
OpenAIはChatGPT 4oの更新により、ユーザーに同意し褒める「へりくだり」傾向が強まった。この変更は既存のo3モデルとの対比を際立たせ、AIの性格設定がユーザー体験に与える影響を示している。
OpenAI o3、Claude 3.7 Sonnet、Gemini 2.5 Proの評価と解釈[2025年4月版]
2025年4月時点で、OpenAI o3、Claude 3.7 Sonnet、Gemini 2.5 Proという主要AIモデルの性能評価と解釈が行われた。
LLM推論のための強化学習の現状
OpenAIがGPT-4.5を、MetaがLlama 4をリリースしたが、従来型モデルのため反応は控えめだった。一方、xAIやAnthropicは強化学習による推論機能を強化している。
AIの進歩は鈍化しているのか?
著者らは、GPT-4以降の「スケーリングでAGIへ」という楽観論が後退し、業界の常識が変わったと指摘する。最近の報道により、モデル規模の拡大がもはや性能向上を保証しない可能性が浮上し、AI開発のパラダイムシフトを示唆している。
ChatGPTにおける言語的バイアス:言語モデルが方言差別を強化する
ChatGPTなどの言語モデルは、標準語を優遇し方言を劣位に扱うバイアスを示し、方言差別を強化する可能性がある。
AI企業は神創造から製品構築へ転換した。それは良いことだ
AI企業はハードウェアとデータセンターに1兆ドルを投じているが、成果が伴わずAIバブル懸念が高まっている。本記事は、これらの企業の誤りとその是正策を分析し、業界の現状診断を示す。