#agentic ai のAIニュース

78件の記事

プレゼンテーション:AIネイティブ開発の4つのパターン

Patrick Debois氏が、AI時代のソフトウェアエンジニアリングの進化について議論し、プロデューサーからマネージャーへの移行、仕様駆動開発による実装より意図への焦点、配信から発見への移行、エージェント知識の管理という4つの主要パターンを共有した。

InfoQ·3月9日·★★★★

エージェント型手動テスト

サイモン・ウィリソン氏が、コードを実行して検証できるコーディングエージェントの利点を説明し、LLMが生成したコードは実行確認が必要と指摘している。

Simon Willison Blog·3月6日·★★★★

人間とエージェント的AIのチーム形成の展望:継続性、緊張、未来研究

研究者らは、自律行動・生成表現・進化目標を持つエージェント的AIシステムの台頭が、行動軌道・認識的基盤・論理の安定性に関する構造的不確実性を人間-AIチーム形成にもたらすと指摘する。

ArXiv cs.AI·3月6日·★★★★

自己帰属バイアス:AIモニターが自らを甘く評価する傾向

研究者らが、言語モデルが自身の行動を監視する際、ユーザーではなく自身が提示した行動を評価すると、自己帰属バイアスが生じ、甘い評価を下す傾向があることを示した。

ArXiv cs.AI·3月6日·★★★★

6000万件のCopilotコードレビューを達成

GitHubは、Copilotコードレビュー(CCR)の利用が昨年4月の開始から10倍に増加し、現在GitHub上のコードレビューの5件に1件以上を占めていると発表した。同社はコメント品質向上のための継続的な実験を実施し、リポジトリの文脈を取得するエージェント型アーキテクチャに移行した。

GitHub Blog·3月6日·★★★★

GPT 5.4がAI Gatewayで利用可能に

OpenAIがGPT-5.4とGPT-5.4 ProをAI Gatewayでリリースした。このモデルは、コーディングだけでなく報告書や分析などの知識作業でも複数ステップのワークフローを効率的に処理し、前世代より高速でトークン効率が向上している。

Vercel Blog·3月5日·★★★★

LioがAndreessen Horowitzなどから3000万ドルを調達し、企業調達の自動化を推進

AI調達スタートアップのLioが、Andreessen Horowitz主導で3000万ドルのシリーズA資金を調達した。

TechCrunch AI·3月5日·★★★★

パイロット段階を超えて:Dyna.Aiが8桁のシリーズAを調達し、金融サービス向けエージェントAIを実用化へ

シンガポールのDyna.Aiが、金融機関向けエージェントAIサービスを実用化するため、Lion X Ventures主導で8桁のシリーズA資金を調達した。

AI News·3月5日·★★★★

Copilot MemoryがPro/Pro+ユーザー向けにデフォルトで有効化(パブリックプレビュー)

GitHubが、Copilot ProとCopilot Pro+ユーザー向けに、リポジトリレベルのコード理解を保持するCopilot Memory機能をデフォルトで有効化した。

GitHub Changelog·3月4日

LendiがAmazon Bedrockを使用したエージェントAIで顧客の借り換えプロセスを16週間で刷新

Lendi Groupは、Amazon Bedrockを活用したエージェントAIを導入し、住宅ローンの借り換えプロセスを16週間で刷新した。同社は、金利変動や個人事情の変化に対応しにくいという顧客の課題を解決した。

AWS Machine Learning Blog·3月4日·★★★★

TinesがAmazon Quick Suiteでセキュリティ分析を強化する方法

TinesはAmazon Quick Suiteを活用し、複数アプリに分散するセキュリティデータを自動相関・対応することで、組織の異常ログイン検知と対応を迅速化する。

AWS Machine Learning Blog·3月4日

カレンダー招待状だけでPerplexityのCometブラウザを乗っ取り、1Passwordの認証情報を盗む手法が実証

セキュリティ研究者が、改ざんされたカレンダー招待状でPerplexityのエージェント型Cometブラウザを騙し、ローカルファイルを盗んで1Passwordアカウントを完全に乗っ取る手法を実証した。

The Decoder·3月3日·★★★★

サンタンデール銀行とマスターカードが欧州初のAI実行支払いパイロットを実施

サンタンデール銀行とマスターカードが、欧州で初めてAIエージェントが人間の最終コマンドなしに銀行ネットワーク内で支払いを完了する実証実験を実施した。

AI News·3月3日·★★★★

PlanetScale、Bugbotで本番環境の信頼性を保護

PlanetScaleはBugbotを導入し、本番環境の信頼性を保護した。Bugbotは2人のフルタイムエンジニアに相当するレビュー作業を削減した。

Cursor Blog·3月2日

金融サービスにおけるAI導入は不可逆的な段階に到達

Finastraの調査によると、金融機関の98%が何らかのAIを活用しており、導入は不可逆的段階に達した。CIOらは今後、AI活用の深化と機会・課題への対応が求められる。

AI News·3月2日·★★★★

アイデアからプルリクエストへ:GitHub Copilot CLIで構築する実践ガイド

GitHubが、開発者がターミナルでプロジェクトを初期化・テスト・デバッグする現実に合わせて、GitHub Copilot CLIが意図からレビュー可能な差分まで直接支援する実践的なワークフローを紹介している。

GitHub Blog·2月28日

金融ワークフロー向けエージェントAIの信頼性向上

企業が顧客対応や事務作業に自動エージェントを導入する中、金融機関は特に多段階シナリオでの一貫性・説明可能性の課題を解決し、エージェントAIへの信頼向上を優先している。

AI News·2月27日·★★★★

ゴールドマン・サックスとドイツ銀行が取引監視にエージェントAIをテスト

ゴールドマン・サックスとドイツ銀行は、キーワード検索や事前設定ルールを超え、リアルタイムでパターンを推論し人間の審査が必要な行動を検知する「エージェントAI」を取引監視にテストしている。

AI News·2月27日·★★★★

AWS上のHugging Face smolagentsを用いたマルチモデルフレームワークによるエージェント型AI

Hugging FaceのJeff Boudierらは、AWS上でsmolagentsを用いたマルチモデルフレームワークによるエージェント型AIシステムを発表した。このシステムは、複雑な推論・ツール使用・コード実行が可能な自律エージェントへと進化し、企業向けに管理エンドポイントや自動スケーリング機能を提供する。

AWS Machine Learning Blog·2月24日·★★★★

Gemini 3.1 Pro: 最も複雑なタスクのための賢いモデル

Gemini 3.1 Proは、単純な回答では不十分な複雑なタスク向けに設計されたAIモデルです。

Google DeepMind·2月20日·★★★★

エージェント時代におけるAI活用法ガイド

著者は、ChatGPT登場以来のガイドの中で今回が最大の変革と位置付ける。従来のチャットボットとの対話から、タスクを委任してツールを活用して実行する「エージェント」としてのAI利用が実用化されたことを説明し、この変化に対応した新しい活用法を提示している。

One Useful Thing·2月18日·★★★★

Claude Opus 4.6の紹介

AnthropicがClaude Opus 4.6を発表した。この新バージョンは、AIアシスタントの性能向上を目指すリリースである。

Anthropic News·2月5日·★★★★★

H社の新Holo2モデルがUIローカライゼーションで先行

H社が新たに発表したHolo2モデルは、ユーザーインターフェースのローカライゼーション分野でリードする技術を提供する。

Hugging Face Blog·2月4日·★★★★

CopilotからPilotへ:Agentic Codingによる実装〜PR自動化の取り組み

LINEヤフー株式会社の平野氏が、同社全エンジニアを対象としたAI利活用の一環として、Agentic Coding技術を用いてプルリクエストの自動化を実装する取り組みを紹介している。

LY Corp Tech Blog·1月29日·★★★★

Salesforce、Slackbot AIエージェントを刷新し、MicrosoftやGoogleと職場AIで競争

SalesforceはSlackbotを単なる通知ツールからAIエージェントに刷新し、MicrosoftやGoogleとの職場AI競争を強化。

VentureBeat AI·1月13日·★★★★

Seed Prover 1.5:新たなエージェント型アーキテクチャと強化された数学的推論能力

バイトダンスのSeedチームは、新たなエージェント型アーキテクチャを採用した「Seed Prover 1.5」を発表し、2025年のプットナム数学競技会の11問を9時間で解決するなど、数学的推論能力が大幅に向上したことを示した。

字节跳动Seed·12月24日·★★★★

Amazon Research Award受賞者63名が発表される

Amazonが、8カ国41大学の研究者63名をAmazon Research Award受賞者として発表し、受賞者はAmazonの公開データセットとAWSのAI/MLサービス・ツールにアクセスできる。

Amazon Science·11月26日

Qwen3-Coder:世界におけるエージェント型コーディング

QwenチームはMoE方式の「Qwen3-Coder」を発表した。最大1Mトークンに対応し、コーディングとエージェントタスクで卓越する。

Qwen Blog·7月22日·★★★★