#llm応用 のAIニュース
31件の記事
コグニションのスコット・ウー氏、AI コーディングエージェントが人間を代替すべきではないと主張
コグニションのスコット・ウー氏は、AI コーディングエージェントは人間の開発者を完全に置き換えるべきではなく、あくまで支援ツールとして活用されるべきだと述べています。
アンストロピックの魔法のようなコード検査ツール:現時点ではチェダーよりスイスチーズの方が穴が多い
AnthropicはAIコードセキュリティモデル「Mythos」を公開した。しかし、このシステムは人間が教えた脆弱性しか検出できず、その能力には限界がある。名称の期待と現実のギャップが指摘されている。
エージェントビルダーのメモリ構築方法:エージェントへの記憶機能の実装
Agent Builderチームは、エージェントの能力を向上させるためのメモリシステムを開発した。本記事では、その設計動機、技術的実装の詳細、得られた教訓、および今後の展望について解説している。
大規模なAIコードレビューの運用
筆者のエンジニアチームは、従来のコードレビューが招く待ち時間と分断を解消するため、大規模なAIコードレビューの自動化実験を開始した。
Anthropic、Claude Code向けにエージェントベースのコードレビュー機能を導入
Anthropicは、Claude Code向けに新しいコードレビュー機能を導入し、複数のAIレビュアーを使用してコード変更を分析するエージェントベースのプルリクエストレビューシステムを追加した。
デザイン分野におけるClaude Codeの時代が到来
Claude Designは、3回の対話でインタラクティブなプロトタイプを生成し、デザインツールのルールを変革している。
自動化アライメント研究者:大規模言語モデルを用いてスケーラブルな監視を拡張
自動化アライメント研究者が、大規模言語モデルを活用してAIシステムのスケーラブルな監視手法を拡張する研究を発表した。
ChatGPTを使った研究手法
OpenAIのChatGPTが、検索と深い調査を通じて最新情報を収集し、情報源を分析し、構造化された知見を生成する研究手法を紹介している。
Carta HealthcareがAIに臨床抽象化担当者のように推論させる方法
Carta Healthcareが、AIに臨床抽象化担当者のように推論させる技術を開発した。同社は、医療データの抽出と分析において、AIが人間の専門家と同様の論理的思考プロセスを模倣する手法を確立した。
Amazon Bedrockを活用したテキストからSQLへのソリューション
Amazonは、Amazon Bedrockを基盤としたテキストからSQLへのソリューションを提供し、ビジネスユーザーが日常的な分析クエリをセルフサービスで実行できるようにすることで、データ駆動型組織の課題を解決する。
OpenAI、病院が少ない地域から週60万件の健康相談を受けており、7割は時間外に集中していると発表
OpenAIが発表した調査によると、米国ではChatGPTが週に数百万件の健康相談を受けており、特に医師が不足する地域から週60万件、その7割が診療時間外に集中している。
自律システムの倫理評価
人工知能が高リスク環境での意思決定最適化に活用される中、技術的に最適なAI出力が公平かどうかを問う。低コスト電力配分戦略が低所得地域に不利益をもたらす可能性など、倫理的課題を指摘する。
コンプライアンス証拠収集のためのAI駆動システム構築
GitHubやAWSコンソールなどの複数システムで手動でスクリーンショットを撮るコンプライアンス監査プロセスを、AIシステムが自動化する方法を紹介している。
この企業はあなたのZoom会議をAIポッドキャストに密かに変換している
WebinarTV社は、Zoom会議リンクをインターネット上で秘密裏に収集し、通話を録音してAI生成ポッドキャストに変換し、利益を得ている。
LlamaParseとGemini 3.1でスマートな財務アシスタントを構築
Googleが、非構造化文書から高品質データを抽出するワークフローを紹介。LlamaParseとGemini 3.1モデルを組み合わせ、複雑な財務表の解析と要約を実現するイベント駆動型アーキテクチャを提案している。
AnthropicのClaudeが2週間でFirefoxに22件の脆弱性を発見
AnthropicはMozillaとのセキュリティ連携で、Firefoxに22件の脆弱性(うち14件は「高深刻度」)を発見した。
Mozillaとの提携でFirefoxのセキュリティを向上
Claude Opus 4.6がMozillaの研究者と協力し、2週間でFirefoxの脆弱性を22件発見した。
開発の退屈な部分を自動化した方法
バックエンドエンジニアのVuongVu氏が、開発プロセスにおける反復的で退屈な作業を自動化する手法とその実装方法を紹介している。
ABEMAがAIエージェントを用いてA/Bテスト文化を促進する取り組み
ABEMAのData Scienceチームが、2025年9月から半年間、ミッション型インタラクティブAIエージェントを活用し、A/Bテストの実施を効率化・促進する取り組みを実施した。
コーディングエージェントには最適条件があり、多くの人はそれを飛ばしている
コーディングエージェント成功の4条件:参照物、自己テスト、設計図、方向性の管理。これらを満たせば品質が向上するが、全てのプロジェクトに適するわけではない。
GoogleがOpalに自動化ワークフロー作成機能を追加
GoogleがOpalに新機能として自動化ワークフロー作成機能を追加し、業務効率化を支援します。
Metaの故人シミュレーションAI特許が示す『幽霊労働』の危険性
Metaが故人のユーザーをAIでシミュレーションする特許を取得。研究者は『AI復活』の転換点と指摘し、倫理的懸念を提起。
OpenAI Codex製品責任者:コードは人間が書かなくなるが、より多くの構築者が生まれる
OpenAI Codex責任者がAIコーディングの現状を語る。社内ではIDEを使わずCodex利用が20倍増。真の課題はモデルではなく人間の適応。オープン標準やエージェント市場の未来も議論。
経済研究
経済研究に関する記事の要約です。本文が「Economic Research」のみのため、詳細な内容要約はできません。
Nemotronを使用したRAG向け文書処理パイプラインの構築方法
NVIDIAが、複雑なPDFの解析、ネストされた表の抽出、チャート内データの認識を可能にする、RAG(検索拡張生成)向け文書処理パイプラインの構築方法を紹介している。
CopilotからPilotへ:Agentic Codingによる実装〜PR自動化の取り組み
LINEヤフー株式会社の平野氏が、同社全エンジニアを対象としたAI利活用の一環として、Agentic Coding技術を用いてプルリクエストの自動化を実装する取り組みを紹介している。
貢献度指標で理解するClaude Codeの影響
貢献度指標を用いて、Claude Codeが開発プロセスに与える影響を測定・理解する方法について説明します。
Salesforce、Cursorにより開発速度を30%以上加速し高品質コードを実現
SalesforceはAI駆動開発ツール「Cursor」を導入し、開発速度を30%以上向上させるとともに、コード品質の向上を実現した。
プロジェクト・ベンド:フェーズ2
サンフランシスコ事務所でAI店員が運営する小売店を試験したが成果は不十分。フェーズ2ではAIによる事業運営の実現に向けて調整を進めている。
サイバー防衛者のためのAI構築
Claudeの能力を向上させ、コードやシステムの脆弱性を検出・分析・修復する支援を強化しました。これにより、Claude Sonnet 4.5はOpus 4.1と同等以上の脆弱性発見能力を実現しています。
マルチエージェント研究システムの構築方法
Anthropic社が、複数のClaudeエージェントを使用して複雑なトピックを効果的に探索する研究機能を開発し、その構築過程での技術的課題と得られた教訓を共有した。