#llm応用のAIニュース

31件の記事

コグニションのスコット・ウー氏、AI コーディングエージェントが人間を代替すべきではないと主張

コグニションのスコット・ウー氏は、AI コーディングエージェントは人間の開発者を完全に置き換えるべきではなく、あくまで支援ツールとして活用されるべきだと述べています。

TechCrunch AI·5月30日·★★★★

アンストロピックの魔法のようなコード検査ツール：現時点ではチェダーよりスイスチーズの方が穴が多い

AnthropicはAIコードセキュリティモデル「Mythos」を公開した。しかし、このシステムは人間が教えた脆弱性しか検出できず、その能力には限界がある。名称の期待と現実のギャップが指摘されている。

The Register AI/ML·4月27日

エージェントビルダーのメモリ構築方法：エージェントへの記憶機能の実装

Agent Builderチームは、エージェントの能力を向上させるためのメモリシステムを開発した。本記事では、その設計動機、技術的実装の詳細、得られた教訓、および今後の展望について解説している。

LangChain Blog·4月23日

大規模なAIコードレビューの運用

筆者のエンジニアチームは、従来のコードレビューが招く待ち時間と分断を解消するため、大規模なAIコードレビューの自動化実験を開始した。

Cloudflare Blog·4月20日·★★★★

Anthropic、Claude Code向けにエージェントベースのコードレビュー機能を導入

Anthropicは、Claude Code向けに新しいコードレビュー機能を導入し、複数のAIレビュアーを使用してコード変更を分析するエージェントベースのプルリクエストレビューシステムを追加した。

InfoQ·4月17日

デザイン分野におけるClaude Codeの時代が到来

Claude Designは、3回の対話でインタラクティブなプロトタイプを生成し、デザインツールのルールを変革している。

宝玉的分享·4月17日·★★★★

自動化アライメント研究者：大規模言語モデルを用いてスケーラブルな監視を拡張

自動化アライメント研究者が、大規模言語モデルを活用してAIシステムのスケーラブルな監視手法を拡張する研究を発表した。

Anthropic Research·4月14日·★★★★

ChatGPTを使った研究手法

OpenAIのChatGPTが、検索と深い調査を通じて最新情報を収集し、情報源を分析し、構造化された知見を生成する研究手法を紹介している。

OpenAI News·4月10日

Carta HealthcareがAIに臨床抽象化担当者のように推論させる方法

Carta Healthcareが、AIに臨床抽象化担当者のように推論させる技術を開発した。同社は、医療データの抽出と分析において、AIが人間の専門家と同様の論理的思考プロセスを模倣する手法を確立した。

Claude Blog·4月8日·★★★★

Amazon Bedrockを活用したテキストからSQLへのソリューション

Amazonは、Amazon Bedrockを基盤としたテキストからSQLへのソリューションを提供し、ビジネスユーザーが日常的な分析クエリをセルフサービスで実行できるようにすることで、データ駆動型組織の課題を解決する。

AWS Machine Learning Blog·4月8日

OpenAI、病院が少ない地域から週60万件の健康相談を受けており、7割は時間外に集中していると発表

OpenAIが発表した調査によると、米国ではChatGPTが週に数百万件の健康相談を受けており、特に医師が不足する地域から週60万件、その7割が診療時間外に集中している。

The Decoder·4月6日·★★★★

自律システムの倫理評価

人工知能が高リスク環境での意思決定最適化に活用される中、技術的に最適なAI出力が公平かどうかを問う。低コスト電力配分戦略が低所得地域に不利益をもたらす可能性など、倫理的課題を指摘する。

MIT ML News·4月2日·★★★★

コンプライアンス証拠収集のためのAI駆動システム構築

GitHubやAWSコンソールなどの複数システムで手動でスクリーンショットを撮るコンプライアンス監査プロセスを、AIシステムが自動化する方法を紹介している。

AWS Machine Learning Blog·4月1日

この企業はあなたのZoom会議をAIポッドキャストに密かに変換している

WebinarTV社は、Zoom会議リンクをインターネット上で秘密裏に収集し、通話を録音してAI生成ポッドキャストに変換し、利益を得ている。

404 Media·3月24日·★★★★

LlamaParseとGemini 3.1でスマートな財務アシスタントを構築

Googleが、非構造化文書から高品質データを抽出するワークフローを紹介。LlamaParseとGemini 3.1モデルを組み合わせ、複雑な財務表の解析と要約を実現するイベント駆動型アーキテクチャを提案している。

Google Developers AI·3月24日

AnthropicのClaudeが2週間でFirefoxに22件の脆弱性を発見

AnthropicはMozillaとのセキュリティ連携で、Firefoxに22件の脆弱性（うち14件は「高深刻度」）を発見した。

TechCrunch AI·3月7日

Mozillaとの提携でFirefoxのセキュリティを向上

Claude Opus 4.6がMozillaの研究者と協力し、2週間でFirefoxの脆弱性を22件発見した。

Anthropic Red Team·3月6日

開発の退屈な部分を自動化した方法

バックエンドエンジニアのVuongVu氏が、開発プロセスにおける反復的で退屈な作業を自動化する手法とその実装方法を紹介している。

CyberAgent Developers Blog·3月4日·★★★★

ABEMAがAIエージェントを用いてA/Bテスト文化を促進する取り組み

ABEMAのData Scienceチームが、2025年9月から半年間、ミッション型インタラクティブAIエージェントを活用し、A/Bテストの実施を効率化・促進する取り組みを実施した。

CyberAgent Developers Blog·3月2日

コーディングエージェントには最適条件があり、多くの人はそれを飛ばしている

コーディングエージェント成功の4条件：参照物、自己テスト、設計図、方向性の管理。これらを満たせば品質が向上するが、全てのプロジェクトに適するわけではない。

宝玉的分享·2月25日·★★★★

GoogleがOpalに自動化ワークフロー作成機能を追加

GoogleがOpalに新機能として自動化ワークフロー作成機能を追加し、業務効率化を支援します。

TechCrunch AI·2月25日

Metaの故人シミュレーションAI特許が示す『幽霊労働』の危険性

Metaが故人のユーザーをAIでシミュレーションする特許を取得。研究者は『AI復活』の転換点と指摘し、倫理的懸念を提起。

404 Media·2月24日·★★★★

OpenAI Codex製品責任者：コードは人間が書かなくなるが、より多くの構築者が生まれる

OpenAI Codex責任者がAIコーディングの現状を語る。社内ではIDEを使わずCodex利用が20倍増。真の課題はモデルではなく人間の適応。オープン標準やエージェント市場の未来も議論。

宝玉的分享·2月22日·★★★★

経済研究

経済研究に関する記事の要約です。本文が「Economic Research」のみのため、詳細な内容要約はできません。

Anthropic Research·2月21日·★★★★

Nemotronを使用したRAG向け文書処理パイプラインの構築方法

NVIDIAが、複雑なPDFの解析、ネストされた表の抽出、チャート内データの認識を可能にする、RAG（検索拡張生成）向け文書処理パイプラインの構築方法を紹介している。

NVIDIA Developer Blog·2月5日·★★★★

CopilotからPilotへ：Agentic Codingによる実装〜PR自動化の取り組み

LINEヤフー株式会社の平野氏が、同社全エンジニアを対象としたAI利活用の一環として、Agentic Coding技術を用いてプルリクエストの自動化を実装する取り組みを紹介している。

LY Corp Tech Blog·1月29日·★★★★

貢献度指標で理解するClaude Codeの影響

貢献度指標を用いて、Claude Codeが開発プロセスに与える影響を測定・理解する方法について説明します。

Claude Blog·1月29日

Salesforce、Cursorにより開発速度を30%以上加速し高品質コードを実現

SalesforceはAI駆動開発ツール「Cursor」を導入し、開発速度を30%以上向上させるとともに、コード品質の向上を実現した。

Cursor Blog·1月21日·★★★★

プロジェクト・ベンド：フェーズ2

サンフランシスコ事務所でAI店員が運営する小売店を試験したが成果は不十分。フェーズ2ではAIによる事業運営の実現に向けて調整を進めている。

Anthropic Red Team·12月18日

サイバー防衛者のためのAI構築

Claudeの能力を向上させ、コードやシステムの脆弱性を検出・分析・修復する支援を強化しました。これにより、Claude Sonnet 4.5はOpus 4.1と同等以上の脆弱性発見能力を実現しています。

Anthropic Red Team·9月29日·★★★★

マルチエージェント研究システムの構築方法

Anthropic社が、複数のClaudeエージェントを使用して複雑なトピックを効果的に探索する研究機能を開発し、その構築過程での技術的課題と得られた教訓を共有した。

Anthropic Engineering·6月13日·★★★★

#llm応用 のAIニュース