#human-in-the-loop のAIニュース

18件の記事

Stripe の金融コンプライアンス向け本番級 AI エージェント：AWS ベッドロックでの構築教訓

Stripe は AWS の Amazon Bedrock を活用し、年間 1.4 兆ドルの決済処理に対応する金融コンプライアンスのための本番級 AI エージェントシステムを構築した。この取り組みにより、毎日数千件の取引レビュー業務が効率化された具体的な手法と教訓が紹介されている。

AWS Machine Learning Blog·6月26日·★★★★

AI、オープンツール、人間をループに組み込みながら huggingface_hub を毎週リリース

Hugging Face は、AI とオープンツールの活用に加え、人間のフィードバックをループに組み込むことで、huggingface_hub の毎週の更新を可能にした。

Hugging Face Blog·6月23日

AI と人間の講師を組み合わせることで学習を個別最適化するプレプリの取り組み

OpenAI News は、教育プラットフォーム「Preply」が人工知能と人間の講師を融合させ、学習者のニーズに合わせた個別最適な学習体験を実現している事例を紹介した。

OpenAI News·6月12日

Simon Willison Blog の「datasette-agent 0.2a0」リリース

Simon Willison が公開した「datasette-agent 0.2a0」は、実行中にツールがユーザーに質問できる機能を追加し、コンテキストパラメータを通じて対話型処理を可能にした。

Simon Willison Blog·6月11日·★★★★

Google の AI に関する内部の批判と声明変更について

404 Media のエマニュエル・マイバーグ氏によると、Google 従業員が同社の AI 技術の問題点をネタにしたミームを共有していることが報じられた。これを受け Google の広報担当者は、発表文から「人間をループに維持することが重要」という文言を削除した新しいバージョンの声明を公開するよう要請した。

Simon Willison Blog·6月5日·★★★★

Claude を製品間でどのように統制するか（28 分読）

Anthropic は、AI エージェントのシステムレベルでの相互作用を考慮し、環境層で統制設計を行い、モデル層で行動誘導を行うことで、ユーザーの監視能力に応じた隔離強度を実現し、潜在的な被害にハード制限を設ける重要性を説明している。

TLDR AI·5月27日·★★★★

卒業式で AI アナウンサーが名前を誤読・飛ばす

The Verge は、近年人気を集める卒業式の AI 音声アナウンスシステムが、学生の名前を誤って発音したり読み飛ばしたりする事例が多発していることを報じた。

The Verge AI·5月20日

AWS キーノートは AI を魔法のように称賛するが、同社のエンジニアたちは異なる現実を語る

アマゾンのスティーブ・タルツァ氏は、自チームの目的として開発者のスピード向上と摩擦削減を挙げた。しかし、AI 活用が進む中でも、人間による最終確認なしに何もリリースしないという原則は不変であると明言した。

The Register AI/ML·4月29日·★★★★

AWS は AI を魔法のように喧伝するが、社内エンジニアは異なる現実を語る

Amazon の StoreGen チームは、AI 活用を進めつつも、すべての成果物を人間が最終確認することと、若手開発者の継続的な採用を原則としており、AI による短縮化には限界があると指摘している。

The Register AI/ML·4月29日·★★★★

ブラウザラン：AIエージェントにブラウザを提供する

AIエージェントがウェブと対話するためのブラウザツール「Browser Run」が発表された。同ツールはサイトのナビゲーション、データ抽出、スクリーンショット撮影などを大規模に実行でき、人間の介入も可能な機能を提供する。

Cloudflare Blog·4月15日·★★★★

AIエージェントのHuman-in-the-Loop評価を深化させる

本記事は、AIエージェントのHuman-in-the-Loopを定量評価する手法とビジネス価値を検討し、評価の非対称性と総体性という2つの分析軸を導入して実践的な意思決定ツールに昇華させる方法を解説する。

LayerX Tech Blog·4月1日

ADK Go 1.0がリリース！

GoogleがGo言語向けのAgent Development Kit（ADK）1.0を発表し、実験的なAIスクリプトから本番環境対応のサービス開発へ移行を促進。OpenTelemetry統合によるトレーシング機能やプラグインシステムを導入。

Google Developers AI·4月1日·★★★★

LangChainがGTMエージェントを構築した方法

LangChainのVishnu SureshとJess Ouが、営業担当者の作業効率化のためにGTMエージェントを開発した。従来は複数ツール間での手動作業が必要だったが、同エージェントにより自動化を実現した。

LangChain Blog·3月10日

自動化されたデータ分析に向けて：LLMベースのリスク推定のためのガイド付きフレームワーク

研究者らは、大規模言語モデル（LLM）を用いたデータセットリスク分析のためのガイド付きフレームワークを提案し、手動監査の課題と完全自動化の限界を克服する。

ArXiv cs.AI·3月6日

AIの不適切な導入が人員削減の背景にある可能性

クラウドデータ・AIコンサルティング企業のDatatonicは、人間とAIの協働の不適切な導入が、生産性や競争力の低下を招き、結果として人員削減につながっていると指摘している。

AI News·2月27日

デバッグモードの導入：ランタイムログ付きエージェント

開発者がランタイムログを活用して複雑なバグを再現・修正できるデバッグモードを提供する。

Cursor Blog·12月10日·★★★★

適切なAI評価ツールの選択

著者は、AI評価においてツール選びに過度に注目するのではなく、プロセス重視であるべきだと指摘。また、ツールの陳腐化が速いため比較は困難とし、自身の経験に基づき推奨ツールを示唆している。

Hamel Husain·10月1日·★★★★

サーモン・イン・ザ・ループ

筆者はコンサルタントとして水力発電ダムにおける魚の数をAIとコンピュータビジョンで自動計測するプロジェクトに携わり、デジタル変革における複雑な社会技術的問題の解決に取り組んだ。

The Gradient·12月17日