#human-in-the-loop のAIニュース
18件の記事
Stripe の金融コンプライアンス向け本番級 AI エージェント:AWS ベッドロックでの構築教訓
Stripe は AWS の Amazon Bedrock を活用し、年間 1.4 兆ドルの決済処理に対応する金融コンプライアンスのための本番級 AI エージェントシステムを構築した。この取り組みにより、毎日数千件の取引レビュー業務が効率化された具体的な手法と教訓が紹介されている。
AI、オープンツール、人間をループに組み込みながら huggingface_hub を毎週リリース
Hugging Face は、AI とオープンツールの活用に加え、人間のフィードバックをループに組み込むことで、huggingface_hub の毎週の更新を可能にした。
AI と人間の講師を組み合わせることで学習を個別最適化するプレプリの取り組み
OpenAI News は、教育プラットフォーム「Preply」が人工知能と人間の講師を融合させ、学習者のニーズに合わせた個別最適な学習体験を実現している事例を紹介した。
Simon Willison Blog の「datasette-agent 0.2a0」リリース
Simon Willison が公開した「datasette-agent 0.2a0」は、実行中にツールがユーザーに質問できる機能を追加し、コンテキストパラメータを通じて対話型処理を可能にした。
Google の AI に関する内部の批判と声明変更について
404 Media のエマニュエル・マイバーグ氏によると、Google 従業員が同社の AI 技術の問題点をネタにしたミームを共有していることが報じられた。これを受け Google の広報担当者は、発表文から「人間をループに維持することが重要」という文言を削除した新しいバージョンの声明を公開するよう要請した。
Claude を製品間でどのように統制するか(28 分読)
Anthropic は、AI エージェントのシステムレベルでの相互作用を考慮し、環境層で統制設計を行い、モデル層で行動誘導を行うことで、ユーザーの監視能力に応じた隔離強度を実現し、潜在的な被害にハード制限を設ける重要性を説明している。
卒業式で AI アナウンサーが名前を誤読・飛ばす
The Verge は、近年人気を集める卒業式の AI 音声アナウンスシステムが、学生の名前を誤って発音したり読み飛ばしたりする事例が多発していることを報じた。
AWS キーノートは AI を魔法のように称賛するが、同社のエンジニアたちは異なる現実を語る
アマゾンのスティーブ・タルツァ氏は、自チームの目的として開発者のスピード向上と摩擦削減を挙げた。しかし、AI 活用が進む中でも、人間による最終確認なしに何もリリースしないという原則は不変であると明言した。
AWS は AI を魔法のように喧伝するが、社内エンジニアは異なる現実を語る
Amazon の StoreGen チームは、AI 活用を進めつつも、すべての成果物を人間が最終確認することと、若手開発者の継続的な採用を原則としており、AI による短縮化には限界があると指摘している。
ブラウザラン:AIエージェントにブラウザを提供する
AIエージェントがウェブと対話するためのブラウザツール「Browser Run」が発表された。同ツールはサイトのナビゲーション、データ抽出、スクリーンショット撮影などを大規模に実行でき、人間の介入も可能な機能を提供する。
AIエージェントのHuman-in-the-Loop評価を深化させる
本記事は、AIエージェントのHuman-in-the-Loopを定量評価する手法とビジネス価値を検討し、評価の非対称性と総体性という2つの分析軸を導入して実践的な意思決定ツールに昇華させる方法を解説する。
ADK Go 1.0がリリース!
GoogleがGo言語向けのAgent Development Kit(ADK)1.0を発表し、実験的なAIスクリプトから本番環境対応のサービス開発へ移行を促進。OpenTelemetry統合によるトレーシング機能やプラグインシステムを導入。
LangChainがGTMエージェントを構築した方法
LangChainのVishnu SureshとJess Ouが、営業担当者の作業効率化のためにGTMエージェントを開発した。従来は複数ツール間での手動作業が必要だったが、同エージェントにより自動化を実現した。
自動化されたデータ分析に向けて:LLMベースのリスク推定のためのガイド付きフレームワーク
研究者らは、大規模言語モデル(LLM)を用いたデータセットリスク分析のためのガイド付きフレームワークを提案し、手動監査の課題と完全自動化の限界を克服する。
AIの不適切な導入が人員削減の背景にある可能性
クラウドデータ・AIコンサルティング企業のDatatonicは、人間とAIの協働の不適切な導入が、生産性や競争力の低下を招き、結果として人員削減につながっていると指摘している。
デバッグモードの導入:ランタイムログ付きエージェント
開発者がランタイムログを活用して複雑なバグを再現・修正できるデバッグモードを提供する。
適切なAI評価ツールの選択
著者は、AI評価においてツール選びに過度に注目するのではなく、プロセス重視であるべきだと指摘。また、ツールの陳腐化が速いため比較は困難とし、自身の経験に基づき推奨ツールを示唆している。
サーモン・イン・ザ・ループ
筆者はコンサルタントとして水力発電ダムにおける魚の数をAIとコンピュータビジョンで自動計測するプロジェクトに携わり、デジタル変革における複雑な社会技術的問題の解決に取り組んだ。