Ramp は内部財務チームの業務を分析し、Loom動画からプロセスを抽出してAIエージェントが直接Excelを操作する「Ramp Sheets」を開発しました。従来のコード生成アプローチではなく、人間と同じ手順でスプレッドシートを編集することでブラックボックス化を防ぎ、信頼性を高めています。さらに、リレーショナルモデルの推論時にベクトルを追加する「ステアリングベクトル」技術や、エラーを検知して自己修正する自律監視ループの実験にも成功しています。このアプローチは、エンタープライズ向けAIエージェントが人間と協働し、複雑な業務を安全に自動化するための重要な指針となります。
Ramp の実践的なアーキテクチャ決定と、LLMが文脈を逸脱した際の自己修正メカニズムの詳細は、AI エージェント開発者にとって必聴の内容です。特に「トークン外思考」の実験結果は、今後の AI インフラ設計において重要な示唆を与えます。
- 01
ブラックボックス回避の設計
財務チームのLoom動画からプロセスを抽出し、Pythonコード生成ではなく人間と同じ手順でExcelを直接操作するエージェントを採用した。
- 02
自己監視と自己修正ループ
内部コーディングエージェントが出力を検証し、不十分な結果をフィルタリングしてエンジニアに報告する自律的な改善サイクルを実装している。
- 03
トークン外思考の実験
推論時にステアリングベクトルを追加することで、モデルが文脈から逸脱した際にも自己認識し、話題を修正する挙動を確認した。
- 04
サンドボックスと評価戦略
各セッションで独立したサンドボックスを使用し、LLMによる自動評価ではなく専門家の人間判断を用いた厳密な検証プロセスを採用している。
この動画は、エンタープライズAIが単なるコード生成ツールから、人間の業務フローを忠実に再現し、自己監視機能を持つ自律的なパートナーへと進化する可能性を示しています。特に「ブラックボックス化」への懸念に対し、透明性の高い操作プロセスと人間による評価を組み合わせた解決策は、金融や法務など高リスクな業界でのAI導入の障壁を下げる重要な知見です。