Harness-1 の紹介：gpt-oss-20b を基盤とし、状態管理型検索ハネス内で強化学習を用いて訓練された 20B パラメータの検索サブエージェント

#RAG #Reinforcement Learning #Search Agents #Stateful AI #Open Source

整理・翻訳:ainew.jp 編集システムAIによる自動処理作り方と限界

本文の状態

要点を先行公開

本文を取得できないため、要約と元記事への導線を掲載しています。

同じ出来事の情報源

この情報源を基点に整理

MarkTechPost

30秒でわかる

イリノイ大学アーバナ・シャンペーン校や UC バークレーなどの研究者チームは、既存の検索エージェントが検索判断と記憶管理を同時に最適化しようとする課題に対し、Harness-1 と呼ばれる 20B パラメータの検索サブエージェントを開発した。このモデルは gpt-oss-20b を基盤とし、状態管理型検索ハネス内で強化学習を用いて訓練されている。