最新AI技術情報をキャッチアップするAIエージェントを作成し、研究開発業務の一部を自動化した
ABEJA の研究者が、最新 AI 技術動向のキャッチアップを自動化するため、GitHub Actions と LLM を組み合わせた独自 AI Agent を開発・公開した。
キーポイント
自動レポート生成システムの構築
GitHub Actions を活用し、Claude や Gemini の Web 検索機能を用いて週次・月次の AI 技術動向レポートを自動的に作成する仕組みを実現した。
MCP サーバーを活用した情報収集
GitHub MCP や Hugging Face MCP サーバーを連携させ、人気のリポジトリやモデル情報を取得し、情報の網羅性を高めている。
Issue 内での質疑応答機能
作成されたレポートに対して GitHub Issue 内で直接 AI に質問できる機能を Claude Code Action を活用して実装し、情報探索の効率化を図った。
プロンプト駆動型の軽量設計
複雑な RAG やデータベース構築を避け、キーワード選定とプロンプト調整に依存する軽量な構成で迅速に実装し、コスト対効果を重視した。
フレームワーク非採用の理由と代替手段
既存の AI Agent フレームワークは依存度が高いためあえて使用せず、Claude モデルには claude_code_sdk を直接利用し、開発コストと移行リスクを回避した。
既存リサーチツールとの精度・速度比較
Claude Research や Gemini Deep Research と比較し、自作エージェントは回答が簡潔で開発者視点の情報が含まれ、かつ数分という高速性を実現している。
Vibe Coding による完全自動化の実現
実装から PR 作成・レビューに至るまで LLM による Vibe coding を活用し、GitHub Actions と連携してコストゼロで週次レポートを自動生成している。
影響分析・編集コメントを表示
影響分析
この記事は、AI エンジニアや研究者が膨大な情報の中から必要な知見を抽出する際のワークフロー変革を示唆しています。特に MCP プロトコルを活用した外部ツール連携と、GitHub Actions を活用した低コスト自動化の組み合わせは、個人開発者や小規模チームでも実践可能な具体的な解決策として示されており、実務への即効性が高いです。
編集コメント
複雑なシステム構築を避け、プロンプトと既存 API の組み合わせで実用性を追求したアプローチは、現場のエンジニアにとって非常に参考になる事例です。特に MCP サーバーを活用して LLM の能力範囲を広げている点は注目すべき技術動向と言えます。
最新 AI Tech 情報キャッチアップ用 AI Agent を作成し自身の研究開発業務を一部自動化してみた
こんにちは!ABEJA で ABEJA Platform 開発や AI 関連の研究開発業務を行っている坂井(@Yagami360)です。 こちらはABEJAアドベントカレンダー2025の23日目の記事です。
ここ5〜6年くらいのAI 技術の進歩は目覚ましいですよね。数年前に ChatGPT 登場して以降、更に進歩が大きく加速してきています。 AI 技術の飛躍的な進歩は嬉しい反面、進歩が早すぎて最新の AI 技術動向を全然キャッチアップしきれていないというのが最近の自分の悩みになってました。
そんな研究開発業務における悩みも AI Agent 使えば簡単に解決できるのではないかと思い、研究開発用の AI Agent を作成してみました。
最新 AI Tech 情報キャッチアップ用 AI Agent 作成可能なレポートの種類
Claude Research / Gemini Deep Research で作成したレポートとの精度比較
最新 AI Tech 情報キャッチアップ用 AI Agent
今回の研究開発用 AI Agent は、最新の AI Tech 関連の情報を収集して GitHub Issue 上のレポートとして自動作成する AI Agent になっています。
GitHub レポジトリは、以下においています。詳しい使い方等は、レポジトリの README を見ても貰えればと思います
今回の研究開発用 AI Agent で作成可能なレポートとしては、以下のような種類になっています。
GitHub Action により毎週金曜日に自動的に作成されるレポートで、今週1週間の AI 技術動向に関するレポートになっています

GitHub Action により毎月1日に自動的に作成されるレポートで、先月1ヶ月間の AI 技術動向に関するレポートになっています

GitHub Action の workflow_dispatch

基本的には、プロンプトで指示しただけの技術的に簡単な AI Agent になっています。(プロンプト指定だけでそれなりのレポート品質になったので、RAG とか使わなかったというのが背景です)
もし中身の詳細知りたい方いれば、コード見てもらえれば思いますが、以下ポイントを列挙しておきます。
Claude か Gemini の各種モデルが利用できます。 デフォルトでは、API 利用コストの安さ観点から Gemini の gemini-2.5-flash
最近の AI トレンドや将来性の高い AI 技術関連のキーワードリストをプロンプトで指定し、関連した情報を取得できるようにしています。 ここらへんのキーワード選定は、自身の AI 知識が必要であり、時代の変化に応じた継続的なプロンプト調整が必要になるかと思います
Claude モデルや Gemini モデルの Web 検索機能を使用して、プロンプトで指定した有益なサイトのURLリストから情報を取得できるようにしています。 どのようなサイトが有益かは、自身の AI 知識が必要であり、時代の変化に応じた継続的なプロンプト調整が必要になるかと思います。
なおサイトURLによっては、うまくページング処理等をしないとすべての情報を取得できないのですが、現時点ではここらへんの処理は実装していないので、一部情報がとれてない箇所もあります。 また、ちゃんとした AI Agent を開発する場合は、取得した各種情報をデータベースに保存して、毎回情報取得しなくて済むようにするかと思いますが、今回はさくっと作りたかったので毎回これら情報を取得するようにしています(それ故、API 利用コストが大きくなります)
GitHub MCP サーバーや Hugging Face MCP サーバーを使用して、AI 関連で人気の GitHub レポジトリや Hugging Face 上のモデル・データセットなどの情報を取得できるようにしています。 ただし現状では Claude モデルのみでのサポートで、Gemini モデルではサポートしていません。今後 Gemini モデルでも MCP サーバーを利用できるようにする予定です。
また今後必要に応じて、ArXiv MCP サーバーを使用した論文情報の取得や Slack MCP サーバーを使用した Slack 通知機能、Twitter MCP サーバーを使用した Twitter 投稿機能なども追加しようとは思ってます
GitHub Issue レポート内での質疑応答機能
作成されたレポートに関して、詳細を深堀りしたいケースが多々ありますが、GitHub Issue 内に閉じた形で確認できればツールを色々横断しなくて済むので便利です。 そのため作成された GitHub Issue レポート内にて、@claude

仕組み的には、Claude Code Action や Gemini CLI Action を使用して実現しています。Claude Code Action や Gemini CLI Action の本来の用途は、バグ報告 GitHub Issue からの PR 自動作成や PR 自動レビューなどになりますが、今回の AI Agent では、これら機能をうまく利用して、レポート内容の質疑応答をできるようにしています。
GitHub Actions による定期的なレポート自動作成
GitHub Action の schedule 機能で、定期的にレポートを自動作成できるようにしています。 これにより、最新 AI Tech のキャッチアップに必要なことは、毎週1回 or 毎月1回 GitHub Issue を開き自動的に作成されたレポートを確認するだけで良いです
定期実行可能なサービスには他にも色々あるかと思いますが、GitHub Action を使用することで GitHub レポジトリ内で完結し、なおかつコストの発生しない方法でレポート作成できるようにしています(API 利用コストは別途発生します)
uv による Python パッケージ管理
Python パッケージ管理ツールとしては、uv を使用しています。 pip や conda は、AIプロダクションレベルでは NG として、これまで poetry が広く使われてきたかと思いますが、 uv は内部的には Rust 言語で書かれており、非常に高速に Python パッケージのインストール処理を行えます。開発者体験も大きく向上するので非常にオススメです。(poetry → uv への以降も比較的簡単に行えるようになっています)
AI Agent 開発用フレームワーク
AI Agent 用のフレームワークとしては、LangChain / LangGraph, Microsoft Agent Framework (AutoGen, Semantic Kernel), Google ADR, OpenAI Swarm, CrewAI など、ノーコード系だと Dify, OpenAI AgentKit / Agent Builder, Vertex AI Agent Builder などなど様々なツールが乱立しており、それぞれメリット・デメリットがありますが(AI Agent 時代における各社シェア争いでフレームワーク乱立しすぎて開発者的には困るのですが)、 今回の AI Agent の機能的にこれらのフレームワークの必要性がなかったため特に使用していません。単純に Claude モデルであれば claude_code_sdk
今後マルチ AI Agent 化したいなどあれば、適切なフレームワークを使用するようにしようと思います。(あるフレームワークに寄せるとコード全体がそのフレームワーク依存になり、後で別のフレームワークに移行するコスト高そうだったので、あえてフレームワーク使用しなったというのもあります。)
Vibe coding で開発
少し別の話になりますが、この AI Agent は、LLM モデルによる Vibe coding で実装しており、実装の殆どを AI で行っています。 また PR 作成に関しても、Cursor or Claude Code CLI + GitHub MCP サーバーによる PR 自動作成で行っており、PR レビューに関しても、Claude Code Actions or Gemini CLI Action or GitHub MCP サーバーを使用した自動レビューで行っています。これからは如何に Vibe Coding で自動化して効率化させるかの時代ですね。
Claude Research / Gemini Deep Research で作成したレポートとの精度比較
そもそも今回のような AI Agent をわざわざ作らなくても、Claude Research や Gemini Deep Research 使ってレポート作成すればいいのでは?という観方もあると思うので、簡単な精度比較もやっておきました。
公正な比較のために、モデルは同じモデルを使用し、プロンプトに関しては、研究開発用 AI Agent は週次レポート用のプロンプト、Claude Research と Gemini Deep Research に関しては「2025-10-03 ~ 2025-10-09 の最新 AI Tech 情報を教えて」という週次レポート期間の単純なプロンプトにしています。
研究開発用 AI Agent での週次レポート by gemini-2.5-flash
Claude Research by claude-sonnet-4 でのレポート
Gemini Deep Research by gemini-2.5-flash でのレポート
主観にはなりますが、自作した研究開発用 AI Agent の優位点は以下にあるのかと思います
簡潔な情報になっており、キャップアップしやすい
開発者が知りたい情報(フレームワークなど)も知れる
高速に回答 研究開発用 AI Agent は数分。Claude Research は 20~30分もかかる
GitHub Actions で週次/月次レポートを自動作成してくれる
用途に応じて色々カスタマイズできる
AI にも各レポートのメリット・デメリットを比較してもらいました。(もっと厳密な品質比較したければ、品質評価モデルや品質スコア等を使用すべきかと思いますが、簡単のためチャットで精度比較しただけです)
概ね自分の主観での比較と同じような回答をしてくれています。今回の AI Agent の目的としては、エンジニアや研究者が、ビジネス価値や将来性の高い最新 AI Tech 動向をクイックにキャッチアップできることにあるので、AI Agent 作成した一定の価値がありそうです




なおこの比較結果は、精度比較時点(2025/10頃)での結果なので、今後 Claude Research や Gemini Deep Research 使ったほうが良いレポート作成できるというのは大いにあります
AI Agent を使用すれば、研究開発業務においても自身の業務を色々自動化&効率化できることがわかりました。
また今回の研究開発用 AI Agent は、最新 AI 技術キャッチアップのみの AI Agent でしたが、他にも AI 関連の最新論文調査用 AI Agent や、これら最新 AI Tech 情報や論文動向を加味した株価予想マルチ AI Agent 等も作成できる気がしました。
AI Agent 使って、手が追いついてないことや苦手なことはどんどん自動化していきましょう!
ABEJAは、テクノロジーの社会実装に取り組んでいます。 技術はもちろん、技術をどのようにして社会やビジネスに組み込んでいくかを考えるのが好きな方は、下記採用ページからエントリーください! (新卒の方やインターンシップのエントリーもお待ちしております!) careers.abejainc.com
特に下記ポジションの募集を強化しています!ぜひ御覧ください!
トランスフォーメーション領域:データサイエンティスト
トランスフォーメーション領域:データサイエンティスト(ミドル)
トランスフォーメーション領域:データサイエンティスト(シニア)
原文を表示
こんにちは!ABEJA で ABEJA Platform 開発や AI 関連の研究開発業務を行っている坂井(@Yagami360)です。 こちらはABEJAアドベントカレンダー2025の23日目の記事です。
ここ5〜6年くらいのAI 技術の進歩は目覚ましですよね。数年前に ChatGPT 登場して以降、更に進歩が大きく加速してきています。 AI 技術の飛躍的な進歩は嬉しい反面、進歩が早すぎて最新の AI 技術動向を全然キャッチアップしきれていないというのが最近の自分の悩みになってました。
そんな研究開発業務における悩みも AI Agent 使えば簡単に解決できるのではないかと思い、研究開発用の AI Agent を作成してみました。
最新 AI Tech 情報キャッチアップ用 AI Agent 作成可能なレポートの種類
Claude Research / Gemini Deep Research で作成したレポートとの精度比較
最新 AI Tech 情報キャッチアップ用 AI Agent
今回の研究開発用 AI Agent は、最新の AI Tech 関連の情報を収集して GitHub Issue 上のレポートとして自動作成する AI Agent になっています。
GitHub レポジトリは、以下においています。詳しい使い方等は、レポジトリの README を見ても貰えればと思います
今回の研究開発用 AI Agent で作成可能なレポートとしては、以下のような種類になっています。
GitHub Action により毎週金曜日に自動的に作成されるレポートで、今週1週間の AI 技術動向に関するレポートになっています

GitHub Action により毎月1日に自動的に作成されるレポートで、先月1ヶ月間の AI 技術動向に関するレポートになっています

GitHub Action の workflow_dispatch

基本的には、プロンプトで指示しただけの技術的に簡単な AI Agent になっています。(プロンプト指定だけでそれなりのレポート品質になったので、RAG とか使わなかったというのが背景です)
もし中身の詳細知りたい方いれば、コード見てもらえれば思いますが、以下ポイントを列挙しておきます。
Claude か Gemini の各種モデルが利用できます。 デフォルトでは、API 利用コストの安さ観点から Gemini の gemini-2.5-flash
最近の AI トレンドや将来性の高い AI 技術関連のキーワードリストをプロンプトで指定し、関連した情報を取得できるようにしています。 ここらへんのキーワード選定は、自身の AI 知識が必要であり、時代の変化に応じた継続的なプロンプト調整が必要になるかと思います
Claude モデルや Gemini モデルの Web 検索機能を使用して、プロンプトで指定した有益なサイトのURLリストから情報を取得できるようにしています。 どのようなサイトが有益かは、自身の AI 知識が必要であり、時代の変化に応じた継続的なプロンプト調整が必要になるかと思います。
なおサイトURLによっては、うまくページング処理等をしないとすべての情報を取得できないのですが、現時点ではここらへんの処理は実装していないので、一部情報がとれてない箇所もあります。 また、ちゃんとした AI Agent を開発する場合は、取得した各種情報をデータベースに保存して、毎回情報取得しなくて済むようにするかと思いますが、今回はさくっと作りたかったので毎回これら情報を取得するようにしています(それ故、API 利用コストが大きくなります)
GitHub MCP サーバーや Hugging Face MCP サーバーを使用して、AI 関連で人気の GitHub レポジトリや Hugging Face 上のモデル・データセットなどの情報を取得できるようにしています。 ただし現状では Claude モデルのみでのサポートで、Gemini モデルではサポートしていません。今後 Gemini モデルでも MCP サーバーを利用できるようにする予定です。
また今後必要に応じて、ArXiv MCP サーバーを使用した論文情報の取得や Slack MCP サーバーを使用した Slack 通知機能、Twitter MCP サーバーを使用した Twitter 投稿機能なども追加しようとは思ってます
GitHub Issue レポート内での質疑応答機能
作成されたレポートに関して、詳細を深堀りしたいケースが多々ありますが、GitHub Issue 内に閉じた形で確認できればツールを色々横断しなくて済むので便利です。 そのため作成された GitHub Issue レポート内にて、@claude

仕組み的には、Claude Code Action や Gemini CLI Action を使用して実現しています。Claude Code Action や Gemini CLI Action の本来の用途は、バグ報告 GitHub Issue からの PR 自動作成や PR 自動レビューなどになりますが、今回の AI Agent では、これら機能をうまく利用して、レポート内容の質疑応答をできるようにしています。
GitHub Actions による定期的なレポート自動作成
GitHub Action の schedule 機能で、定期的にレポートを自動作成できるようにしています。 これにより、最新 AI Tech のキャッチアップに必要なことは、毎週1回 or 毎月1回 GitHub Issue を開き自動的に作成されたレポートを確認するだけで良いです
定期実行可能なサービスには他にも色々あるかと思いますが、GitHub Action を使用することで GitHub レポジトリ内で完結し、なおかつコストの発生しない方法でレポート作成できるようにしています(API 利用コストは別途発生します)
uv による Python パッケージ管理
Python パッケージ管理ツールとしては、uv を使用しています。 pip や conda は、AIプロダクションレベルでは NG として、これまで poetry が広く使われてきたかと思いますが、 uv は内部的には Rust 言語で書かれており、非常に高速に Python パッケージのインストール処理を行えます。開発者体験も大きく向上するので非常にオススメです。(poetry → uv への以降も比較的簡単に行えるようになっています)
AI Agent 開発用フレームワーク
AI Agent 用のフレームワークとしては、LangChain / LangGraph, Microsoft Agent Framework (AutoGen, Semantic Kernel), Google ADR, OpenAI Swarm, CrewAI など、ノーコード系だと Dify, OpenAI AgentKit / Agent Builder, Vertex AI Agent Builder などなど様々なツールが乱立しており、それぞれメリット・デメリットがありますが(AI Agent 時代における各社シェア争いでフレームワーク乱立しすぎて開発者的には困るのですが)、 今回の AI Agent の機能的にこれらのフレームワークの必要性がなかったため特に使用していません。単純に Claude モデルであれば claude_code_sdk
今後マルチ AI Agent 化したいなどあれば、適切なフレームワークを使用するようにしようと思います。(あるフレームワークに寄せるとコード全体がそのフレームワーク依存になり、後で別のフレームワークに移行するコスト高そうだったので、あえてフレームワーク使用しなったというのもあります。)
Vibe coding で開発
少し別の話になりますが、この AI Agent は、LLM モデルによる Vibe coding で実装しており、実装の殆どを AI で行っています。 また PR 作成に関しても、Cursor or Claude Code CLI + GitHub MCP サーバーによる PR 自動作成で行っており、PR レビューに関しても、Claude Code Actions or Gemini CLI Action or GitHub MCP サーバーを使用した自動レビューで行っています。これからは如何に Vibe Coding で自動化して効率化させるかの時代ですね。
Claude Research / Gemini Deep Research で作成したレポートとの精度比較
そもそも今回のような AI Agent をわざわざ作らなくても、Claude Research や Gemini Deep Research 使ってレポート作成すればいいのでは?という観方もあると思うので、簡単な精度比較もやっておきました。
公正な比較のために、モデルは同じモデルを使用し、プロンプトに関しては、研究開発用 AI Agent は週次レポート用のプロンプト、Claude Research と Gemini Deep Research に関しては「2025-10-03 ~ 2025-10-09 の最新 AI Tech 情報を教えて」という週次レポート期間の単純なプロンプトにしています。
研究開発用 AI Agent での週次レポート by gemini-2.5-flash
Claude Research by claude-sonnet-4 でのレポート
Gemini Deep Research by gemini-2.5-flash でのレポート
主観にはなりますが、自作した研究開発用 AI Agent の優位点は以下にあるのかと思います
簡潔な情報になっており、キャップアップしやすい
開発者が知りたい情報(フレームワークなど)も知れる
高速に回答 研究開発用 AI Agent は数分。Claude Research は 20~30分もかかる
GitHub Actions で週次/月次レポートを自動作成してくれる
用途に応じて色々カスタマイズできる
AI にも各レポートのメリット・デメリットを比較してもらいました。(もっと厳密な品質比較したければ、品質評価モデルや品質スコア等を使用すべきかと思いますが、簡単のためチャットで精度比較しただけです)
概ね自分の主観での比較と同じような回答をしてくれています。今回の AI Agent の目的としては、エンジニアや研究者が、ビジネス価値や将来性の高い最新 AI Tech 動向をクイックにキャッチアップできることにあるので、AI Agent 作成した一定の価値がありそうです




なおこの比較結果は、精度比較時点(2025/10頃)での結果なので、今後 Claude Research や Gemini Deep Research 使ったほうが良いレポート作成できるというのは大いにあります
AI Agent を使用すれば、研究開発業務においても自身の業務を色々自動化&効率化できることがわかりました。
また今回の研究開発用 AI Agent は、最新 AI 技術キャッチアップのみの AI Agent でしたが、他にも AI 関連の最新論文調査用 AI Agent や、これら最新 AI Tech 情報や論文動向を加味した株価予想マルチ AI Agent 等も作成できる気がしました。
AI Agent 使って、手が追いついてないことや苦手なことはどんどん自動化していきましょう!
ABEJAは、テクノロジーの社会実装に取り組んでいます。 技術はもちろん、技術をどのようにして社会やビジネスに組み込んでいくかを考えるのが好きな方は、下記採用ページからエントリーください! (新卒の方やインターンシップのエントリーもお待ちしております!) careers.abejainc.com
特に下記ポジションの募集を強化しています!ぜひ御覧ください!
トランスフォーメーション領域:データサイエンティスト
トランスフォーメーション領域:データサイエンティスト(ミドル)
トランスフォーメーション領域:データサイエンティスト(シニア)
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み