AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
LangChain Blog·2026年6月17日 03:08·約13分で読める

非同期コーディングエージェント「Open SWE」の公開を発表

#コーディングエージェント#非同期処理#LLM#オープンソース#LangChain
TL;DR

LangChain は、開発者がコードの生成と修正を非同期で行えるオープンソースコーディングエージェント「Open SWE」を公開した。

AI深層分析2026年6月17日 04:02
3
注目/ 5段階
深度40%
2
関連度30%
4
実用性20%
4
革新性10%
3

キーポイント

1

非同期型コーディングエージェントの登場

従来の同期処理とは異なり、開発者がコード生成や修正タスクを並列・非同期で実行できる新しいアーキテクチャを採用している。

2

オープンソース化による開発者支援

LangChain が中心となり、コミュニティが自由に利用・改変可能な形でツールを公開し、コード生成の民主化を推進する。

3

コーディングワークフローの効率化

開発者がコードを生成・修正するプロセスを自動化することで、ソフトウェア開発のスピードと生産性の向上を目指す。

影響分析・編集コメントを表示

影響分析

この発表は、コーディングエージェントが単なるコード生成ツールから、より複雑で効率的な非同期ワークフローを扱えるインフラへと進化していることを示しています。特に LangChain のような主要フレームワークがオープンソースでこの機能を公開することは、開発現場における AI エージェントの標準的な利用パターンを変える可能性があり、ソフトウェア開発プロセス全体の変革を加速させる要因となります。

編集コメント

「Open SWE」という名称から、既存の SWE-agent プロジェクトとの関連や、LangChain 独自の非同期アーキテクチャへの注目が集まります。開発現場での実装コスト削減に直結する機能であり、今後の AI エージェントの実用化において重要なマイルストーンとなるでしょう。

image
image

ソフトウェアエンジニアリングにおける AI の利用は、過去 2 年間で進化を遂げてきました。最初はオートコンプリートとして始まり、次に IDE 内のコパイロットへと発展し、ここ数ヶ月の急速な変化を経て、クラウド上で非同期に実行される、よりエンドツーエンド型の長期稼働型エージェントへと進化しました。

私たちは将来、すべてのエージェントがこのような形態になるだろうと考えています。つまり、長期稼働型で非同期かつ、より自律的なものになると予想しています。具体的には以下のような特徴を持つでしょう:

  • クラウド上で非同期に実行される
  • ツールチェーンと直接統合される
  • 環境全体を十分に把握し、長期的な時間軸でのタスク計画を適切に行える
  • タスク完了前に自身の作業を検証し(問題があれば修正する)

ここ数ヶ月で明らかになったのは、このビジョンが現実となる最初の分野がソフトウェアエンジニアリングであるということです。しかしながら、これらの特徴を捉えたオープンソースプロジェクトはまだ存在していません。

そこで私たちは、最初のオープンソース・非同期型・クラウドホスト型のコーディングエージェントである Open SWE を構築しました。これは GitHub リポジトリに直接接続し、GitHub のイシューや当社の カスタム UI からタスクを委任することが可能です。Open SWE はチームのエンジニアの一人として機能します:コードベースの調査を行い、詳細な実行計画を作成し、コードを書き、テストを実行し、自身の作業にエラーがないかレビューし、完了したらプルリクエストを開きます。

image
image

LangGraph リポジトリに対する Open SWE の貢献私たちはこれを社内で使用し、LangGraph などのプロジェクトや、すでに主要なコントリビューターとなっている Open SWE リポジトリ自体の開発を加速させてきました。

image
image

自身のリポジトリに対する Open SWE の貢献本日、私たちはこれをコミュニティと共有できることを嬉しく思います。

使い方

Open SWE のホスト版は数分で使い始めることができます。必要なのは Anthropic API キーだけです。

  • swe.langchain.com にアクセスしてください。
  • GitHub アカウントを接続し、Open SWE がアクセスしたいリポジトリを選択してください。
  • 設定画面で Anthropic API キーを入力してください。
  • 新しいタスクを開始して、その進行を見守ってください!
image
image

Open SWE ホームページ始めの一歩として、ドキュメントの 例ページ をチェックしてみてください。

なぜ Open SWE なのか?

オープンソースのコーディングプロジェクトは多数存在します。なぜ新たに作る必要があるのでしょうか?私たちは、単にプロンプトやツールに焦点を当てるだけでなく、それ以外の側面にも注目を集め、集中させることを望みました。具体的には、これらのエージェントを信頼性を持って対話できる状態にするために必要な全体的なフローと UX(ユーザー体験)をより強調したかったのです。

UI/UX は、エージェント構築において最も未開拓の領域の一つであると考えています。アプリケーション全体のインタラクションパターンは、その利用頻度を大きく決定づけるものです。非同期型エージェントという新しいアイデアにおいては、ここで探求すべき面白いパターンが数多くあると考えられます。主なポイントは より多くの制御 と 深い統合 です。

制御: Open SWE には、実行中のコーディングエージェントに対する制御を強化する 2 つの主要な機能があります。作業の確認や軌道修正のために、再起動することなくいつでもエージェントを一時停止できます。

  • Human in the loop: Open SWE が計画を生成すると、中断してあなたにその計画の承認、編集、削除、または変更要求を行う機会を与えます。何か見落とした場合は、単に「もっと掘り下げて」と伝えるだけで、タスクのための計画プロセスを再開始します。
  • Double texting: 多くのコーディングエージェントは、実行中に新しい要求やフィードバックを受け付ける機能をサポートしていません。Open SWE はそのような制約に悩まされることはありません。製品仕様を変更したい場合、新機能を追加したい場合、あるいは方向性が逸れていると感じた場合は、単にメッセージを送るだけで、それがアクティブなセッションにスムーズに統合されます。

Deeply integrated: Open SWE は GitHub アカウントとリポジトリに直接統合されているため、他の開発者と同様にタスクを割り当てたり、コードのコンテキストを提供したりできます。開発者はすでに GitHub を利用しているのですから、なぜ新しい製品を学ぶ必要があるのでしょうか?Open SWE では、新しいタスクごとに追跡用イシューが作成されます。このイシューはセッション中、ステータス更新や実行計画などを通じて随時更新されます。タスクが完了すると、プルリクエストが自動的に開かれ、追跡用イシューにリンクされます。

GitHub から直接ランを実行することもできます:

  • GitHub のイシューにラベル(例:open-swe-auto)を追加するだけで、Open SWE が作業を開始します。完了すると、レビュー待ちのプルリクエストが作成されます。これは人間のようなチームメンバーとして、既存のプロセスに自然に組み込まれます。

これらの 2 つのコア支柱に加え、私たちが注力した他の 2 つのコンポーネントもあります。これらは人間と OpenSWE の相互作用パターンよりも、OpenSWE がどのように実行され、どのように機能するかという点に焦点を当てています。

  • 隔離されたサンドボックス内で実行:すべてのタスクは、安全で隔離された Daytona サンドボックス内で実行されます。各 Open SWE セッションに専用のサンドボックスが割り当てられるため、悪意のあるコマンドを心配する必要はなく、Open SWE に任意のシェルコマンドを実行させることができます。これにより、各コマンドの実行前に人間の承認を待つ必要がなくなり、より迅速に進めることが可能になります。
  • クラウド上で非同期に実行:クラウドネイティブなアーキテクチャにより、Open SWE はローカルリソースを消費することなく、複数のタスクを並列して処理できます。朝に一連のタスクを割り当てておけば、午後にはプルリクエスト(PR: Pull Request)のセットが完了しているという状況も実現可能です。
  • コミット前に計画とレビューを実行:多くのエージェントはすぐにコーディングを開始し、その結果 CI パイプライン(CI: Continuous Integration)を破綻させるミスにつながることがよくあります。Open SWE は、専用のプランナー(Planner)とレビュアー(Reviewer)コンポーネントを持つマルチエージェントアーキテクチャを採用しています。プランナーはまずコードベースを調査し、堅牢な戦略を策定します。コード記述後、レビュアーは一般的なエラーのチェック、テストおよびフォーマッターの実行を行い、プルリクエストを開く前に変更内容について検討を行います。このアプローチにより、レビューサイクル数を減らしつつ、実用的なコードをより効果的に作成できることが確認されています。

考慮事項: Open SWE は複雑で実行に時間がかかるタスクには非常に優れています。しかし、小さな 1 行のバグ修正や単純なスタイル更新のようなケースでは、このアーキテクチャは最適ではありません。そのようなタスクでは、エージェントが計画とレビューの段階をスキップして、すぐに実行に移せることが望まれます。現在、まさにその機能を実装するバージョンの開発を進めています。これは CLI(コマンドラインインターフェース)を通じてローカルで動作し、より自律的なエージェントとして振る舞い、コードの計画やレビューが必要かどうかを自ら判断できるものです。これが完成すれば、Open SWE は単純な 1 行のスタイル修正から、ゼロからの完全な製品実装に至るまで、あらゆるエンジニアリングタスクに対応する真のワンストップショップとなります。

仕組み:エージェントアーキテクチャ

Open SWE は、マネージャー、プランナー、プログラマー(内部にレビューアというサブエージェントを内蔵)の 3 つの専門的な LangGraph エージェントが順次連携して動作します。

image
image
  • マネージャー:このグラフがエントリーポイントです。ユーザーとの対話を処理し、タスクをルーティングします。タスクを作成すると状態を初期化し、制御権をプランナーに引き渡します。
  • プランナー:コードの一行も書かれる前に、プランナーはリクエストを分析し、ファイルを表示したり検索を実行したりしてコードベースを調査し、詳細なステップバイステップの実行計画を作成します。デフォルトでは、この計画に対して編集・承認・フィードバックを提供できる手動レビューステップが必要ですが、大胆に行動したい場合はこのステップをスキップすることもできます。
  • プログラマー&レビューア:計画が承認されると、プログラマーはサンドボックス内で各ステップを実行します。これにはコードの記述、テストの実行、ドキュメントのためのウェブ検索が含まれます。プログラマーがタスクを完了すると、生成されたコードの品質・正確性・完全性を分析するレビューアに引き渡されます。問題が発見された場合、フィードバックと共にタスクはプログラマーに戻され、次のイテレーションが行われます。このアクションとレビューのループは、コードが完璧になるまで続きます。

レビューアが作業を承認すると、Open SWE は最終的な結論を生成し、プルリクエストを開き、タスクを完了としてマークします。

Tech We Used: LangGraph and LangGraph Platform

Open SWE は、ワークフローの各ステップをより細かく制御できる LangGraph を基盤として構築されています。Open SWE は 4 つのエージェントを通じて動作し、それぞれが独自の状態と一意の入力/出力を持っています。LangGraph を使用することで、すべてのエージェントの呼び出しを容易にオーケストレーションしたり、いつでもその状態を管理したり、エッジケースにおけるエラー処理を行ったりすることが可能になります。また、LangGraph フレームワークに加え、Open SWE は LangGraph Platform (LGP) 上でデプロイされています。LGP は長時間実行されるエージェント(これらのエージェントは場合によっては 1 時間連続で動作することもあります)のために特別に設計されており、組み込みの永続化機能(人間が関与するループ機能を支えるもの)と自動スケーリング機能を備えています。これにより、必要に応じて数百のエージェント実行を同時に開始することが可能になります。

Refined with LangSmith

Open SWE は複雑なマルチエージェントシステムです。このシステムを実用的なものにする上で最大の課題は、生成される結果が十分な精度を持っていることを保証することでした。その中で最も大きな課題は コンテキストエンジニアリング でした。ツールを使用する方法に関する正しい指示が含まれているか?適切なコンテキストを取得できているか?これらの指示を変更した場合、パフォーマンスはどう変化するのか?まずコンテキストエンジニアリングのデバッグを行い、その後でコンテキストエンジニアリングの変更を評価するために、私たちは最先端の AI オブザーバビリティ および評価プラットフォームである LangSmith を利用しました。

オープンソースかつ拡張可能

Open SWE は、すぐに使える強力なツールとして構築しましたが、コミュニティのための基盤としての可能性に最も興奮しています。プロジェクト全体はオープンソースであり、LangGraph をベースに構築され、拡張を前提に設計されています。

リポジトリのフォーク、プロンプトのカスタマイズ、社内 API 用の新ツールの追加、あるいはチーム固有のニーズに合わせてエージェントのコアロジックを変更することも可能です。当社の 開発者向けドキュメント では、独自バージョンの設定とデプロイに関する詳細なガイドを提供しています。

ソフトウェア開発の未来は、人間とエージェントとの協働によって築かれるものだと信じています。Open SWE は、その未来をオープンに構築するための最初の大きな一歩です。

  • Open SWE を試す
  • GitHub リポジトリ
  • ドキュメント
  • YouTube 動画発表

関連コンテンツ

image
image

企業アナウンスメント

LangSmith

Interrupt で発表したすべてのもの

image
image

Jacob Talbot

2026 年 5 月 14 日

image
image

11 分

image
image

企業アナウンスメント

LangChain Labs の発表

image
image

ハリスン・チェイス

2026 年 5 月 14 日

image
image

3 分

image
image

企業アナウンスメント

インターラプト プレビュー:MC にご登場いただきましょう

image
image

ベッカ・ウェンク

2026 年 4 月 28 日

image
image

7 分

image
image

エージェントが実際に何をしているかを確認する

LangSmith は、エージェントエンジニアリングプラットフォームであり、開発者がすべてのエージェントの決定をデバッグし、変更の評価を行い、ワンクリックでデプロイできるよう支援します。

原文を表示

The use of AI in software engineering has evolved over the past two years. It started as autocomplete, then went to a copilot in an IDE, and in the fast few months has evolved to be a long running, more end-to-end agent that run asynchronously in the cloud.

We believe that all agents will long more like this in the future - long running, asynchronous, more autonomous. Specifically, we think that they will:

  • Run asynchronously in the cloud
  • Integrate directly with your tooling
  • Have enough context over your environment to properly plan tasks over longer time horizons
  • Review their own work (and fix any issues) before completing their task

Over the past few months it became apparent that software engineering was the first discipline where this vision would become a reality. Yet there was no open source project that captured these characteristics.

So we built Open SWE, the first open-source, async, cloud-hosted coding agent. It connects directly to your GitHub repositories, allowing you to delegate tasks from GitHub issues or our custom UI. Open SWE operates like another engineer on your team: it can research a codebase, create a detailed execution plan, write code, run tests, review its own work for errors, and open a pull request when it's finished.

Open SWE contributions to the LangGraph repository
Open SWE contributions to the LangGraph repository

We've been using it internally to accelerate our own development on projects like LangGraph, and the Open SWE repo itself where it’s already a top contributor.

Open SWE contributions to its own repository
Open SWE contributions to its own repository

Today, we're excited to share it with the community.

How to Use It

You can get started with the hosted version of Open SWE in minutes. All you need is an Anthropic API key.

  • Visit swe.langchain.com.
  • Connect your GitHub account and select the repositories you want Open SWE to access.
  • Provide your Anthropic API key in settings.
  • Start a new task and watch it go!
Open SWE Homepage
Open SWE Homepage

If you’re looking for a place to start, you can check out the examples page in our documentation.

Why Open SWE?

There are a number of open source coding projects. Why built a new one? We wanted to drive attention and focus to aspects besides just the prompts and tools used. Specifically, we wanted to highlight more of the overall flow and UX that is needed to bring these agents to the point where we can interact with them in a reliable way.

We think UI/UX is often the one of the more under-explored areas in agent building. The overall interaction pattern of your application can greatly determine the usage it gets. With asynchronous agents being such a new idea, we think there are a lot of interesting patterns to explore here. Two main points are more control and deep integration.

Control: Open SWE has two main features that give you more control over your coding agent while it's running. You can interrupt the agent when you want to review work or nudge it back on track without restarting.

  • Human in the loop: When Open SWE generates a plan, it interrupts and gives you the chance to accept, edit, delete, or request changes to the plan. It missed something? Simply tell it to keep digging, and it’ll restart the planning process for your task.
  • Double texting: Most coding agents don’t support accepting new requests or feedback while they’re running. Open SWE doesn’t suffer from that constraint. If you change your mind on the product spec, want to add a new feature, or see it going off the rails, simply send it a message, and it’ll smoothly integrate that into its active session.

Deeply integrated: Open SWE integrates directly with your GitHub account and repositories, so you can assign it work like any other developer and give it context to your code. Developers already live in GitHub, so why make them learn a new product? With Open SWE, every new task is given a tracking issue. This issue is updated throughout the session with status updates, execution plans and more. When it completes a task, a pull request is automatically opened and linked back to the tracking issue.

You can also trigger runs directly from GitHub:

  • Simply add a label (e.g., open-swe-auto) to a GitHub issue, and Open SWE gets to work. When it’s done, it opens a pull request, ready for your review. It fits into your existing process, just like a human teammate.

Besides these two core pillars, there are two other components we focused on. These focus less on the interaction pattern of humans with OpenSWE, but rather on how OpenSWE runs and does it work.

  • Runs in an isolated sandbox Every task runs in a secure, isolated Daytona sandbox. Since each Open SWE session is given its own sandbox, you don’t need to worry about malicious commands, and can let Open SWE execute any shell command it wants. This means we can move quicker, without requiring human approval for every command it wants to run.
  • Runs asynchronously in the cloud: The cloud-native architecture means Open SWE can work on multiple tasks in parallel without consuming your local resources. You can assign it a list of tasks in the morning and come back to a set of PRs in the afternoon.
  • Plans and reviews before committing: Many agents jump straight to code, often leading to mistakes that break your CI pipeline. Open SWE uses a multi-agent architecture with dedicated Planner and Reviewer components. The Planner researches the codebase to form a robust strategy first. After the code is written, the Reviewer checks for common errors, runs tests and formatters, and reflects on the changes before ever opening a PR. We've found this is more effective at writing workable code with fewer review cycles.

Considerations: Open SWE is great for complex, longer running tasks. But for small one-liner bug fixes or simple style updates, this architecture is not optimal. For tasks like these, you want the agent to be able to skip the planning and reviewing stages, and jump right into execution. We’re currently working on implementing a version of Open SWE which does just this. It runs locally via a CLI, and is more agentic, allowing it to choose whether or not it needs to plan or review its code. When this is done, Open SWE will be a true one-stop-shop for all engineering tasks, for anything from simple one-line style fixes, all the way to complete product implementation from scratch.

How It Works: The Agent Architecture

Open SWE operates using three specialized LangGraph agents that work in sequence: a Manager, a Planner, and a Programmer (which contains a sub-agent Reviewer).

  • Manager: This graph is the entry point. It handles user interactions and routes tasks. When you create a task, it initializes the state and passes control to the Planner.
  • Planner: Before a single line of code is written, the Planner analyzes the request, researches the codebase by viewing files and running searches, and creates a detailed, step-by-step execution plan. By default, this requires a manual review step where you can edit, approve, or provide feedback on the proposed plan. If you’re feeling bold, however, you can skip this step.
  • Programmer & Reviewer: Once a plan is approved, the Programmer executes each step in the sandbox. This includes writing code, running tests, and searching the web for documentation. When the Programmer completes its tasks, it hands off to the Reviewer, which analyzes the generated code for quality, correctness, and completeness. If issues are found, it sends the task back to the Programmer with feedback for another iteration. This action-review loop continues until the code is perfect.

Once the Reviewer approves the work, Open SWE generates a final conclusion, opens a pull request, and marks the task as complete.

Tech We Used: LangGraph and LangGraph Platform

Open SWE is built on LangGraph, which allows us to have more control over each step in the workflow. Open SWE operates through four agents, each with their own state and unique inputs/outputs. By using LangGraph, we’re able to easily orchestrate calling all of the agents, managing their state at any point in time, and handling edge error cases. In addition to the LangGraph framework, Open SWE is deployed on LangGraph Platform (LGP). LGP is purpose built for long running agents (these agents can sometimes run for an hour at a time), comes with built in persistence (powering our human-in-the-loop features) and autoscales (so that we can kick of hundreds of agent runs if necessary).

Refined with LangSmith

Open SWE is a complex multi-agent system. The main challenge in getting this system to be useful was making sure that the results it produced were accurate enough. The biggest challenge with this was context engineering. Did it have the correct instructions on how to use the tools? Was it fetching the right context? If we changed those instructions, how would the performance change? In order to first debug context engineering, and then later to evaluate changes to context engineering, we used LangSmith - the leading AI observability and evaluation platform.

Open Source and Extensible

We built Open SWE to be a powerful tool out of the box, but we're most excited about its potential as a foundation for the community. The entire project is open source, built on LangGraph, and designed to be extended.

You can fork the repository, customize the prompts, add new tools for your internal APIs, or modify the agent's core logic to fit your team's specific needs. Our developer documentation provides a detailed guide for setting up and deploying your own version.

We believe the future of software development will be collaborative between humans and agents. Open SWE is our first big step in building that future in the open.

  • Try Open SWE
  • GitHub Repository
  • Documentation
  • YouTube Video Announcement

Related content

Company Announcements

LangSmith

Everything we shipped at Interrupt

Jacob Talbot

May 14, 2026

11

min

Company Announcements

Introducing LangChain Labs

Harrison Chase

May 14, 2026

3

min

Company Announcements

Interrupt Preview: Meet the MC

Becca Weng

April 28, 2026

7

min

See what your agent is really doing

LangSmith, our agent engineering platform, helps developers debug every agent decision, eval changes, and deploy in one click.

この記事をシェア

関連記事

Latent Space★42026年6月19日 14:53

[AINews] GLM は GPT より優れているか?GLM-5.2 が実用性を証明、Z.ai が 12 月までに「Open Fable」を公開予定

Latent Space のニュースでは、中国のモデル「GLM-5.2」がベンチマークで優れた結果を示し実用性があると評価されたことと、Z.ai が 12 月までにオープンソースプロジェクト「Open Fable」を発表する見込みについて報じられています。

MarkTechPost★32026年6月19日 11:44

Salesforce CodeGen チュートリアル:ユニットテストと安全性チェック付きの Python 関数の生成・検証・再ランク付け

Salesforce は Hugging Face からモデルを読み込み、自然言語から Python 関数を生成するエンドツーエンドワークフローを公開した。この手法には構文チェックや静的解析、ユニットテストによる検証が含まれる。

AWS Machine Learning Blog★42026年6月19日 08:31

CloudWatch の SageMaker メトリクスとインサイトダッシュボードを用いた生成 AI 推論の監視・デバッグ

AWS は、大規模な生成 AI 推論エンドポイントの P99 レイテンシ急上昇などのトラブルを GPU メモリ圧力や KV キャッシュ飽和などから特定できるよう、CloudWatch に SageMaker の詳細メトリクスとインサイトダッシュボードを追加した。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む