LangSmith:より良い整理のために再設計された製品ホームページとリソースタグ
LangChain が提供する LangSmith の製品ホームページを再設計し、リソースタグ機能を追加することで、開発者の情報検索とプロジェクト整理の効率化を図った。
キーポイント
製品ホームページの全面リニューアル
ユーザー体験(UX)を向上させるため、LangSmith のトップページデザインが刷新され、情報の階層構造が見直された。
リソースタグ機能の追加
ドキュメントやチュートリアルなどのリソースにタグ付けする機能が実装され、関連性の高い情報へのフィルタリングが可能になった。
情報の整理と検索効率の向上
タグ機能により、膨大なリソースの中から特定のテーマや技術スタックに関連する資料を迅速に見つけられるようになり、学習コストが削減される。
影響分析・編集コメントを表示
影響分析
このアップデートは、LangChain エコシステムの利用者が膨大なリソースを効果的に活用するための基盤整備であり、特に大規模なプロジェクトや学習中の開発者にとっての生産性向上に寄与します。ただし、機能追加にとどまるため、技術的なパラダイムシフトをもたらすものではありませんが、プラットフォームの成熟度を示す重要な一歩です。
編集コメント
機能追加という点では地味ですが、LLM アプリ開発の現場で「情報過多」に悩む開発者にとって、検索と整理を支援するこの改善は実用的な価値が高いです。

本日、私たちは再設計された LangSmith のプロダクトホームページおよび、ワークスペース内でのリソース整理に対する改善されたサポートのリリースを発表できることを嬉しく思います。これらのアップデートは、エンジニアリングチームが LLM アプリケーションを構築し、最適化し、反復する際の継続的な洞察に基づいています。本稿では、私たちの更新された信念と、それがどのようにデザインを導いたかについて詳しく解説します。
LangSmith ホームページ再設計へのアプローチ
数千の開発者や企業との協力を通じて、私たちは LLM アプリケーションの構築において、主に 3 つの領域で作業を行っていることを観察しました。それは、観測性(observability)、評価(evaluation)、そしてプロンプトエンジニアリングです。各要素が効果的な開発ワークフローにおいて果たす重要な役割を反映するため、私たちは LangSmith のプロダクトホームページ をこれら 3 つの領域に分けました。
観測性(Observability)
*このセクションには、トレーシングプロジェクトとダッシュボードが含まれています。*
AI エンジニアに対する最も重要な推奨事項の一つは「自社のデータを参照せよ」というものであり、LangSmith はこれを実現するために、ユーザーが課題を特定し、時間の経過とともに LLM アプリケーションのパフォーマンスを理解するのを支援します。
Tracing Projects は、AI アプリケーションから発行されるトレースのコレクションです。このページ内では、トレースを検索およびフィルタリングし、特定のトレースをクリックしてより詳細なビューを表示できます。このようなデータポイントレベルの観測機能は、アプリケーション内で何が起きているかを理解し、迅速にデバッグや問題特定を行うために不可欠です。
Dashboards を使用すると、アプリケーションにとって最も重要な指標を時間経過とともに追跡するためのカスタム監視チャートを作成できます。これには、コスト、レイテンシ、品質といった基本指標に加え、時間の経過に伴うエージェントのアクションやリアルタイム評価スコアといったより具体的な基準も含まれます。
当社の観測機能は、開発における詳細なデバッグから、本番環境でのスケールしたパフォーマンス監視に至るまで、ライフサイクルのあらゆる段階でユーザーが LLM アプリケーションを最適化できるよう設計されています。
Evaluation
*このセクションには、Datasets、Experiments、Annotation Queues が含まれます。*
LLM アプリケーションの評価 は、開発におけるボトルネックとなることがよくあります。高品質で継続的な評価(または「evals」)は、開発者がアプリケーションのパフォーマンスがどの程度良好であるかを理解し、改善が必要な領域を特定するのに役立ちます。LangSmith Evaluation は推測を不要にし、精度、スタイル、その他の主要基準にわたる回帰や改善点を明確に示します。
まず、LangSmith は データセット のキュレーションを容易にします。ユーザーは既存のデータをインポートするか、LangSmith の観測可能性セクションからログ内のデータポイントを自動的に追加できます。その後、これらのデータセット上で実験を実行し、自動評価器で結果をスコアリングし、時間経過とともにその結果を追跡できます。
LLM アプリケーションの評価において、人間のレビューは依然として重要な要素であり、LangSmith は注釈キューを通じてこのプロセスを簡素化します。注釈キューを使用することで、ユーザーは人間のレビューが必要なデータポイントを整理・管理でき、レビュワーのワークフローを効率化し、一貫性が高く高品質なフィードバックを保証できます。
プロンプトエンジニアリング
*LangSmith のこのセクションには、プロンプトとプレイグラウンドが含まれています。*
応答性と信頼性の高い LLM アプリケーションを構築するには、効果的なプロンプトエンジニアリングが不可欠です。LangSmith を使用すると、ユーザーはプロンプトの保存およびバージョン管理が可能となり、その進化を追跡したり、チームメンバーとシームレスに協力したりすることが容易になります。
さらに、LangSmith のプレイグラウンドでは、ユーザーはリアルタイムでプロンプトを反復して改善できます。ユーザーは個々のデータポイントに対して、あるいはデータセット全体に対してプロンプトを実行し、スケーラブルな影響を評価できます。また、プレイグラウンドでは、異なるプロンプトとモデルの組み合わせがどのようにパフォーマンスを発揮するかを並列比較することも可能です。
プロンプトエンジニアリングは、私たちが境界を押し広げたいと考える分野です。"プロンプトエンジニアのための IDE"とは実際にどのようなものになるのでしょうか?この問いに迫り、プロンプトエンジニアが必要とするツールを再考し、私たちの考えの一部をまもなく共有できることを楽しみにしています。
始め方ガイド
新規ユーザーがすぐに使い始められるよう、ホームページの上部にオブザーバビリティ(可観測性)、評価、およびプロンプトエンジニアリングをカバーするオンボーディングガイドを追加しました。
LangSmith を試す
今日から新しい LangSmith ホームページと機能をご覧ください。smith.langchain.com で体験し、アプリ内のフィードバックフォームを通じてご意見を聞かせてください。
関連コンテンツ

LangSmith
コーディングエージェントが予測可能な時間を費やす方法

Martha Janicki
2026 年 6 月 15 日
5 分

LangSmith
エージェントに最適なサンドボックスを選ぶ方法

Rahul Verma
2026 年 6 月 12 日
6
分

LangSmith
エージェントに専用のコンピューターを

Amy Ru
2026 年 6 月 5 日
7
分
エージェントが実際に何をしているかを確認する
エージェントエンジニアリングプラットフォームの LangSmith は、開発者がすべてのエージェントの意思決定をデバッグし、評価の変更を行い、ワンクリックでデプロイできるように支援します。
原文を表示

Today, we’re excited to release a redesigned LangSmith product homepage as well as improved support for resource organization within your workspaces. These updates reflect our ongoing insights into how engineering teams build, optimize, and iterate on their LLM applications. In this post, we will walk through our updated beliefs and how they guided our design.
Our approach to redesigning the LangSmith homepage
Through collaborating with thousands of developers and companies, we’ve observed that they work across three main areas when building LLM applications: observability, evaluation, and prompt engineering. To reflect the critical role each plays in an effective developer workflow, we’ve split our LangSmith product homepage into these three areas.
Observability
*This section in LangSmith includes Tracing Projects and Dashboards.*
One of the biggest recommendations for AI engineers is to “look at your own data” — and LangSmith enables this by helping users identify issues and understand their LLM application’s performance over time.
Tracing Projects are collections of traces emitted from your AI application. Inside this page, you can search and filter traces, then click into a specific trace for a more detailed view. This type of datapoint-level observability is crucial for understanding what is going on in your application, so that you can debug and identify issues quickly.
Dashboards allow you to create custom monitoring charts to track the metrics that matter the most to your application over time. This includes basic metrics like cost, latency, and quality as well as more specific criteria like agent actions over time or realtime evaluation scores.
Our observability features are designed to empower users to optimize their LLM application at every step in the lifecycle — from detailed debugging in development, to monitoring performance at scale in production.
Evaluation
*This section in LangSmith includes Datasets, Experiments, and Annotation Queues.*
Evaluating your LLM application is often a bottleneck in development. High-quality, continuous evaluations (or “evals”) help developers understand how well their application is performing and pinpoint areas for improvements. LangSmith Evaluation removes the guesswork, highlighting regressions or improvements across metrics like accuracy, style, and other key criteria.
First, LangSmith makes it easy to curate datasets. Users can import existing data, or automatically add data points from their logs in the Observability section of LangSmith. You can then run experiments over these datasets, score the result with automatic evaluators, and track the results of these over time.
Human review remains a crucial part of evaluating LLM applications, and LangSmith simplifies this process with Annotation Queues. Using Annotation Queues, users can organize and manage data points that need human review, streamlining the workflow for reviewers and ensuring consistent, high-quality feedback.
Prompt Engineering
*This section in LangSmith includes Prompts and the Playground.*
Effective prompt engineering is necessary for building a responsive and reliable LLM application. LangSmith enables user to store and version prompts, making it easy to track their evolution and collaborate seamlessly with team members.
Additionally, the Playground in LangSmith allows users to iterate on prompts in real-time. Users can run prompts against individual datapoints or over an entire dataset to assess their impact at scale. The Playground also allows for side-by-side comparisons of how different prompt and model combinations perform.
Prompt engineering is an area where we’re interested in pushing the boundaries. What could an “IDE for prompt engineering” truly look like? We’re diving into this question, reimagining the tools that prompt engineers need, and we’re excited to share some of our ideas soon.
Onboarding guides to get started
To help new users get started quickly, we also added an onboarding guide at the top of the homepage, covering Observability, Evaluation, and Prompt Engineering.
Try out LangSmith
Explore the new LangSmith homepage and features today at smith.langchain.com — and let us know what you think through the in-app feedback form.
Related content

LangSmith
How We Made Coding Agent Spend Predictable

Martha Janicki
June 15, 2026
5
min

LangSmith
How to Choose the Right Sandbox for Your Agent

Rahul Verma
June 12, 2026
6
min

LangSmith
Give your agent its own computer

Amy Ru
June 5, 2026
7
min
See what your agent is really doing
LangSmith, our agent engineering platform, helps developers debug every agent decision, eval changes, and deploy in one click.
関連記事
[AINews] 今日特に大きな出来事はありませんでした
Latent Space は、GLM 5.2 が依然として注目されていると指摘しつつ、AIE WF 2026 の通常チケットが月曜日に完売すると発表しました。同サイト購読者向けに限定割引を提供し、参加者には Warp や Datadog などからのスポンサークレジットも付与されます。
米国がアンソロピックの「Fable 5」発売を禁止、しかし市場は動じず
米国政府は国家安全保障上の懸念から、アマゾンの研究者らがガードレール回避手法を発見したとして、アンソロピックに対し最新モデル「Fable 5」と「Mythos 5」の販売差し止めを命じた。サイバーセキュリティ研究者らはこの措置が危険だとする公開書簡に署名し、同社も他モデルでも同様の抜け道が存在すると指摘している。
社内データ分析エージェントの構築方法について
GitHub は、大規模なデータ組織が直面する自己完結型のデータアクセスと洞察提供の課題に対し、AI を活用した信頼性の高い解決策として、社内でデータ分析エージェントを構築したことを発表した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み