美团が API で 1.6 兆パラメータの LongCat-2.0 モデルを公開(2 分読了)
Meituan は、1.6 トリオンパラメータの MoE モデル「LongCat-2.0」を API で公開し、100 万トークンのコンテキストウィンドウとエージェントコーディング機能を実現した。
キーポイント
超大規模 MoE アーキテクチャの実装
1.6 トリオンパラメータの Mixture-of-Experts システムであり、トークンあたり約 480 億パラメータが活性化される設計となっている。
超長文コンテキスト処理能力
100 万トークンの入力ウィンドウと最大 12.8 万トークンの出力長をサポートし、大規模リポジトリや多段階エージェントタスクに最適化されている。
開発者向け API と互換性
OpenAI および Anthropic の API フォーマットに完全準拠しており、Claude Code や Codex スタイルのワークフローとシームレスに連携可能。
専用インフラと学習データ
AI ASIC スーパーポッド上で 35 トリオントークン以上の事前学習を行い、1M コンテキスト対応の独自アテンション機構「LongCat Sparse Attention」を採用。
1.6T パラメータの MoE アーキテクチャと超長文コンテキスト
1.6 トリオンパラメータ(トークンあたり約480億がアクティブ)の混合専門家モデルで、最大 128K トークンの出力と 100 万トークンのコンテキストウィンドウをサポートし、複雑なコーディングやエージェントタスクに最適化されています。
API 経由での公開と従量課金モデル
OpenAI や Anthropic と互換性のある API 形式で提供され、入力トークン(キャッシュあり/なし)や出力トークンに応じた従量課金プランが導入されています。
Owl Alpha の正体とモデル重みの公開状況
本モデルは OpenRouter で非公開で利用されていた「Owl Alpha」の正体であり、現在は API 経由でのみ利用可能ですが、GitHub リポジトリには MIT ライセンスの下でドキュメントが公開され、モデル重みのリリースも予定されています。
影響分析・編集コメントを表示
影響分析
この発表は、中国発の AI モデルが単なるチャットボットから、大規模コードベースや複雑な業務フローを処理できる自律型エージェントへと進化していることを示す重要な転換点です。特に 100 万トークンのコンテキストウィンドウと API 互換性の組み合わせは、開発現場における長文解析タスクのワークフローを根本から変革する可能性を秘めています。
編集コメント
1.6T という圧倒的なパラメータ規模と、実用的な 100 万トークンコンテキストを両立させた LongCat-2.0 は、エンタープライズレベルの複雑タスク処理において強力な競合候補となり得ます。API の互換性を重視した設計は、既存の開発環境への導入を容易にする戦略的かつ現実的なアプローチと言えます。
Meituan は、先行する LongCat-2.0-Preview に続く LongCat モデルファミリーにおける重要な進展として、LongCat-2.0 を発表しました。この新モデルは、1 兆 6,000 億パラメータの Mixture-of-Experts(専門家混合)システムとして設計されており、トークンあたり約 480 億のパラメータがアクティブになります。これは、エージェントによるコーディング、ツール使用、長文脈処理、自動化されたワークフロー、および複雑な指示の実行を目的としています。
LongCat-2.0 は、100 万トークンのコンテキストウィンドウと、LongCat API Platform を介した最大 128K トークンの出力長を特徴としています。開発者は、OpenAI 互換および Anthropic 互換の API フォーマットを通じてアクセスでき、Claude Code、OpenClaw、OpenCode、Kilo Code、Codex スタイルのワークフローをサポートしています。
同社は、完全なトレーニング実行とデプロイが AI ASIC スーパーポッド上で行われ、事前学習は 35 兆トークン以上を跨って実施されたと報告しています。LongCat はまた、長期ホライズンのタスク向けに LongCat Sparse Attention(スパースアテンション)を導入し、1M コンテキストのデータから数百億トークンをモデルにトレーニングさせることで、大規模なリポジトリ、長文書、多段階のエージェントタスクに適したシステムを位置付けています。
AINews サブスクリプション
今回のリリースは API を通じて一般公開され、課金も開始されました。従量制課金プランでは現在、LongCat-2.0 が以下の価格で利用可能です:
- キャッシュされていない入力トークン 100 万あたり 0.75 ドル
- キャッシュされた入力トークン 100 万あたり 0.015 ドル
- 出力トークン 100 万あたり 2.95 ドル
LongCat によって、さらに期間限定の低価格もリストされています。トークンパックの有効期限は 30 日間で、キャッシュヒット(cache hits)はトークンパックの使用量にはカウントされません。
今回のリリースはまだ完全な重み(weights)の公開ではありません。GitHub リポジトリは MIT ライセンスの下で公開されていますが、リポジトリと Hugging Face のモデルカードの両方で、モデルの重みは近日公開される予定であることが示されています。これにより、現時点での発売形態はハイブリッド型となっています:API を通じて利用可能であり、公開リポジトリにドキュメントが記載されている一方で、ダウンロード可能なモデルの重みはまだ保留中です。
LongCat-2.0 はまた、OpenRouter で稼働している非公開だったモデルである Owl Alpha とも関連付けられています。LongCat の公式アカウントは、LongCat-2.0 を Owl Alpha の背後にある完全なモデルであると説明しています。一方、OpenRouter では Owl Alpha を、ツール使用(tool-use)、コード生成(code-generation)、自動化されたワークフロー、複雑な指示の追従能力を備えた 105 万トークンコンテキストのエージェントモデルとしてリストしています。OpenRouter の無料モデルページでは、Owl Alpha が 3.74T トークンの処理実績を持つと記載されており、発表前にすでに多くの開発者によって使用されていたことが示唆されています。
LongCat を開発した Meituan は、このプロジェクトを「物理的な世界でのシナリオにおいて AI を有用にするために設計された大規模言語モデルのファミリー」と説明しています。同チームは既に LongCat-Flash-Chat、LongCat-Video、LongCat-Image、LongCat-Next など他の AI プロジェクトをリリースしており、LongCat-2.0 を、より広範なマルチモーダルおよびエージェント指向のポートフォリオにおける新たなフラッグシップ言語モデルとして位置付けています。
Meituan has officially launched LongCat-2.0, a new large language model featuring 1.6 trillion parameters, now available via its API platform. This release marks a significant milestone in the company's AI capabilities, positioning it as one of the most powerful open-access models globally.
The LongCat-2.0 model is designed to handle complex reasoning tasks, multi-step problem solving, and high-precision code generation. With 1.6T parameters, it demonstrates exceptional performance in natural language understanding, logical deduction, and creative content creation compared to previous iterations.
Developers can now access the model through Meituan's API endpoints, which offer flexible pricing tiers based on usage volume. The platform supports various integration methods including RESTful APIs and SDKs for major programming languages, enabling seamless deployment in enterprise applications.
Meituan emphasizes that LongCat-2.0 undergoes rigorous safety evaluations to minimize hallucinations and ensure reliable outputs. The company has implemented advanced filtering mechanisms to prevent the generation of harmful or biased content while maintaining high accuracy across diverse domains.
The launch comes amid intensifying competition in the AI model market, with major tech companies continuously pushing the boundaries of parameter scale and performance. Meituan aims to differentiate itself through specialized optimization for e-commerce and local services scenarios, leveraging its extensive domain data.
Early adopters report significant improvements in task completion rates and response quality when using LongCat-2.0 for complex workflows. The model's ability to maintain context over long conversations makes it particularly suitable for customer service automation and intelligent assistant applications.
Meituan plans to release regular updates to the API platform, including new features like enhanced reasoning capabilities and support for additional languages. The company also intends to expand its developer ecosystem through workshops, documentation improvements, and community initiatives.
For organizations seeking to integrate advanced AI capabilities into their operations, LongCat-2.0 offers a robust solution with enterprise-grade reliability. The API access model allows businesses to scale usage dynamically without requiring substantial infrastructure investments.
The technical specifications of LongCat-2.0 include support for context windows up to 1 million tokens, enabling processing of extensive documents and multi-modal inputs. This capability positions the model as a versatile tool for research institutions and large-scale application development.
Meituan's commitment to open innovation is reflected in its transparent documentation and accessible API design. The company encourages feedback from the developer community to continuously refine the model's performance and address emerging use cases.
As the AI landscape evolves, LongCat-2.0 represents Meituan's strategic investment in next-generation language technology. The 1.6T parameter scale demonstrates the company's dedication to pushing the boundaries of what is possible with large-scale models while maintaining practical usability for real-world applications.
原文を表示
Meituan has unveiled LongCat-2.0, marking a significant advancement in its LongCat model family following the earlier LongCat-2.0-Preview. This new model is designed as a 1.6 trillion-parameter Mixture-of-Experts system, with approximately 48 billion parameters active per token. It is aimed at agentic coding, tool use, long-context work, automated workflows, and the execution of complex instructions.
LongCat-2.0 features a 1 million-token context window and a maximum output length of 128K tokens via the LongCat API Platform. Developers can access it through OpenAI-compatible and Anthropic-compatible API formats, with support for Claude Code, OpenClaw, OpenCode, Kilo Code, and Codex-style workflows.
The company reports that the full training run and deployment were conducted on AI ASIC superpods, with pretraining across more than 35 trillion tokens. LongCat also introduced LongCat Sparse Attention for long-horizon tasks and trained the model on hundreds of billions of tokens of 1M-context data, positioning the system for large repositories, long documents, and multi-step agent tasks.
AINews Subscription
The release is publicly available via the API, and billing is now active. The pay-as-you-go pricing structure currently supports LongCat-2.0 at:
- $0.75 per 1M uncached input tokens
- $0.015 per 1M cached input tokens
- $2.95 per 1M output tokens
Lower limited-time prices are also listed by LongCat. Token packs are valid for 30 days, and cache hits do not count against token-pack usage.
This release is not yet a full weights drop. The GitHub repository is public under an MIT license, but both the repository and Hugging Face model card indicate that model weights are forthcoming. This makes the launch a hybrid release for now: usable through the API and documented in public repositories, while the downloadable model weights remain pending.
LongCat-2.0 is also linked to Owl Alpha, the previously undisclosed model running on OpenRouter. LongCat’s official account describes LongCat-2.0 as the full model behind Owl Alpha, while OpenRouter lists Owl Alpha as a 1.05M-context agentic model with tool-use, code-generation, automated workflow, and complex instruction-following capabilities. OpenRouter’s free-models page lists Owl Alpha at 3.74T tokens, indicating the model had already seen significant developer usage before the reveal.
Meituan, the company behind LongCat, describes the project as a family of large language models designed to make AI useful in physical-world scenarios. The team has already released LongCat-Flash-Chat, LongCat-Video, LongCat-Image, LongCat-Next, and other AI projects, positioning LongCat-2.0 as the new flagship language model in a broader multimodal and agent-focused portfolio.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み