Tinkerの発表
Thinking Machines LabがTinkerを発表。詳細は不明だが、新たなプロジェクトや製品の開始を示唆。
キーポイント
Thinking Machines Labが言語モデルのファインチューニング用API「Tinker」を発表
大規模混合専門家モデルを含む様々なモデルを簡単に切り替えてファインチューニング可能
分散トレーニングの複雑さを抽象化し、研究者がアルゴリズムとデータに集中できる環境を提供
プリンストン、スタンフォード、バークレーなどの研究機関ですでに実績あり
無料で開始し、今後使用量ベースの料金を導入予定
影響分析・編集コメントを表示
影響分析
Tinkerは大規模言語モデルのファインチューニングを民主化し、研究者や開発者がインフラ管理の負担なく最先端モデルのカスタマイズ実験を可能にする。これにより、学術研究から産業応用まで、より多様な主体がAIモデルの最適化に参入できる環境が整備される。
編集コメント
研究機関向けの専用ファインチューニング環境として、学術界と産業界のAI開発ギャップを埋める可能性のあるサービス。
「Tinker」の正式発表:言語モデルファインチューニングのための柔軟なAPIサービス
Thinking Machines Labは本日、言語モデルのファインチューニングのための柔軟なAPIサービス「Tinker」を発表しました。このサービスは、分散トレーニングの複雑な基盤管理を自社が担当しつつ、研究者や開発者にアルゴリズムとデータの制御権を提供することを目的としています。これにより、より多くの人々が最先端モデルの研究を行い、自身のニーズに合わせてカスタマイズすることを可能にし、同社の使命を推進します。
Tinkerの主な特徴は以下の通りです。
第一に、Qwen-235B-A22Bのような大規模なMixture of Expertsモデルを含む、大小様々なオープンウェイトモデルのファインチューニングを可能にします。小規模モデルから大規模モデルへの切り替えは、Pythonコード内の1つの文字列を変更するだけで完了する簡便さを実現しています。
第二に、これはマネージドサービスであり、自社の内部クラスターとトレーニング基盤上で動作します。スケジューリング、リソース割り当て、障害回復はすべてサービス側が管理するため、ユーザーはインフラ管理を気にすることなく、大小のトレーニングを即座に開始できます。また、LoRA(Low-Rank Adaptation)技術を採用することで、複数のトレーニング実行間で同一の計算リソースを共有し、コスト削減を図っています。
第三に、APIは「forward_backward」や「sample」といった低レベルなプリミティブを提供し、これを用いて一般的な事後学習手法のほとんどを表現できます。しかし、優れた結果を得るには多くの詳細な調整が必要であるため、Tinker API上で動作する現代的な事後学習手法の実装を集めたオープンソースライブラリ「Tinker Cookbook」も同時に公開しました。
すでに複数の主要研究機関がTinkerを利用しており、その応用例は多岐にわたります。プリンストン大学のGoedelチームは数学的定理証明器を訓練し、スタンフォード大学のRotskoff化学グループは化学推論タスクを完了するモデルのファインチューニングを行いました。カリフォルニア大学バークレー校のSkyRLグループは、マルチエージェントかつマルチターンのツール使用を伴うカスタム非同期オフポリシー強化学習ループでの実験を実施し、Redwood Researchは困難なAI制御タスクに対してQwen3-32Bモデルに強化学習を適用しています。
Tinkerは現在、研究者と開発者を対象としたプライベートベータ版として提供されています。利用希望者はウェイトリストに登録可能です。組織での利用に関心がある場合は、別途連絡が推奨されています。
料金体系は、開始時は無料で提供され、今後数週間のうちに使用量に基づく課金を導入する予定です。同社は、ユーザーがTinkerを用いてどのような発見と創造を行うかを期待すると述べています。
原文を表示
Announcing Tinker - Thinking Machines Lab Announcing Tinker
TinkerToy Computer invented by Daniel Hillis and Brian Silverman
Today, we are launching Tinker, a flexible API for fine-tuning language models. It empowers researchers and hackers to experiment with models by giving them control over the algorithms and data while we handle the complexity of distributed training. Tinker advances our mission of enabling more people to do research on cutting-edge models and customize them to their needs.
Tinker lets you fine-tune a range of large and small open-weight models, including large mixture-of-experts models such as Qwen-235B-A22B. Switching from a small model to a large one is as simple as changing a single string in your Python code.
Tinker is a managed service that runs on our internal clusters and training infrastructure. We handle scheduling, resource allocation, and failure recovery. This allows you to get small or large runs started immediately, without worrying about managing infrastructure. We use LoRA so that we can share the same pool of compute between multiple training runs, lowering costs.
Tinker’s API gives you low-level primitives like forward_backward and sample, which can be used to express most common post-training methods. Even so, achieving good results requires getting many details right. That’s why we’re releasing an open-source library, the Tinker Cookbook, with modern implementations of post-training methods that run on top of the Tinker API.
Groups at Princeton, Stanford, Berkeley, and Redwood Research have already been using Tinker:
The Princeton Goedel Team trained mathematical theorem provers
The Rotskoff Chemistry group at Stanford fine-tuned a model to complete chemistry reasoning tasks
Berkeley’s SkyRL group ran experiments on a custom async off-policy RL training loop with multi-agents and multi-turn tool-use.
Redwood Research used Tinker to RL Qwen3-32B on difficult AI control tasks
Tinker is now in private beta for researchers and developers. You can sign up for the Tinker waitlist here. We will be onboarding users to the platform starting today.
If you’re an organization interested in using Tinker, please contact us here.
Tinker will be free to start. We will introduce usage-based pricing in the coming weeks.
We’re excited to see what you discover and make with Tinker!
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み