Ornith-1.0:エージェント型コーディングのための自己構築型LLM
DeepReinforce が公開した新モデル Ornith-1.0 は、Gemma と Qwen を基盤とし、自律的なコードスケーフォールディング機能によりローカル環境でのエージェントコーディング性能を大幅に向上させた。
キーポイント
多様なアーキテクチャと高性能
9B から 397B の MoE モデルまでバリエーションがあり、Gemba 4 と Qwen 3.5 を基盤に、オープンソースモデルとして最高水準のコーディングベンチマーク性能を達成している。
ライセンス互換性の確保
ベースモデルである Gemma 4 と Qwen 3.5 が Apache 2.0 ライセンスを採用しており、商用利用や改変における法的リスクが低く、実装の自由度が高い。
ローカル環境での実証済み
LM Studio を介して Pi.dev などのローカルハードウェア上で動作確認され、複雑なツール呼び出しを要するエージェントタスクや画像生成において高い効率と精度を示した。
影響分析・編集コメントを表示
影響分析
このモデルは、オープンソースコミュニティにおけるコーディングエージェントの性能と信頼性を再定義する重要な一歩です。特に、ベースモデルのライセンス問題(Gemma の過去事例)を回避し、Apache 2.0 で提供される点は、企業や開発者がローカル環境で安全に高度な AI エージェントを構築・展開するための障壁を取り除く意味があります。
編集コメント
ベースモデルのライセンス問題をクリアし、ローカル環境で高機能なエージェントが動作する実例を示した点は、開発者コミュニティにとって極めて価値が高いです。
Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding
これは興味深い新しいオープンウェイト(MIT ライセンス)モデルであり、DeepReinforce からの最初のモデルリリースです。
[...] バリアントには、9B Dense、31B Dense、35B MoE、そして 397B MoE が含まれています。事前学習済みである Gemma 4 と Qwen 3.5 を基盤として構築されており、同規模のオープンソースモデルの中でコーディングベンチマークにおいて最先端のパフォーマンスを達成しています。
私の知る限り、これらの基盤となるモデルのライセンスはこのような用途での使用と互換性があります。Gemma 4 は Apache 2.0 ライセンスであり(以前の Gemma モデルに問題を引き起こした、不具合のある追加の Gemma Terms of Use に縛られていません)、Qwen 3.5 も同様に Apache 2.0 ライセンスです。
私は LM Studio を使用してこのモデルを実行しており、ornith-1.0-35b-Q4_K_M.gguf(20GB)の GGUF ファイルを Pi に接続して使用しています。最初の印象は非常に良好で、多数のツール呼び出しにわたってエージェントハネスを熟練した方法で実行できるようです。
こちらがターミナルセッションです。私は Datasette のチェックアウトに対して「アクタークッキーをデコードするコードを見つけよ」と指示し、その後「ボタンがクリックされたときに挿入ダイアログを開くコードを見つけよ」と指示しました。これらを容易に処理してくれました。
また、このペリカンを描くよう指示も出しました draw this pelican、その結果は 1 秒あたり 103 トークンの速度でした:

少し歪んでいますが、ペリカンであることは明確です。
DeepReinforce 自体に関する情報はほとんど見つかりませんでした。私が発見できた最も古い論文は、2025 年 6 月発表の CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning です。
Tags: ai, generative-ai, local-llms, llms, qwen, pelican-riding-a-bicycle, gemma, llm-release, lm-studio
原文を表示
Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding
This is an interesting new open weights (MIT licensed) model, the first model release from DeepReinforce.
[...] with variants including 9B Dense, 31B Dense, 35B MoE, and 397B MoE. Built on top of pretrained Gemma 4 and Qwen 3.5, it achieves state-of-the-art performance among open-source models of comparable size on coding benchmarks.
As far as I can tell the licenses of those underlying models is compatible with being used in this way - Gemma 4 is Apache 2.0 licensed (and not bound by the janky additional Gemma Terms of Use that afflicted the previous Gemma models) and Qwen 3.5 is Apache 2.0 licensed as well.
I've been running the model using LM Studio and the ornith-1.0-35b-Q4_K_M.gguf (20GB) GGUF, hooked up to Pi. Initial impressions are very good - it seems to be able to run the agent harness over many tool calls in a proficient way.
Here's a terminal session where I asked it to "find the code that decodes the actor cookie" and then "find the code that opens the insert dialog when thebutton is clicked" against a Datasette checkout, which it handled with ease.
I also had it draw this pelican, which came out at 103 tokens/second:

It's a little bit mangled but the pelican is clearly a pelican.
I couldn't find much information about DeepReinforce themselves. The earliest paper I could find from the was CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning from June 2025.
Tags: ai, generative-ai, local-llms, llms, qwen, pelican-riding-a-bicycle, gemma, llm-release, lm-studio
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み