Claude Codeは月200ドル、Gooseは無料で同じ機能を提供
Anthropic の Claude Code が高額な利用制限を課す中、Block 社が開発した無料のローカル実行型 AI エージェント「Goose」が急成長し、開発者の不満解消とデータ主権の確保という新たな潮流を生んでいる。
キーポイント
Claude Code の価格・制限への反発
Anthropic の Claude Code は月額最大$200のプランでも利用時間やトークン数に厳しい制限があり、開発者の間で不満が広がっている。
Goose による無料ローカル代替案
Block(旧 Square)が開発したオープンソースの Goose は、Claude Code と同等の機能を誇りながら、完全無料でユーザーのローカルマシン上で動作する。
データ主権とオフライン利用の実現
Goose の最大の特徴はデータが外部に送信されない点と、インターネット接続が不要なオフライン環境でも稼働できる点にある。
急成長するコミュニティと開発速度
GitHub で 2.6 万スター以上を獲得し、多数のコントリビューターによって活発に更新が続いており、商用製品に匹敵する開発ペースを維持している。
Goose はオンマシン型 AI エージェントとして動作
Block 社が開発した Goose は、Claude Code のようなクラウド依存ではなく、Ollama などのツールを使用してローカルでオープンソースモデルを実行できる。
モデル非対称性と完全なオフライン対応
Goose は Anthropic や OpenAI など特定のモデルに縛られず、ユーザーが任意の LLM を選択可能であり、インターネット接続なしでも動作する。
ツール呼び出しと実行能力
Goose は単にテキストを生成するだけでなく、外部システムに対してファイル作成やテスト実行などの具体的な操作を実行する「ツール呼び出し」機能を活用しています。
影響分析・編集コメントを表示
影響分析
この記事は、生成 AI ツールが普及する中で発生している「コストと制限の壁」に対する開発者層の本格的な反発を示しており、クラウド依存型サービスからの脱却を促す重要な転換点となっています。特に Block 社のような大手企業がオープンソースで高品質なローカルツールを提供したことは、業界全体のパラダイムシフト(データ主権とコスト構造の再定義)を加速させる契機となるでしょう。
編集コメント
AI ツール市場が「高機能だが高額・制限あり」から「高性能かつ無料・ローカル」という新たな価値基準へシフトしつつあることを示す、象徴的な事例です。開発者のワークフローにおける自律性とコスト意識の高まりを如実に反映しています。
Claude Codeは月額200ドルまで。Gooseは同じことを無料で実現
クレジット:VentureBeat(Midjourneyで作成)
人工知能によるコーディング革命には、落とし穴がある:それは高額だということだ。
Claude Codeは、Anthropicが提供するターミナルベースのAIエージェントで、自律的にコードを書き、デバッグし、デプロイすることができる。世界中のソフトウェア開発者の想像力を掻き立てている。しかし、その価格設定――使用量に応じて月額20ドルから200ドルまで――は、まさにそれがサービスを提供しようとしているプログラマーたちの間で、反発を広げている。
今、無料の代替手段が注目を集めている。Gooseは、Block(旧Squareとして知られる金融技術会社)が開発したオープンソースのAIエージェントで、Claude Codeとほぼ同じ機能を提供するが、ユーザーのローカルマシン上で完全に動作する。サブスクリプション料金なし。クラウド依存なし。5時間ごとにリセットされるレート制限もない。
「あなたのデータは、とにかく、あなたのもとに留まります」と、最近のライブストリームでこのツールを実演したソフトウェアエンジニアのParth Sareenは述べた。このコメントは、核心的な魅力を捉えている:Gooseは開発者に、AIを活用したワークフローを完全にコントロールする力を与える。オフラインで――飛行機の中でも――作業できる能力を含めてだ。
このプロジェクトの人気は爆発的に高まっている。Gooseは現在、コード共有プラットフォームGitHubで26,100以上のスターを獲得し、362人の貢献者と、ローンチ以来102のリリースを数える。最新バージョン1.20.1は2026年1月19日にリリースされ、商業製品に匹敵する開発ペースを反映している。
Claude Codeの価格体系と使用制限に不満を持つ開発者にとって、GooseはAI業界ではますます珍しくなっているもの、つまり真剣な仕事のための真に無料で、縛りのない選択肢を体現している。
Anthropicの新たなレート制限が開発者の反乱を引き起こす
Gooseがなぜ重要かを理解するには、Claude Codeの価格設定をめぐる論争を理解する必要がある。
元OpenAI幹部らによって設立されたサンフランシスコの人工知能企業Anthropicは、Claude Codeをそのサブスクリプション階層の一部として提供している。無料プランでは一切アクセスできない。Proプランは、年額払いで月額17ドル(月払いは20ドル)だが、ユーザーは5時間ごとにわずか10〜40回のプロンプトしか使用できず、これは真剣な開発者が集中的な作業を数分で使い切ってしまう制約だ。
月額100ドルと200ドルのMaxプランは、より多くの余裕を提供する:それぞれ50〜200プロンプトと200〜800プロンプトに加え、Anthropicの最も強力なモデル、Claude 4.5 Opusへのアクセスが可能だ。しかし、これらの高額な階層でさえ、開発者コミュニティを憤慨させてきた制限が付いている。
7月下旬、Anthropicは新たな週間レート制限を発表した。このシステムでは、Proユーザーは週に40〜80時間のSonnet 4の使用が可能となる。200ドル階層のMaxユーザーは、240〜480時間のSonnet 4に加え、24〜40時間のOpus 4が利用できる。発表からほぼ5ヶ月が経過した今も、不満は収まっていない。
問題は? その「時間」は実際の時間ではない。コードベースのサイズ、会話の長さ、処理されるコードの複雑さによって大きく変動する、トークンベースの制限を表している。独立した分析によると、実際のセッションごとの制限は、Proユーザーで約44,000トークン、200ドルのMaxプランで約220,000トークンに相当するとされる。
「混乱を招き、曖昧です」と、ある開発者は広く共有された分析記事に書いた。「『Opus 4を24〜40時間』と言われても、実際に何が得られるのかについて、何も有用な情報は得られません。」
Redditや開発者フォーラムでの反発は激しい。集中的なコーディングを開始して30分以内に1日の制限に達したと報告するユーザーもいる。他のユーザーはサブスクリプションを完全に解約し、新しい制限を「冗談だ」や「実際の仕事には使えない」と呼んでいる。
Anthropicはこの変更を擁護し、この制限はユーザーの5%未満にしか影響せず、「24時間365日、継続的にバックグラウンドでClaude Codeを実行している」人々を対象としていると述べている。しかし、同社はその数字がMax契約者の5%を指すのか、全ユーザーの5%を指すのかを明確にしていない――この区別は極めて重要だ。
Blockがオフラインで動作する無料AIコーディングエージェントを構築した方法
Gooseは、同じ問題に対して根本的に異なるアプローチを取る。
Jack Dorseyが率いる決済会社Blockによって構築されたGooseは、エンジニアが「オンマシンAIエージェント」と呼ぶものだ。ユーザーのクエリをAnthropicのサーバーに送信して処理するClaude Codeとは異なり、Gooseはユーザーが自身でダウンロードし制御するオープンソースの言語モデルを使用して、ローカルコンピュータ上で完全に動作させることができる。
このプロジェクトのドキュメントでは、Gooseは「コード提案を超えて」「任意のLLMでインストール、実行、編集、テストを行う」と説明されている。最後のフレーズ――「任意のLLM」――が重要な差別化要因だ。Gooseは設計上、モデルに依存しない。
APIアクセスがあれば、GooseをAnthropicのClaudeモデルに接続できる。OpenAIのGPT-5やGoogleのGeminiを使用できる。GroqやOpenRouterのようなサービスを経由させることもできる。あるいは――ここが興味深いところだが――Ollamaのようなツールを使って完全にローカルで実行することもできる。Ollamaは、オープンソースモデルを自身のハードウェアでダウンロードし実行することを可能にする。
実際的な意味合いは大きい。ローカルセットアップでは、サブスクリプション料金、使用制限、レート制限はなく、コードが外部サーバーに送信される心配もない。AIとの会話は決してユーザーのマシンを離れない。
「私は飛行機の中でいつもOllamaを使っています――とても楽しいですよ!」とSareenは実演中に述べ、ローカルモデルが開発者をインターネット接続の制約から解放する方法を強調した。
Gooseが従来のコードアシスタントにできないこと
Gooseは、コマンドラインツールまたはデスクトップアプリケーションとして動作し、複雑な開発タスクを自律的に実行できる。ゼロからプロジェクト全体を構築し、コードを書き実行し、失敗をデバッグし、複数のファイルにわたるワークフローを調整し、外部APIと対話することができる――すべて、絶え間ない人間の監視なしに。
そのアーキテクチャは、AI業界が「ツール呼び出し」または「関数呼び出し」と呼ぶものに依存している――言語モデルが外部システムに対して特定のアクションを要求する能力だ。Gooseに新しいファイルを作成するよう依頼したり、テストスイートを実行したり、GitHubのプルリクエストのステータスを確認したりするとき、Gooseは単に何が起こるべきかを説明するテキストを生成するだけではない。実際にそれらの操作を実行する。
この能力は、基盤となる言語モデルに大きく依存する。自然言語のリクエストを実行可能なコードやシステムコマンドに変換する能力でモデルをランク付けするBerkeley Function-Calling Leaderboardによると、現在、AnthropicのClaude 4モデルがツール呼び出しで最高のパフォーマンスを発揮している。
しかし、新しいオープンソースモデルが急速に追いついている。Gooseのドキュメントは、強力なツール呼び出しサポートを備えたいくつかの選択肢を強調している:MetaのLlamaシリーズ、AlibabaのQwenモデル、GoogleのGemmaバリアント、そして推論に焦点を当てたDeepSeekのアーキテクチャだ。
このツールはまた、Model Context Protocol(MCP)とも統合されている。MCPは、AIエージェントを外部サービスに接続するための新興標準だ。MCPを通じて、Gooseはデータベース、検索エンジン、ファイルシステム、サードパーティのAPIにアクセスでき――その能力を、基盤となる言語モデルが提供するものをはるかに超えて拡張する。
ローカルモデルでGooseをセットアップする
完全に無料で、プライバシーを保護するセットアップに関心のある開発者にとって、そのプロセスには主に3つのコンポーネントが含まれる:Goose自体、Ollama(オープンソースモデルをローカルで実行するためのツール)、そして互換性のある言語モデルだ。
ステップ1:Ollamaをインストールする
Ollamaは、個人のハードウェア上で大規模言語モデルを実行するプロセスを劇的に簡素化するオープンソースプロジェクトだ。モデルのダウンロード、最適化、提供といった複雑な作業を、シンプルなインターフェースを通じて処理する。
ollama.comからOllamaをダウンロードしてインストールする。インストール後、単一のコマンドでモデルをプルできる。コーディングタスクには、強力なツール呼び出しサポートを提供するQwen 2.5がおすすめだ:
ollama run qwen2.5
モデルは自動的にダウンロードされ、ユーザーのマシン上で実行を開始する。
ステップ2:Gooseをインストールする
Gooseは、デスクトップアプリケーションとコマンドラインインターフェースの両方として利用可能だ。デスクトップ版はより視覚的な体験を提供し、CLIは完全にターミナル内で作業することを好む開発者にアピールする。
インストール手順
原文を表示
Credit: VentureBeat made with Midjourney
The artificial intelligence coding revolution comes with a catch: it's expensive.
Claude Code, Anthropic's terminal-based AI agent that can write, debug, and deploy code autonomously, has captured the imagination of software developers worldwide. But its pricing — ranging from $20 to $200 per month depending on usage — has sparked a growing rebellion among the very programmers it aims to serve.
Now, a free alternative is gaining traction. Goose, an open-source AI agent developed by Block (the financial technology company formerly known as Square), offers nearly identical functionality to Claude Code but runs entirely on a user's local machine. No subscription fees. No cloud dependency. No rate limits that reset every five hours.
"Your data stays with you, period," said Parth Sareen, a software engineer who demonstrated the tool during a recent livestream. The comment captures the core appeal: Goose gives developers complete control over their AI-powered workflow, including the ability to work offline — even on an airplane.
The project has exploded in popularity. Goose now boasts more than 26,100 stars on GitHub, the code-sharing platform, with 362 contributors and 102 releases since its launch. The latest version, 1.20.1, shipped on January 19, 2026, reflecting a development pace that rivals commercial products.
For developers frustrated by Claude Code's pricing structure and usage caps, Goose represents something increasingly rare in the AI industry: a genuinely free, no-strings-attached option for serious work.
Anthropic's new rate limits spark a developer revolt
To understand why Goose matters, you need to understand the Claude Code pricing controversy.
Anthropic, the San Francisco artificial intelligence company founded by former OpenAI executives, offers Claude Code as part of its subscription tiers. The free plan provides no access whatsoever. The Pro plan, at $17 per month with annual billing (or $20 monthly), limits users to just 10 to 40 prompts every five hours — a constraint that serious developers exhaust within minutes of intensive work.
The Max plans, at $100 and $200 per month, offer more headroom: 50 to 200 prompts and 200 to 800 prompts respectively, plus access to Anthropic's most powerful model, Claude 4.5 Opus. But even these premium tiers come with restrictions that have inflamed the developer community.
In late July, Anthropic announced new weekly rate limits. Under the system, Pro users receive 40 to 80 hours of Sonnet 4 usage per week. Max users at the $200 tier get 240 to 480 hours of Sonnet 4, plus 24 to 40 hours of Opus 4. Nearly five months later, the frustration has not subsided.
The problem? Those "hours" are not actual hours. They represent token-based limits that vary wildly depending on codebase size, conversation length, and the complexity of the code being processed. Independent analysis suggests the actual per-session limits translate to roughly 44,000 tokens for Pro users and 220,000 tokens for the $200 Max plan.
"It's confusing and vague," one developer wrote in a widely shared analysis. "When they say '24-40 hours of Opus 4,' that doesn't really tell you anything useful about what you're actually getting."
The backlash on Reddit and developer forums has been fierce. Some users report hitting their daily limits within 30 minutes of intensive coding. Others have canceled their subscriptions entirely, calling the new restrictions "a joke" and "unusable for real work."
Anthropic has defended the changes, stating that the limits affect fewer than five percent of users and target people running Claude Code "continuously in the background, 24/7." But the company has not clarified whether that figure refers to five percent of Max subscribers or five percent of all users — a distinction that matters enormously.
How Block built a free AI coding agent that works offline
Goose takes a radically different approach to the same problem.
Built by Block, the payments company led by Jack Dorsey, Goose is what engineers call an "on-machine AI agent." Unlike Claude Code, which sends your queries to Anthropic's servers for processing, Goose can run entirely on your local computer using open-source language models that you download and control yourself.
The project's documentation describes it as going "beyond code suggestions" to "install, execute, edit, and test with any LLM." That last phrase — "any LLM" — is the key differentiator. Goose is model-agnostic by design.
You can connect Goose to Anthropic's Claude models if you have API access. You can use OpenAI's GPT-5 or Google's Gemini. You can route it through services like Groq or OpenRouter. Or — and this is where things get interesting — you can run it entirely locally using tools like Ollama, which let you download and execute open-source models on your own hardware.
The practical implications are significant. With a local setup, there are no subscription fees, no usage caps, no rate limits, and no concerns about your code being sent to external servers. Your conversations with the AI never leave your machine.
"I use Ollama all the time on planes — it's a lot of fun!" Sareen noted during a demonstration, highlighting how local models free developers from the constraints of internet connectivity.
What Goose can do that traditional code assistants can't
Goose operates as a command-line tool or desktop application that can autonomously perform complex development tasks. It can build entire projects from scratch, write and execute code, debug failures, orchestrate workflows across multiple files, and interact with external APIs — all without constant human oversight.
The architecture relies on what the AI industry calls "tool calling" or "function calling" — the ability for a language model to request specific actions from external systems. When you ask Goose to create a new file, run a test suite, or check the status of a GitHub pull request, it doesn't just generate text describing what should happen. It actually executes those operations.
This capability depends heavily on the underlying language model. Claude 4 models from Anthropic currently perform best at tool calling, according to the Berkeley Function-Calling Leaderboard, which ranks models on their ability to translate natural language requests into executable code and system commands.
But newer open-source models are catching up quickly. Goose's documentation highlights several options with strong tool-calling support: Meta's Llama series, Alibaba's Qwen models, Google's Gemma variants, and DeepSeek's reasoning-focused architectures.
The tool also integrates with the Model Context Protocol, or MCP, an emerging standard for connecting AI agents to external services. Through MCP, Goose can access databases, search engines, file systems, and third-party APIs — extending its capabilities far beyond what the base language model provides.
Setting Up Goose with a Local Model
For developers interested in a completely free, privacy-preserving setup, the process involves three main components: Goose itself, Ollama (a tool for running open-source models locally), and a compatible language model.
Step 1: Install Ollama
Ollama is an open-source project that dramatically simplifies the process of running large language models on personal hardware. It handles the complex work of downloading, optimizing, and serving models through a simple interface.
Download and install Ollama from ollama.com. Once installed, you can pull models with a single command. For coding tasks, Qwen 2.5 offers strong tool-calling support:
ollama run qwen2.5
The model downloads automatically and begins running on your machine.
Step 2: Install Goose
Goose is available as both a desktop application and a command-line interface. The desktop version provides a more visual experience, while the CLI appeals to developers who prefer working entirely in the terminal.
Installation instructions vary by operating system but generally involve downloading from Goose's GitHub releases page or using a package manager. Block provides pre-built binaries for macOS (both Intel and Apple Silicon), Windows, and Linux.
Step 3: Configure the Connection
In Goose Desktop, navigate to Settings, then Configure Provider, and select Ollama. Confirm that the API Host is set to http://localhost:11434 (Ollama's default port) and click Submit.
For the command-line version, run goose configure, select "Configure Providers," choose Ollama, and enter the model name when prompted.
That's it. Goose is now connected to a language model running entirely on your hardware, ready to execute complex coding tasks without any subscription fees or external dependencies.
The RAM, processing power, and trade-offs you should know about
The obvious question: what kind of computer do you need?
Running large language models locally requires substantially more computational resources than typical software. The key constraint is memory — specifically, RAM on most systems, or VRAM if using a dedicated graphics card for acceleration.
Block's documentation suggests that 32 gigabytes of RAM provides "a solid baseline for larger models and outputs." For Mac users, this means the computer's unified memory is the primary bottleneck. For Windows and Linux users with discrete NVIDIA graphics cards, GPU memory (VRAM) matters more for acceleration.
But you don't necessarily need expensive hardware to get started. Smaller models with fewer parameters run on much more modest systems. Qwen 2.5, for instance, comes in multiple sizes, and the smaller variants can operate effectively on machines with 16 gigabytes of RAM.
"You don't need to run the largest models to get excellent results," Sareen emphasized. The practical recommendation: start with a smaller model to test your workflow, then scale up as needed.
For context, Apple's entry-level MacBook Air with 8 gigabytes of RAM would struggle with most capable coding models. But a MacBook Pro with 32 gigabytes — increasingly common among professional developers — handles them comfortably.
Why keeping your code off the cloud matters more than ever
Goose with a local LLM is not a perfect substitute for Claude Code. The comparison involves real trade-offs that developers should understand.
Model Quality: Claude 4.5 Opus, Anthropic's flagship model, remains arguably the most capable AI for software engineering tasks. It excels at understanding complex codebases, following nuanced instructions, and producing high-quality code on the first attempt. Open-source models have improved dramatically, but a gap persists — particularly for the most challenging tasks.
One developer who switched to the $200 Claude Code plan described the difference bluntly: "When I say 'make this look modern,' Opus knows what I mean. Other models give me Bootstrap circa 2015."
Context Window: Claude Sonnet 4.5, accessible through the API, offers a massive one-million-token context window — enough to load entire large codebases without chunking or context management issues. Most local models are limited to 4,096 or 8,192 tokens by default, though many can be configured for longer contexts at the cost of increased memory usage and slower processing.
Speed: Cloud-based services like Claude Code run on dedicated server hardware optimized for AI inference. Local models, running on consumer laptops, typically process requests more slowly. The difference matters for iterative workflows where you're making rapid changes and waiting for AI feedback.
Tooling Maturity: Claude Code benefits from Anthropic's dedicated engineering resources. Features like prompt caching (which can reduce costs by up to 90 percent for repeated contexts) and structured outputs are polished and well-documented. Goose, while actively developed with 102 releases to date, relies on community contributions and may lack equivalent refinement in specific areas.
How Goose stac
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み