TalatのAI会議メモはクラウドではなく自身のマシン上に保存される
開発者Nick Payneは、音声データをクラウドに送信せずMac上で完全にローカル処理するAI議事録アプリ「Talat」を開発し、プライバシー重視のユーザー向けに買い切り制で提供している。
キーポイント
完全ローカル処理によるプライバシー保護
TalatはFluidAudioツールキットとMacのNeural Engineを活用し、音声データを一切クラウドに送信せず、端末内でAIによる文字起こしと要約を実行する。
買い切り制と最小限のデータ収集
20MBの軽量アプリで、アカウント作成不要、分析データの送信もなく、サブスクリプションではなく一度きりの購入で利用できる。
既存サービスとの差別化
人気のAI議事録アプリGranola(クラウド依存、サブスクリプション)に対し、Talatはプライバシーとローカル処理を優先した代替選択肢を提供する。
開発の背景と技術的発見
開発者はMacのCore Audio Taps APIを調査する中でオープンソースライブラリAudioTeeを作成し、後に完全ローカル処理を可能にするFluidAudioと出会い製品化に至った。
影響分析・編集コメントを表示
影響分析
この記事は、AIツールの普及に伴うデータプライバシー懸念に対し、技術的に実現可能なローカル処理ソリューションを示している。クラウド依存の主流モデルに対し、プライバシー重視のユーザー層向けの市場セグメントが形成されつつあることを示唆しており、AI業界における製品多様化の動向を反映している。
編集コメント
クラウドAI全盛の時代に、ローカル処理とプライバシーを前面に打ち出した逆張り戦略が注目される。技術的実現可能性と市場ニーズの交差点を捉えたケーススタディとして参考になる。
評価額2億5000万ドルのAI搭載メモ作成アプリ「Granola」は、テクノロジー業界の創業者やベンチャーキャピタリスト(VC)の間で人気のツールとなっています。しかしある開発者は、よりプライベートでローカル専用、かつ一括購入でサブスクリプションが不要な代替手段への需要があると考えました。それが、新たなMacアプリ「Talat」の誕生につながったのです。
イングランド・ヨークシャーを拠点とする開発者で、自称コンピュータおたくのニック・ペイン氏は、ローカルAIメモ作成ツールを構築するアイデアは、主に一連の幸運な偶然から生まれたと語ります。
「Granolaは素晴らしいと思います。十分な愛情と手間をかければElectronアプリ(デスクトップアプリケーション構築用フレームワーク)でどこまでできるかを示す輝かしい例です」と彼はTechCrunchに語りました。「初めて試した時、当時の標準的な回避策であったビデオ録画なしに、私のMacのシステムオーディオを録音できたことに魅了されました。それが膨大な調査につながり、比較的新しくドキュメントが乏しいAppleのAPIを発見したのです」
そのAPI(開発者がMacのオーディオストリームにアクセスできるようにする「Core Audio Taps」)を扱いやすくするため、ペイン氏はオープンソースのオーディオライブラリ「AudioTee」の作成を決めました。
「その間、私は少しずつツールキットを組み立てていましたが、単なるクールな技術デモではなく、製品として独り立ちできると感じられるものには出会えませんでした」とペイン氏は述べます。「Granolaなどが利用する、最先端のホスト型文字起こしモデルは驚異的で、自分の音声がほぼリアルタイムで画面上に展開される様子は直感的にクールです。しかし常に気になっていたのは、その対価として自分のデータだけでなく、オーディオデータ、つまり自分の実際の声を提供しなければならない点でした」
その後、彼は「FluidAudio」というソフトウェアツールキットに偶然出会います。これはAppleデバイス上で完全ローカルかつ低遅延のオーディオAIを実現するSwiftフレームワークで、小型で高速な文字起こしモデルをMacのNeural Engine(AppleのAI処理専用ハードウェア)上で直接実行できます。
これが決め手となり、ペイン氏は自身の研究を実際の製品に変えられると確信しました。オーディオがユーザーのMacから流出することも、文字起こしデータが他社のサーバーに保存されることもない製品です。
長年の友人で元同僚のマイク・フランクリン氏と共に構築された「Talat」は、ペイン氏のオーディオ分野への関心が結実したものです。その成果は20MBサイズの、アカウント作成や開発者への分析データ送信を必要としない一括購入製品です。継続的な料金も一切かかりません。
一部のAIメモ作成ツールには多様な機能があるかもしれませんが、Talatは合理化された機能セットを提供します。Zoom、Teams、Meetなどの会議アプリ使用中にコンピュータのマイクからオーディオをキャプチャし、リアルタイムで文字起こしします。アプリはリアルタイムで話者を割り当てようとしますが、必要に応じて再割り当ても可能です。メモの記入や、文字起こしセグメントの編集、削除、分割も行えます。会議終了時には、ローカルのLLMが重要なポイント、決定事項、アクション項目を含む要約を生成します。
メモ、文字起こしデータ、要約はすべてTalat内で検索可能です。
プライバシー面に加え、ペイン氏はユーザーに選択肢を提供することが目標だと述べています。
「私たちは設定の自由度を重視し、ユーザーが自身のデータの行き先を制御できるようにしています。自分で選んだLLMの使用、[メモアプリ] Obsidianへの自動エクスポート、会議終了時にデータを送信するウェブフック、オンデマンドでデータを取得するためのMCPサーバー(AIツールが外部データソースに接続するための標準化された方法)などです」と彼は説明します。
内部では、AIは複数の要素を組み合わせたものとなっています。「主にFluidAudioによって統合・抽象化されています」とペイン氏は指摘し、同フレームワークが多くの重労働を担っていると評価します。要約機能では、アプリはデフォルトで「Qwen3-4B-4bit」というAIモデルを使用します。これはかなり控えめなハードウェア上でも実行可能です。
ただしユーザーは、任意のクラウドLLMプロバイダーに切り替えたり、Nvidiaが開発した音声認識モデルである2種類の「Parakeet」モデルのいずれかを選択したり、ローカルでAIモデルを実行するツール「Ollama」を指定したりすることができ、体験をより細かく制御できます。今後、Talatはより多くの組み込み選択肢のサポートや、Google CalendarやNotionなど他アプリとの連携機能も追加予定です。
リリース時点では、MシリーズMac(Apple独自プロセッサを搭載、M1以降)ユーザーはアプリをダウンロードし、購入前に10時間分の録音を無料で試用できます。
Talatは現在プレリリース版(49ドル)で、活発に開発が続けられています。
アプリがバージョン1.0に達すると、価格は99ドルに上がります。
ペイン氏とフランクリン氏は自力でTalatを立ち上げており、今後も中核製品は一括購入制を維持する計画です。
原文を表示
The AI-powered notetaking app Granola, valued at $250 million, has become a popular tool among tech industry founders and VCs. But one developer believes there’s demand for a more private, local-only alternative that’s available for a one-time fee and without a subscription. That’s led to the creation of a new Mac app called Talat.
Yorkshire, England-based developer Nick Payne, a self-described computer nerd, says the idea to build a local AI notetaker came about mostly because of a series of happy accidents.
“I think Granola is awesome; it’s a shining example of what you can do with an Electron app [a framework for building desktop applications] given enough love and care,” he told TechCrunch. “When I first tried it, I was fascinated that it managed to record system audio on my Mac without recording video, which was the standard workaround at the time. That led to a ton of research, discovering a relatively new and poorly-documented Apple API.”
To make it easier to work with that API (Core Audio Taps, which lets developers tap into a Mac’s audio streams), Payne decided to create an open source audio library, AudioTee.
“During that time, I was slowly piecing together a toolkit, but I never found anything that felt like it could stand on its own as a product rather than just a cool tech demo,” Payne said. “The state-of-the-art hosted transcription models — the same providers folks like Granola use — are incredible, and it’s viscerally cool to see your speech unfurled onscreen in near real-time. But it always nagged me that the tradeoff required providing not just my data, but my audio data; my actual voice,” he added.
He then stumbled upon a software toolkit called FluidAudio, a Swift framework that enables fully local, low-latency audio AI on Apple devices. It lets you run small, fast transcription models directly on the Mac’s Neural Engine — Apple’s dedicated hardware for AI processing.
That was the piece that made Payne realize he could turn his research into an actual product — one where your audio never leaves your Mac, and your transcripts aren’t stored on another company’s servers.
Talat, which was built alongside Payne’s longtime friend and former colleague, Mike Franklin, is the result of Payne’s interest in the audio space. The result is a 20 MB, one-time purchase that doesn’t require you to create an account or even share analytics data back with the developers. There are no ongoing fees, either.
While some AI notetakers may have more bells and whistles, Talat offers a streamlined set of features. It captures audio from your computer’s microphone when you’re in meeting apps like Zoom, Teams, Meet, and others, and transcribes it in real time. The app tries to assign speakers in real-time, but you can reassign them as needed. You can also take notes, plus edit, delete, or split transcript segments. When the meeting finishes, a local LLM generates a summary with key points, decisions, and action items.
The notes, transcripts, and summaries are all searchable in Talat, too.
In addition to the privacy angle, Payne said the goal is to give users more options.
“We’re leaning into configurability and letting users control where their data goes: pick your own LLM, auto-export to [note-taking app] Obsidian, webhooks that push data out when a meeting finishes, an MCP server,” which is a standardized way for AI tools to connect to outside data sources, “to pull it on demand,” he explained.
Under the hood, the AI is a mixture — “mostly stitched together and abstracted behind FluidAudio,” Payne noted, which he credits with doing a lot of the heavy lifting. For the summarization piece, the app defaults to an Al model called Qwen3-4B-4bit, which can run on even fairly modest hardware.
However, users can opt to switch that out to any cloud LLM provider of their choice, or they can choose between two Parakeet variants — speech recognition models developed by Nvidia — or point it at Ollama (a tool for running AI models locally), giving them more control over the experience. In time, Talat will add support for more built-in choices, as well, as well as integrations for other apps, like Google Calendar and Notion.
At launch, users with M-series Mac computers (those running Apple’s own processors, starting with the M1) can download the app and try it out for free with 10 hours of recordings before deciding to purchase.
Talat is available for $49 while in this pre-release version, which is still under active development.
When the app hits a 1.0 release, the price will increase to $99.
Payne and Franklin are bootstrapping Talat and plan to keep the core product a one-time purchase going forward.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み