AAIニュース
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業
AAIニュース

世界中のAI最新情報を日本語で。毎時自動収集・翻訳・要約。

コンテンツ

最新ニュースAI日報週報

分析

トレンド企業動画

サイト

についてRSSお問い合わせ
© 2026 ainew.jp — All rights reserved.特定商取引法に基づく表記
ニュース一覧元記事を開く
fal.ai Blog·2026年3月25日 01:00·約2分

Inworld TTS-1.5 Maxがfalプラットフォームで利用可能に

#Text-to-Speech#Real-time AI#Multilingual AI#fal.ai#Inworld
TL;DR

falプラットフォームがInworldのTTS-1.5 Maxモデルを追加し、低レイテンシと高表現力を備えた多言語TTSの提供を開始した。

AI深層分析2026年4月28日 03:23
3
注目/ 5段階
深度40%
4
関連度30%
3
実用性20%
4
革新性10%
2

キーポイント

1

モデルの特性と性能

TTS-1.5 Maxは、最初の音声出力までの時間を約250ms以下に抑えつつ、発音の正確性と感情表現の豊かさを向上させたモデルである。

2

多言語サポートとコスト

15か国語に対応し、グローバルなローカライズ用途に適しており、約0.01ドル/分の低コストで提供される。

3

開発者向け実装

fal上で利用可能となり、開発者はリアルタイム対話やインタラクティブなメディア体験への統合を試験・実装できる。

影響分析・編集コメントを表示

影響分析

このニュースは、リアルタイム音声合成市場における競争激化を示唆しており、特に低レイテンシと高品質の両立を追求する開発者にとって有益な選択肢を提供します。Inworldのモデルがfalのようなインフラプラットフォームで利用可能になることで、AIエージェントやインタラクティブメディア分野での実装ハードルが下がり、より多くのアプリケーションで自然な音声対話機能が標準化される可能性があります。

編集コメント

低レイテンシと多言語対応を兼ね備えたTTSモデルのプラットフォームへの統合は、AIエージェントの実用化において重要な一歩です。コスト効率も良いため、大規模なユーザーベースを持つサービスでの採用が進むと予想されます。

imageimage fal に Inworld TTS-1.5 Max を追加できることを嬉しく思います。これにより、プラットフォーム上の最先端のリアルタイム音声モデルのセットが拡大します。このモデルは、低遅延の音声生成、表現力の向上、および本番環境での利用に向けた多言語サポートに焦点を当てています。

アシスタントからメディア体験まで、アプリケーション全体で音声インターフェースの中核となりつつある現在、開発者は遅延、品質、コストのバランスが取れたモデルを必要としています。TTS-1.5 Max はこれらの制約内で動作するように設計されており、リアルタイムインタラクションをサポートします。

Inworld TTS-1.5 Max とは?

Inworld TTS-1.5 Max は、表現力に富み低遅延の音声合成を実現するためのテキスト読み上げ(TTS: Text-to-Speech)モデルです。これは、高品質版である Max 型と低遅延版である Mini 型の両方を含む TTS-1.5 ファミリーの一部です。

Max モデルは、応答性をほぼリアルタイムに保ちつつ、音声の質と表現範囲を優先し、ほとんどのアプリケーションにおけるデフォルトオプションとして位置づけられています。

主な特徴

リアルタイム遅延

TTS-1.5 Max は、最初の音声までの時間を約 250ms(P90)未満で達成し、応答時間がユーザーエクスペリエンスに影響を与える会話型およびインタラクティブなユースケースを可能にします。

表現力と精度の向上

以前のバージョンと比較して、このモデルはより広い表現範囲と低い単語誤り率を導入しました。これにより、発音ミス、途切れ、不自然なペース配分などのアーティファクトが減少します。

多言語サポート

本モデルは、ローカライゼーションや翻訳などのグローバルアプリケーションおよびユースケースに対応するため、15 か国語をサポートしています。

コストプロファイル

料金は 1 分あたり約 0.01 ドル(100 万文字あたり 10 ドル)で構成されており、多くの同等のリアルタイム TTS(Text-to-Speech:音声合成)システムと比較して低コストオプションとして位置づけられています。

fal でお試しください

fal を介して Inworld TTS-1.5 Max の利用を開始し、表現豊かな音声を生成したり、レイテンシとパフォーマンスのトレードオフをテストしたり、アプリケーションにボイス機能を統合したりできます。

生成メディアや新モデルリリースに関する最新情報は、X(旧 Twitter)、ブログ、または Reddit で随時お知らせいたします!

原文を表示

imageimageWe’re excited to add Inworld TTS-1.5 Max to fal, expanding our set of cutting-edge real-time voice models on the platform. The model focuses on low-latency speech generation, improved expressiveness, and multilingual support for production use cases.

As voice becomes a core interface across applications, from assistants to media experiences, developers need models that balance latency, quality, and cost. TTS-1.5 Max is designed to operate within these constraints while supporting real-time interactions.

What is Inworld TTS-1.5 Max?

Inworld TTS-1.5 Max is a text-to-speech model built for expressive, low-latency voice synthesis. It is part of the TTS-1.5 family, which includes both Max (higher quality) and Mini (lower latency) variants.

The Max model is positioned as the default option for most applications, prioritizing voice quality and expressive range while maintaining near-realtime responsiveness.

Key characteristics

Realtime latency

TTS-1.5 Max achieves time-to-first-audio under ~250ms (P90), enabling conversational and interactive use cases where response time impacts user experience.

Improved expressiveness and accuracy

Compared to earlier versions, the model introduces higher expressive range and lower word error rates. This reduces artifacts such as mispronunciations, cutoffs, and unnatural pacing.

Multilingual support

The model supports 15 languages, including expanded coverage for global applications and use cases like localization and translation.

Cost profile

Pricing is structured at approximately $0.01 per minute ($10 per million characters), positioning it as a lower-cost option relative to many comparable realtime TTS systems.

Try it on fal

You can start using Inworld TTS-1.5 Max on fal to generate expressive speech, test latency-performance tradeoffs, and integrate voice into your applications.

Stay tuned to our X, blog or Reddit for the latest updates on generative media and new model releases!

この記事をシェア

関連記事

AWS Machine Learning Blog重要度42026年6月25日 01:56

Loka が Amazon Nova 2 Sonic を活用した低遅延・自然な音声エージェントを構築

fal.ai Blog重要度42026年5月20日 06:24

fal と AWS:生成メディアの次期フェーズに向けた構築

fal.ai Blog2026年5月16日 03:58

思考の速度で創造が進む世界における長期的な信頼構築

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む