メインコンテンツへスキップ

#together ai のAIニュース

15件の記事

オープンソース AI への移行加速のため 8 億ドルの C ラウンド資金調達を発表

Together AI は、オープンソース AI 分野への移行を加速させる目的で、総額 8 億ドルのシリーズ C 資金調達を実施したと発表した。

Together AI Blog·7月1日·★★★★

Together AI、ICML 2026 に参加:フルスタックにわたる最先端研究を発表

Together AI は ICML 2026 で、フルスタック全体にわたる最先端の研究内容を発表した。

Together AI Blog·6月30日

ParallelKernelBench:最先端のLLMはまだ高速なマルチGPUカーネルを記述できない(現時点では)

Together AIが公開したベンチマーク「ParallelKernelBench」の結果により、現在の最先端大規模言語モデルは依然として効率的なマルチGPU用カーネルコードを生成する能力に欠けていることが示された。

Together AI Blog·6月23日·★★★★

Kimi K2.7 Code と Claude Fable 5 の比較:ランディングページ作成コストが 94% 削減

Together AI は、Kimi K2.7 Code モデルと Claude Fable 5 モデルを比較し、ランディングページ作成におけるコストが 94% 削減されることを示した。

Together AI Blog·6月17日

Together AI が世界最速の音声テキスト変換スタックを構築した方法

Together AI は、世界で最も高速な音声テキスト変換システムを開発し、その技術的アプローチとアーキテクチャの詳細を発表しました。

Together AI Blog·5月29日·★★★★

分布認識型推論特定デコーディングでRLロールアウトを最大50%高速化

強化学習のポストトレーニングにおけるボトルネック「ロールアウト」を、適応型推論特定デコーディング(DAS)により最大50%高速化する。この手法は報酬品質の低下なしに処理速度を向上させる。

Together AI Blog·4月24日·★★★★

Parcae:安定したループモデルで少ないパラメータでより多くのことを実現

Parcaeは、Transformerの2倍のサイズに匹敵する品質を持つ安定したループ言語モデルです。7.7億パラメータのモデルが13億レベルのパフォーマンスを実現し、ループ回数の増加が計算効率の高いスケーリング法則であることを示しました。

Together AI Blog·4月15日·★★★★

EinsteinArena:野生のエージェント集団知能を活用して科学を進展させる

EinsteinArenaは、AIエージェントが数学問題で協力・競争するプラットフォーム。同プラットフォームのエージェントは11件の新記録を樹立し、次元11の kissing number の下限を593から604に引き上げた。

Together AI Blog·4月13日·★★★★

システム向けAI:LLMを用いたデータベースクエリ実行の最適化

新研究により、大規模言語モデル(LLM)が統計ヒューリスティックが見逃す基数推定エラーを修正し、データベースクエリの実行計画を最適化できることが示された。これにより最大4.78倍の高速化が実現する。

Together AI Blog·4月3日·★★★★

Deepgramの音声認識・生成モデルがTogether AIでネイティブ利用可能に

Deepgramの音声テキスト変換(STT)およびテキスト読み上げ(TTS)モデルが、Together AIの専用推論インフラ上でリアルタイム音声エージェント向けに利用可能となった。

Together AI Blog·4月2日

Together AIのカーネルチーム内覧

Together AIのカーネル研究チームは、FlashAttentionやThunderKittensの開発者であり、GPUハードウェアと本番環境のAIとの間のギャップを埋める役割を果たしている。

Together AI Blog·4月1日·★★★★

Aurora:推論効率を向上させるオープンソース強化学習フレームワーク

Auroraは、推論効率を1.25倍向上させるオープンソースの強化学習フレームワークです。これは、推論を単なるオフライン設定から、リクエストごとに自己改善するシステムへと変革します。

Together AI Blog·3月31日·★★★★

計画、分割、征服:弱モデルが長いコンテキストタスクで優れる理由

研究者らは、計画者・ワーカー・マネージャーによる「分割統治」フレームワークを開発した。これにより、Llama-3-70BやQwen-72Bといった比較的小さなモデルが、GPT-4oの単一ショット推論を上回る性能を発揮し、長大なコンテキスト処理におけるLLMの劣化問題を解決した。

Together AI Blog·3月26日·★★★★

Together AI、ツール呼び出し・推論・ビジョン対応のファインチューニングサービスを拡大

Together AIは、ツール呼び出し、推論、ビジョン言語モデルのネイティブサポートを追加し、100B以上のモデルトレーニングに対応するファインチューニングサービスを拡大した。処理速度は最大6倍向上し、ジョブコストと所要時間の見積もり機能も提供している。

Together AI Blog·3月18日·★★★★

Mamba-3:推論専用SSMの登場

Mambaチームは、推論に特化した状態空間モデル「Mamba-3」を発表した。このモデルはTransformerよりデコード速度が速く、前版Mamba-2よりも性能が高い。また、初日からオープンソースとして公開されている。

Together AI Blog·3月17日·★★★★