#tokenization のAIニュース
6件の記事
最適なトークナイザーの発見(15 分読了)
TLDR AI は、先端的な AI モデルが整数列であるトークンで訓練される背景を説明し、特定の条件下で最適なトークナイザーを計算するアルゴリズムを発表した。
TLDR AI·6月12日
Google の AI が「Google」や他の単語のスペルも間違える理由
TechCrunch は、Google の生成 AI モデルが自社の社名や一般的な単語のスペルを誤る現象について分析し、その技術的・データ上の原因を解説している。
TechCrunch AI·5月28日
[AI ニュース] 新たな AI インフラユニコーン:Exa、Modal、TurboPuffer
Latent Space は、今週大きなマイルストーンを達成した過去のゲスト企業として、年間収益1億ドルで黒字化を果たした TurboPuffer と、シリーズC で25億ドルの価値評価を得た Exa を紹介しました。また、Modal も47億ドルの評価額に達しています。
Latent Space·5月22日·★★★★
今日は何も大きな出来事はありませんでした
Smol AI News は、5 月 20 日から 21 日にかけての期間に、主要な AI ニュースや技術進展がない静かな一日であったと報告しています。
Smol AI News·5月21日·★★★★
Opus 4.7 の新トークナイザー:実際のコストはどれくらいか
Anthropic は Claude Opus 4.7 の入力理解を向上させるため新しいトークナイザーを導入した。モデル価格自体は据え置きだが、同じ入力で従来モデルより 12% から 27% 高いコストがかかるようになった。ただし短いプロンプトではコスト効率が向上している。
TLDR AI·4月29日·★★★★
コーディングエージェントの仕組み
サイモン・ウィリソン氏が、LLMを拡張するソフトウェアであるコーディングエージェントの内部動作を解説し、適切な活用方法を提案している。
Simon Willison Blog·3月16日·★★★★