#モデル開発 のAIニュース
7件の記事
モデルの半減期(4 分読)
TLDR AI は、AI モデルのリリース頻度が加速しているという通説に対し、実際のデータ分析を通じてそのペースが半年ごとに半分になるわけではないと指摘し、主要モデルの公開日程を調査して今後の予測を示した。
TLDR AI·5月20日
AnthropicのClaude Opus 4.7、コーディングで大きな進歩を達成、一方でサイバーセキュリティ機能を意図的に縮小
Anthropicが新フラッグシップモデルClaude Opus 4.7を発表した。同モデルはコーディングタスクで大幅な改善を実現したが、訓練中に特定のサイバーセキュリティ機能を意図的に低減させた。
The Decoder·4月17日
AnthropicのMythosがAI研究所と企業に意味すること
Anthropic社は、実際の性能は不明ながら、新モデル「Mythos」を発表し、ベンダーとして多様化を図っていることを示している。
AI Business·3月31日
中国AIモデルMiniMax M2.7、自らの開発に貢献したと報告
中国AI企業MiniMaxは、自らの開発プロセスに能動的に関与したとされるモデルM2.7を発表した。自律最適化ループにより自らの訓練プロセスを改善し、競争力のあるベンチマーク結果を示した。
The Decoder·3月21日·★★★★
モデル発表の舞台裏:早期テストで顧客が発見したClaude Opus 4.6の実力
Claude Opus 4.6の早期テストで顧客は、モデルの性能向上や実用的な応用例を発見し、製品開発に役立つフィードバックを提供した。
Claude Blog·2月9日·★★★★
スクラッチからの推論入門:第1章
著者がLLMにおける推論の仕組みについての新著を執筆中であり、購読者向けに第1章を公開した。本章ではLLMの推論の基本概念と推論時サンプリングなどの手法を概説している。
Sebastian Raschka·3月29日
LLM研究論文:2024年リスト
著者が2024年のLLM研究のハイライトをまとめた記事を計画していたが、事故で負傷したため作業が遅れている。代わりに、2024年のLLM研究論文リストを共有する予定である。
Sebastian Raschka·12月8日