#open source models のAIニュース

12件の記事

[AINews] GLM は GPT より優れているか？GLM-5.2 が実用性を証明、Z.ai が 12 月までに「Open Fable」を公開予定

Latent Space のニュースでは、中国のモデル「GLM-5.2」がベンチマークで優れた結果を示し実用性があると評価されたことと、Z.ai が 12 月までにオープンソースプロジェクト「Open Fable」を発表する見込みについて報じられています。

IBM は数日前に Apache 2.0 ライセンスの LLM「Granite 4.1」ファミリー（3B、8B、30B）を公開した。本記事は同モデルの学習プロセスや、SVG ペリカンのギャラリーを紹介している。

本記事は、QwenやDeepSeekなどの大規模モデルに偏らない多様なオープンソースモデルを紹介する。OCR、RAG検索、音声文字起こし、コード編集など多様な用途とモーダリティに対応するモデルが網羅されており、開発者にとって参考となる。

同社は、エンタープライズ向けAIオペレーティングシステムを構築するために1200万ドルのシード資金を調達した。

2025年、DeepSeek R1の成功を契機に多くの企業がオープンモデル戦略を採用し、AIエコシステムでの影響力確保を図っている。しかし、MetaのLlamaのような事例を除き、オープンモデル構築には明確な金銭的動機を持つ企業が極めて少ないのが実情である。

Hume AIはMITライセンスでTADAを公開した。この高速音声生成モデルはテキストと音声を同期処理し、テストで幻覚を一切発生させなかった。

デイン・ボールは、Anthropicと米国防総省の対立がオープンモデルへの認識転換点になると指摘する。AI強化に伴い既存権力構造との関係が問われ、政府は「重みを持たない＝脳も持たない」というオープンモデルの主張が抱える根本的な問題に直面する。

Z.aiのGLM 5を含む中国発のオープンモデルが、クローズド型最前線モデルに迫る議論を巻き起こしている。過去12ヶ月でオープンモデルの主要供給元はMetaから中国企業へシフトし、定期的な技術追従の動きが続いている。

スタートアップのArcee AIは、特定ドメイン向けポストトレーニングで収益を上げている。今後は米国産の大型高性能オープンモデルを事前学習し、市場での実証とニッチの埋め合わせを目指す。

アンドレイ・クレンコフとジェレミー・ハリスが、DeepSeek 3.2とFlux 2のリリース、Amazonの新AIチップとGoogleのTPUによるAIハードウェアの変化について議論した。

Qwenチームは画像編集モデル「Qwen-Image-Edit」を発表した。20Bパラメータの基盤モデルを拡張し、高精度なテキスト編集と視覚制御を両立する技術を実現した。

Sebastian Raschka氏は、DeepSeek V3とGLM-5を含む現代のLLMアーキテクチャを比較し、各モデルの設計特徴と技術的進化を解説している。