#open source models のAIニュース
12件の記事
[AINews] GLM は GPT より優れているか?GLM-5.2 が実用性を証明、Z.ai が 12 月までに「Open Fable」を公開予定
Latent Space のニュースでは、中国のモデル「GLM-5.2」がベンチマークで優れた結果を示し実用性があると評価されたことと、Z.ai が 12 月までにオープンソースプロジェクト「Open Fable」を発表する見込みについて報じられています。
Granite 4.1 3B SVG ペリカンギャラリー
IBM は数日前に Apache 2.0 ライセンスの LLM「Granite 4.1」ファミリー(3B、8B、30B)を公開した。本記事は同モデルの学習プロセスや、SVG ペリカンのギャラリーを紹介している。
最新オープンアーティファクト(第20号):新組織、新モデルタイプ!Nemotron Super、Sarvam、Cohere Transcribeなど
本記事は、QwenやDeepSeekなどの大規模モデルに偏らない多様なオープンソースモデルを紹介する。OCR、RAG検索、音声文字起こし、コード編集など多様な用途とモーダリティに対応するモデルが網羅されており、開発者にとって参考となる。
このスタートアップは、エンタープライズソフトウェアをプロンプトのように見せたいと考えている
同社は、エンタープライズ向けAIオペレーティングシステムを構築するために1200万ドルのシード資金を調達した。
オープンモデルの次なる展開
2025年、DeepSeek R1の成功を契機に多くの企業がオープンモデル戦略を採用し、AIエコシステムでの影響力確保を図っている。しかし、MetaのLlamaのような事例を除き、オープンモデル構築には明確な金銭的動機を持つ企業が極めて少ないのが実情である。
Hume AIがTADAをオープンソース化、競合より5倍高速で幻覚ゼロの音声モデル
Hume AIはMITライセンスでTADAを公開した。この高速音声生成モデルはテキストと音声を同期処理し、テストで幻覚を一切発生させなかった。
オープンモデルと政府規制に関するディーン・ボールの視点
デイン・ボールは、Anthropicと米国防総省の対立がオープンモデルへの認識転換点になると指摘する。AI強化に伴い既存権力構造との関係が問われ、政府は「重みを持たない=脳も持たない」というオープンモデルの主張が抱える根本的な問題に直面する。
オープンモデルは常に追従状態にある
Z.aiのGLM 5を含む中国発のオープンモデルが、クローズド型最前線モデルに迫る議論を巻き起こしている。過去12ヶ月でオープンモデルの主要供給元はMetaから中国企業へシフトし、定期的な技術追従の動きが続いている。
Arcee AI、米国産オープンモデルに全集中
スタートアップのArcee AIは、特定ドメイン向けポストトレーニングで収益を上げている。今後は米国産の大型高性能オープンモデルを事前学習し、市場での実証とニッチの埋め合わせを目指す。
LWiAIポッドキャスト第227回 - ジェレミーが帰ってきた!DeepSeek 3.2、TPU、ネスト学習
アンドレイ・クレンコフとジェレミー・ハリスが、DeepSeek 3.2とFlux 2のリリース、Amazonの新AIチップとGoogleのTPUによるAIハードウェアの変化について議論した。
Qwen-Image-Edit:高品質かつ高効率な画像編集
Qwenチームは画像編集モデル「Qwen-Image-Edit」を発表した。20Bパラメータの基盤モデルを拡張し、高精度なテキスト編集と視覚制御を両立する技術を実現した。
大規模言語モデル(LLM)アーキテクチャの比較
Sebastian Raschka氏は、DeepSeek V3とGLM-5を含む現代のLLMアーキテクチャを比較し、各モデルの設計特徴と技術的進化を解説している。