#open source models のAIニュース

12件の記事

[AINews] GLM は GPT より優れているか?GLM-5.2 が実用性を証明、Z.ai が 12 月までに「Open Fable」を公開予定

Latent Space のニュースでは、中国のモデル「GLM-5.2」がベンチマークで優れた結果を示し実用性があると評価されたことと、Z.ai が 12 月までにオープンソースプロジェクト「Open Fable」を発表する見込みについて報じられています。

Latent Space·6月19日·★★★★

Granite 4.1 3B SVG ペリカンギャラリー

IBM は数日前に Apache 2.0 ライセンスの LLM「Granite 4.1」ファミリー(3B、8B、30B)を公開した。本記事は同モデルの学習プロセスや、SVG ペリカンのギャラリーを紹介している。

Simon Willison Blog·5月5日

最新オープンアーティファクト(第20号):新組織、新モデルタイプ!Nemotron Super、Sarvam、Cohere Transcribeなど

本記事は、QwenやDeepSeekなどの大規模モデルに偏らない多様なオープンソースモデルを紹介する。OCR、RAG検索、音声文字起こし、コード編集など多様な用途とモーダリティに対応するモデルが網羅されており、開発者にとって参考となる。

Interconnects·3月30日·★★★★

このスタートアップは、エンタープライズソフトウェアをプロンプトのように見せたいと考えている

同社は、エンタープライズ向けAIオペレーティングシステムを構築するために1200万ドルのシード資金を調達した。

TechCrunch AI·3月19日·★★★★

オープンモデルの次なる展開

2025年、DeepSeek R1の成功を契機に多くの企業がオープンモデル戦略を採用し、AIエコシステムでの影響力確保を図っている。しかし、MetaのLlamaのような事例を除き、オープンモデル構築には明確な金銭的動機を持つ企業が極めて少ないのが実情である。

Interconnects·3月16日·★★★★

Hume AIがTADAをオープンソース化、競合より5倍高速で幻覚ゼロの音声モデル

Hume AIはMITライセンスでTADAを公開した。この高速音声生成モデルはテキストと音声を同期処理し、テストで幻覚を一切発生させなかった。

The Decoder·3月14日·★★★★

オープンモデルと政府規制に関するディーン・ボールの視点

デイン・ボールは、Anthropicと米国防総省の対立がオープンモデルへの認識転換点になると指摘する。AI強化に伴い既存権力構造との関係が問われ、政府は「重みを持たない=脳も持たない」というオープンモデルの主張が抱える根本的な問題に直面する。

Interconnects·3月6日·★★★★

オープンモデルは常に追従状態にある

Z.aiのGLM 5を含む中国発のオープンモデルが、クローズド型最前線モデルに迫る議論を巻き起こしている。過去12ヶ月でオープンモデルの主要供給元はMetaから中国企業へシフトし、定期的な技術追従の動きが続いている。

Interconnects·2月18日·★★★★

Arcee AI、米国産オープンモデルに全集中

スタートアップのArcee AIは、特定ドメイン向けポストトレーニングで収益を上げている。今後は米国産の大型高性能オープンモデルを事前学習し、市場での実証とニッチの埋め合わせを目指す。

Interconnects·1月28日·★★★★

LWiAIポッドキャスト第227回 - ジェレミーが帰ってきた!DeepSeek 3.2、TPU、ネスト学習

アンドレイ・クレンコフとジェレミー・ハリスが、DeepSeek 3.2とFlux 2のリリース、Amazonの新AIチップとGoogleのTPUによるAIハードウェアの変化について議論した。

Last Week in AI·12月9日·★★★★★

Qwen-Image-Edit:高品質かつ高効率な画像編集

Qwenチームは画像編集モデル「Qwen-Image-Edit」を発表した。20Bパラメータの基盤モデルを拡張し、高精度なテキスト編集と視覚制御を両立する技術を実現した。

Qwen Blog·8月19日·★★★★

大規模言語モデル(LLM)アーキテクチャの比較

Sebastian Raschka氏は、DeepSeek V3とGLM-5を含む現代のLLMアーキテクチャを比較し、各モデルの設計特徴と技術的進化を解説している。

Sebastian Raschka·7月19日·★★★★