#オープンソースモデル のAIニュース

43件の記事

AI の価格低下はハードウェアではなくソフトウェアの物語である

TLDR AI は、古い汎用ハードウェアで動作するローカル・オープンウェイトモデルが最先端モデルと競争力を強めていると指摘し、これにより大手研究機関が最高峰モデルに課す高額料金の見直しが迫られると述べています。

TLDR AI·5月22日·★★★★

OlmoEarth v1.1:より効率的なモデルファミリーの登場(5 分読了)

OlmoEarth が新バージョン v1.1 を発表し、計算コストを最大 3 倍削減しながら性能を維持するモデルファミリーを提供。これにより惑星規模のマッピングが低コストで可能になり、リモートセンシング分野の開発者や科学研究に貢献する。

TLDR AI·5月20日·★★★★

Tuna-2(GitHub リポジトリ):メタがマルチモーダルモデルの基礎チェックポイントを公開

メタ社は、ピクセル埋め込みを活用した新モデル「Tuna-2」を発表し、既存モデルを上回る性能を示しました。同社は完全な生産用重みではなく、LLM 基盤と拡散ヘッドから一部層を削除した基礎チェックポイントのみを公開します。

TLDR AI·5月5日·★★★★

従量課金モデルが「バイブコーディング」を阻害する理由と、ローカル AI コーディングエージェントの自作方法

モデル開発者が利用制限や価格引き上げ、従量課金への移行を進める中、趣味プロジェクトのコストが高騰している。この課題に対し、ローカル LLM を活用して独自にコーディングエージェントを構築するコスト削減策が提案されている。

The Register AI/ML·5月2日

Laguna XS.2 と M.1:詳細解説(20 分読了)

Poolside が公開したコーディング用エージェントモデル「Laguna M.1」と軽量版「XS.2」について、長期タスク対応能力やオープンソース化の概要を解説する。

TLDR AI·4月29日·★★★★

Qwen3.6-27B、大半のコーディングベンチマークで大型後継モデルを凌駕

アリババは270億パラメータのオープンソースモデル「Qwen3.6-27B」を公開し、このモデルはコーディングベンチマークの大半で15倍大きな後継モデルを上回る性能を示した。

The Decoder·4月25日·★★★★

DeepSeek V4:最前線に近い性能、価格は数分の1

中国のAIラボDeepSeekは、100万トークンコンテキストとMoEアーキテクチャを採用したV4シリーズのプレビューモデル「DeepSeek-V4-Pro」と「DeepSeek-V4-Flash」を公開した。

Simon Willison Blog·4月24日·★★★★★

DeepSeek-V4 プレビュー版公開:百万コンテキストの民主化時代へ

深度求索(DeepSeek)は2026年4月、新モデル「DeepSeek-V4」プレビュー版を公開した。同モデルは百万文字のコンテキストに対応し、エージェント機能と推論性能で开源分野をリードする。

DeepSeek Blog·4月24日·★★★★

OpenAI、テキストから個人情報を除去するオープンソースモデルを公開

OpenAIは、テキスト内の個人データを検出して削除するオープンソースモデル「Privacy Filter」を公開した。

The Decoder·4月23日·★★★★

【AIニュース】上品なトークン最大化

GoogleはCloud NextでTPUv8を発表し、長年のハードウェア投資優位を強化した。また、AIリーダーたちは「トークン最大化」の概念について議論している。

Latent Space·4月23日·★★★★

Qwen3.6-27B:MoEルータ不要、フラッグシップ級のプログラミング能力

通義实验室は270億パラメータの稠密モデル「Qwen3.6-27B」を公開した。MoE不要でデプロイが容易な一方、プログラミングや多模態性能は前代フラッグシップモデルを凌駕する。

通义大模型·4月22日·★★★★

本日は特に目立った出来事なし

2026年4月21日から22日にかけてのAIニュースを、12のサブレッドと544件のツイートを調査した結果、特筆すべき大きな出来事は確認されなかった。

Smol AI News·4月22日·★★★★

LangSmithでファインチューニング済みオープンソースモデルをテストする

LangSmithは、ファインチューニングされたオープンソース大規模言語モデルの評価と比較を行うツールです。複数のモデルをテストし、評価プロセスを自動化することで、最もパフォーマンスの高いAIを選択することを支援します。

LangChain Blog·4月22日

G7eインスタンスでAmazon SageMaker AI上の生成AI推論を加速

AWSはAmazon SageMaker AI上で生成AI推論を加速するG7eインスタンスを発表した。同製品はNVIDIA RTX PRO 6000 GPUを搭載し、開発者や企業のコスト削減と柔軟な運用ニーズに対応する。

AWS Machine Learning Blog·4月21日·★★★★

オープンウェイト「Kimi K2.6」がエージェント群でGPT-5.4とClaude Opus 4.6に挑戦

Moonshot AIはオープンウェイトモデル「Kimi K2.6」を公開した。同モデルはコーディングベンチでGPT-5.4やClaude Opus 4.6と同等の性能を示し、最大300個のエージェントを並列実行する。

The Decoder·4月21日·★★★★

Claude Mythosの神話が崩壊、小規模オープンモデルが同サイバーセキュリティ脆弱性を検出

Anthropic社はClaude Mythosサイバーセキュリティモデルの優位性を主張していたが、2つの研究が小規模なオープンモデルでも同社が公開した脆弱性分析の大半を再現できることを示した。

The Decoder·4月18日

超大規模言語モデル実行の基盤構築

Cloudflareが、MoonshotのKimi K2.5などの大規模オープンソースモデルをホストするWorkers AIを発表し、モデル速度を3倍向上させた。同社は、これらのモデルを基盤としたエージェント製品やツールを今週リリースしている。

Cloudflare Blog·4月16日·★★★★

【AIニュース】2026年4月版 主要ローカルモデル一覧

RedditのローカルLLMコミュニティを調査し、ベンチマーク結果ではなく実際のユーザー推薦に基づいたトップモデルを選定。Qwenなどを例示し、多様なサイズ帯のモデルを網羅したリストを提供している。

Latent Space·4月14日

【AINews】AIエンジニアヨーロッパ2026

3日間にわたる「AIエンジニアヨーロッパ2026」が終了した。オンライン講座、ワークショップに続き、100本以上の講演が行われた。公式アーカイブで録画が公開中だ。

Latent Space·4月11日·★★★★

本日は特に目立った出来事なし

2026年4月9日から10日にかけてのAIニュースを、12のサブレッドと544件のツイッター投稿から収集した結果、特筆すべき大きな出来事は確認されなかった。

Smol AI News·4月10日

WildDet3Dの紹介:単一画像からのオープンワールド3D検出

WildDet3Dは、単一画像から3次元バウンディングボックスを予測するオープンモデルである。カメラや物体カテゴリに汎化し、深度信号を活用する新データセットを含む。

Allen AI (AI2)·4月7日·★★★★

【AIニュース】グッドフライデー

Gemmaの好意的な評価が継続しており、Marc Andreesenのポッドキャストで高い評価を得ている。来週ロンドンで開催されるAIE Europeでは、OpenClawやPiなどの欧州発AIツールのクリエイターが登壇し、ライブ配信される。

Latent Space·4月4日·★★★★

アンソロピック、Claude Opus 4.6 より高性能な新モデル「カピバラ」を投入

AnthropicはClaude Opus 4.6より高性能な新モデル「カピバラ」を投入。パラメータ数は推定10兆で、コーディングやサイバーセキュリティ性能が向上。また、ZhipuはGLM-5.1をリリースし、オープンソースモデルの性能向上を進めている。

Smol AI News·3月27日·★★★★

エージェント能力を強化し長文脈対応のABEJA-Qwen3-14B-Agentic-256k-v0.1を公開

ABEJAは、経済産業省とNEDOのプロジェクト「GENIAC」3期で開発した大規模言語モデル「ABEJA-Qwen3-14B-Agentic-256k-v0.1」を公開した。同モデルは、長文脈処理性能とエージェントとしての能力向上に重点を置いている。

ABEJA Tech Blog·3月27日·★★★★

Mistralが音声生成の新たなオープンソースモデルをリリース

Mistralがスマートウォッチやスマートフォン上で動作可能な新たな音声生成オープンソースモデルをリリースした。

TechCrunch AI·3月26日·★★★★

PrismAudio:音声と映像の同期、音響効果の追従

通義実験室が2026年3月24日に、AI音響効果ツール「PrismAudio」をオープンソースで公開した。このツールは、映像の内容に合った音声を自動生成し、意味の一貫性、タイミングの同期、美的品質の3点を同時に満たすことを目指している。

通义大模型·3月24日·★★★★★

Cursor、新コーディングモデルがMoonshot AIのKimiを基盤に構築されたことを認める

Cursor社は、新たなコーディングモデルが中国企業Moonshot AIの「Kimi」モデルを基盤に構築されたことを認めた。現在の地政学的状況下で中国モデルを基盤とすることは特に困難を伴うと指摘されている。

TechCrunch AI·3月23日

Cursorが中国のオープンソースKimi K2.5を基盤に新コーディングモデルを静かに構築

Cursor社がソフトウェア開発向けAIモデル「Composer 2」をリリースした。同モデルは中国のオープンソースKimi K2.5を基盤に構築され、AnthropicやOpenAIの主要コーディングモデルと同等の性能を低コストで実現することを目指している。

The Decoder·3月21日

テンセント最新決算:混元AIの性能が継続的に向上

テンセントが2025年第4四半期および通期の決算を発表し、同社のAIモデル「混元」の性能が継続的に向上していることを明らかにした。

腾讯混元·3月18日

Fun-CineForge:初の映画・テレビ級音声合成マルチモーダル大規模モデル

通義実験室が、映画・テレビ級の音声合成をサポートする初のマルチモーダル大規模モデル「Fun-CineForge」を発表・オープンソース化した。このモデルは、キャラクターの感情や口の動きに合わせた高品質な音声合成を実現し、AI音声合成技術の新たな進展を示している。

通义大模型·3月16日

Granite 4.0 1B Speech:コンパクトで多言語対応、エッジ向けに構築

IBMがGranite 4.0 1B Speechを発表した。これは、エッジデバイス向けに設計されたコンパクトで多言語対応の音声AIモデルである。

Hugging Face Blog·3月10日·★★★★

Olmo Hybridと将来のLLMアーキテクチャ

Olmoチームは、QwenやKimiなど既存のオープンウェイトモデルで注目されるハイブリッドアーキテクチャを採用した「Olmo Hybrid」を発表し、この設計が業界標準になりつつあることを示唆している。

Interconnects·3月6日·★★★★

新曲創作わずか2秒!階躍星辰がACE-Step 1.5をオープンソース化、開発者コミュニティから好評

階躍星辰とACE Studioが共同でオープンソース音楽生成モデル「ACE-Step 1.5」を発表した。このモデルは作詞・作曲から編曲・録音・ミキシングまでをわずか2-10秒で生成可能で、開発者コミュニティから高い評価を得ている。

阶跃星辰·3月5日·★★★★

Phi-4-reasoning-visionとマルチモーダル推論モデル訓練の教訓

マイクロソフトは、Phi-4-reasoning-vision-15Bというコンパクトで効率的なマルチモーダル推論モデルを開発し、視覚言語タスクや数学・科学推論に優れる性能を実現した。同社はその訓練プロセスから得られた教訓を共有している。

Microsoft Research·3月5日·★★★★

Qwenの世界で何かが起ころうとしている

アリババのQwenチームが、過去数週間にQwen 3.5という注目すべきオープンウェイトモデルファミリーを発表した。しかし、同チームでは過去24時間で複数の重要人物が離脱しており、これがQwenの最後の作品とならないか懸念されている。

Simon Willison Blog·3月5日·★★★★

阶跃星辰がStep 3.5 Flashの事前学習/中間学習/学習フレームワークを全面オープンソース化

阶跃星辰が、Step 3.5 Flashモデルに加えて、エージェント基盤モデルの事前学習、中間学習、学習フレームワークをオープンソースとして公開した。これにより、より深いモデルのカスタマイズが可能になり、ユーザー独自のエージェント構築を支援する。

阶跃星辰·3月4日·★★★★

ClaudeにCUDAカーネルを構築させ、オープンモデルを教え込むことに成功!

Anthropic社のAIモデルClaudeが、CUDAカーネルを構築し、オープンソースモデルにその知識を伝達する能力を実証した。

Hugging Face Blog·1月28日·★★★★

LWiAIポッドキャスト #230 - 2025年振り返り、NvidiaがGroqを買収、GLM 4.7、METR

NvidiaがAIチップスタートアップGroqを約200億ドルで買収。MetaもAIスタートアップManusを買収し、Z.AIはGLM-4.7を発表。

Last Week in AI·1月7日·★★★★★

LWiAIポッドキャスト第225回 - GPT 5.1、Kimi K2思考、リモート労働指数

アンドレイ・クレンコフとミシェル・リーが、OpenAIのGPT 5.1や百度のErnie 5.0などの新AIモデル、百度アポロゴーやPony AIのIPOなどの自動運転技術の進展について議論した。

Last Week in AI·11月22日·★★★★★

GPT-2からgpt-ossへ:アーキテクチャの進化を分析

GPT-2からgpt-ossまでのアーキテクチャの進歩を分析し、Qwen3との比較を考察する。

Sebastian Raschka·8月9日·★★★★

Stability AIとArmが「Stable Audio Open Small」を共同リリース、オンデバイス音声生成の実用化を実現

Stability AIとArmは、3億4100万パラメータのテキスト音声変換モデル「Stable Audio Open Small」をオープンソース公開した。Arm CPU向けに最適化され、スマートフォンで8秒以内に11秒分の音声を生成可能。これにより、デバイス上でのリアルタイム音声生成の実用化が進む。

Stability AI·5月14日·★★★★

Stability AIとArmが協力し、オンデバイス音声生成向け「Stable Audio Open Small」をリリース

Stability AIとArmは、Arm CPU上で動作する3億4100万パラメータのテキスト音声変換モデル「Stable Audio Open Small」をオープンソース化した。スマートフォンで最大11秒の音声を8秒未満で生成できる。

Stability AI·5月14日·★★★★

Qwen2.5 Omni:視覚、聴覚、会話、記述、実行をすべてこなす!

Qwenチームは、テキスト・画像・音声・動画を入力し、リアルタイムのテキスト生成と自然な音声合成で応答する多モーダルモデル「Qwen2.5-Omni」を公開した。このエンドツーエンドのフラッグシップモデルは、Qwen Chatで7B版を試せる。

Qwen Blog·3月27日·★★★★