#ファインチューニングのAIニュース

35件の記事

NVIDIA NeMo AutoModelによるTransformersの微調整加速

NVIDIAはHugging FaceでNeMo AutoModelを公開し、Qwen3やDeepSeek V3のような大規模Mixture-of-Expertsアーキテクチャの微調整パイプラインを最適化した。同フレームワークはExpert ParallelismとDeepEP融合通信カーネルを導入し、GPUクラスター上で専門的なエキスパート重みを動的に分散させることで、トレーニングスループットを最大3.7倍向上させ、ピークGPUメモリ使用量を32%削減した。

TLDR AI·6月25日·★★★★

NVIDIA NeMo AutoModel を用いたトランスフォーマーファインチューニングの加速化

Hugging Face は、NVIDIA の NeMo AutoModel を活用することで、トランスフォーマーモデルのファインチューニング処理を大幅に高速化する手法を発表した。

Hugging Face Blog·6月25日·★★★★

LoRA を超えるか？最も人気のあるファインチューニング手法に勝てるか

Hugging Face は、現在最も普及しているファインチューニング技術である LoRA の限界を検証し、それを上回る新たな手法の可能性について議論している。

Hugging Face Blog·6月18日·★★★★

Databricks Unity Catalog と Amazon SageMaker AI を用いた大規模言語モデルのファインチューニング

Databricks の Unity Catalog と Amazon SageMaker AI を組み合わせて大規模言語モデルをファインチューニングする際、データガバナンスと権限管理における課題について解説している。

AWS Machine Learning Blog·5月14日·★★★★

Amazon SageMaker AI における EU AI 法対応のガイドライン

Amazon は、EU AI 法の遵守義務を判断するために必要な計算資源（FLOPs）の追跡方法を、SageMaker AI を用いた大規模言語モデルのファインチューニングにおいて説明している。

AWS Machine Learning Blog·5月13日·★★★★

1930年代風の13Bパラメータ言語モデル「talkie」の発表

GPT開発者の一人であるAlec Radfordらにより、1930年代の文体を模した13Bパラメータの言語モデル「talkie」が公開された。このプロジェクトは、過去の文書スタイルを学習した独自の言語モデルの実装を示している。

Simon Willison Blog·4月28日

AutoAdapt：大規模言語モデルの自動ドメイン適応

Microsoft Researchは「AutoAdapt」を開発した。大規模言語モデルの専門ドメイン適応を自動化し、計画立案や戦略選択（RAG等）、調整を構造化グラフで自動実行する。適応の高速化と再現性向上を実現した。

Microsoft Research·4月23日·★★★★

LangSmithとLilacを用いたLLMのファインチューニング

LangSmithとLilacを使用して大規模言語モデルをファインチューニングする方法を紹介する。高品質な学習データの収集、データセットのフィルタリングや強化を行い、より高性能なモデルを迅速にデプロイする手法を解説している。

LangChain Blog·4月22日

LangSmithでファインチューニング済みオープンソースモデルをテストする

LangSmithは、ファインチューニングされたオープンソース大規模言語モデルの評価と比較を行うツールです。複数のモデルをテストし、評価プロセスを自動化することで、最もパフォーマンスの高いAIを選択することを支援します。

LangChain Blog·4月22日

Nova Forge SDKシリーズ第2部：データ混合機能を使用したNovaモデルのファインチューニング実践ガイド

Amazonは、Amazon Nova Forge SDKを使用してAmazon Novaモデルをファインチューニングする手順を、データ準備からデータ混合を用いたトレーニング、評価まで実践的に解説するガイドを公開した。

AWS Machine Learning Blog·4月18日·★★★★

MaxText、単一ホストTPUでのSFTとRLのポストトレーニング機能を拡張

MaxTextが、単一ホストTPU構成で教師ありファインチューニング（SFT）と強化学習（RL）の新サポートを導入し、JAXとTunixライブラリを活用して高性能なモデル改良を可能にした。

Google Developers AI·4月16日

Sentence Transformersを用いたマルチモーダル埋め込み・リランカーモデルのトレーニングとファインチューニング

Sentence Transformersライブラリの開発者が、テキストと画像を統合的に処理するマルチモーダル埋め込みモデルとリランカーモデルのトレーニング・ファインチューニング手法を発表した。

Hugging Face Blog·4月16日·★★★★

サイバー防衛の新時代に向けた信頼できるアクセス

OpenAIは、Claude Mythosに対抗する新モデル「GPT-5.4-Cyber」を発表した。同社は今後数ヶ月でより強力なモデルをリリースする準備として、防御的サイバーセキュリティ用途に特化したファインチューニングを進めている。

Simon Willison Blog·4月15日

Amazon BedrockでAmazon Novaモデルをカスタマイズ可能に

AWSが、Amazon Bedrockを通じてAmazon Novaモデルを企業の特定のビジネスニーズに合わせて簡単にカスタマイズできる方法を発表した。顧客は独自の知識やワークフローを反映したモデルを構築できる。

AWS Machine Learning Blog·4月9日·★★★★

LLM-Mrchatterbox 0.1 の公開

Simon Willison が 2026 年 3 月 30 日、大規模言語モデル（LLM）に関する月次ブリーフィング「llm-mrchatterbox」のバージョン 0.1 を公開した。これは月額 10 ドルのスポンサーシップを通じて購読可能な、当月の重要ニュースを厳選したメールダイジェストである。

Simon Willison Blog·3月30日