#ファインチューニング のAIニュース

35件の記事

NVIDIA NeMo AutoModelによるTransformersの微調整加速

NVIDIAはHugging FaceでNeMo AutoModelを公開し、Qwen3やDeepSeek V3のような大規模Mixture-of-Expertsアーキテクチャの微調整パイプラインを最適化した。同フレームワークはExpert ParallelismとDeepEP融合通信カーネルを導入し、GPUクラスター上で専門的なエキスパート重みを動的に分散させることで、トレーニングスループットを最大3.7倍向上させ、ピークGPUメモリ使用量を32%削減した。

TLDR AI·6月25日·★★★★

NVIDIA NeMo AutoModel を用いたトランスフォーマーファインチューニングの加速化

Hugging Face は、NVIDIA の NeMo AutoModel を活用することで、トランスフォーマーモデルのファインチューニング処理を大幅に高速化する手法を発表した。

Hugging Face Blog·6月25日·★★★★

LoRA を超えるか?最も人気のあるファインチューニング手法に勝てるか

Hugging Face は、現在最も普及しているファインチューニング技術である LoRA の限界を検証し、それを上回る新たな手法の可能性について議論している。

Hugging Face Blog·6月18日·★★★★

Databricks Unity Catalog と Amazon SageMaker AI を用いた大規模言語モデルのファインチューニング

Databricks の Unity Catalog と Amazon SageMaker AI を組み合わせて大規模言語モデルをファインチューニングする際、データガバナンスと権限管理における課題について解説している。

AWS Machine Learning Blog·5月14日·★★★★

Amazon SageMaker AI における EU AI 法対応のガイドライン

Amazon は、EU AI 法の遵守義務を判断するために必要な計算資源(FLOPs)の追跡方法を、SageMaker AI を用いた大規模言語モデルのファインチューニングにおいて説明している。

AWS Machine Learning Blog·5月13日·★★★★

1930年代風の13Bパラメータ言語モデル「talkie」の発表

GPT開発者の一人であるAlec Radfordらにより、1930年代の文体を模した13Bパラメータの言語モデル「talkie」が公開された。このプロジェクトは、過去の文書スタイルを学習した独自の言語モデルの実装を示している。

Simon Willison Blog·4月28日

AutoAdapt:大規模言語モデルの自動ドメイン適応

Microsoft Researchは「AutoAdapt」を開発した。大規模言語モデルの専門ドメイン適応を自動化し、計画立案や戦略選択(RAG等)、調整を構造化グラフで自動実行する。適応の高速化と再現性向上を実現した。

Microsoft Research·4月23日·★★★★

LangSmithとLilacを用いたLLMのファインチューニング

LangSmithとLilacを使用して大規模言語モデルをファインチューニングする方法を紹介する。高品質な学習データの収集、データセットのフィルタリングや強化を行い、より高性能なモデルを迅速にデプロイする手法を解説している。

LangChain Blog·4月22日

LangSmithでファインチューニング済みオープンソースモデルをテストする

LangSmithは、ファインチューニングされたオープンソース大規模言語モデルの評価と比較を行うツールです。複数のモデルをテストし、評価プロセスを自動化することで、最もパフォーマンスの高いAIを選択することを支援します。

LangChain Blog·4月22日

Nova Forge SDKシリーズ第2部:データ混合機能を使用したNovaモデルのファインチューニング実践ガイド

Amazonは、Amazon Nova Forge SDKを使用してAmazon Novaモデルをファインチューニングする手順を、データ準備からデータ混合を用いたトレーニング、評価まで実践的に解説するガイドを公開した。

AWS Machine Learning Blog·4月18日·★★★★

MaxText、単一ホストTPUでのSFTとRLのポストトレーニング機能を拡張

MaxTextが、単一ホストTPU構成で教師ありファインチューニング(SFT)と強化学習(RL)の新サポートを導入し、JAXとTunixライブラリを活用して高性能なモデル改良を可能にした。

Google Developers AI·4月16日

Sentence Transformersを用いたマルチモーダル埋め込み・リランカーモデルのトレーニングとファインチューニング

Sentence Transformersライブラリの開発者が、テキストと画像を統合的に処理するマルチモーダル埋め込みモデルとリランカーモデルのトレーニング・ファインチューニング手法を発表した。

Hugging Face Blog·4月16日·★★★★

サイバー防衛の新時代に向けた信頼できるアクセス

OpenAIは、Claude Mythosに対抗する新モデル「GPT-5.4-Cyber」を発表した。同社は今後数ヶ月でより強力なモデルをリリースする準備として、防御的サイバーセキュリティ用途に特化したファインチューニングを進めている。

Simon Willison Blog·4月15日

Amazon BedrockでAmazon Novaモデルをカスタマイズ可能に

AWSが、Amazon Bedrockを通じてAmazon Novaモデルを企業の特定のビジネスニーズに合わせて簡単にカスタマイズできる方法を発表した。顧客は独自の知識やワークフローを反映したモデルを構築できる。

AWS Machine Learning Blog·4月9日·★★★★

LLM-Mrchatterbox 0.1 の公開

Simon Willison が 2026 年 3 月 30 日、大規模言語モデル(LLM)に関する月次ブリーフィング「llm-mrchatterbox」のバージョン 0.1 を公開した。これは月額 10 ドルのスポンサーシップを通じて購読可能な、当月の重要ニュースを厳選したメールダイジェストである。

Simon Willison Blog·3月30日

SageMaker Unified StudioとS3を用いた非構造化データによるLLMファインチューニングの加速

AWSがSageMaker Unified StudioとS3の連携を発表し、S3に保存された非構造化データを機械学習やデータ分析に活用する方法を紹介した。

AWS Machine Learning Blog·3月27日

Nova Forge SDKを使用したNovaカスタマイズ実験の開始

Nova Forge SDKは、大規模言語モデル(LLM)のカスタマイズを容易にし、技術的専門知識やインフラ設定を必要とせずにチームが言語モデルの可能性を活用できるようにする。

AWS Machine Learning Blog·3月19日

Nova Forge SDKの紹介:企業AI向けにNovaモデルをカスタマイズするシームレスな方法

Novaは、企業向けにNovaモデルをカスタマイズするNova Forge SDKを発表した。汎用LLMでは対応できないドメイン固有タスクや独自業務に対応するため、企業は自社データや業務プロセスに特化したLLMを構築できる。

AWS Machine Learning Blog·3月19日·★★★★

Together AI、ツール呼び出し・推論・ビジョン対応のファインチューニングサービスを拡大

Together AIは、ツール呼び出し、推論、ビジョン言語モデルのネイティブサポートを追加し、100B以上のモデルトレーニングに対応するファインチューニングサービスを拡大した。処理速度は最大6倍向上し、ジョブコストと所要時間の見積もり機能も提供している。

Together AI Blog·3月18日·★★★★

Hugging Faceにおけるオープンソースの現状:2026年春

Hugging Faceが2026年春のオープンソース動向を発表し、プラットフォーム上でのモデル共有・協業の進展を報告した。

Hugging Face Blog·3月18日·★★★★

カスタムLLMのデプロイを加速: OumiでファインチューニングしAmazon Bedrockにデプロイ

OumiのDavid StewartとMatthew Personsが、オープンソース大規模言語モデルの実験から本番環境への移行における課題を解決する方法を紹介。LlamaモデルをOumiでファインチューニングし、Amazon Bedrockにデプロイする手順を示す。

AWS Machine Learning Blog·3月11日

LLMの自律的調査能力を高めるAgenticRLの取り組みと知見

ABEJAの服部氏が、LLMの自律的(Agentic)能力向上のためのPost Training(SFTと強化学習)の手法と知見を紹介した。SFTでの精度劣化回避やTool-Useを用いた強化学習タスク、実装上の課題などをまとめている。

ABEJA Tech Blog·3月10日

エージェントが説得するとき:LLMにおけるプロパガンダ生成と緩和

研究チームが、LLMベースのエージェントがプロパガンダ目的で操作され、扇動的なコンテンツを生成する可能性を調査した。プロパガンダ分類モデルと修辞技法検出モデルを用いて出力を分析した。

ArXiv cs.AI·3月6日·★★★★

検索関連性のスケーリング:LLM生成判定によるApp Storeランキングの強化

Apple社は、App Storeの検索関連性を最大化するため、ユーザーの行動データとテキスト関連性を組み合わせた手法を開発した。専門家によるテキスト関連性ラベルの不足を補うため、大規模言語モデル(LLM)を活用して検索結果の品質を向上させている。

Apple Machine Learning·2月27日·★★★★

UnslothとHugging Face Jobsで無料でAIモデルをトレーニング

UnslothとHugging Face Jobsを活用することで、効率的かつ無料でAIモデルのトレーニングが可能になります。

Hugging Face Blog·2月20日

AIモデル蒸留のためのライセンス準拠合成データパイプライン構築方法

NVIDIAが、ドメイン特化型AIモデルのファインチューニングや蒸留において、ライセンス準拠の合成データパイプラインを構築する方法を解説している。

NVIDIA Developer Blog·2月6日

Google TPU上でのTunixを使用した簡単なFunctionGemmaモデルのファインチューニング

軽量なJAXベースのTunixライブラリをGoogle TPUで使用することで、FunctionGemmaモデルのファインチューニングが高速かつ簡単に行える。

Google Developers AI·2月3日

DeepSeekが推論コスト削減、OpenAIがAMDと連携強化、Thinking Machinesがファインチューニング簡素化、ロボットが空間認識向上

DeepSeekがAI推論コストを削減し、OpenAIがAMDと協力関係を強化した。Thinking Machinesがファインチューニングプロセスを簡素化し、ロボットが空間認識能力を向上させた。

The Batch·10月15日

Claudeが進化、Qwen3が普及、大手AI企業が製品ラインを多様化、LoRAアダプターが手軽に利用可能に

AnthropicがClaudeを進化させ、AlibabaがQwen3を普及させ、大手AI企業が製品ラインを多様化し、LoRAアダプターが手軽に利用可能になった。

The Batch·10月8日

Tinkerの発表

Thinking Machines LabがTinkerを発表。詳細は不明だが、新たなプロジェクトや製品の開始を示唆。

Thinking Machines Lab·10月1日·★★★★

後悔のないLoRA

John Schulmanらによる、LoRA(Low-Rank Adaptation)の効率的な適応手法についての研究。従来の微調整よりも計算コストを抑えつつ、モデル性能を維持する方法を提案。

Thinking Machines Lab·9月29日·★★★★

実務家による大規模言語モデル(LLM)の公開講座

業界のベテラン25人以上が講師を務める「Mastering LLMs」講座を公開した。評価、RAG、ファインチューニングなど実務に即したトピックを扱い、既存の技術をLLMに応用する手法を提供している。

Hamel Husain·7月29日·★★★★

敵対的検証によるAIのデバッグ

著者は、モデル入力や訓練データの急変(ドリフト)を検出する「敵対的検証」手法を推奨する。この簡易な方法は複雑なツール不要で、本番環境と評価データの不一致によるバグや、プロンプト更新時の問題を防止する。

Hamel Husain·4月12日·★★★★

Mistralモデルへのllama-adapterファインチューニング

Spiral.AI株式会社のエンジニアが、Mistral AIが2023年9月にリリースした言語モデル「Mistralモデル」にllama-adapterを適用してファインチューニングする方法を紹介している。

Spiral.AI Tech Blog·2月13日

Cohereによる大規模言語モデルの実世界への応用

CohereはGPTやBERTのような大規模言語モデルをAPIとして提供し、Google Brain出身の創業者がTransformers論文の共著者を含む。

Jay Alammar·3月7日