#ファインチューニング のAIニュース
35件の記事
NVIDIA NeMo AutoModelによるTransformersの微調整加速
NVIDIAはHugging FaceでNeMo AutoModelを公開し、Qwen3やDeepSeek V3のような大規模Mixture-of-Expertsアーキテクチャの微調整パイプラインを最適化した。同フレームワークはExpert ParallelismとDeepEP融合通信カーネルを導入し、GPUクラスター上で専門的なエキスパート重みを動的に分散させることで、トレーニングスループットを最大3.7倍向上させ、ピークGPUメモリ使用量を32%削減した。
NVIDIA NeMo AutoModel を用いたトランスフォーマーファインチューニングの加速化
Hugging Face は、NVIDIA の NeMo AutoModel を活用することで、トランスフォーマーモデルのファインチューニング処理を大幅に高速化する手法を発表した。
LoRA を超えるか?最も人気のあるファインチューニング手法に勝てるか
Hugging Face は、現在最も普及しているファインチューニング技術である LoRA の限界を検証し、それを上回る新たな手法の可能性について議論している。
Databricks Unity Catalog と Amazon SageMaker AI を用いた大規模言語モデルのファインチューニング
Databricks の Unity Catalog と Amazon SageMaker AI を組み合わせて大規模言語モデルをファインチューニングする際、データガバナンスと権限管理における課題について解説している。
Amazon SageMaker AI における EU AI 法対応のガイドライン
Amazon は、EU AI 法の遵守義務を判断するために必要な計算資源(FLOPs)の追跡方法を、SageMaker AI を用いた大規模言語モデルのファインチューニングにおいて説明している。
1930年代風の13Bパラメータ言語モデル「talkie」の発表
GPT開発者の一人であるAlec Radfordらにより、1930年代の文体を模した13Bパラメータの言語モデル「talkie」が公開された。このプロジェクトは、過去の文書スタイルを学習した独自の言語モデルの実装を示している。
AutoAdapt:大規模言語モデルの自動ドメイン適応
Microsoft Researchは「AutoAdapt」を開発した。大規模言語モデルの専門ドメイン適応を自動化し、計画立案や戦略選択(RAG等)、調整を構造化グラフで自動実行する。適応の高速化と再現性向上を実現した。
LangSmithとLilacを用いたLLMのファインチューニング
LangSmithとLilacを使用して大規模言語モデルをファインチューニングする方法を紹介する。高品質な学習データの収集、データセットのフィルタリングや強化を行い、より高性能なモデルを迅速にデプロイする手法を解説している。
LangSmithでファインチューニング済みオープンソースモデルをテストする
LangSmithは、ファインチューニングされたオープンソース大規模言語モデルの評価と比較を行うツールです。複数のモデルをテストし、評価プロセスを自動化することで、最もパフォーマンスの高いAIを選択することを支援します。
Nova Forge SDKシリーズ第2部:データ混合機能を使用したNovaモデルのファインチューニング実践ガイド
Amazonは、Amazon Nova Forge SDKを使用してAmazon Novaモデルをファインチューニングする手順を、データ準備からデータ混合を用いたトレーニング、評価まで実践的に解説するガイドを公開した。
MaxText、単一ホストTPUでのSFTとRLのポストトレーニング機能を拡張
MaxTextが、単一ホストTPU構成で教師ありファインチューニング(SFT)と強化学習(RL)の新サポートを導入し、JAXとTunixライブラリを活用して高性能なモデル改良を可能にした。
Sentence Transformersを用いたマルチモーダル埋め込み・リランカーモデルのトレーニングとファインチューニング
Sentence Transformersライブラリの開発者が、テキストと画像を統合的に処理するマルチモーダル埋め込みモデルとリランカーモデルのトレーニング・ファインチューニング手法を発表した。
サイバー防衛の新時代に向けた信頼できるアクセス
OpenAIは、Claude Mythosに対抗する新モデル「GPT-5.4-Cyber」を発表した。同社は今後数ヶ月でより強力なモデルをリリースする準備として、防御的サイバーセキュリティ用途に特化したファインチューニングを進めている。
Amazon BedrockでAmazon Novaモデルをカスタマイズ可能に
AWSが、Amazon Bedrockを通じてAmazon Novaモデルを企業の特定のビジネスニーズに合わせて簡単にカスタマイズできる方法を発表した。顧客は独自の知識やワークフローを反映したモデルを構築できる。
LLM-Mrchatterbox 0.1 の公開
Simon Willison が 2026 年 3 月 30 日、大規模言語モデル(LLM)に関する月次ブリーフィング「llm-mrchatterbox」のバージョン 0.1 を公開した。これは月額 10 ドルのスポンサーシップを通じて購読可能な、当月の重要ニュースを厳選したメールダイジェストである。
SageMaker Unified StudioとS3を用いた非構造化データによるLLMファインチューニングの加速
AWSがSageMaker Unified StudioとS3の連携を発表し、S3に保存された非構造化データを機械学習やデータ分析に活用する方法を紹介した。
Nova Forge SDKを使用したNovaカスタマイズ実験の開始
Nova Forge SDKは、大規模言語モデル(LLM)のカスタマイズを容易にし、技術的専門知識やインフラ設定を必要とせずにチームが言語モデルの可能性を活用できるようにする。
Nova Forge SDKの紹介:企業AI向けにNovaモデルをカスタマイズするシームレスな方法
Novaは、企業向けにNovaモデルをカスタマイズするNova Forge SDKを発表した。汎用LLMでは対応できないドメイン固有タスクや独自業務に対応するため、企業は自社データや業務プロセスに特化したLLMを構築できる。
Together AI、ツール呼び出し・推論・ビジョン対応のファインチューニングサービスを拡大
Together AIは、ツール呼び出し、推論、ビジョン言語モデルのネイティブサポートを追加し、100B以上のモデルトレーニングに対応するファインチューニングサービスを拡大した。処理速度は最大6倍向上し、ジョブコストと所要時間の見積もり機能も提供している。
Hugging Faceにおけるオープンソースの現状:2026年春
Hugging Faceが2026年春のオープンソース動向を発表し、プラットフォーム上でのモデル共有・協業の進展を報告した。
カスタムLLMのデプロイを加速: OumiでファインチューニングしAmazon Bedrockにデプロイ
OumiのDavid StewartとMatthew Personsが、オープンソース大規模言語モデルの実験から本番環境への移行における課題を解決する方法を紹介。LlamaモデルをOumiでファインチューニングし、Amazon Bedrockにデプロイする手順を示す。
LLMの自律的調査能力を高めるAgenticRLの取り組みと知見
ABEJAの服部氏が、LLMの自律的(Agentic)能力向上のためのPost Training(SFTと強化学習)の手法と知見を紹介した。SFTでの精度劣化回避やTool-Useを用いた強化学習タスク、実装上の課題などをまとめている。
エージェントが説得するとき:LLMにおけるプロパガンダ生成と緩和
研究チームが、LLMベースのエージェントがプロパガンダ目的で操作され、扇動的なコンテンツを生成する可能性を調査した。プロパガンダ分類モデルと修辞技法検出モデルを用いて出力を分析した。
検索関連性のスケーリング:LLM生成判定によるApp Storeランキングの強化
Apple社は、App Storeの検索関連性を最大化するため、ユーザーの行動データとテキスト関連性を組み合わせた手法を開発した。専門家によるテキスト関連性ラベルの不足を補うため、大規模言語モデル(LLM)を活用して検索結果の品質を向上させている。
UnslothとHugging Face Jobsで無料でAIモデルをトレーニング
UnslothとHugging Face Jobsを活用することで、効率的かつ無料でAIモデルのトレーニングが可能になります。
AIモデル蒸留のためのライセンス準拠合成データパイプライン構築方法
NVIDIAが、ドメイン特化型AIモデルのファインチューニングや蒸留において、ライセンス準拠の合成データパイプラインを構築する方法を解説している。
Google TPU上でのTunixを使用した簡単なFunctionGemmaモデルのファインチューニング
軽量なJAXベースのTunixライブラリをGoogle TPUで使用することで、FunctionGemmaモデルのファインチューニングが高速かつ簡単に行える。
DeepSeekが推論コスト削減、OpenAIがAMDと連携強化、Thinking Machinesがファインチューニング簡素化、ロボットが空間認識向上
DeepSeekがAI推論コストを削減し、OpenAIがAMDと協力関係を強化した。Thinking Machinesがファインチューニングプロセスを簡素化し、ロボットが空間認識能力を向上させた。
Claudeが進化、Qwen3が普及、大手AI企業が製品ラインを多様化、LoRAアダプターが手軽に利用可能に
AnthropicがClaudeを進化させ、AlibabaがQwen3を普及させ、大手AI企業が製品ラインを多様化し、LoRAアダプターが手軽に利用可能になった。
Tinkerの発表
Thinking Machines LabがTinkerを発表。詳細は不明だが、新たなプロジェクトや製品の開始を示唆。
後悔のないLoRA
John Schulmanらによる、LoRA(Low-Rank Adaptation)の効率的な適応手法についての研究。従来の微調整よりも計算コストを抑えつつ、モデル性能を維持する方法を提案。
実務家による大規模言語モデル(LLM)の公開講座
業界のベテラン25人以上が講師を務める「Mastering LLMs」講座を公開した。評価、RAG、ファインチューニングなど実務に即したトピックを扱い、既存の技術をLLMに応用する手法を提供している。
敵対的検証によるAIのデバッグ
著者は、モデル入力や訓練データの急変(ドリフト)を検出する「敵対的検証」手法を推奨する。この簡易な方法は複雑なツール不要で、本番環境と評価データの不一致によるバグや、プロンプト更新時の問題を防止する。
Mistralモデルへのllama-adapterファインチューニング
Spiral.AI株式会社のエンジニアが、Mistral AIが2023年9月にリリースした言語モデル「Mistralモデル」にllama-adapterを適用してファインチューニングする方法を紹介している。
Cohereによる大規模言語モデルの実世界への応用
CohereはGPTやBERTのような大規模言語モデルをAPIとして提供し、Google Brain出身の創業者がTransformers論文の共著者を含む。