メインコンテンツへスキップ

#lora のAIニュース

10件の記事

Amazon Nova モデルのファインチューニングによる正確なメールデータ抽出

AWS は、Amazon Nova モデルをファインチューニングすることで、毎日数百万通のメールを処理する企業がコストとハルシネーションを減らしつつ、正確にデータを抽出できる方法を発表した。

AWS Machine Learning Blog·7月1日·★★★★

LoRA を超えるか?最も人気のあるファインチューニング手法に勝てるか

Hugging Face は、現在最も普及しているファインチューニング技術である LoRA の限界を検証し、それを上回る新たな手法の可能性について議論している。

Hugging Face Blog·6月18日·★★★★

NVIDIA BioNeMoレシピを用いたLoRAによる生物学的基盤モデルのファインチューニング

NVIDIAは、BioNeMoレシピを活用してLoRA技術で生物学的基盤モデルを効率的にファインチューニングする方法を発表した。

NVIDIA Developer Blog·6月16日·★★★★

あなたの言語・ドメイン、またはアクセント向けに Nemotron 3.5 ASR をファインチューニングする方法

Hugging Face は、Nemotron 3.5 ASR モデルを特定の言語や業界ドメイン、話者のアクセントに合わせてカスタマイズするファインチューニングの手順を解説した。

Hugging Face Blog·6月4日·★★★★

Amazon SageMaker AI でアゼルバイジャン語の言語モデルをトレーニングする手法

AWS は、PyTorch や Hugging Face Transformers などのオープンソースツールを活用し、Azercell Telecom と共同でアゼルバイジャン語対応の言語モデルを Amazon SageMaker AI 上で構築・トレーニングするソリューションを発表した。

AWS Machine Learning Blog·5月29日·★★★★

Granite 4.0 3B Vision:企業文書向けのコンパクトなマルチモーダルAI

IBMが企業文書向けに開発したGranite 4.0 3B Visionは、テキストと画像を同時処理できる小型マルチモーダルAIモデルで、文書解析の効率化を実現する。

Hugging Face Blog·4月1日·★★★★

効率的なファインチューニングのためのLoRAターゲットモジュール選択の最適化

研究者のRushil AnirudhとAnjie Fangが、低ランク適応(LoRA)を使用してAIモデルをファインチューニングする際の精度と効率性のトレードオフを明らかにするアブレーション研究を実施した。

Amazon Science·3月19日·★★★★

ECG-MoE:専門家混合型心電図基盤モデル

研究者がECG-MoEを提案した。このモデルは専門家混合アーキテクチャを用いて、心拍の形態とリズムを別々にモデル化し、心臓診断のための多様な臨床タスクに対応する。

ArXiv cs.AI·3月6日·★★★★

Doc-to-LoRAとText-to-LoRAによる即時LLM更新

SakanaAIが、文書やテキストからLoRAアダプターを動的に生成するHypernetworkを訓練し、LLMのカスタマイズを高速化・容易化する研究「Doc-to-LoRA」と「Text-to-LoRA」を発表した。

Sakana AI·2月27日·★★★★

後悔のないLoRA

John Schulmanらによる、LoRA(Low-Rank Adaptation)の効率的な適応手法についての研究。従来の微調整よりも計算コストを抑えつつ、モデル性能を維持する方法を提案。

Thinking Machines Lab·9月29日·★★★★