#hugging face のAIニュース
67件の記事
LeRobot v0.5.0:すべての次元をスケーリング
LeRobotチームがLeRobot v0.5.0をリリースし、ロボット学習のすべての次元をスケーリングする新機能を導入した。
モジュラーディフューザーの紹介 - 拡散パイプラインのための構成可能なビルディングブロック
研究チームが、拡散モデルパイプラインのための構成可能なビルディングブロック「モジュラーディフューザー」を発表した。この技術は、画像生成AIの開発効率と柔軟性を向上させることを目的としている。
PRX パート3 ― 24時間でテキストから画像生成モデルをトレーニング!
PRXチームが、わずか24時間でテキストから画像を生成するAIモデルをトレーニングする手法を発表した。この高速トレーニング手法は、AI開発の効率化とリソース削減に貢献する可能性がある。
トランスフォーマーにおけるエキスパート混合(MoEs)
トランスフォーマーモデルに複数の専門家ネットワークを組み合わせるMoE手法を紹介。効率的な計算と高性能化を実現する技術で、大規模AIモデルの開発に寄与。
H社の新Holo2モデルがUIローカライゼーションで先行
H社が新たに発表したHolo2モデルは、ユーザーインターフェースのローカライゼーション分野でリードする技術を提供する。
テキストから画像生成モデルの学習設計:アブレーション研究からの知見
研究者がテキストから画像生成モデルの学習設計を検証し、アブレーション研究を通じて効果的な学習手法を特定した。
ClaudeにCUDAカーネルを構築させ、オープンモデルを教え込むことに成功!
Anthropic社のAIモデルClaudeが、CUDAカーネルを構築し、オープンソースモデルにその知識を伝達する能力を実証した。
AssetOpsBench:AIエージェントベンチマークと産業現場のギャップを埋める
研究者らが、AIエージェントの評価基準と産業現場の実態を結び付ける「AssetOpsBench」を発表した。このベンチマークは、現実の産業環境でのAIエージェントの性能評価を目的としている。
3行で始める文章検索 ― txtai入門
txtaiは社内資料や議事録などの固有データを検索できるAIパッケージで、LLMでは扱えない情報へのアクセスを可能にします。
GigaTIME:マルチモーダルAIが生成する仮想患者集団を用いた腫瘍微小環境モデルの大規模化
研究チームは、マルチモーダルAIで生成した仮想患者集団を用い、腫瘍微小環境の相互作用を解明する大規模モデルを構築した。
先週のAI #328 - DeepSeek 3.2、Mistral 3、Trainium3、Runway Gen-4.5
DeepSeekはGPT-5やGemini 3 Proと対抗する新推論モデル「DeepSeek 3.2」を公開した。高速・低コストで高性能なオープンソースモデルであり、業界の競争を激化させる重要なリリースである。
ついにBERTの代替モデル登場:ModernBERTを発表
Hugging Faceは、既存のBERT系モデルに置き換え可能なエンコーダー専用モデル「ModernBERT」を発表した。最大8192トークンのシーケンス長に対応し、処理速度と下流タスクの性能を向上させた。
Transformersでのモデル学習状況をSlackに通知する
Hugging Face Transformersライブラリを使用したモデル学習中に、学習状況をSlackに自動通知する方法についての記事です。
Transformersで特定の文字列が出力された際に生成を停止する方法
SpiralAIのインターン生が、Transformersライブラリを使用したテキスト生成時に、特定の文字列(例:###)が出力された際に生成を自動停止する方法について説明している。
日本語ビジネスニュースコーパスで学習したBART事前学習済モデルの公開
ストックマーク社が、日本語ビジネスニュースの分類・要約向けに、BART事前学習済モデルを開発・公開した。
大規模言語モデルの人間評価:Hugging FaceのBLOOMはどれほど優れているか?
Hugging Faceが1760億パラメータの多言語大規模言語モデルBLOOMを発表し、7つの実世界カテゴリーで人間による評価を実施して他の最先端LLMとの比較を行った。
トランスフォーマー言語モデルを説明するためのインターフェース
トランスフォーマー言語モデルを入力の顕著性とニューロン活性化で分析するインターフェースを紹介。入力の重要度とニューロン活性化の可視化を通じてモデルの内部動作を理解する手法を提案。