#hugging face のAIニュース

67件の記事

LeRobot v0.5.0:すべての次元をスケーリング

LeRobotチームがLeRobot v0.5.0をリリースし、ロボット学習のすべての次元をスケーリングする新機能を導入した。

Hugging Face Blog·3月9日·★★★★

モジュラーディフューザーの紹介 - 拡散パイプラインのための構成可能なビルディングブロック

研究チームが、拡散モデルパイプラインのための構成可能なビルディングブロック「モジュラーディフューザー」を発表した。この技術は、画像生成AIの開発効率と柔軟性を向上させることを目的としている。

Hugging Face Blog·3月5日·★★★★

PRX パート3 ― 24時間でテキストから画像生成モデルをトレーニング!

PRXチームが、わずか24時間でテキストから画像を生成するAIモデルをトレーニングする手法を発表した。この高速トレーニング手法は、AI開発の効率化とリソース削減に貢献する可能性がある。

Hugging Face Blog·3月4日

トランスフォーマーにおけるエキスパート混合(MoEs)

トランスフォーマーモデルに複数の専門家ネットワークを組み合わせるMoE手法を紹介。効率的な計算と高性能化を実現する技術で、大規模AIモデルの開発に寄与。

Hugging Face Blog·2月26日·★★★★

H社の新Holo2モデルがUIローカライゼーションで先行

H社が新たに発表したHolo2モデルは、ユーザーインターフェースのローカライゼーション分野でリードする技術を提供する。

Hugging Face Blog·2月4日·★★★★

テキストから画像生成モデルの学習設計:アブレーション研究からの知見

研究者がテキストから画像生成モデルの学習設計を検証し、アブレーション研究を通じて効果的な学習手法を特定した。

Hugging Face Blog·2月3日·★★★★

ClaudeにCUDAカーネルを構築させ、オープンモデルを教え込むことに成功!

Anthropic社のAIモデルClaudeが、CUDAカーネルを構築し、オープンソースモデルにその知識を伝達する能力を実証した。

Hugging Face Blog·1月28日·★★★★

AssetOpsBench:AIエージェントベンチマークと産業現場のギャップを埋める

研究者らが、AIエージェントの評価基準と産業現場の実態を結び付ける「AssetOpsBench」を発表した。このベンチマークは、現実の産業環境でのAIエージェントの性能評価を目的としている。

Hugging Face Blog·1月21日·★★★★

3行で始める文章検索 ― txtai入門

txtaiは社内資料や議事録などの固有データを検索できるAIパッケージで、LLMでは扱えない情報へのアクセスを可能にします。

AI Shift Tech Blog·1月7日

GigaTIME:マルチモーダルAIが生成する仮想患者集団を用いた腫瘍微小環境モデルの大規模化

研究チームは、マルチモーダルAIで生成した仮想患者集団を用い、腫瘍微小環境の相互作用を解明する大規模モデルを構築した。

Microsoft Research·12月10日·★★★★★

先週のAI #328 - DeepSeek 3.2、Mistral 3、Trainium3、Runway Gen-4.5

DeepSeekはGPT-5やGemini 3 Proと対抗する新推論モデル「DeepSeek 3.2」を公開した。高速・低コストで高性能なオープンソースモデルであり、業界の競争を激化させる重要なリリースである。

Last Week in AI·12月8日·★★★★

ついにBERTの代替モデル登場:ModernBERTを発表

Hugging Faceは、既存のBERT系モデルに置き換え可能なエンコーダー専用モデル「ModernBERT」を発表した。最大8192トークンのシーケンス長に対応し、処理速度と下流タスクの性能を向上させた。

Answer.AI·12月19日·★★★★★

Transformersでのモデル学習状況をSlackに通知する

Hugging Face Transformersライブラリを使用したモデル学習中に、学習状況をSlackに自動通知する方法についての記事です。

Spiral.AI Tech Blog·7月16日

Transformersで特定の文字列が出力された際に生成を停止する方法

SpiralAIのインターン生が、Transformersライブラリを使用したテキスト生成時に、特定の文字列(例:###)が出力された際に生成を自動停止する方法について説明している。

Spiral.AI Tech Blog·1月22日

日本語ビジネスニュースコーパスで学習したBART事前学習済モデルの公開

ストックマーク社が、日本語ビジネスニュースの分類・要約向けに、BART事前学習済モデルを開発・公開した。

Stockmark Tech Blog·1月24日

大規模言語モデルの人間評価:Hugging FaceのBLOOMはどれほど優れているか?

Hugging Faceが1760億パラメータの多言語大規模言語モデルBLOOMを発表し、7つの実世界カテゴリーで人間による評価を実施して他の最先端LLMとの比較を行った。

Surge AI Blog·7月19日·★★★★

トランスフォーマー言語モデルを説明するためのインターフェース

トランスフォーマー言語モデルを入力の顕著性とニューロン活性化で分析するインターフェースを紹介。入力の重要度とニューロン活性化の可視化を通じてモデルの内部動作を理解する手法を提案。

Jay Alammar·12月17日·★★★★