Hugging Face Blog の最新記事
公式130件の記事
Hugging Face と Cerebras が Gemma 4 をリアルタイム音声 AI に導入
Hugging Face と Cerebras は共同で、Gemma 4 モデルをリアルタイム音声 AI アプリケーションに統合する取り組みを発表した。
ScarfBench:エンタープライズ向け Java フレームワーク移行における AI エージェントのベンチマーク
Hugging Face が、企業環境での Java フレームワーク移行タスクを遂行する AI エージェントの性能を評価するためのベンチマーク「ScarfBench」を発表した。
専門化が不可避である理由
Hugging Face は、AI モデルの性能向上と実用性確保のために、汎用モデルから特定領域に特化した専門化への移行が避けられないと論じている。
Hugging Face モデルページに過去のすべての評価結果を表示
Hugging Face がモデルページの機能強化を行い、過去に実施されたあらゆる評価結果をユーザーが閲覧可能にした。これにより、各モデルの性能比較や信頼性確認が容易になる。
DiScoFormer:分布を超えた密度とスコアを扱う単一のトランスフォーマー
Hugging Face が、異なる確率分布にわたって密度推定とスコア計算の両方を処理できる新しい「DiScoFormer」というトランスフォーマーモデルを発表した。これは多様なデータ分布に対応する汎用的な手法として注目される。
1 コマンドで Hugging Face Jobs で vLLM サーバーを実行可能に
Hugging Face が、vLLM サーバーを Hugging Face Jobs 上で単一のコマンドで実行できる機能を導入した。これにより、大規模言語モデルの推論環境構築が簡素化された。
ハイブリッドモデルはどのトークンをより正確に予測するか?
Hugging Face Blog は、ハイブリッド型言語モデルが従来のモデルと比較して、特定のトークン予測においてどのような精度の向上を示すかを分析した研究結果を公開しました。
NVIDIA NeMo AutoModel を用いたトランスフォーマーファインチューニングの加速化
Hugging Face は、NVIDIA の NeMo AutoModel を活用することで、トランスフォーマーモデルのファインチューニング処理を大幅に高速化する手法を発表した。
FFASR リーダーボードの発表:実世界における音声認識の評価基準を提示
Hugging Face が、実世界の環境で音声認識モデルの性能を比較・評価するための新しいベンチマーク指標「FFASR リーダーボード」を発表した。
軽量ハーンネスを用いた CUGA による実用的エージェントアプリ構築:24 の動作例を紹介
Hugging Face は、軽量なハーンネス上で動作する 24 の実用的なエージェントアプリケーションの事例を公開し、CUGA を活用した開発手法を提示しました。
Transformers.js で提案されたクロスオリジンストレージ API の実験
Hugging Face が、Transformers.js 環境で提案されているクロスオリジンストレージ API の実装可能性を実験している。
AI、オープンツール、人間をループに組み込みながら huggingface_hub を毎週リリース
Hugging Face は、AI とオープンツールの活用に加え、人間のフィードバックをループに組み込むことで、huggingface_hub の毎週の更新を可能にした。
Hugging Face に PP-OCRv6 を公開:150 万パラメータから 3450 万パラメータへ拡張した 50 カ国語対応 OCR
Hugging Face が、PP-OCRv6 モデルを公開しました。このモデルは、パラメータ数を 150 万から 3450 万に増やすことで、50 の言語に対応する高精度な OCR(光学文字認識)機能を実現しています。
OpenClaw リポジトリのトリアージをローカルモデルで無料で行えるようになりました!
Hugging Face が、OpenClaw リポジトリの内容をトリアージするためにローカルモデルを利用する仕組みを無料で提供開始した。
MosaicLeaks:研究エージェントは秘密を守れるか?
Hugging Face は、AI エージェントが機密情報を漏洩するリスクを検証する「MosaicLeaks」という評価フレームワークを発表した。
LoRA を超えるか?最も人気のあるファインチューニング手法に勝てるか
Hugging Face は、現在最も普及しているファインチューニング技術である LoRA の限界を検証し、それを上回る新たな手法の可能性について議論している。
エージェント性は十分か?独自ツールを用いたオープンモデルのベンチマーク調査
Hugging Face が、独自に構築したツール環境において、オープンソースモデルがどれほど「エージェント性」を発揮できるかを評価するベンチマーク手法を発表しました。
MolmoMotion:言語指示に基づく 3D モーション予測技術の発表
Hugging Face が、言語による指示で 3D の動きを予測する新しいモデル「MolmoMotion」を発表しました。この技術は、テキスト入力から物体やキャラクターの未来の動作を推定する能力を持ちます。
Hugging Face Hub からロボットハードウェアへ:Strands Agents と LeRobot の連携
Hugging Face が、同社のプラットフォーム上で開発された Strands Agents および LeRobot を活用し、AI モデルを直接ロボットハードウェアに展開する取り組みを発表した。
エージェント型リソース発見:エージェントが検索できるようにする
Hugging Face は、AI エージェントが自律的に必要なリソースを検索・発見できる新機能「Agentic Resource Discovery」を発表した。これにより、エージェントの自律的なタスク遂行能力が向上する。
OLMO-EVAL:モデル開発ループのための評価ワークベンチ
Hugging Face が、モデル開発の効率化を目的とした評価ワークベンチ「OLMO-EVAL」を発表した。このツールは、開発者がモデルの性能を継続的に検証・改善するプロセスを支援するものである。
PyTorch のプロファイリング(第 2 部):nn.Linear から融合 MLP へ
Hugging Face Blog は、PyTorch のプロファイリング手法について解説し、従来の nn.Linear レベルから、より効率的な融合 MLP 構造への最適化プロセスを詳述している。
音声エージェントはバイリンガル顧客に対応できるか?コードスイッチング音声における最先端 ASR のベンチマーク
Hugging Face は、音声エージェントが言語を混在させた(コードスイッチング)音声に対してどの程度対応可能かを評価するため、最先端の自動音声認識(ASR)技術をベンチマークした。
開発者向け初のモデル「North Mini Code」の発表:Cohere が Hugging Face で紹介
AI 企業 Cohere は、Hugging Face Blog を通じて、開発者向けの専用モデルとして初めて「North Mini Code」を発表した。この新モデルは、コード生成や技術的タスクの支援を目的としている。
エージェントが2つのHugging Face Spaceを連鎖させて3Dのパリ美術館を構築した方法
Hugging Face Blogは、AIエージェントが2つの異なるHugging Face Spaceを連携させることで、3D形式のパリ美術館を構築するプロセスを紹介している。
NeuroBait:ADHD の脳にドーパミンを刺激するためにモデルをファインチューニングした
Hugging Face が、ADHD(注意欠如・多動症)を持つ人の脳にドーパミンを刺激するよう特別に調整された「NeuroBait」というAIモデルを発表しました。
GitHub の CI を Hugging Face Jobs へ移行する方法
Hugging Face は、開発者が GitHub Actions から自社の Hugging Face Jobs プラットフォームへ継続的インテグレーション環境を移行するための手順と利点を解説したガイドを発表しました。
消えたクラッシュ:5 つのモデル経済における制御と創発
Hugging Face は、5 つのモデルが共存する経済環境において、システムクラッシュが消失した現象を分析し、制御メカニズムと創発的行動の関係性を明らかにした。
パキスタン向け安全問題解決のための小型 AI ツール「Pakistan Notice Helper」の開発
Hugging Face が、パキスタンのローカルな安全性課題に対応する小型 AI ツール「Pakistan Notice Helper」を開発したと発表した。
オープンソースコミュニティがエージェント型強化学習「OpenEnv」を支援
Hugging Face のブログによると、オープンソースコミュニティがエージェント型強化学習のためのプラットフォーム「OpenEnv」の発展を支援している。
素晴らしいデジタル入れ歯(失敗したプロジェクト)
Hugging Face ブログは、デジタル技術を用いた入れ歯の開発プロジェクトが最終的に失敗に終わった経緯と教訓について報告している。
Hugging Face Blog:OpenAI Codex の利用料割引に OpenAI が特別支援 - OpenAI チャレンジ
Hugging Face は、OpenAI コードックスの利用料割引において OpenAI が特別支援を行ったと発表しました。これは OpenAI チャレンジの一環です。
Her(ヘール)— クロード・コードセッションのための探偵ツール
Hugging Face が、Claude Code の利用セッションを監視・分析する新ツール「Her」を発表した。このツールは開発者の作業プロセスを検証し、デバッグや効率化を支援する機能を提供する。
5 つのラボ、5 つの思考:小規模モデルによるマルチモデル金融ドラマの構築
Hugging Face は、5 つの研究機関が協力し、小規模な AI モデルを活用して複数の視点を持つ金融ドラマを生成する手法を発表した。
ペルソナ・アトラス:著名な思考者の思考マップを可視化
Hugging Face が「Persona Atlas」を発表し、著名な人物の思考パターンや認知特性をマッピングする手法を公開した。これは AI の推論能力向上や人間理解の深化に寄与する研究である。
30 億パラメータモデル上でマルチエージェント経済を稼働:Thousand Token Wood の実装
Hugging Face は、30 億パラメータの軽量モデルを用いて複数のエージェントが経済活動を行うシステム「Thousand Token Wood」の実装と配送を発表した。
Nemotron 3.5 コンテンツセーフティ:グローバル企業向けカスタマイズ可能なマルチモーダル安全性
Hugging Face は、Nemotron 3.5 のコンテンツセーフティ機能を発表し、グローバル企業の AI 利用に向けたカスタマイズ可能なマルチモーダル安全性を提供する。
あなたの言語・ドメイン、またはアクセント向けに Nemotron 3.5 ASR をファインチューニングする方法
Hugging Face は、Nemotron 3.5 ASR モデルを特定の言語や業界ドメイン、話者のアクセントに合わせてカスタマイズするファインチューニングの手順を解説した。
EVA-Bench Data 2.0:3 つのドメイン、121 のツール、213 のシナリオ
Hugging Face が公開した評価ベンチマーク「EVA-Bench Data 2.0」は、3 つのドメインにわたる 121 のツールと 213 のシナリオを含むデータセットであり、AI モデルの実用性を多角的に評価する基準を提供します。
Hugging Face CLI をエージェント最適化された Hub 操作手段として設計する
Hugging Face は、ハブ上のリソースを効率的に扱うための CLI ツールを、AI エージェントによる自動化利用を意識した設計へと刷新すると発表した。
チャットボットを超えた直接選好最適化
Hugging Face は、チャットボットの分野に限定されない形で直接選好最適化(DPO)の応用範囲を広げる研究を発表しました。
Reachy Mini に MCP ツールの追加を発表
Hugging Face は、ロボット「Reachy Mini」に MCP(モデル・コネクタ・プロトコル)ツールを追加し、AI モデルとの連携機能を強化したと発表した。
Holo3.1:高速かつローカル環境でのコンピュータ操作エージェント
Hugging Face は、ローカル環境で動作する高速なコンピュータ操作エージェント「Holo3.1」を発表した。これにより、プライバシーを損なわずに効率的な自動化が可能となる。
JetBrains が 12B モデルの混合専門家モデル「Mellum2」を発表
JetBrains は、推論効率を高めるための 120 億パラメータ規模の混合専門家(MoE)モデル「Mellum2」を発表した。同社はコード生成や開発支援に特化したこの新モデルの詳細を紹介している。
LLM を超える:スケーラブルな企業向け AI 導入がエージェントロジックに依存する理由
Hugging Face Blog は、大規模言語モデル(LLM)だけでは不十分であり、企業が AI を大規模に導入するには、自律的な判断を行うエージェントの論理設計が不可欠であると指摘している。
NVIDIA Cosmos 3 の登場:物理 AI の推論と行動のための初のオープンオムニモデル
NVIDIA が、物理世界の推論と行動を担うための最初のオープンソース型オムニモデル「Cosmos 3」を発表した。この新モデルは、AI が現実世界を理解し、動作する能力を強化する基盤技術として期待されている。
PyTorch のプロファイリング(第 1 部):torch.profiler を始めるための初心者ガイド
Hugging Face Blog が、PyTorch のパフォーマンス解析ツールである torch.profiler の基本的な使い方と導入方法を解説した入門記事を発表しました。
エンタープライズ IT アジェンシータスクの初ベンチマーク「ITBench-AA」で最先端モデルも正答率50%未満
Artificial Analysis と IBM が共同開発した新ベンチマーク「ITBench-AA」において、最先端の AI モデルがエンタープライズ IT 業務タスクで 50% を下回るスコアしか記録できなかったと発表された。
Reachy Mini が完全ローカル動作へ
Hugging Face は、ロボット「Reachy Mini」のソフトウェアをクラウド依存から切り離し、端末上で完全にローカルで動作可能にするアップデートを発表した。これにより、通信環境に依存しない自律制御が可能となる。
Nemotron Labs の拡散言語モデルによる光速テキスト生成への道
Hugging Face Blog は、Nemotron Labs が開発した拡散言語モデルを用いて、従来の手法よりも高速なテキスト生成を実現する技術について紹介している。