#hugging face のAIニュース
67件の記事
MosaicLeaks:研究エージェントは秘密を守れるか?
Hugging Face は、AI エージェントが機密情報を漏洩するリスクを検証する「MosaicLeaks」という評価フレームワークを発表した。
LoRA を超えるか?最も人気のあるファインチューニング手法に勝てるか
Hugging Face は、現在最も普及しているファインチューニング技術である LoRA の限界を検証し、それを上回る新たな手法の可能性について議論している。
エージェント性は十分か?独自ツールを用いたオープンモデルのベンチマーク調査
Hugging Face が、独自に構築したツール環境において、オープンソースモデルがどれほど「エージェント性」を発揮できるかを評価するベンチマーク手法を発表しました。
MolmoMotion:言語指示に基づく 3D モーション予測技術の発表
Hugging Face が、言語による指示で 3D の動きを予測する新しいモデル「MolmoMotion」を発表しました。この技術は、テキスト入力から物体やキャラクターの未来の動作を推定する能力を持ちます。
Hugging Face Hub からロボットハードウェアへ:Strands Agents と LeRobot の連携
Hugging Face が、同社のプラットフォーム上で開発された Strands Agents および LeRobot を活用し、AI モデルを直接ロボットハードウェアに展開する取り組みを発表した。
エージェント型リソース発見:エージェントが検索できるようにする
Hugging Face は、AI エージェントが自律的に必要なリソースを検索・発見できる新機能「Agentic Resource Discovery」を発表した。これにより、エージェントの自律的なタスク遂行能力が向上する。
Kimi K2.7 Code(Hugging Face リポジトリ)
Moonshot AI が、複雑なソフトウェア開発ワークフローでのタスク完了能力とトークン効率を向上させたコーディング特化型エージェントモデル「Kimi K2.7 Code」を発表した。この Mixture-of-Experts 構造を持つモデルは総パラメータ数が1兆に達し、OpenAI や Anthropic と互換性のある API を通じて利用可能である。
FineWeb を用いたストリーミング、フィルタリング、重複排除、トークン化、大規模ウェブコーパス分析のコーディングハンズオン
MarkTechPost は、大規模なデータセットをダウンロードせずに FineWeb データセットのサンプルをストリーミングし、スキーマやメタデータを調査するチュートリアルを提供しています。また、品質フィルタリングパイプラインの再現、MinHash による重複検出、GPT-2 トークナイザーを用いたトークン数検証、および有用な分析結果の生成方法を解説しています。
OLMO-EVAL:モデル開発ループのための評価ワークベンチ
Hugging Face が、モデル開発の効率化を目的とした評価ワークベンチ「OLMO-EVAL」を発表した。このツールは、開発者がモデルの性能を継続的に検証・改善するプロセスを支援するものである。
PyTorch のプロファイリング(第 2 部):nn.Linear から融合 MLP へ
Hugging Face Blog は、PyTorch のプロファイリング手法について解説し、従来の nn.Linear レベルから、より効率的な融合 MLP 構造への最適化プロセスを詳述している。
ストリーミング、Pandas、tiktoken を活用した NVIDIA Nemotron-Pretraining-Code-v3 メタデータからのコードデータセットパイプライン構築
MarkTechPost は、NVIDIA の大規模コード事前学習用データセット「Nemotron-Pretraining-Code-v3」のメタデータを対象に、フルダウンロードを避けてストリーミング処理し、Pandas と tiktoken を使用して分析可能なサンプルパイプラインを構築する手法を紹介している。
開発者向け初のモデル「North Mini Code」の発表:Cohere が Hugging Face で紹介
AI 企業 Cohere は、Hugging Face Blog を通じて、開発者向けの専用モデルとして初めて「North Mini Code」を発表した。この新モデルは、コード生成や技術的タスクの支援を目的としている。
現在利用可能な Hugging Face 上の最良の無料画像生成ツール
KDnuggets が、Hugging Face プラットフォーム上で現在無料で利用できる画像生成ツールのベストリストを紹介している。
NeuroBait:ADHD の脳にドーパミンを刺激するためにモデルをファインチューニングした
Hugging Face が、ADHD(注意欠如・多動症)を持つ人の脳にドーパミンを刺激するよう特別に調整された「NeuroBait」というAIモデルを発表しました。
ClawHub セキュリティシグナル:AI スキルデータセットを用いたエンドツーエンドのセキュリティ分析と判定分類のためのコーディングガイド
MarkTechPost は、Hugging Face からデータを取得し、異なるセキュリティスキャナが AI スキルや関連ファイルをどのように評価するかを調査するチュートリアルを提供しています。また、スキャナの不一致パターンを分析した上で、SKILL.md テキストと組み合わせた実用的な機械学習パイプラインの構築方法を解説しています。
消えたクラッシュ:5 つのモデル経済における制御と創発
Hugging Face は、5 つのモデルが共存する経済環境において、システムクラッシュが消失した現象を分析し、制御メカニズムと創発的行動の関係性を明らかにした。
パキスタン向け安全問題解決のための小型 AI ツール「Pakistan Notice Helper」の開発
Hugging Face が、パキスタンのローカルな安全性課題に対応する小型 AI ツール「Pakistan Notice Helper」を開発したと発表した。
5 つのラボ、5 つの知性:小型モデルで多モデル金融ドラマを構築する(6 分読)
複数の研究機関が協力し、小型言語モデルを活用して多様な視点を持つ金融ドラマを共同開発した。この取り組みは、リソース制約下での高度な生成技術の可能性を示している。
オープンソースコミュニティがエージェント型強化学習「OpenEnv」を支援
Hugging Face のブログによると、オープンソースコミュニティがエージェント型強化学習のためのプラットフォーム「OpenEnv」の発展を支援している。
Her(ヘール)— クロード・コードセッションのための探偵ツール
Hugging Face が、Claude Code の利用セッションを監視・分析する新ツール「Her」を発表した。このツールは開発者の作業プロセスを検証し、デバッグや効率化を支援する機能を提供する。
5 つのラボ、5 つの思考:小規模モデルによるマルチモデル金融ドラマの構築
Hugging Face は、5 つの研究機関が協力し、小規模な AI モデルを活用して複数の視点を持つ金融ドラマを生成する手法を発表した。
ペルソナ・アトラス:著名な思考者の思考マップを可視化
Hugging Face が「Persona Atlas」を発表し、著名な人物の思考パターンや認知特性をマッピングする手法を公開した。これは AI の推論能力向上や人間理解の深化に寄与する研究である。
EVA-Bench Data 2.0:3 ドメイン、121 ツール、213 シナリオ(9 分読了)
TLDR AI が公開した EVA-Bench データセットの第 2 版は、3 つのドメインにわたる 121 のツールと 213 のシナリオを含む評価データを提供し、AI ツール利用能力の評価基準を強化します。
Nemotron 3.5 のコンテンツ安全性に関する解説(9 分読了)
NVIDIA が公開した「Nemotron 3.5」モデルのコンテンツ安全性機能について、その仕組みや性能を詳しく解説している記事です。
あなたの言語・ドメイン、またはアクセント向けに Nemotron 3.5 ASR をファインチューニングする方法
Hugging Face は、Nemotron 3.5 ASR モデルを特定の言語や業界ドメイン、話者のアクセントに合わせてカスタマイズするファインチューニングの手順を解説した。
EVA-Bench Data 2.0:3 つのドメイン、121 のツール、213 のシナリオ
Hugging Face が公開した評価ベンチマーク「EVA-Bench Data 2.0」は、3 つのドメインにわたる 121 のツールと 213 のシナリオを含むデータセットであり、AI モデルの実用性を多角的に評価する基準を提供します。
Ideogram 4(GitHub リポジトリ)
Ideogram が、既存モデルの微調整ではなくゼロから訓練したオープンウェイトテキスト画像生成モデル「Ideogram 4」を公開しました。同社は、構造化 JSON プロンプトインターフェースや多言語テキストレンダリング機能、2K 解像度対応などの新機能を搭載しています。
チャットボットを超えた直接選好最適化
Hugging Face は、チャットボットの分野に限定されない形で直接選好最適化(DPO)の応用範囲を広げる研究を発表しました。
Holo3.1:高速かつローカル環境でのコンピュータ操作エージェント
Hugging Face は、ローカル環境で動作する高速なコンピュータ操作エージェント「Holo3.1」を発表した。これにより、プライバシーを損なわずに効率的な自動化が可能となる。
JetBrains が 12B モデルの混合専門家モデル「Mellum2」を発表
JetBrains は、推論効率を高めるための 120 億パラメータ規模の混合専門家(MoE)モデル「Mellum2」を発表した。同社はコード生成や開発支援に特化したこの新モデルの詳細を紹介している。
TRL でデルタ重み同期を実装:トリリオンパラメータをハブバケットで管理
TRL は非同期強化学習において、変更されたモデルパラメータのみを送信する「デルタ重み同期」手法を導入し、データ転送量をギガバイトからメガバイトに削減した。また、Hugging Face Hub のバケット機能を活用して学習器と推論エンジンの通信を分離し、帯域幅の大幅な節約を実現した。
3D プリンタ対応の人間型ロボット脚がロボティクス実験を加速
Hugging Face が公開した約 2,500 ドルの安価な 3D プリント製人間型ロボット脚により、研究者は実世界での AI ロボットソフトウェアテストと訓練を容易に行えるようになった。
DeepSeek-V4:エージェントが実際に活用できる100万トークンコンテキスト
DeepSeekは、自律型エージェントが実際に活用できる100万トークンのコンテキスト長を実現した新モデル「DeepSeek-V4」を公開した。
QIMMA:品質重視のアラビア語LLMリーダーボード
開発チームは、アラビア語大規模言語モデルの性能を品質基準で評価するリーダーボード「QIMMA」を公開した。同ボードは、モデルの正確性と信頼性を最優先し、アラビア語処理能力を比較する。
合成ペルソナで韓国語AIエージェントを実社会の属性に適合させる方法
筆者は、合成ペルソナを用いて韓国語AIエージェントを実社会の人口統計に適合させる手法を解説する。開発者はこれにより、対象属性を正確に反映したエージェントを構築できる。
AIとサイバーセキュリティの未来:オープン性が重要な理由
AI技術の進展に伴い、サイバーセキュリティ業界はオープンな情報共有と透明性を確保する必要がある。
LLMアーキテクチャを理解するための私のワークフロー
著者が記事や講演、LLM-Galleryで使用するLLMアーキテクチャの図面作成ワークフローを公開した。公式技術文書から始めるが、最近の論文は詳細不足のため、公開されたモデル重みから推測する手法を説明している。
Ecom-RLVE:Eコマース対話エージェントのための適応可能な検証環境
研究者がEcom-RLVEを発表した。これはEコマース対話エージェントのための適応可能な検証環境であり、AIエージェントの性能評価と改善を目的としている。
Sentence Transformersを用いたマルチモーダル埋め込み・リランカーモデルのトレーニングとファインチューニング
Sentence Transformersライブラリの開発者が、テキストと画像を統合的に処理するマルチモーダル埋め込みモデルとリランカーモデルのトレーニング・ファインチューニング手法を発表した。
ALTK-Evolve:AIエージェントのオンザジョブ学習
研究者がALTK-Evolveを開発した。AIエージェントが実務中に継続的に学習・適応する手法を提案した。
SafetensorsがPyTorch Foundationに参加
Hugging Faceが開発したセキュアなテンソル保存形式「Safetensors」が、PyTorch Foundationに正式に参加し、AIモデルの安全性向上と業界標準化を推進する。
Gemma 4のダウンロード数が200万を突破
GoogleのGemma 4は公開初週で約200万回のダウンロードを記録した。これは前モデルGemma 3の年間670万回、Gemma 2の140万回を下回る数字だが、Qwen 3.5の2700万回と比較すると依然として低い。今週伦敦で開催されるGemma 4のキーマノートに向けて注目が集まっている。
Holo3:コンピュータ利用の新たなフロンティアを切り拓く
Holo3が、コンピュータ利用の新たなフロンティアを切り拓く技術を発表した。同技術は、ユーザー体験の革新を目指すものである。
TRL v1.0:分野の前提が崩れても機能するポストトレーニングライブラリ
Hugging Faceが、AIモデルのポストトレーニング用ライブラリ「TRL v1.0」をリリースした。このライブラリは、研究分野の前提が変化しても柔軟に対応できる設計となっている。
Mr. Chatterboxは(弱い)ビクトリア朝時代の倫理的に訓練されたモデルで、自身のコンピュータで実行可能
Trip Venturella氏が、英国図書館の著作権切れテキストのみで訓練した言語モデル「Mr. Chatterbox」を公開した。同モデルは1837年から1899年に出版された28,000以上のビクトリア朝英国テキストで完全に一から訓練されている。
あなたのOpenClawを解放せよ
OpenAIがOpenClawの新機能を発表し、開発者がより柔軟にAIツールをカスタマイズできるようにした。
SPEED-Benchの紹介:投機的デコーディングのための統一かつ多様なベンチマーク
研究者がSPEED-Benchを発表した。これは投機的デコーディングの性能を評価するための統一的なベンチマークであり、多様なタスクとモデルを網羅している。
Hugging Faceにおけるオープンソースの現状:2026年春
Hugging Faceが2026年春のオープンソース動向を発表し、プラットフォーム上でのモデル共有・協業の進展を報告した。
NVIDIAがAI向けオープンデータを構築する方法
NVIDIAは、AIモデルの学習と開発を促進するために、大規模で多様なオープンデータセットを体系的に構築・公開している。
ユリシーズ・シーケンス並列処理:100万トークンのコンテキストでのトレーニング
研究者らが、ユリシーズ・シーケンス並列処理という手法を開発し、100万トークンの長いコンテキストで大規模言語モデルを効率的にトレーニングできるようにした。