#hugging face のAIニュース

67件の記事

MosaicLeaks：研究エージェントは秘密を守れるか？

Hugging Face は、AI エージェントが機密情報を漏洩するリスクを検証する「MosaicLeaks」という評価フレームワークを発表した。

Hugging Face Blog·6月19日·★★★★

LoRA を超えるか？最も人気のあるファインチューニング手法に勝てるか

Hugging Face は、現在最も普及しているファインチューニング技術である LoRA の限界を検証し、それを上回る新たな手法の可能性について議論している。

Hugging Face Blog·6月18日·★★★★

エージェント性は十分か？独自ツールを用いたオープンモデルのベンチマーク調査

Hugging Face が、独自に構築したツール環境において、オープンソースモデルがどれほど「エージェント性」を発揮できるかを評価するベンチマーク手法を発表しました。

Hugging Face Blog·6月18日·★★★★

MolmoMotion：言語指示に基づく 3D モーション予測技術の発表

Hugging Face が、言語による指示で 3D の動きを予測する新しいモデル「MolmoMotion」を発表しました。この技術は、テキスト入力から物体やキャラクターの未来の動作を推定する能力を持ちます。

Hugging Face Blog·6月18日·★★★★

Hugging Face Hub からロボットハードウェアへ：Strands Agents と LeRobot の連携

Hugging Face が、同社のプラットフォーム上で開発された Strands Agents および LeRobot を活用し、AI モデルを直接ロボットハードウェアに展開する取り組みを発表した。

Hugging Face Blog·6月17日·★★★★

エージェント型リソース発見：エージェントが検索できるようにする

Hugging Face は、AI エージェントが自律的に必要なリソースを検索・発見できる新機能「Agentic Resource Discovery」を発表した。これにより、エージェントの自律的なタスク遂行能力が向上する。

Hugging Face Blog·6月17日·★★★★

Kimi K2.7 Code（Hugging Face リポジトリ）

Moonshot AI が、複雑なソフトウェア開発ワークフローでのタスク完了能力とトークン効率を向上させたコーディング特化型エージェントモデル「Kimi K2.7 Code」を発表した。この Mixture-of-Experts 構造を持つモデルは総パラメータ数が1兆に達し、OpenAI や Anthropic と互換性のある API を通じて利用可能である。

TLDR AI·6月15日·★★★★

FineWeb を用いたストリーミング、フィルタリング、重複排除、トークン化、大規模ウェブコーパス分析のコーディングハンズオン

MarkTechPost は、大規模なデータセットをダウンロードせずに FineWeb データセットのサンプルをストリーミングし、スキーマやメタデータを調査するチュートリアルを提供しています。また、品質フィルタリングパイプラインの再現、MinHash による重複検出、GPT-2 トークナイザーを用いたトークン数検証、および有用な分析結果の生成方法を解説しています。

MarkTechPost·6月15日·★★★★

OLMO-EVAL：モデル開発ループのための評価ワークベンチ

Hugging Face が、モデル開発の効率化を目的とした評価ワークベンチ「OLMO-EVAL」を発表した。このツールは、開発者がモデルの性能を継続的に検証・改善するプロセスを支援するものである。

Hugging Face Blog·6月13日

PyTorch のプロファイリング（第 2 部）：nn.Linear から融合 MLP へ

Hugging Face Blog は、PyTorch のプロファイリング手法について解説し、従来の nn.Linear レベルから、より効率的な融合 MLP 構造への最適化プロセスを詳述している。

Hugging Face Blog·6月11日·★★★★

ストリーミング、Pandas、tiktoken を活用した NVIDIA Nemotron-Pretraining-Code-v3 メタデータからのコードデータセットパイプライン構築

MarkTechPost は、NVIDIA の大規模コード事前学習用データセット「Nemotron-Pretraining-Code-v3」のメタデータを対象に、フルダウンロードを避けてストリーミング処理し、Pandas と tiktoken を使用して分析可能なサンプルパイプラインを構築する手法を紹介している。

MarkTechPost·6月10日

開発者向け初のモデル「North Mini Code」の発表：Cohere が Hugging Face で紹介

AI 企業 Cohere は、Hugging Face Blog を通じて、開発者向けの専用モデルとして初めて「North Mini Code」を発表した。この新モデルは、コード生成や技術的タスクの支援を目的としている。

Hugging Face Blog·6月10日·★★★★

現在利用可能な Hugging Face 上の最良の無料画像生成ツール

KDnuggets が、Hugging Face プラットフォーム上で現在無料で利用できる画像生成ツールのベストリストを紹介している。

KDnuggets·6月9日·★★★★

NeuroBait：ADHD の脳にドーパミンを刺激するためにモデルをファインチューニングした

Hugging Face が、ADHD（注意欠如・多動症）を持つ人の脳にドーパミンを刺激するよう特別に調整された「NeuroBait」というAIモデルを発表しました。

Hugging Face Blog·6月9日

ClawHub セキュリティシグナル：AI スキルデータセットを用いたエンドツーエンドのセキュリティ分析と判定分類のためのコーディングガイド

MarkTechPost は、Hugging Face からデータを取得し、異なるセキュリティスキャナが AI スキルや関連ファイルをどのように評価するかを調査するチュートリアルを提供しています。また、スキャナの不一致パターンを分析した上で、SKILL.md テキストと組み合わせた実用的な機械学習パイプラインの構築方法を解説しています。

MarkTechPost·6月9日·★★★★

消えたクラッシュ：5 つのモデル経済における制御と創発

Hugging Face は、5 つのモデルが共存する経済環境において、システムクラッシュが消失した現象を分析し、制御メカニズムと創発的行動の関係性を明らかにした。

Hugging Face Blog·6月8日

パキスタン向け安全問題解決のための小型 AI ツール「Pakistan Notice Helper」の開発

Hugging Face が、パキスタンのローカルな安全性課題に対応する小型 AI ツール「Pakistan Notice Helper」を開発したと発表した。

Hugging Face Blog·6月8日

5 つのラボ、5 つの知性：小型モデルで多モデル金融ドラマを構築する（6 分読）

複数の研究機関が協力し、小型言語モデルを活用して多様な視点を持つ金融ドラマを共同開発した。この取り組みは、リソース制約下での高度な生成技術の可能性を示している。

TLDR AI·6月8日

オープンソースコミュニティがエージェント型強化学習「OpenEnv」を支援

Hugging Face のブログによると、オープンソースコミュニティがエージェント型強化学習のためのプラットフォーム「OpenEnv」の発展を支援している。

Hugging Face Blog·6月8日·★★★★

Her（ヘール）— クロード・コードセッションのための探偵ツール

Hugging Face が、Claude Code の利用セッションを監視・分析する新ツール「Her」を発表した。このツールは開発者の作業プロセスを検証し、デバッグや効率化を支援する機能を提供する。

Hugging Face Blog·6月7日

5 つのラボ、5 つの思考：小規模モデルによるマルチモデル金融ドラマの構築

Hugging Face は、5 つの研究機関が協力し、小規模な AI モデルを活用して複数の視点を持つ金融ドラマを生成する手法を発表した。

Hugging Face Blog·6月7日

ペルソナ・アトラス：著名な思考者の思考マップを可視化

Hugging Face が「Persona Atlas」を発表し、著名な人物の思考パターンや認知特性をマッピングする手法を公開した。これは AI の推論能力向上や人間理解の深化に寄与する研究である。

Hugging Face Blog·6月6日

EVA-Bench Data 2.0：3 ドメイン、121 ツール、213 シナリオ（9 分読了）

TLDR AI が公開した EVA-Bench データセットの第 2 版は、3 つのドメインにわたる 121 のツールと 213 のシナリオを含む評価データを提供し、AI ツール利用能力の評価基準を強化します。

TLDR AI·6月5日·★★★★

Nemotron 3.5 のコンテンツ安全性に関する解説（9 分読了）

NVIDIA が公開した「Nemotron 3.5」モデルのコンテンツ安全性機能について、その仕組みや性能を詳しく解説している記事です。

TLDR AI·6月5日·★★★★

あなたの言語・ドメイン、またはアクセント向けに Nemotron 3.5 ASR をファインチューニングする方法

Hugging Face は、Nemotron 3.5 ASR モデルを特定の言語や業界ドメイン、話者のアクセントに合わせてカスタマイズするファインチューニングの手順を解説した。

Hugging Face Blog·6月4日·★★★★

EVA-Bench Data 2.0：3 つのドメイン、121 のツール、213 のシナリオ

Hugging Face が公開した評価ベンチマーク「EVA-Bench Data 2.0」は、3 つのドメインにわたる 121 のツールと 213 のシナリオを含むデータセットであり、AI モデルの実用性を多角的に評価する基準を提供します。

Hugging Face Blog·6月4日·★★★★

Ideogram 4（GitHub リポジトリ）

Ideogram が、既存モデルの微調整ではなくゼロから訓練したオープンウェイトテキスト画像生成モデル「Ideogram 4」を公開しました。同社は、構造化 JSON プロンプトインターフェースや多言語テキストレンダリング機能、2K 解像度対応などの新機能を搭載しています。

TLDR AI·6月4日·★★★★

チャットボットを超えた直接選好最適化

Hugging Face は、チャットボットの分野に限定されない形で直接選好最適化（DPO）の応用範囲を広げる研究を発表しました。

Hugging Face Blog·6月3日·★★★★

Holo3.1：高速かつローカル環境でのコンピュータ操作エージェント

Hugging Face は、ローカル環境で動作する高速なコンピュータ操作エージェント「Holo3.1」を発表した。これにより、プライバシーを損なわずに効率的な自動化が可能となる。

Hugging Face Blog·6月2日

JetBrains が 12B モデルの混合専門家モデル「Mellum2」を発表

JetBrains は、推論効率を高めるための 120 億パラメータ規模の混合専門家（MoE）モデル「Mellum2」を発表した。同社はコード生成や開発支援に特化したこの新モデルの詳細を紹介している。

Hugging Face Blog·6月2日

TRL でデルタ重み同期を実装：トリリオンパラメータをハブバケットで管理

TRL は非同期強化学習において、変更されたモデルパラメータのみを送信する「デルタ重み同期」手法を導入し、データ転送量をギガバイトからメガバイトに削減した。また、Hugging Face Hub のバケット機能を活用して学習器と推論エンジンの通信を分離し、帯域幅の大幅な節約を実現した。

TLDR AI·5月28日·★★★★

3D プリンタ対応の人間型ロボット脚がロボティクス実験を加速

Hugging Face が公開した約 2,500 ドルの安価な 3D プリント製人間型ロボット脚により、研究者は実世界での AI ロボットソフトウェアテストと訓練を容易に行えるようになった。

Ars Technica AI·5月27日·★★★★

DeepSeek-V4：エージェントが実際に活用できる100万トークンコンテキスト

DeepSeekは、自律型エージェントが実際に活用できる100万トークンのコンテキスト長を実現した新モデル「DeepSeek-V4」を公開した。

Hugging Face Blog·4月24日·★★★★

QIMMA：品質重視のアラビア語LLMリーダーボード

開発チームは、アラビア語大規模言語モデルの性能を品質基準で評価するリーダーボード「QIMMA」を公開した。同ボードは、モデルの正確性と信頼性を最優先し、アラビア語処理能力を比較する。

Hugging Face Blog·4月21日

合成ペルソナで韓国語AIエージェントを実社会の属性に適合させる方法

筆者は、合成ペルソナを用いて韓国語AIエージェントを実社会の人口統計に適合させる手法を解説する。開発者はこれにより、対象属性を正確に反映したエージェントを構築できる。

Hugging Face Blog·4月21日·★★★★

AIとサイバーセキュリティの未来：オープン性が重要な理由

AI技術の進展に伴い、サイバーセキュリティ業界はオープンな情報共有と透明性を確保する必要がある。

Hugging Face Blog·4月21日

LLMアーキテクチャを理解するための私のワークフロー

著者が記事や講演、LLM-Galleryで使用するLLMアーキテクチャの図面作成ワークフローを公開した。公式技術文書から始めるが、最近の論文は詳細不足のため、公開されたモデル重みから推測する手法を説明している。

Sebastian Raschka·4月18日

Ecom-RLVE：Eコマース対話エージェントのための適応可能な検証環境

研究者がEcom-RLVEを発表した。これはEコマース対話エージェントのための適応可能な検証環境であり、AIエージェントの性能評価と改善を目的としている。

Hugging Face Blog·4月16日·★★★★

Sentence Transformersを用いたマルチモーダル埋め込み・リランカーモデルのトレーニングとファインチューニング

Sentence Transformersライブラリの開発者が、テキストと画像を統合的に処理するマルチモーダル埋め込みモデルとリランカーモデルのトレーニング・ファインチューニング手法を発表した。

Hugging Face Blog·4月16日·★★★★

ALTK-Evolve：AIエージェントのオンザジョブ学習

研究者がALTK-Evolveを開発した。AIエージェントが実務中に継続的に学習・適応する手法を提案した。

Hugging Face Blog·4月8日·★★★★

SafetensorsがPyTorch Foundationに参加

Hugging Faceが開発したセキュアなテンソル保存形式「Safetensors」が、PyTorch Foundationに正式に参加し、AIモデルの安全性向上と業界標準化を推進する。

Hugging Face Blog·4月8日·★★★★

Gemma 4のダウンロード数が200万を突破

GoogleのGemma 4は公開初週で約200万回のダウンロードを記録した。これは前モデルGemma 3の年間670万回、Gemma 2の140万回を下回る数字だが、Qwen 3.5の2700万回と比較すると依然として低い。今週伦敦で開催されるGemma 4のキーマノートに向けて注目が集まっている。

Latent Space·4月7日·★★★★