Hugging Face Blog の最新記事

公式

49件の記事

Holo3:コンピュータ利用の新たなフロンティアを切り拓く

Holo3が、コンピュータ利用の新たなフロンティアを切り拓く技術を発表した。同技術は、ユーザー体験の革新を目指すものである。

Hugging Face Blog·4月2日

ファルコン・パーセプション

AI企業がFalcon Perceptionを発表した。この技術は高度な視覚認識システムであり、自律走行車や監視システムへの応用が期待される。

Hugging Face Blog·4月1日

Granite 4.0 3B Vision:企業文書向けのコンパクトなマルチモーダルAI

IBMが企業文書向けに開発したGranite 4.0 3B Visionは、テキストと画像を同時処理できる小型マルチモーダルAIモデルで、文書解析の効率化を実現する。

Hugging Face Blog·4月1日·★★★★

TRL v1.0:分野の前提が崩れても機能するポストトレーニングライブラリ

Hugging Faceが、AIモデルのポストトレーニング用ライブラリ「TRL v1.0」をリリースした。このライブラリは、研究分野の前提が変化しても柔軟に対応できる設計となっている。

Hugging Face Blog·3月31日·★★★★

あなたのOpenClawを解放せよ

OpenAIがOpenClawの新機能を発表し、開発者がより柔軟にAIツールをカスタマイズできるようにした。

Hugging Face Blog·3月27日

音声エージェント評価の新フレームワーク(EVA)

研究者らが音声エージェントの性能評価のための新フレームワーク「EVA」を発表した。このフレームワークは、音声AIの能力を体系的に測定する標準化された評価手法を提供する。

Hugging Face Blog·3月24日·★★★★

1日以内にドメイン固有の埋め込みモデルを構築する

研究チームが、特定分野に特化した埋め込みモデルを24時間以内に効率的に構築する手法を発表した。

Hugging Face Blog·3月21日·★★★★

Nemotron 3 Content Safety 4B:マルチモーダル・多言語コンテンツモデレーション

NVIDIAが、画像とテキストを同時に分析できるマルチモーダルAIモデル「Nemotron 3 Content Safety 4B」を発表した。このモデルは100言語に対応し、有害コンテンツの自動検出を可能にする。

Hugging Face Blog·3月21日·★★★★

Mellea 0.4.0の新機能とGraniteライブラリのリリース

Melleaがバージョン0.4.0をリリースし、Graniteライブラリを公開した。新バージョンではパフォーマンス向上と新APIが追加され、Graniteライブラリは開発者がAI機能を統合しやすくするツールを提供する。

Hugging Face Blog·3月20日·★★★★

SPEED-Benchの紹介:投機的デコーディングのための統一かつ多様なベンチマーク

研究者がSPEED-Benchを発表した。これは投機的デコーディングの性能を評価するための統一的なベンチマークであり、多様なタスクとモデルを網羅している。

Hugging Face Blog·3月19日

Nemotron 3 Nano 4B:効率的なローカルAIのためのコンパクトハイブリッドモデル

NVIDIAが、ローカル環境での効率的なAI実行を可能にするコンパクトなハイブリッドモデル「Nemotron 3 Nano 4B」を発表した。

Hugging Face Blog·3月18日·★★★★

Hugging Faceにおけるオープンソースの現状:2026年春

Hugging Faceが2026年春のオープンソース動向を発表し、プラットフォーム上でのモデル共有・協業の進展を報告した。

Hugging Face Blog·3月18日

Holotron-12B - 高スループットコンピュータ使用エージェント

Holotron-12Bは高スループットのコンピュータ使用エージェントであり、ユーザーの代わりに効率的にコンピュータ操作を実行するAIシステムです。

Hugging Face Blog·3月17日·★★★★

ヘルスケアロボティクスにおける物理的AIの台頭

研究者らが、医療現場でのロボット操作を向上させる物理的AIシステムを開発し、手術支援や患者ケアへの応用を目指している。

Hugging Face Blog·3月17日·★★★★

意味的類似性を超えて:NVIDIA NeMo Retrieverの汎用化可能なエージェント型検索パイプラインの紹介

NVIDIAが、従来の意味的類似性検索を超える汎用化可能なエージェント型検索パイプライン「NeMo Retriever」を発表した。

Hugging Face Blog·3月14日·★★★★

データサイエンティストのように考えるエージェントを構築:再利用可能なツール生成でDABStepで1位を獲得した方法

研究チームが、再利用可能なツール生成技術を用いて、データサイエンティストのように推論するAIエージェントを開発し、DABStepベンチマークで1位を達成した。

Hugging Face Blog·3月13日

NVIDIAのAI-QがDeepResearch Bench IとIIで首位を獲得

NVIDIAが開発したAI-Qが、DeepResearch Bench IとIIのベンチマークで1位を達成した。

Hugging Face Blog·3月12日·★★★★

コードコンセプト:プログラミング概念の種から生成された大規模合成データセット

研究者がプログラミング概念の種から生成した大規模合成データセット「Code Concepts」を発表した。このデータセットはAIによるコード生成や理解の研究に活用される。

Hugging Face Blog·3月12日·★★★★

NVIDIAがAI向けオープンデータを構築する方法

NVIDIAは、AIモデルの学習と開発を促進するために、大規模で多様なオープンデータセットを体系的に構築・公開している。

Hugging Face Blog·3月11日·★★★★

Hugging Face Hubにストレージバケット機能を導入

Hugging Faceが、同社のAIモデル共有プラットフォーム「Hub」にストレージバケット機能を追加した。これにより、開発者は大規模なデータセットやモデルファイルを効率的に管理できるようになる。

Hugging Face Blog·3月10日·★★★★

トークンを流し続ける:16のオープンソースRLライブラリからの教訓

研究者が16のオープンソース強化学習ライブラリを分析し、効率的なトークン管理と学習安定化のための実践的な知見を共有した。

Hugging Face Blog·3月10日·★★★★

Granite 4.0 1B Speech:コンパクトで多言語対応、エッジ向けに構築

IBMがGranite 4.0 1B Speechを発表した。これは、エッジデバイス向けに設計されたコンパクトで多言語対応の音声AIモデルである。

Hugging Face Blog·3月10日

ユリシーズ・シーケンス並列処理:100万トークンのコンテキストでのトレーニング

研究者らが、ユリシーズ・シーケンス並列処理という手法を開発し、100万トークンの長いコンテキストで大規模言語モデルを効率的にトレーニングできるようにした。

Hugging Face Blog·3月9日·★★★★

LeRobot v0.5.0:すべての次元をスケーリング

LeRobotチームがLeRobot v0.5.0をリリースし、ロボット学習のすべての次元をスケーリングする新機能を導入した。

Hugging Face Blog·3月9日

NVIDIA NeMo Evaluator Agent Skillsによる数分での対話型LLM評価

NVIDIAは、NeMo Evaluator Agent Skillsを発表した。このツールは、大規模言語モデルの対話能力を数分で自動評価できる。

Hugging Face Blog·3月7日·★★★★

組み込みプラットフォームへのロボティクスAI導入:データセット記録、VLAファインチューニング、オンデバイス最適化

研究チームが、ロボティクスAIを組み込みプラットフォームに導入するための手法を発表した。データセット記録、視覚言語行動モデルのファインチューニング、オンデバイス最適化の3つの技術を組み合わせて実現する。

Hugging Face Blog·3月5日

モジュラーディフューザーの紹介 - 拡散パイプラインのための構成可能なビルディングブロック

研究チームが、拡散モデルパイプラインのための構成可能なビルディングブロック「モジュラーディフューザー」を発表した。この技術は、画像生成AIの開発効率と柔軟性を向上させることを目的としている。

Hugging Face Blog·3月5日

PRX パート3 ― 24時間でテキストから画像生成モデルをトレーニング!

PRXチームが、わずか24時間でテキストから画像を生成するAIモデルをトレーニングする手法を発表した。この高速トレーニング手法は、AI開発の効率化とリソース削減に貢献する可能性がある。

Hugging Face Blog·3月4日

トランスフォーマーにおけるエキスパート混合(MoEs)

トランスフォーマーモデルに複数の専門家ネットワークを組み合わせるMoE手法を紹介。効率的な計算と高性能化を実現する技術で、大規模AIモデルの開発に寄与。

Hugging Face Blog·2月26日·★★★★

Jetson上でのオープンソース視覚言語モデル(VLM)のデプロイ

Jetsonプラットフォームでオープンソースの視覚言語モデルを効率的にデプロイする方法について解説。

Hugging Face Blog·2月24日·★★★★

UnslothとHugging Face Jobsで無料でAIモデルをトレーニング

UnslothとHugging Face Jobsを活用することで、効率的かつ無料でAIモデルのトレーニングが可能になります。

Hugging Face Blog·2月20日

GGMLとllama.cppがHFに参加し、ローカルAIの長期的な進歩を確保

GGMLとllama.cppがHugging Faceに参加し、オープンソースのローカルAI開発を強化し、長期的な進歩とコミュニティ主導のイノベーションを促進します。

Hugging Face Blog·2月20日·★★★★

「データ不足」の壁を乗り越える:合成ペルソナが日本のAI開発を加速

日本ではAI開発におけるデータ不足が課題だが、合成ペルソナ(人工的に生成されたユーザーデータ)を活用することで、この壁を克服し開発を加速できる可能性がある。

Hugging Face Blog·2月20日

IBMとUCバークレー、IT-BenchとMASTを用いてエンタープライズエージェントの失敗原因を診断

IBMとUCバークレーはIT-BenchとMASTというツールを開発し、企業向けAIエージェントが失敗する原因を分析・特定する手法を確立しました。

Hugging Face Blog·2月19日·★★★★

Gradioのgr.HTMLによるワンショットWebアプリケーション

Gradioのgr.HTMLコンポーネントを使うと、HTMLコードを1回書くだけで、どんなWebアプリでも簡単に作れます。

Hugging Face Blog·2月18日·★★★★

CodexとClaudeによるすべてのためのカスタムカーネル

CodexとClaudeが提供するカスタムカーネルにより、あらゆるユーザーがAIモデルを自身のニーズに合わせて最適化できるようになります。

Hugging Face Blog·2月13日·★★★★

実践におけるOpenEnv:現実世界環境でのツール利用エージェントの評価

OpenEnvを実際の環境で使用し、ツールを活用するエージェントの性能を評価する研究についての記事です。

Hugging Face Blog·2月12日·★★★★

Transformers.js v4 プレビュー版がNPMで利用可能に!

Transformers.js v4のプレビュー版がNPMで公開されました。最新バージョンではパフォーマンス向上と新機能が追加されています。

Hugging Face Blog·2月9日·★★★★

SyGra Studioの紹介

SyGra Studioは、グラフィックデザインを効率的に作成・編集できる新しいソフトウェアツールです。直感的なインターフェースと高度な機能を備え、クリエイターのワークフローを向上させます。

Hugging Face Blog·2月6日·★★★★

コミュニティ評価:ブラックボックス型リーダーボードよりもコミュニティを信頼する理由

AIモデルの評価において、不透明なリーダーボードよりもコミュニティ主導の評価を重視する重要性を主張する記事です。

Hugging Face Blog·2月4日·★★★★

H社の新Holo2モデルがUIローカライゼーションで先行

H社が新たに発表したHolo2モデルは、ユーザーインターフェースのローカライゼーション分野でリードする技術を提供する。

Hugging Face Blog·2月4日

グローバルオープンソースAIエコシステムの未来:DeepSeekからAI+へ

DeepSeekなどの企業が、オープンソースAIモデルを基盤としたグローバルなAIエコシステム「AI+」の構築を目指している。

Hugging Face Blog·2月4日

テキストから画像生成モデルの学習設計:アブレーション研究からの知見

研究者がテキストから画像生成モデルの学習設計を検証し、アブレーション研究を通じて効果的な学習手法を特定した。

Hugging Face Blog·2月3日

Daggrの紹介:プログラムでチェーンアプリを構築し、視覚的に検査

Daggrは、開発者がプログラムでチェーンアプリケーションを構築し、視覚的に検査できるツールを提供する。

Hugging Face Blog·1月29日

ClaudeにCUDAカーネルを構築させ、オープンモデルを教え込むことに成功!

Anthropic社のAIモデルClaudeが、CUDAカーネルを構築し、オープンソースモデルにその知識を伝達する能力を実証した。

Hugging Face Blog·1月28日

中国のオープンソースAIエコシステムにおけるアーキテクチャ選択:DeepSeekを超えた構築

中国の研究チームが、DeepSeekを超えるオープンソースAIエコシステムのアーキテクチャ選択について分析し、分散型開発とモデル最適化の戦略を提案した。

Hugging Face Blog·1月28日

Alyah ⭐️: アラビア語LLMにおけるエミレーツ方言能力の堅牢な評価に向けて

研究者らが、アラビア語大規模言語モデル(LLM)のエミレーツ方言理解能力を評価するための堅牢なベンチマーク「Alyah」を開発した。

Hugging Face Blog·1月27日·★★★★

GPT-OSSのエージェンシック強化学習トレーニングの実現:実践的振り返り

OpenAIが、GPT-OSSモデル向けにエージェンシック強化学習のトレーニング手法を実装し、その実践的な知見を共有した。

Hugging Face Blog·1月27日

AssetOpsBench:AIエージェントベンチマークと産業現場のギャップを埋める

研究者らが、AIエージェントの評価基準と産業現場の実態を結び付ける「AssetOpsBench」を発表した。このベンチマークは、現実の産業環境でのAIエージェントの性能評価を目的としている。

Hugging Face Blog·1月21日