#pytorch のAIニュース
18件の記事
Miles:大規模 LLM の強化学習後学習のための PyTorch ネイティブスタック
TLDR AI は、大規模言語モデルの強化学習後学習を容易に構築・再現・運用するためのフレームワーク「Miles」を紹介した。このツールは、分散システム化が進む大規模 LLM 向けに、トレーニングの構成可能性と拡張性を高めつつ、研究者やインフラチームがコアトレーナーをカスタマイズできる設計となっている。
PyTorch の Fused MLP を活用した最適化手法(29 分読了)
TLDR AI が、PyTorch で Fused MLP(融合型多層パーセプトロン)技術を用いて深層学習モデルの計算効率を向上させる具体的な最適化手法を紹介している。
PyTorch のプロファイリング(第 2 部):nn.Linear から融合 MLP へ
Hugging Face Blog は、PyTorch のプロファイリング手法について解説し、従来の nn.Linear レベルから、より効率的な融合 MLP 構造への最適化プロセスを詳述している。
NVIDIA cuTile Python チュートリアル:Colab でベクトル加算、行列加算、行列乗算を行うタイル化 GPU カーネルの構築
NVIDIA は Colab 環境で cuTile を使用し、Python から直接効率的な CUDA スタイルカーネルを実装するチュートリアルを提供した。この手法はベクトルや行列の演算をタイル処理で高速化する。
AI エンジニアが知っておくべき Python の必須概念 5 つ
KDnuggets は、AI エンジニアが習得すべき Python の重要な概念を 5 つ紹介する記事を発表しました。
PyTorch のプロファイリング(第 1 部):torch.profiler を始めるための初心者ガイド
Hugging Face Blog が、PyTorch のパフォーマンス解析ツールである torch.profiler の基本的な使い方と導入方法を解説した入門記事を発表しました。
Google Tensor SDK Beta と LiteRT の発表
Google が機械学習 SDK「Google Tensor ML SDK」をベータ版へ移行し、開発者が Google Pixel 10 デバイスの TPU で高性能なモデルを構築・展開できる機能を LiteRT と統合して提供開始した。
PyTorch 2.12 リリースのハイライト(7 分読了)
PyTorch チームが、深層学習フレームワーク「PyTorch」の最新バージョン「2.12」をリリースし、パフォーマンス向上や新機能追加などの改善点を発表した。
メタの最適化推薦システム推論に関する詳細解説
メタが、大規模な推薦システムの推論処理を高速化・効率化する技術の詳細を58分かけて解説した。これにより、AIインフラのパフォーマンス向上に寄与する。
MN-Core 2におけるGLSLの実装
PFNインターン生は、深層学習アクセラレータ「MN-Core」でGLSLシェーダーを利用するため、GLSLコードをPyTorchコードに変換するトランスパイラを実装した。これにより、グラフィックス処理の並列性能を活用し、MN-Coreの用途拡大を図っている。
SafetensorsがPyTorch Foundationに参加
Hugging Faceが開発したセキュアなテンソル保存形式「Safetensors」が、PyTorch Foundationに正式に参加し、AIモデルの安全性向上と業界標準化を推進する。
TorchTPU:GoogleスケールのTPU上でPyTorchをネイティブ実行
GoogleがTorchTPUを発表。同社のTPUインフラ上でPyTorchワークロードを最小限のコード変更でネイティブ実行できる新エンジニアリングスタックを提供する。
depyf: 機械学習研究者のためのPyTorchコンパイラの不透明な箱を開く
PyTorch 2.xのコンパイラは深層学習プログラムを高速化するが、Pythonバイトコードレベルで動作するため不透明で、研究者には活用が難しい。depyfはこの課題を解決するツールである。
π0シリーズで使用されるaction expertをコードレベルで理解する
ABEJAのデータサイエンティストが、π0シリーズのaction expertの仕組みを、openpiの実装コードを基に解説するブログ記事。
DeepLearning.AI Proの紹介
DeepLearning.AIが、AI教育プラットフォーム「DeepLearning.AI Pro」を発表した。同プラットフォームは、実践的なAIスキルを習得するための高度な学習コンテンツとツールを提供する。
LLM評価の4つの主要アプローチを理解する(基礎から)
多肢選択ベンチマーク、検証器、リーダーボード、LLMジャッジの4つの評価手法を、コード例を交えて解説。
Qwen3をゼロから理解し実装する
主要なオープンソースLLMの一つであるQwen3について、詳細な解説と実装方法を紹介します。
1ペタバイトのデータセットで機械学習する / WebDataset入門
大規模データセットでの機械学習では、ネットワーク帯域やディスクI/Oがボトルネックとなる。本記事では、学習側での効率的なデータ処理方法について解説する。