X: AK の最新記事
88件の記事
KARL:強化学習による知識エージェント
強化学習を用いた新しい知識エージェントモデルの研究論文発表
LLMエージェントとR統計の統合
分布認識検索によるLLMエージェントとR統計エコシステムの連携
SkillNet発表
AIスキルの作成・評価・接続の新手法
TencentがHY-WUを公開
Tencentが機能的神経記憶フレームワークHY-WUをHugging Faceで公開
LTX-2.3モデル公開
LTX-2.3モデルがHugging Faceでリリースされました
異種エージェント協調強化学習
複数エージェントの協調学習に関する研究発表
リアルタイム長動画生成モデル発表
Helios、リアルタイム長動画生成モデルの論文公開
BBQ-to-Image論文発表
大規模テキスト画像モデルにおける数値バウンディングボックスと色制御技術
生成報酬モデルの新手法
長さスケーリングを超えた生成報酬モデルの新たなアプローチ
多モーダル事前学習の新論文
言語モデルを超える多モーダル事前学習の研究発表
コードエージェントの限界を探る
単一リポジトリのバグ修正を超えたコードエージェントの生存可能性に関する研究論文
画像生成の空間理解向上
報酬モデリングによる画像生成の空間理解向上に関する研究発表
大規模エージェントRLによるCUDAカーネル生成
高性能CUDAカーネル生成のための大規模エージェント強化学習技術
OmniLottie: ベクターアニメ生成
パラメータ化Lottieトークンによるベクターアニメーション生成技術
画像生成の空間理解向上
報酬モデリングによる画像生成の空間理解改善に関する研究発表
dLLM: 単純拡散言語モデル発表
新しい拡散ベースの言語モデル「dLLM」の論文が公開されました。
JavisDiT++発表
音声と映像の統合生成モデルを最適化する新技術
一般世界モデルの一貫性原理
トリニティ・オブ・コンシステンシーを定義原理とする一般世界モデルの論文発表
MetaがVecGlypher発表
言語モデルによる統一ベクトルグリフ生成技術の論文公開
SkyReels-V4発表
マルチモーダル動画・音声生成・編集モデル
分子グラフ生成の新手法
階層的離散拡散モデルによる分子グラフ生成の進展
Xray-Visual Models発表
産業規模データで視覚モデルをスケーリングする新モデル
KV結合によるテスト時学習
線形アテンションとして機能する新しいテスト時学習手法の発表
言語行動事前学習によるゼロショット転送
異なるロボット間でゼロショット学習を可能にする新手法発表
拡散モデル新手法発表
Ψ-Samplersと効率的カリキュラム学習の新研究
体現LLMの反射的テスト計画
試行錯誤から学習する体現LLMの新たな研究手法
LLM拡張のデータエンジニアリング
大規模言語モデルの拡張におけるデータエンジニアリング技術について
長文コンテキスト向け新手法
3D再構築のためのテスト時トレーニング手法を発表
ロボティクス向け隠れ報酬手法
トークン確率を隠れゼロショット報酬として活用する新手法
ManCAR: 適応的逐次推論モデル
適応的テスト時計算による多様体制約潜在推論手法の発表
VLANeXtモデル構築レシピ
強力なVLAモデル構築のための手法とレシピを紹介
大規模動画推論スイート発表
新しい動画推論モデルスイートの研究論文が公開されました。
Rolling Sink: 動画生成モデルの新手法
限定的な学習とオープンエンドテストを橋渡しするオートリグレッシブ動画拡散モデル
VESPO: LLM訓練の新手法
シーケンスレベル軟方策最適化による安定したオフポリシーLLM訓練手法
SpargeAttention2発表
学習可能なスパース注意機構の新手法、ハイブリッドマスキングと蒸留を提案
Google Unified Latents発表
Googleが新しい潜在変数モデル「Unified Latents」を発表
Mobile-Agent-v3.5発表
マルチプラットフォームGUIエージェントの新モデル
RynnBrain公開
オープンな具現化基盤モデル発表