X: AK の最新記事

88件の記事

KARL:強化学習による知識エージェント

強化学習を用いた新しい知識エージェントモデルの研究論文発表

X: AK·3月10日

LLMエージェントとR統計の統合

分布認識検索によるLLMエージェントとR統計エコシステムの連携

X: AK·3月7日

SkillNet発表

AIスキルの作成・評価・接続の新手法

X: AK·3月7日

TencentがHY-WUを公開

Tencentが機能的神経記憶フレームワークHY-WUをHugging Faceで公開

X: AK·3月6日

LTX-2.3モデル公開

LTX-2.3モデルがHugging Faceでリリースされました

X: AK·3月6日

異種エージェント協調強化学習

複数エージェントの協調学習に関する研究発表

X: AK·3月6日

リアルタイム長動画生成モデル発表

Helios、リアルタイム長動画生成モデルの論文公開

X: AK·3月5日

BBQ-to-Image論文発表

大規模テキスト画像モデルにおける数値バウンディングボックスと色制御技術

X: AK·3月5日

生成報酬モデルの新手法

長さスケーリングを超えた生成報酬モデルの新たなアプローチ

X: AK·3月5日

多モーダル事前学習の新論文

言語モデルを超える多モーダル事前学習の研究発表

X: AK·3月5日·★★★★

コードエージェントの限界を探る

単一リポジトリのバグ修正を超えたコードエージェントの生存可能性に関する研究論文

X: AK·3月5日

画像生成の空間理解向上

報酬モデリングによる画像生成の空間理解向上に関する研究発表

X: AK·3月4日·★★★★

大規模エージェントRLによるCUDAカーネル生成

高性能CUDAカーネル生成のための大規模エージェント強化学習技術

X: AK·3月4日

OmniLottie: ベクターアニメ生成

パラメータ化Lottieトークンによるベクターアニメーション生成技術

X: AK·3月4日

画像生成の空間理解向上

報酬モデリングによる画像生成の空間理解改善に関する研究発表

X: AK·3月3日·★★★★

dLLM: 単純拡散言語モデル発表

新しい拡散ベースの言語モデル「dLLM」の論文が公開されました。

X: AK·3月3日

JavisDiT++発表

音声と映像の統合生成モデルを最適化する新技術

X: AK·3月2日

一般世界モデルの一貫性原理

トリニティ・オブ・コンシステンシーを定義原理とする一般世界モデルの論文発表

X: AK·2月28日

MetaがVecGlypher発表

言語モデルによる統一ベクトルグリフ生成技術の論文公開

X: AK·2月27日

SkyReels-V4発表

マルチモーダル動画・音声生成・編集モデル

X: AK·2月27日

分子グラフ生成の新手法

階層的離散拡散モデルによる分子グラフ生成の進展

X: AK·2月27日

Xray-Visual Models発表

産業規模データで視覚モデルをスケーリングする新モデル

X: AK·2月26日

KV結合によるテスト時学習

線形アテンションとして機能する新しいテスト時学習手法の発表

X: AK·2月26日·★★★★

言語行動事前学習によるゼロショット転送

異なるロボット間でゼロショット学習を可能にする新手法発表

X: AK·2月26日·★★★★

拡散モデル新手法発表

Ψ-Samplersと効率的カリキュラム学習の新研究

X: AK·2月26日

体現LLMの反射的テスト計画

試行錯誤から学習する体現LLMの新たな研究手法

X: AK·2月26日·★★★★

LLM拡張のデータエンジニアリング

大規模言語モデルの拡張におけるデータエンジニアリング技術について

X: AK·2月26日

長文コンテキスト向け新手法

3D再構築のためのテスト時トレーニング手法を発表

X: AK·2月25日

ロボティクス向け隠れ報酬手法

トークン確率を隠れゼロショット報酬として活用する新手法

X: AK·2月25日·★★★★

ManCAR: 適応的逐次推論モデル

適応的テスト時計算による多様体制約潜在推論手法の発表

X: AK·2月25日

VLANeXtモデル構築レシピ

強力なVLAモデル構築のための手法とレシピを紹介

X: AK·2月25日·★★★★

大規模動画推論スイート発表

新しい動画推論モデルスイートの研究論文が公開されました。

X: AK·2月25日

Rolling Sink: 動画生成モデルの新手法

限定的な学習とオープンエンドテストを橋渡しするオートリグレッシブ動画拡散モデル

X: AK·2月25日·★★★★

VESPO: LLM訓練の新手法

シーケンスレベル軟方策最適化による安定したオフポリシーLLM訓練手法

X: AK·2月23日·★★★★

SpargeAttention2発表

学習可能なスパース注意機構の新手法、ハイブリッドマスキングと蒸留を提案

X: AK·2月21日·★★★★

Google Unified Latents発表

Googleが新しい潜在変数モデル「Unified Latents」を発表

X: AK·2月20日·★★★★

Mobile-Agent-v3.5発表

マルチプラットフォームGUIエージェントの新モデル

X: AK·2月20日

RynnBrain公開

オープンな具現化基盤モデル発表

X: AK·2月20日