AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
腾讯混元·2026年4月23日 18:50·約14分で読める

Hy3プレビュー版を公開・オープンソース化:混元再構築後の初モデル、エージェント能力が大幅に向上

#大規模言語モデル#混合专家モデル(MoE)#エージェント技術#オープンソース#腾讯混元
TL;DR

腾讯混元が295Bパラメータの高速・低速思考融合MoEモデル「Hy3 preview」をオープンソースで公開し、複雑推論・コード生成・エージェント能力の大幅向上とコスト効率の実現を目指す。

AI深層分析2026年4月23日 21:41
4
重要/ 5段階
深度40%
4
関連度30%
4
実用性20%
3
革新性10%
3

キーポイント

1

モデルアーキテクチャと仕様

総パラメータ295B、アクティブパラメータ21BのMoE構造を採用し、最大256Kのコンテキスト長に対応。

2

訓練基盤の再構築と評価方針

2026年2月に事前訓練と強化学習のインフラを再構築し、公開榜单依存から自建題目や人工評価へ転換した。

3

複雑推論・コンテキスト学習の強化

数学・科学分野の高難度ベンチマークで優位性を発揮し、CL-benchにより冗長な文脈理解と指令追従能力を向上。

4

コード生成とエージェント能力の飛躍

SWE-BenchやTerminal-Benchなど実環境ベンチマークで競争力ある結果を記録し、内部開発ワークフローにも最適化。

5

交互理解与反馈优化

通过URM与RLHF技术深度优化,显著降低事实性错误,提升对模糊/碎片化意图的理解与共情回复能力,带动元宝用户活跃度大幅增长。

6

多端产品接入与开源生态支持

已全面上线元宝、QQ、ima、腾讯文档等内部产品,并兼容OpenClaw、KiloCode等主流开源智能体框架,加速AI能力落地。

7

性能指标跃升与长链路Agent支持

在办公场景中首Token延迟降低54%、端到端耗时降47%、成功率超99.99%,可稳定驱动长达495步的复杂Agent工作流。

影響分析・編集コメントを表示

影響分析

この公開により、オープンソース界隈ではプロプライエタリモデルに匹敵するエージェント連携と実装コスト効率の実現が可能となる。ベンチマークの多様化と内部実装データの公開は、単なる数値競争から実務適用への転換を示唆しており、競合他社にもアーキテクチャ最適化と実装重視の潮流を促すだろう。

編集コメント

公式発表のPR色が強いものの、ベンチマークの実務寄りの転換とMoE設計によるコスト効率の追求は業界標準を押し上げる要因となる。オープンソースコミュニティでは実装事例と内部評価データの検証が注目される。

腾讯混元 2026-04-23 17:50 广东

image
image

再構築の第一歩

今日、腾讯混元 Hy3 preview 言語モデルが公開され、オープンソース化されました。これは高速思考と低速思考を融合した混合专家模型(Mixture of Experts, MoE)モデルで、総パラメータ数は295B、アクティブパラメータ数は21B、最大サポートされるコンテキスト長は256Kです。

今年2月、私たちは事前学習(Pre-training)および强化学习(Reinforcement Learning)のインフラストラクチャを再構築するとともに、モデルの実用性追求に向けた3つの原則を確立しました。

能力の体系化:「偏ったスキル」を推奨しません。なぜなら、コードエージェント(Code Agent)という単一の応用であっても、推論、長文処理、指示遵循(Instruction Following)、対話、コーディング、ツール利用など、多種多様な能力の深い連携が必要となるためです。

評価の真実性:「リストアップ(ベンチマーク操作)」されやすい公開ランキングからあえて離れ、独自問題の作成、最新試験への対応、人間による評価、製品ベータテストなど多角的な手法を通じて、モデルの「実戦力」を評価・改善しています。

コストパフォーマンスの追求:実用性は商業合理性と不可分です。モデルアーキテクチャと推論フレームワークの設計を深く連携させ、タスクコストを大幅に削減し、インテリジェンスが「手頃な価格で利用でき、かつ効果的に活用できる」状態を実現しています。

Hy3 previewは再構築後のトレーニングで最初に訓練されたモデルであり、混元シリーズ迄今为止最もインテリジェントなモデルです。複雑な推論、指示遵循(Instruction Following)、コンテキスト学習(Contextual Learning)、コーディング、エージェント(Agent)機能などの能力と推論パフォーマンスにおいて大幅な向上を実現しました。

・詳細なベンチマーク(Benchmark)データとケースは混元ブログ(https://hy.tencent.com/hy3-preview)にてご確認いただけます。

複雑な推論

推論能力は、モデルが各種の問題を解決する基盤です。Hy3 previewはFrontierScience OlympiadやIMO Answer Benchなどの高難度な理系推論タスクで顕著なパフォーマンスを示すとともに、最新の清華大学求真書院数学博士資格試験(26春)や全国中学生生物学オリンピック(CHSBO 2025)でも優れた成績を収め、汎化可能な強力な推論能力を備えています。

image
image

コンテキスト学習と指示遵循(Instruction Following)

実際の生産や生活の様々なシーンにおいて、雑多で冗長なコンテキストを理解し、複雑多变なルールに従うことはモデルの最大の課題です。複数のビジネスシーンからのインスピレーションに基づき、CL-benchおよびCL-bench-Lifeを提案し、モデルのコンテキスト学習能力を革新的に評価するとともに、Hy3 previewにおいてモデルのコンテキスト学習および指示遵循(Instruction Following)能力を大幅に向上させました。

image
image

・その他のケースは混元ブログ(https://hy.tencent.com/hy3-preview)にてご確認いただけます。

コーディングとエージェント(Agent)

コードとエージェント(Agent)は、Hy3 previewにおいて最も顕著な向上が見られる領域です。事前学習(Pre-training)および强化学习(Reinforcement Learning)フレームワークの再構築と、强化学习タスク規模の拡大により、SWE-Bench VerifiedやTerminal-Bench 2.0などの主流コードエージェント(Code Agent)ベンチマーク(Benchmark)、BrowseCompやWideSearchなどの主流検索エージェント(Agent)ベンチマークにおいて、競争力のある結果を比較的短期間で達成しました。

image
image

デジタル世界において、コーディングはモデルの開発環境における実行能力に焦点を当て、検索はオープンな情報空間における検索・フィルタリング・統合能力に焦点を当てます。この2つが組み合わさることで、モデルが複雑なエージェント(Agent)シナリオ(例えばOpenClawなど)において本当に実用性を持つかどうかが決まります。Hy3 previewはClawEvalやWildClawBenchなどの評価で顕著なパフォーマンスを示し、当社のエージェント(Agent)能力の包括性と実用性をさらに証明しています。

image
image

公開ランキングに加え、私たちはさらに複数の内部評価セットを構築し、モデルの実開発シーンにおけるパフォーマンスを評価しました。その結果、バックエンドエンジニアリングタスクセットのHy-Backend、実際のユーザー開発インタラクションに近づけたHy-Vibe Bench、そして高難度ソフトウェアエンジニアリング開発タスクセットのHy-SWE Maxいずれにおいても、Hy3 previewは強力な競争力を発揮しています。

image
image

各オープンソースモデルのサイズとエージェント(Agent)総合パフォーマンスを比較すると、Hy3 previewは高いコストパフォーマンスを示しています。

image
image

ケース(事例)

プロンプト:微信小程序のネイティブフレームワーク(または指定されたフレームワーク)を使用して、完全でコンパイル・実行可能なハイキングルートと旅行プランの推奨ミニアプリを開発してください。app.jsonなどのグローバル設定、すべてのページ(WXML/WXSS/JS/JSON)、および完全なモックデータを一度に出力してください。中核的な要件には、美しい画像スライダー、「今季のおすすめ」および「ルートの難易度」カテゴリナビゲーションを備えたホーム画面、行程タイムライン、美しい沿線ギャラリー、適した季節と装備の提案を含むルート詳細ページ、ローカルキャッシュお気に入り機能をサポートするマイページが含まれます。UIデザインは爽やかで自然、図文并茂である必要があり、コードロジックの完結性、欠落ファイルや参照エラーのないことを保証してください。生成後、微信開発者ツールに直接インポートして成功裏にプレビューし、完全なインタラクションを体験できることを確認してください。

モデルの出力

image
image

ケース(事例)

騰訊ドキュメントAIアシスタント「開物AI」にプロンプトを入力:「深層学習に基づく医学画像支援診断研究」に関する学術報告用PPTを作成する。全15ページ構成とし、第1ページは表紙(タイトル、著者、所属機関、日付)、第2ページは目次、第3〜4ページは研究背景と動機(医学画像診断の現状とAI支援診断のニーズ)、第5〜6ページは関連作業の総覧(既存手法の比較と課題)、第7〜9ページは研究手法と実験設計(モデルアーキテクチャ、データセット、学習戦略)、第10〜12ページは実験結果とデータ分析(精度、再現率などの指標比較グラフ)、第13ページは結論と今後の課題、第14ページは参考文献、第15ページは謝辞とする。

モデルの出力

・ 詳細なケースは混元ブログ(https://hy.tencent.com/hy3-preview)にてご確認ください。

自然な対話とユーザー理解

知能の上限を探求する一方で、私たちは常にモデルと人間のインタラクション、および人間理解への注力を続けています。そのため、元宝チームと深く連携し、URM(User-Feedback RM:ユーザーフィードバック評価モデル)を用いてユーザーの実際のフィードバックをモデリングし、RLHF(Reinforcement Learning from Human Feedback:人間からの強化学習)技術と組み合わせて微細な最適化を行いました。推論、長文処理、指示遵循、エージェントなどの能力の最適化と相まって、これによりユーザー体験が大幅に向上しました。Hy3 previewは事実誤認が顕著に減少し、ユーザーの曖昧な意図や断片的な入力をより正確に理解できるようになり、返信スタイルはより共感的で、内容は深みを増しました。元宝でのグレーテスト(段階的公開テスト)において、Hy3 previewは以前のモデルと比較して元宝のユーザー活性度を大幅に向上させたことを確認しています。

・ 詳細なケースは混元ブログ(https://hy.tencent.com/hy3-preview)にてご確認ください。

プロダクトの公開と初期フィードバック

Hy3 previewはすでに元宝、CodeBuddy、WorkBuddy、QQ、ima、QQブラウザ、騰訊ドキュメント、騰訊楽享に公開されており、微信公式アカウント、騰訊ニュース、騰訊自选股(個人投資家向けプラットフォーム)、和平精英、騰訊カスタマーサービスなどの複数のプロダクトでも順次公開されています。さらに、Hy3 previewはOpenClaw、OpenCode、KiloCodeなどの人気のあるオープンソースエージェント製品にも対応しています。

image
image

元宝のプロダクトマネージャー、Loganは次のように述べています。「Hy3 previewの開発過程において、混元と元宝は深いCo-Design(共同設計)を行いました。一方では、意図理解の精度、テキスト作成の品質、ディープサーチなどのハードコア指標におけるモデルのパフォーマンスをターゲットに向上させ;他方では、文体、筆致、EQ(感情知能)、コンテンツ構成、コンテンツの専門性に対して微細な調整を行いました。モデルとプロダクトの深い連携により、ユーザーにはより知的で『生身の人間のような』インタラクション体験をもたらしました。」

image
image

imaのプロダクトマネージャー、kayceeは次のように述べています。「現在、imaにはHy3 Previewがすでに組み込まれており、imaのナレッジベース質問応答と汎用質問応答という2つのシナリオにおいて、テスト結果はHy3 previewが長文処理能力に優れていることを示しています。特に検索関連タスクでは、回答情報の正確性、網羅性、包括性の面で良好なパフォーマンスを発揮しています。」

image
image

CodeBuddyおよびWorkBuddyのプロダクトにおいて、Hy3 previewは最初のトークン(First Token)の遅延を54%短縮し、エンドツーエンドの処理時間を47%削減し、成功率を99.99%+まで向上させました。実際のユーザー環境では、Hy3 previewは最大495ステップに及ぶ複雑なエージェントワークフローを安定して駆動しており、ドキュメント処理、データ分析、知識検索、MCP(Model Context Protocol)ツールチェーンのオーケストレーションなど、多様なオフィスワークシナリオをカバーしています。

image
image

微信公众号のプロダクトマネージャーであるAstrid氏は、公式アカウントのAI分身(AI Avatar)およびAIカスタマーサポートの専用シナリオ評価において、Hy3 previewはHy2と比較してより包括的な能力向上を示していると述べた。新モデルはユーザーの意図理解、複雑なコンテキスト(Context)の継承、知識情報の整理においてより成熟したパフォーマンスを発揮し、曖昧な質問や短い追跡質問、多輪対話に対してはユーザーの要望をより正確に把握し、より明確で安定した回答を出力できる。ナレッジベース、ユーザーの記憶、コンテキスト(Context)を組み合わせて回答を生成する際も、AI分身やAIカスタマーサポートの役割により適合し、過度な補完(脳内シミュレーション)、主観的な代入、感情的な表現が大幅に減少し、全体として「信頼性、自然さ、効率性」の高い回答目標に近いインタラクション体験を実現している。

image
image

『和平精英(Game for Peace)』のAIゲームプレイ責任者であるjessexue氏は、Hy3 previewモデルのサービス開始後、『和平精英』は直ちにAI NPC(Non-Player Character)シナリオへの統合と評価を実施し、全体的なパフォーマンスは印象的であると述べた。ゲーム外のキャラクター扮装(ロールプレイ)シナリオでは、Hy3 previewはキャラクター設定を正確に理解できるだけでなく、オープンエンドな質問に対して高度に関連性があり付加価値の高いコンテンツを出力でき、よりリアルで自然、没入感のある対話体験をもたらした。一方、ゲーム内の複雑なバトルシナリオでは、モデルの回答リズムが実際のプレイヤーのチャット体験に近く、優れた安定性と卓越した擬人化扮装能力を示し、全体的な効果は目覚ましいものとなった。

image
image

腾讯ドキュメント(Tencent Docs)のAI Agent開発責任者であるJohnny氏は、Hy3 previewモデルのサービス開始後、同チームはコアシナリオを軸に総合評価を実施したと述べた。AI PPT(プレゼンテーション資料生成)シナリオを例に挙げると、Hy3 previewモデルは前バージョン(Hy2)と比較して顕著な進歩を遂げ、生成成功率が20%向上し、評価スコアが10%向上すると同時に、生成所要時間が20%短縮された。全体的に、新モデルは評価シナリオにおいて優れたパフォーマンスを発揮し、テンプレート選択、色彩調整、アウトライン生成、コンテンツ補完の各段階において卓越した成果を示し、ハルシネーション(Hallucination)がなく、テーマに適合し、視覚効果も優れている。顕著な技術的突破を示しており、今後の応用が期待される。

image
image

QQ AIアシスタント「小Q」のプロダクト責任者であるTea氏は、Hy3 previewは前世代のHy2と比較して、小Qアシスタントのシナリオにおいて、長文テキストの初出力レイテンシ(First Token Latency)、全体応答速度、ストリーミング出力効率において顕著な最適化を実現したと述べた。中核能力面では、数学的推論パフォーマンスの向上が特に顕著であり、マルチシナリオでのインストラクションフォロー(Instruction Following)と汎化能力がさらに強化された。ツール呼び出しの推論および多輪代名詞解決(Coreference Resolution)においてもより安定かつ効率的であり、OpenClaw公式のPinchBench QQエージェントシナリオテストで顕著な成果を収め、総合体験が明確に向上した。

オープンソース、API、トークンプラン

Hy3 previewのモデル重みとコードは、GitHub、HuggingFace、ModelScope、GitCodeなどのプラットフォームで既にオープンソース化されており、vLLMやSGLangといった主流の推論フレームワーク(Inference Framework)に対応しているため、開発者は直接ダウンロードして利用可能である。(詳細リンクは記事末尾参照)

モデルアーキテクチャと推論フレームワークの深い連携、ならびに推論フレームワーク、演算子(Operator)パフォーマンス、量子化アルゴリズムの最適化により、Hy3 previewのコストは前世代モデルと比較して大幅に削減された。腾讯云(Tencent Cloud)では、競争力のあるAPI価格とカスタマイズ可能なトークンプランを提供しており、個人版の最低価格は月28元となっている。

image
image
image
image

Hy3 previewは当社の再構築における第一歩である。モデルの性能はすでに大幅に進歩しているものの、依然として既知の問題がいくつか存在する。今回のオープンソース化と公開を通じて、オープンソースコミュニティおよびユーザーからの生のフィードバックを得ていただき、Hy3正式版の実用性向上に役立てたいと考えている。同時に、私たちは引き続き大規模な事前学習(Pre-training)と強化学習の規模を拡大し、モデルの知能の上限を引き上げるとともに、腾讯の他製品とのより深い連携を通じて、実環境におけるモデルの実用性を継続的に改善し、差別化された能力を探求していく。

ご体験およびごフィードバックを心よりお待ちしております。

付録:オープンソースおよびAPI&トークンプランのリンク

GitHub:https://github.com/Tencent-Hunyuan/Hy3-preview

Hugging Face:https://huggingface.co/tencent/Hy3-preview

ModelScope:https://modelscope.cn/models/Tencent-Hunyuan/Hy3-preview

GitCode:https://ai.gitcode.com/tencent_hunyuan/Hy3-preview

腾讯云TokenPlan接続先:https://console.cloud.tencent.com/tokenhub/tokenplan/hy?regionId=1

腾讯云API接続先:

https://console.cloud.tencent.com/tokenhub/models/detail?modelId=hy3-preview&regionId=1

原文を読む

WeChatで開くためにジャンプ

原文を表示

腾讯混元 2026-04-23 17:50 广东

imageimage

重建的第一步

今天,腾讯混元 Hy3 preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型,总参数 295B,激活参数 21B,最大支持 256K 上下文长度。

今年 2 月,我们重建了预训练和强化学习的基础设施,以及模型追求实用性的三个原则:

能力体系化:我们不推崇“偏科”,因为即使是代码智能体的单一应用,也涉及推理、长文、指令、对话、代码、工具等多种能力的深度协同。

评测真实性: 我们主动跳出易被“刷榜”的公开榜单,通过自建题目、最新考试、人工评测、产品众测等多种方式评估和改进模型的“真实战斗力”。

性价比追求:实用性离不开商业合理性,我们深度协同模型架构和推理框架的设计,大幅降低任务成本,让智能用得起、用得好。

Hy3 preview 是我们重建后训练的第一个模型,也是混元迄今最智能的模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。

· 详细Bench数据和Case可访问混元博客(https://hy.tencent.com/hy3-preview)了解更多。

复杂推理

推理能力是模型解决各种问题的基础。Hy3 preview 在FrontierScience Olympiad、IMO Answer Bench 等高难度理工科推理任务中表现突出,并在最新的清华大学求真书院数学博资考(26春)和全国中学生生物学联赛(CHSBO 2025)中取得优异成绩,展现出可泛化的强推理能力。

image
image

上下文学习和指令遵循

在各种真实的生产与生活场景,理解杂乱冗长的上下文并遵从复杂多变的规则是模型的首要挑战。基于我们多种业务场景的灵感,我们提出了 CL-bench 和 CL-bench-Life 来创新性地评估模型的上下文学习能力,并在 Hy3 preview 显著地提升了模型上下文学习和指令遵循能力。

image
image

· 更多Case可访问混元博客(https://hy.tencent.com/hy3-preview)了解。

代码和智能体

代码和智能体是 Hy3 preview 提升最为显著的方向。得益于预训练及强化学习框架的重建和强化学习任务规模的提升,我们以较快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代码智能体基准以及 BrowseComp、WideSearch 等主流搜索智能体基准中取得了强竞争力的结果。

image
image

在数字世界中,代码关注的是模型在开发环境中的执行能力,搜索则聚焦于开放信息空间中的检索、筛选与整合能力,两者共同决定了模型在复杂智能体场景(例如OpenClaw)中是否真正具备可用性。Hy3 preview 在  ClawEval 和 WildClawBench 等评测中表现突出,进一步表明我们的智能体能力的全面与实用性。

image
image

除了公开榜单,我们进一步构建了多个内部的评测集,对模型在真实开发场景中的表现进行评估。结果表明,无论是在后端工程任务集 Hy-Backend,贴近真实用户开发交互的 Hy-Vibe Bench,还是高难度软件工程开发任务集 Hy-SWE Max上,Hy3 preview 均体现出了强竞争力。

image
image

比较各个开源模型的大小与智能体综合表现,Hy3 preview 展现出高性价比。

image
image

Case

prompt:请帮我使用微信小程序原生框架(或指定框架)开发一个完整、可直接编译运行的徒步路线与旅游计划推荐小程序,请一次性输出包含 app.json 等全局配置、所有页面(WXML/WXSS/JS/JSON)以及完整的 Mock数据,核心需求包括:一个带有精美图片轮播、‘当季推荐’及‘路线难度’分类导航的首页;一个包含行程时间轴、精美沿途图库、适宜季节与装备建议的路线详情页;以及一个支持本地缓存收藏功能的个人中心页,UI设计需清新自然、图文并茂,请确保代码逻辑闭环、无缺失文件或引用错误,生成后我可以直接导入微信开发者工具成功预览并体验完整交互。

模型输出

image
image

Case

在腾讯文档AI 助手“开物AI”中输入Prompt:创建一份关于"基于深度学习的医学影像辅助诊断研究"的学术汇报PPT,共15页,第1页封面(标题、作者、单位、日期),第2页目录,第3-4页研究背景与动机(医学影像诊断现状与AI辅助诊断的需求),第5-6页相关工作综述(现有方法对比与不足),第7-9页研究方法与实验设计(模型架构、数据集、训练策略),第10-12页实验结果与数据分析(准确率、召回率等指标对比图表),第13页结论与未来工作,第14页参考文献,第15页致谢。

模型输出

· 更多Case可访问混元博客(https://hy.tencent.com/hy3-preview)了解。

自然对话和用户理解

在探索智能上限的同时,我们始终关注模型与人的交互和对人的理解。为此,我们与元宝团队进行了深度的合作,使用 URM (User-Feedback RM)  对用户的真实反馈进行建模,并结合 RLHF 技术进行了细粒度的优化。结合推理、长文、指令、智能体等能力的优化,这带来了用户体验的大幅提升:Hy3 preview 的事实性错误显著降低,能更精准理解用户的模糊意图和碎片化的输入,回复风格更加共情,内容更具深度。在元宝的灰度测试上,我们看到 Hy3 preview 在元宝用户活跃度上较之前模型实现了大幅增长。

· 更多Case可访问混元博客(https://hy.tencent.com/hy3-preview)了解。

产品的上线和初步反馈

Hy3 preview 已在元宝、CodeBuddy、WorkBuddy、QQ、ima、QQ浏览器、腾讯文档、腾讯乐享上线,并在微信公众号、腾讯新闻、腾讯自选股、和平精英、腾讯客服等多个产品陆续上线中。另外,Hy3 preview 已支持流行的开源智能体产品,如 OpenClaw、OpenCode、KiloCode 等。

image
image

元宝产品经理 Logan 表示,Hy3 preview 研发过程中,混元与元宝进行了深度Co-Design。一方面针对性地提升了模型在意图理解精准度、文本创作质量、深度搜索等硬核指标上的表现;另一方面对文风、文笔、情商、内容组织和内容专业度上进行了精细化调优。模型与产品的深度协同,为用户带来了更智能且更具“活人感”的交互体验。

image
image

ima 产品经理 kaycee 表示,目前 ima 已经接入Hy3 Preview,在 ima 知识库问答和通用问答两个场景下,测试结果显示,Hy3 preview 处理长文的能力出色,特别是检索类任务,在回答信息的准确性、覆盖度和全面性上表现较好。

image
image

在CodeBuddy、WorkBuddy 产品上,Hy3 preview 首 token 延迟降低 54%、端到端时长降低 47%、成功率提升至 99.99%+。实际用户环境中,Hy3 preview 已稳定驱动最长 495 步的复杂 Agent 工作流,覆盖文档处理、数据分析、知识检索、MCP 工具链编排等多样化办公场景。

image
image

微信公众号产品经理 Astrid 表示,在公众号AI 分身和 AI 客服的场景专项评测中,Hy3 preview 展现出相比 Hy2更全面的能力升级。新模型在用户意图理解、复杂上下文承接和知识信息组织方面表现更成熟,面对模糊提问、短句追问和多轮对话时,能够更准确地把握用户诉求,并输出更清晰、更稳定的回复。结合知识库、用户记忆与上下文生成回答时更贴合AI 分身和 AI 客服的角色,过度脑补、主观代入和情绪化表达显著减少,使整体交互体验更贴近“可信、自然、高效”的回复目标。

image
image

和平精英AI玩法负责人jessexue表示,Hy3 preview 模型上线后,和平精英第一时间在 AI NPC 场景中完成接入并开展评测,整体表现令人印象深刻。在游戏局外的人设扮演场景中,Hy3 preview 不仅能够精准理解角色设定,还能针对开放性问题输出高度关联、富有增量价值的内容,带来了更加真实、自然、沉浸的对话体验。而在游戏局内的复杂对战场景中,模型回复节奏贴近真实玩家聊天体验,展现出优秀的稳定性与出色的拟人化扮演能力,整体效果表现亮眼。

image
image

腾讯文档AI Agent 研发负责人 Johnny 表示,Hy3 preview 模型上线后,腾讯文档 Agent 团队围绕核心场景开展综合评测,以 AI PPT 场景为例,Hy3 preview模型较上一版本(Hy2)取得了显著进步:生成成功率提升 20%,评测得分提升 10%,同时生成耗时缩短 20%。整体而言,新模型在评测场景中表现优异,在模版选择,色彩匹配,生成大纲,补充内容多个阶段,均体现出优秀的表现,无幻觉,契合主题,视觉效果好,展现了明显的技术突破,后续应用值得期待。

image
image

QQ AI助手 小Q产品负责人Tea表示,Hy3 preview 相较上一代Hy2,在小Q助手场景上,新模型在长文本首字节时延、整体响应速度与流式输出效率方面显著优化;核心能力上,数学推理表现提升尤为明显,多场景指令遵循与泛化能力进一步增强;在工具调用推理及多轮指代消解方面表现更稳定高效,在 OpenClaw官方 PinchBench QQ智能体场景测试中取得突出效果,综合体验实现明显跃升。

开源、API、Token Plan

Hy3 preview 的模型权重、代码已在 GitHub、HuggingFace、ModelScope、GitCode 等平台开源,支持 vLLM、SGLang 等主流推理框架,开发者可以直接下载使用。(详细链接见文末)

得益于模型架构和推理框架的深度协同,以及我们在推理框架、算子性能、量化算法等方面的优化,Hy3 preview 的成本相比上一代模型大幅下降。在腾讯云上,我们推出了有竞争力的 API 价格以及定制化的 Token Plan,个人版定价最低28元/月。

image
image
image
image

Hy3 preview 是我们重建的第一步。虽然模型效果已经取得了巨大进步,但仍存在一些已知问题,我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升 Hy3 正式版的实用性。与此同时,我们也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯更多产品的深入协同,持续改进模型在真实场景中的实用性并探索差异化能力。

欢迎大家体验并给我们反馈。

附:开源和 API & Token Plan 链接

Github:https://github.com/Tencent-Hunyuan/Hy3-preview

Hugging Face:https://huggingface.co/tencent/Hy3-preview

ModelScope:https://modelscope.cn/models/Tencent-Hunyuan/Hy3-preview

GitCode:https://ai.gitcode.com/tencent_hunyuan/Hy3-preview

腾讯云TokenPlan接入地址:https://console.cloud.tencent.com/tokenhub/tokenplan/hy?regionId=1

腾讯云API接入地址:

https://console.cloud.tencent.com/tokenhub/models/detail?modelId=hy3-preview&regionId=1

阅读原文

跳转微信打开

この記事をシェア

関連記事

月之暗面 Kimi★42026年4月21日 00:34

Kimi K2.6をリリースおよびオープンソース化し、コードとエージェントクラスタ能力を全面的に強化

Kimi開発チームはAIモデル「K2.6」をリリースしオープンソース化した。同モデルはコード処理能力とエージェントクラスタの運用性能を大幅に強化した。

The Verge AI★52026年6月2日 01:40

Anthropic が正式に株式公開を申請

AI 企業 Anthropic は、米証券取引委員会(SEC)に対して株式公開(IPO)の申請書を提出し、市場への上場プロセスを開始した。これは OpenAI との競合において先手を打つ重要なマイルストーンである。

The Verge AI★42026年5月27日 21:00

教皇は AGI に夢中ではない

レオ14世教皇が AI の社会的影響を論じた回勅「Magnifica Humanitas」を発表し、AI の利用は技術問題ではなく人権や自由に関わるものだと警告した。

ニュース一覧に戻る元記事を読む