AI在线 AI在线

腾讯自研大模型混元2.0发布:多方面能力提升

腾讯自研大模型混元2.0(Tencent HY2.0)正式发布,与此同时,DeepSeek V3.2也逐步接入腾讯生态。 目前,这两大模型已在元宝、ima等腾讯AI原生应用中率先上线,腾讯云也同步开放了相关模型的API及平台服务。 全新发布的Tencent HY2.0采用混合专家(MoE)架构,总参数量高达406B(激活参数32B),支持256K超长上下文窗口,其推理能力和效率在业界处于领先地位。

腾讯自研大模型混元2.0(Tencent HY2.0)正式发布,与此同时,DeepSeek V3.2也逐步接入腾讯生态。目前,这两大模型已在元宝、ima等腾讯AI原生应用中率先上线,腾讯云也同步开放了相关模型的API及平台服务。

全新发布的Tencent HY2.0采用混合专家(MoE)架构,总参数量高达406B(激活参数32B),支持256K超长上下文窗口,其推理能力和效率在业界处于领先地位。

腾讯混元2. 0 正式发布:推理能力/效率业界领先

与上一版本(Hunyuan-T1-20250822)模型相比,HY2.0Think在预训练数据和强化学习策略上有了显著改进。在数学、科学、代码、指令遵循等复杂推理场景中,其综合表现稳居国内第一梯队,泛化性也大幅提升。

在数学科学知识推理方面,HY2.0Think使用高质量数据进行Large Rollout强化学习,推理能力大幅增强。在国际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛MIT数学竞赛(HMMT2025)等权威测试中,该模型取得了一流成绩。结合预训练数据的进步,模型在极度考验知识水平的Humanitys Last Exam(HLE)和泛化性的ARC AGI等任务上也有大幅进步。

腾讯混元2. 0 正式发布:推理能力/效率业界领先

在指令遵循与长文多轮能力上,HY2.0Think通过重要性采样修正缓解了训练和推理不一致问题,实现了长窗口RL的高效稳定训练。同时,借助多样化可验证的任务沙盒以及基于打分准则的强化学习,该模型在Multi Challenge等指令遵循和多轮任务上的效果显著提升。

代码与智能体能力方面,腾讯构建了规模化的可验证环境及高质量合成数据,极大增强了模型在Agentic Coding及复杂工具调用场景下的落地能力。在SWE-bench Verified及Tau2-Bench等面向真实应用场景的智能体任务上,该模型实现了跃升。

相关资讯

Deepseek崛起挑战霸主!a16z最新AI应用Top100榜单发布,17家新秀强势入围前50!

风险投资公司 Andreessen Horowitz (a16z) 最新发布的消费者人工智能领域报告揭示了显著的市场动态。 报告追踪了排名前100的消费级 AI 应用,通过 Similarweb 的网络访问数据和 Sensor Tower 的移动应用数据进行排名,每两年更新一次。 最新排名显示,自2024年8月以来,有17家新公司跻身前50名,标志着市场格局的重大变化。
3/17/2025 10:30:00 AM
AI在线

百度世界2025将于11月13日举办:聚焦大模型技术、AI原生应用与全球化战略

百度年度科技盛会即将拉开帷幕。 2025 年 11 月 13 日,百度将在北京举办百度世界 2025 大会,此次活动将围绕三大核心主题展开,包括大模型技术深度、AI原生应用生态广度以及全球出海战略。 这场盛会被视为百度未来十年发展的重要里程碑,将展示公司如何利用AI技术在国内外市场实现更大突破。
10/14/2025 2:46:32 PM
AI在线

DeepSeek-V3 模型完成小版本升级,已可试用体验

DeepSeek 在其官方交流群宣布称,DeepSeek-V3 模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API 接口和使用方式保持不变。
3/24/2025 9:10:06 PM
远洋