资讯列表
阿里云推出最新通义千问 QwQ-32B 推理模型,仅 1/20 参数媲美 DeepSeek R1
通义千问官方今日宣布推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。
3/6/2025 7:08:05 AM
问舟
为什么 Qwen 能自我改进推理,Llama 却不行?斯坦福找到了原理
给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行? 当遇到困难问题时,人类会花时间深入思考以找到解决方案。 在 AI 领域,最近的一些大语言模型在通过强化学习进行自我改进训练时,也已经开始表现出类似的推理行为。
3/6/2025 6:00:00 AM
机器之心
全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理
就在刚刚,我们在未经监督微调的2B模型上,见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」! 这一成就,再次让AI社区轰动。 博客地址::,能成功扩展到多模态推理领域吗?
3/6/2025 1:00:00 AM
新智元
C#与人工智能的奇妙融合:探索AI在.NET生态中的无限可能!
在当今数字化时代,人工智能(AI)已经成为推动各行业发展的重要力量。 C#作为一种广泛应用的编程语言,在.NET生态中也逐渐与AI技术实现了深度融合,为开发者带来了无限的可能性。 本文将介绍C#在人工智能领域的应用,讲解使用ML.NET进行机器学习模型训练与部署的方法,以及如何利用神经网络加速库提升效率,并通过图像识别、自然语言处理等实际案例,激发读者对C#与AI结合的探索热情。
3/6/2025 12:38:08 AM
cocan
AI 正在重塑 UI 和体验,这场变革才刚刚开始
编者按:AI 的出现,正在隐形地重构我们熟知的交互模式,推动着 UI 范式历史性地进化。 但是,但是仅仅只在目前已有的 UI 上打 AI 补丁就够了吗? 当然不是,这篇来自 Tetiana Sydorenko 的文章重新回溯了设计交互的历史,并且洞悉了 AI 加入之后,这场变革的内在逻辑链,揭示了从操作指令到 AI 意图识别的设计范式转变,对于资深的设计从业者而言,新的契机藏在其中。
3/6/2025 12:32:02 AM
Tetiana Sydorenko
我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具,看谁更厉害!
先给 DeepSeek 泼一盆冷水,DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。 下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程,功能虽小,但还是能看出差距的。 这两天 Trae 不是推出了国内版吗 (), 搭载豆包和 DeepSeek 大模型,因为之前 Trae 国际版是支持 Claude Sonnet 的,最开始是 3.5,后来 Claude 升级了 3.7,隔了一天 Trae 就跟进了,而且也是完全免费的。
3/6/2025 12:22:00 AM
风筝
MegaSynth:用70万合成数据突破3D场景重建瓶颈,PSNR提升1.8dB!
一眼概览MegaSynth 提出了一种基于非语义合成数据的大规模 3D 场景重建方法,生成 70 万个合成场景数据集,训练大型重建模型(LRMs),相比使用真实数据训练的模型,PSNR 提升 1.2~1.8 dB,显著增强 3D 场景重建的广覆盖能力。 核心问题当前 3D 场景重建方法受限于:数据规模受限:现有真实数据集 DL3DV 仅 10K 场景,远小于物体级数据集(如 Objaverse 80 万个实例)。 数据分布不理想:现有数据集多为人工采集,难以确保场景多样性,摄像机运动范围受限,且可能包含噪声和不精确标注。
3/6/2025 12:15:00 AM
萍哥学AI
DeepSeek+Drawio一键生成20多种图表,90%都不知道的技巧(附保姆级教程)
大家好,我是岳哥。 DeepSeek目前还不支持直接画图,但是我们借助一些第三方工具,还是可以达到生成图表的效果。 今天继续给大家分享工作中的流程图,甘特图,统计图,如何通过DeepSeek来生成。
3/6/2025 12:08:00 AM
、平凡世界
韩国 Newnal 公司推出独特形态“AI 手机”:上下双屏设计,顶屏内置专属数字化身
用户的外貌、声音及个人有关信息都被用来创造一个可在手机主屏幕上方小屏幕中活动并能对话的虚拟分身。只需按下手机侧面的方形按钮即可召唤它,然后吩咐它做事。
3/5/2025 10:32:33 PM
清源
上海交大今年增加 150 名本科招生名额,扩招 AI、集成电路等学科
据上海交通大学公众号消息,2025年,学校将继续增加150名本科招生名额,重点面向国家急需的前沿技术和新兴业态,扩大人工智能、集成电路、生物医药、医疗健康、新能源等学科领域的招生规模。
3/5/2025 9:17:14 PM
清源
即梦AI推全新“动作模仿” 功能:人物图片+参考视频生成同款动作视频
即梦 AI 发布了一项全新的 “动作模仿” 功能,旨在为用户提供更加生动和真实的 AI 视频创作体验。 这项功能由字节跳动的智能创作数字人团队提供技术支持,允许用户只需通过即梦 AI 的数字人入口,上传一张人物图片和一条参考视频,即可生成动态视频,让图片中的人物能够模仿参考视频中的动作,并准确还原情绪。 根据即梦 AI 的官方介绍,该 “动作模仿” 功能支持肖像、半身及全身等多种画幅类型,能够同步还原不同画幅下的肢体动作和人脸表情。
3/5/2025 9:12:00 PM
AI在线
宇树科技在深圳成立新公司,继续布局智能机器人领域
近日,杭州宇树科技有限公司在深圳成立了一家全资子公司 —— 深圳天羿科技有限公司。 根据相关报道,深圳天羿科技的法定代表人为周昌慧,注册资本为10万人民币。 该公司的经营范围广泛,包括智能机器人的研发与销售、工业机器人销售、机械设备研发与制造、服务消费机器人制造,以及计算机软硬件及辅助设备的批发与制造等。
3/5/2025 9:09:00 PM
AI在线
看完清北看浙大,DeepSeek 宝典一网打尽(附 12 部全集下载)
这次,IT之家为大家找到了浙大出品的两份 DeepSeek 宝典,还外加清华沈阳团队的新攻略,一共三份武林秘籍。
3/5/2025 8:04:33 PM
泓澄
刚刚,2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto
强化学习先驱 Andrew Barto 与 Richard Sutton 获得今年的 ACM 图灵奖。 人工智能学者,再次收获图灵奖! 刚刚,计算机学会(ACM)宣布了 2024 年的 ACM A.M.
3/5/2025 7:46:00 PM
机器之心
英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的
价格低了点,功耗高了点,性能和原来差不多? 昨晚,英伟达 GeForce RTX 5070 显卡正式解禁,各种评测开始进入人们的视线。 我们知道,最近英伟达 RTX 50 系显卡的实际表现引发了不少争议,出现了核心单元丢失、供电等多种问题。
3/5/2025 7:42:00 PM
机器之心
大规模实用化量子化学计算曙光显现,ByteDance Research开源工具集ByteQC
真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。 为了解决这一问题,近日字节跳动 ByteDance Research 团队开发并开源了 ByteQC —— 基于 GPU 加速的大规模量子化学计算工具集。 该工具集使用强大的 GPU 算力,大幅度加速了常见的量子化学算法,同时结合领域内前沿的量子嵌入方法实现了量子化学「黄金标准」精度下的大规模量子化学体系的模拟。
3/5/2025 7:38:00 PM
机器之心
大模型推理新范式!清华&蚂蚁:用编程思维来思考,用自然语言来表达
2024 年 9 月,OpenAI 携 o1 模型吹响推理革命的号角,以惊人的思维链长度刷新认知边界。在这场技术革命中,中国力量迅速崛起:DeepSeek R1 以极低的训练成本成功复现 o1 性能,引发全球热议。然而,在振奋的结果背后,上述「灵魂拷问」似乎并没有得到解答
3/5/2025 7:36:00 PM
机器之心
GitHub狂揽4K星!新晋语音核弹实测:秒杀ChatGPT,太会撩,太逼真,怕上瘾
AI好好用报道编辑:Sia风险投资家罗布·托斯曾在福布斯专栏上预测,语音 AI 将在 2025 年实现飞跃,AI 将通过语音图灵测试。 这才过了一个多月,一个全新的语音模型就让顶尖技术社区直呼 「 cool but terrifying 」。 当《 I'm Not a Robot 》捧起今年奥斯卡最佳真人短片的奖杯时,片中那个让人惊魂未定的 AI 人类还被视为一个科幻寓言。
3/5/2025 7:00:00 PM
AI好好用