AI在线 AI在线

理论

传神语联发布深度思考大模型-T1:根原创铸基,任度双脑开启AI深度思考新高度

2025年3月24日,传神语联A纪元系列线上发布活动的第一天,传神语联重磅发布任度双脑深度思考大模型-T1(以下简称任度大模型-T1),为大模型领域贡献了又一创新性成果。 那么,你或许会好奇,在大模型层出不穷的今天,传神语联为什么还执着于推出大模型? 底气来自哪里?
3/25/2025 5:59:13 PM

阿里震撼发布,32B的Qwen2.5,开发者福音!实测:AI可以帮抓小偷了!阿里撞车DS再次坐实“AI汪峰”;网友:美国模型完了

编辑 | 伊风阿里今天发了Qwen2.5-VL的32B版本,达到同等规模的SOTA模型,堪称开发者福音! 千问接连两三次的模型发布时间都不太凑巧。 今日与DeepSeek V3的更新撞车,而上次发的QwQ-32B以轻量推理模型击败了DeepSeek R1,但风头完全被Manus抢走了!
3/25/2025 1:31:45 PM
伊风

AMD跑DeepSeek性能超H200!128并发Token间延迟不超50ms,吞吐量达H200五倍

DeepSeek-R1掀起新一轮购卡潮的同时,AMD的含金量也上升了。 在AMD的MI300X上跑FP8满血R1,性能全面超越了英伟达H200——相同延迟下吞吐量最高可达H200的5倍,相同并发下则比H200高出75%。 这个结果,一方面归功于SGLang框架,另一方面则是得益于AMD新优化的AI内核库AITER。
3/25/2025 12:59:01 PM
量子位

阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明

就在 DeepSeek V3「小版本更新」后的几个小时,阿里通义千问团队也开源了新模型。 择日不如撞日,Qwen2.5-VL-32B-Instruct 就这么来了。 相比此前的 Qwen2.5-VL 系列模型,32B 模型有如下改进:回复更符合人类主观偏好:调整了输出风格,使回答更加详细、格式更规范,并更符合人类偏好。
3/25/2025 12:11:08 PM
机器之心

为矛盾的理论提供统一解释,牛津大学等揭秘非晶硅结构

编辑丨coisini非晶硅(α-Si)是研究最广泛的无序网络固体之一,其结构已经被研究了几十年。 两种主要理论分别基于连续随机网络模型和「类晶体」模型,后者被定义为在保持整体非晶网络的同时,表现出类似于晶体状态的局部结构有序性。 然而,这种局部有序性的程度一直不明确。
3/25/2025 12:02:00 PM
ScienceAI

分子对接速度提升10,000倍,深度图学习加速RNA虚拟筛选,助力药物靶标发现

编辑 | 萝卜皮RNA 是尚未开发的药物靶标的巨大宝库。 基于结构的虚拟筛选 (VS) 利用结合位点信息识别候选分子,传统上采用分子对接模拟。 然而,对接很难在大型化合物库和 RNA 靶标中扩展。
3/25/2025 12:01:00 PM
ScienceAI

DeepSeek-V3在Mac Studio上以每秒20个token的速度运行,这对OpenAI来说是一场噩梦

DeepSeek悄然发布了一款新的大型语言模型,已在AI行业掀起波澜——不仅因为其能力出众,更因其部署方式独特。 这款名为DeepSeek-V3-0324的641GB模型出现在AI仓库Hugging Face上,几乎没有进行任何宣传,延续了该公司一贯低调却影响深远的产品发布风格。 此次发布尤为引人注目的是该模型的MIT许可证——允许其免费用于商业用途——以及早期报告显示,它可以直接在消费级硬件上运行,特别是配置了M3 Ultra芯片的Apple Mac Studio。
3/25/2025 11:42:41 AM
Michael Nuñez

谷歌320亿豪赌云安全热门赛道:AI+CNAPP

当云安全进入“AI驱动、秒级响应”时代,企业需要的不仅是技术堆砌,而是能将安全转化为业务加速引擎的智能平台;这意味着企业需要AI驱动的CNAPP解决方案来简化CI/CD安全性并减轻DevOps团队的云安全负担。 云安全的未来属于集成人工智能、自动检测风险并在多云环境中提供全栈可视性的平台。 谷歌能否占据CNAPP领先地位将取决于Wiz与谷歌人工智能驱动的威胁情报和安全运营套件的集成程度。
3/25/2025 10:59:17 AM
佚名

专治AI爬虫,Cloudflare推出“下一代蜜罐”

网络基础设施服务商Cloudflare近日推出一项全新功能“AI Labyrinth”(AI迷宫),专门针对那些未经授权、肆意抓取网站数据的AI爬虫。 这项工具不走寻常路,不直接拦截,而是用AI生成的“假内容”迷惑爬虫,让试图为ChatGPT这类大语言模型收集训练数据的AI公司空忙一场。 “下一代蜜罐”登场成立于2009年的Cloudflare提供网站基础设施和安全服务,尤其擅长抵御分布式拒绝服务(DDoS)攻击和恶意流量。
3/25/2025 10:54:08 AM
佚名

RAG(七)Chain-of-Note:笔记链让检索增强型语言模型更强大!

现有的检索增强型语言模型(Retrieval-Augmented Language Models, RALMs)在处理外部知识时存在一定的局限性。 这些模型有时会因为检索到不相关或不可靠的信息而产生误导性的回答,或者在面对检索信息和模型内在知识的干扰时,无法正确选择使用哪一种知识。 此外,在检索信息不足或完全不存在的情况下,标准的RALMs可能会尝试生成一个答案,即使它们并不具备足够的信息来准确作答。
3/25/2025 10:41:06 AM
Goldma

SFT 指令微调数据如何构建?

SFT的重点是学习样式,而非知识注入,所以SFT的样本在于其质量而非数量,少量但精良的样本往往胜过大批中低品质的样本,实现同样甚至更优的微调效果。 通常情况下,2-10k数据就会有一个不错的效果。 这一理念在Meta发布的《LIMA: Less Is More for Alignment》论文中得到了有力阐述,该文献强调了在指令微调过程中,高品质微调数据的决定性作用。
3/25/2025 10:27:14 AM
Goldma

统一细粒度感知!北大&阿里提出UFO:无需SAM,16个token让MLLM实现精准分割

本文作者来自北京大学和阿里通义万相实验室。 其中论文第一作者是汤昊,北京大学 2022 级博士生,目前主要关注统一的多模态任务建模算法。 指导教授是王立威老师,北京大学智能学院教授,曾获 NeurIPS 2024 最佳论文奖、ICLR 2023 杰出论文奖及 ICLR 2024 杰出论文提名奖。
3/25/2025 10:13:26 AM
机器之心

棋盘变战场,大模型却呆了?普林斯顿、UT Austin新基准SPIN-Bench曝AI智商瓶颈

当棋盘变成战场,当盟友暗藏心机,当谈判需要三十六计,AI 的智商令人叹息! 近日,来自普林斯顿和德州大学奥斯丁分校最新评测基准 SPIN-Bench,用一套 "组合拳" 暴击了大模型的软肋。 研究显示,即便是 o1、o3-mini、DeepSeek R1、GPT-4o、Claude 3.5 等顶尖大模型,在涉及战略规划和社会推理的复杂任务中集体 "自闭"。
3/25/2025 9:50:23 AM
机器之心

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

昨夜,DeepSeek V3 毫无征兆地来了一波更新,升级到了「DeepSeek-V3-0324」版本。 目前,新版本在 Hugging Face 上可以下载并部署。 Hugging Face 地址:,DeepSeek-V3-0324 没有公布详细的模型卡。
3/25/2025 9:48:22 AM
机器之心

“AI辅导2小时,成绩冲进全国前2%”,OpenAI总裁转发私立教学成果,网友:一年学费4万美元??

“用AI辅导功课,学生成绩提升至全国前2%的水平”。 美国得克萨斯州一所私立K12学校Alpha学校,最近传出了这样一则消息引起大量网友关注。 OpenAI总裁Greg Brockman下场转发:围绕个性化AI导师设计的学校取得了良好成果。
3/25/2025 9:47:03 AM
量子位

大神卡帕西亲自演绎零基础开发APP,ChatGPT四轮对话搞定,一小时即在手机运行

大神卡帕西带着他的教程又来了! 这次不是教学视频,而是手把手教你如何用大模型开发APP——他没有阅读任何文档,也没有在专门平台Swift编程过,在与ChatGPT仅四轮对话的指导下,成功在手机上运行上了。 ,时长00:24这是个用来减肥跟踪APP。
3/25/2025 9:43:03 AM
量子位

一文看懂多模态思维链DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了

DeepSeek V3升级了,新版本V3-0324。 官方轻描淡写只说是“小版本升级”,但很多人实测下来可一点也不小。 把流行的小球弹跳测试,提升难度到4维空间超立方体也没问题。
3/25/2025 9:28:21 AM
量子位

GenAI如何重新定义亚太地区的零售银行业务

GenAI采用的现状包括GPT-4等尖端语言模型在内的GenAI最新进展,正使金融机构能够以新颖的方式利用AI的能力。 合成数据生成——即使用算法而非现实世界收集来创建数据——已成为关键推动因素,为多样化的银行业务需求提供可扩展、自动化的解决方案。 然而,IDC的《2024年数据与AI脉搏》研究显示,东南亚地区的AI采用情况参差不齐。
3/25/2025 9:28:04 AM
Deepak Ramanathan