资讯列表
4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
12/26/2024 4:53:00 PM
机器之心
劲爆!理想汽车转做大模型,主持人质疑李想是否跟风:你有理想吗?李想自曝三次创业心得:终极是硅基家人,要做中国第一!
编辑 | 言征厂长李想回来了! 不过出人意料的是,李想一公开露面,就曝出一个大料:李想要把理想汽车这家车企改造成一家AI企业? 昨晚,理想汽车官宣的三天直播上来就抛出了一个让人脑洞大开、议论纷纷的话题。
12/26/2024 4:46:49 PM
言征
引入长思维链!微信基于阿里千问大模型搞出个翻译版o1
最近,类 o1 模型的出现,验证了长思维链 (CoT) 在数学和编码等推理任务中的有效性。 在长思考(long thought)的帮助下,LLM 倾向于探索、反思和自我改进推理过程,以获得更准确的答案。 在最近的一项研究中,微信 AI 研究团队提出了 DRT-o1,将长 CoT 的成功引入神经机器翻译 (MT)。
12/26/2024 4:44:27 PM
ScienceAI 2024「AI+材料&化学」专题年度回顾
编辑 | 2049在数字化转型的背景下,人工智能技术正在从根本上改变化学与材料科学的研究范式。 2024年,这场技术革新在多个领域展现其变革力量。 在分子设计领域,基于图神经网络(GNN)和 Transformer 架构的深度学习模型,结合分子动力学模拟,实现了分子性质的精确预测与优化。
12/26/2024 4:39:00 PM
ScienceAI
速度提升44%,节能153倍,清华使用内存计算硬件高效标记数据
编辑丨&对于现在的许多 AI 任务来说,标记数据是一个耗时、劳动密集型且昂贵的过程。 深度贝叶斯主动学习 (DBAL) 以指数级方式提高标记效率,从而大幅降低成本。 为了解决 DBAL 需要高带宽的数据传输和概率计算的问题,来自清华大学的团队提出一种忆阻器随机梯度 Langevin 动力学原位学习方法。
12/26/2024 4:38:00 PM
ScienceAI
「数字孪生」东京上线!Jim Fan:具身智能零样本迁移现实世界,共享「蜂群思维」
东京高分辨率点云3D数字孪生模型现已公开发布! 任何人都可以免费下载。 项目地址:,而且它对东京的刻画也非常之精细——其绝对位置精度大约在10cm以内。
12/26/2024 4:30:00 PM
新智元
英特尔至强6独享MRDIMM,内存带宽飙升,加速推理达2.4倍!
之前的文章中,有业者预测至强6性能核处理器每颗计算单元芯片中的内核数量为43,加上每个计算单元有两组双通道内存控制器各占一个网格,那么总共占用43 2=45个网格,可以由5×9的布局构成。 但这个假设有一个问题,要构成128核的6980P,三颗芯片只屏蔽1个内核,这良率要求比较高啊。 至今还未在公开渠道看到至强6性能核处理器的Die shot或架构图,但英特尔发布了晶圆照片作为宣传素材。
12/26/2024 4:00:00 PM
独享MRDIMM有多强?至强6性能核处理器的内存二三事
至强 6 性能核处理器在核数、内存带宽均大幅提升的加持下,推理性能激增,进一步提升了推理的性价比。 至强 6 性能核的核心规模在之前的文章中,有从业者预测至强 6 性能核处理器每颗计算单元芯片中的内核数量为 43,加上每个计算单元有两组双通道内存控制器各占一个网格,那么总共占用 43 2=45 个网格,可以由 5×9 的布局构成。 但这个假设有一个问题,要构成 128 核的 6980P,三颗芯片只屏蔽 1 个内核,这良率要求比较高啊。
12/26/2024 3:59:00 PM
机器之心
SPAR:融合自对弈与树搜索的高性能指令优化框架
大语言模型的指令遵循能力需要模型能够准确识别指令中的细微要求,并在输出中精确体现这些要求。 现有方法通常采用偏好学习进行优化,在创建偏好对时直接从模型中采样多个独立响应。 但是这种方法可能会引入与指令精确遵循无关的内容变化(例如,同一语义的不同表达方式),这干扰了模型学习识别能够改进指令遵循的关键差异。
12/26/2024 3:35:33 PM
SACHIN KUMAR
CMU等提出超实用「模型泛化性」指标,分布外准确率提升6% | ICML 2024 Oral
当前许多深度学习分类模型通常在大规模数据中训练以找到足以区分不同类别的特征。 然而,这种方式不可避免地学到伪相关特征(Spurious Correlation),导致训练的分类器在分布偏移(Distribution Shift)下往往会失效。 因此,如何在衡量一个训练好的模型的泛化性(Generalization)一直是一个关键问题。
12/26/2024 3:30:00 PM
新智元
理想同学 App 明日上线,支持语音交流、识物等功能
据理想汽车官方消息,理想同学 App 将于明日(12 月 27 日)上线。在理想 AI Talk 第三场直播开启(20:00)后,可以通过应用商店(苹果用户)和官网下载(安卓用户)。
12/26/2024 3:05:45 PM
浩渺
Anthropic联创:Scaling Law没崩,但推理成天价!有了TTT,25年AI更加速
Scaling Law要撞墙了? Anthropic联创Jack Clark反驳了这一说法:绝非如此! 在他看来,目前的AI发展还远远没到极限,「所有告诉你AI进展正在放缓,或者Scaling Law正在撞墙的人,都是错误的。
12/26/2024 3:00:09 PM
新智元
蚂蚁群组团“最强 AGI”:破解几何难题“完爆”人类,群体智能登顶 PNAS
你听说过「通用蚂蚁智能」吗?今天,全网爆火一个视频充分展示了什么是 AGI—— 蚂蚁群体智能的智慧。在解决钢琴搬运难题任务中,它们甚至超越了人类,最新研究登上 PNAS。
12/26/2024 2:49:47 PM
清源
Deepseek新模型意外曝光!编程跑分一举超越Claude 3.5 Sonnet
还没等到官宣,Deepseek-v3竟意外曝光了? 据Reddit网友爆料,v3已在API和网页上发布,一些榜单跑分也新鲜出炉。 在Aider多语言编程测试排行榜中,Deepseek-v3一举超越Claude 3.5 Sonnet,排在第1位的o1之后。
12/26/2024 2:42:23 PM
量子位
你的生理年龄可以逆转吗?17 种 AI 算法测试洞察 22.5 万人血液样本带来新见解
伦敦国王学院的研究人员开发了一种基于 AI 的“衰老时钟”,可以通过分析血液代谢物数据预测个体的健康状况和寿命。
12/26/2024 1:44:57 PM
故渊
蚂蚁群组团最强AGI,破解几何难题完爆人类!群体智能登顶PNAS
所谓AGI,难道是「通用蚂蚁智能」,亦或是「蚂蚁通用智能」? 图片今天,无数只蚂蚁在搬运T形物体,成功穿越迷宫的视频火遍全网。 图片网友纷纷惊呼,「这简直太疯狂了。
12/26/2024 12:59:06 PM
新智元
英国拟试用全球首个 AI 工具评估糖尿病风险:提前 10 年识别潜在患者
据英国《卫报》当地时间23日报道,英国国民医疗服务体系(NHS)将启动全球首个人工智能试验,使用一款“变革性”工具,提前十多年识别出有可能患上2型糖尿病的患者。
12/26/2024 12:40:08 PM
清源