AI在线 AI在线

理论

北航&滴滴!自动驾驶汽车的运动预测:综述

论文链接::综述。 近年来,自动驾驶领域吸引了越来越多的关注。 准确预测各种交通参与者的未来行为对于自动驾驶汽车(AVs)的决策是至关重要的。
2/26/2025 10:17:43 AM
自动驾驶专栏

香港科技大学提出YuE:Suno级别开源音乐生成模型,支持中文!

YuE是港科大提出的一个开源的音乐生成基础模型,专为音乐生成而设计,专门用于将歌词转换成完整的歌曲(lyrics2song)。 它可以生成一首完整的歌曲,时长几分钟,包括朗朗上口的声乐曲目和伴奏曲目。 YuE 能够模拟多种流派/语言/声乐技巧。
2/26/2025 10:14:12 AM
AIGC Studio

DeepSeek开源第三弹:惊人的300行代码驱动R1和V3的训练与推理,超越各种专家内核

DeepSeek开源周第三弹! DeepSeek-AI 重磅发布高效FP8 GEMM库 DeepGEMM:极致性能,代码精简,助力V3/R1模型训练与推理! 简单来说这是由 DeepSeek-AI 团队精心打造的 FP8 通用矩阵乘法 (GEMM) 加速库,专为追求极致性能和代码简洁而生我们一起来扒一扒:Hopper GPU 上狂飙 1350 FP8 TFLOPS!
2/26/2025 10:11:01 AM
AI寒武纪

中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”

当地时间 2 月 25 日,Anthropic 正式发布了 Claude 3.7 Sonnet,“这是迄今为止我们最智能的模型,也是市场上首个混合推理模型。 ”Anthropic 官方表示。 简单来说,Claude 3.7 Sonnet 既能提供近乎即时的响应(标准模式,standard),也可以向用户直观展示其长时间的逐步思考过程(扩展思考模式,extended thinking)。
2/26/2025 10:10:12 AM
架构师秋天

开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测来了!

当很多 AI 公司还就是否该走开源路线而感到左右为难时,阿里的技术团队又开源了一个新的模型 —— 万相(Wan)视频生成大模型(包括全部推理代码和权重,最宽松的开源协议)。 经常玩视频生成模型的同学应该知道,当前的很多模型仍然面临多方面挑战,比如难以还原复杂的人物动作,处理不好物体交互时的物理变化,遇到长文本指令就「选择性遵循」等。 如果三个方面都做得比较好,那模型厂商多半是不舍得开源的。
2/26/2025 9:44:14 AM
机器之心

苹果史上最大投资!4年5000亿美金重注AI+芯片,特朗普专门感谢

苹果CEO库克,发文纪念乔布斯诞辰70周年:乔布斯不仅看到了世界的现状,更看到了它的无限可能。 他的远见不断激励我们突破界限,创造未来。 今天,在他70岁诞辰之际,我们缅怀他的传承,并致敬他永恒的影响力。
2/26/2025 9:30:26 AM
新智元

Claude 3.7狂飙物理引擎碾压Grok 3,高考数学题被秒成渣!疯狂融资35亿Transformer女神加盟

除了编程界,Claude 3.7 Sonnet的出世,好像并没有在AI圈掀起巨大的风浪。 与DeepSeek R1、o3-mini推理模型不同的是,它是世界首个混合推理模型,即「原生」推理。 正如Anthropic介绍,「一个模型,两种思考方式」。
2/26/2025 9:24:03 AM
新智元

由AI驱动的虚假信息攻击或成银行致命威胁

近日,一项英国研究揭示了AI虚假信息的潜在威胁,它可能轻松引发银行客户的恐慌,甚至导致银行挤兑事件。 这一发现为金融机构敲响了警钟,提醒它们必须重视并防范这一新型风险。 英国研究机构“对虚假信息说不”(Say No To Disinfo)与通信专家公司费尼莫尔·哈珀(Fenimore Harper)合作,模拟了一场由AI驱动的虚假信息宣传活动。
2/26/2025 9:05:00 AM
Florian Maier

谷歌推出 Gemini Code Assist 个人版编程工具,免费可用

IT之家 2 月 26 日消息,当地时间 25 日,谷歌宣布推出面向个人开发者的免费版本的 Gemini Code Assist,旨在使学生、爱好者、自由职业者和初创公司更容易获得“具有最新 AI 能力”的编程助手。 谷歌产品管理高级总监 Ryan J. Salva 表示,现在任何人都可以更方便地学习、创建代码片段、调试和修改现有应用程序,无需在不同窗口之间切换以获取帮助或从不相关的来源复制粘贴信息。
2/26/2025 8:24:35 AM
清源

算法系列之搜索算法-深度优先搜索DFS

随着每年"金三银四"招聘季的到来,许多求职者开始积极备战面试。 在众多面试环节中,机试往往是不可或缺的一环,而算法能力更是机试考核的重点。 为此,我们特别推出算法系列文章,帮助大家系统复习算法知识。
2/26/2025 5:00:00 AM
修己xj

惊艳!百度文心智能体平台,全面接入DeepSeek满血版!

起猛了! 突然发现百度搜索也接入满血版 DeepSeek R1 的,直接就在搜索框下面就能看到了,这使用起来无比丝滑。 图片我好奇了点进去看了看,界面还是很简洁的,上面是一些辅助提示,下面就是输入框,默认会勾选满血版 DeepSeek R1 ,同样也支持联网搜索。
2/26/2025 4:00:00 AM
小林coding

DeepSeek高阶提示词编写思路-从原则到方法技能

Hello,大家好,我是人月聊IT。 在前面文章我曾经谈到过。 在我们使用GPT的时候的,当时有一个标准的提示词模版,即:角色:让GPT扮演什么角色技能:GPT需要具备哪些关键的技能目标:输出的目标是什么约束:有哪些工具约束,过程约束等在原有的这个提示词模版中,最难的往往是技能描述。
2/26/2025 1:00:00 AM
何明璐

解决RAG与长上下文模型的困境,你学会了吗?

长文本模型非常适合减少某些需要更长上下文用例的幻觉,但并非所有情况都理想。 译自Solving the RAG vs. Long Context Model Dilemma,作者 Kiran Matty。
2/26/2025 12:16:56 AM
岱军

360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能

2025年2月24日,由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,仅以5%参数,逼近DeepSeek-R1-671B的性能。 核心突破:小模型,大能量数学领域:以78.1分(AIME 2024评测)逼近原版R1模型(79.8分),远超DeepSeek-R1-Distill-Llama-70B(70.0分);综合性能:在编程(LiveCodeBench 61.6分)、科学(GPQA-Diamond 65.0分)领域全面领先最佳开源70B模型DeepSeek-R1-Distill-Llama-70B;效率跃迁:仅需5%参数量,性能达原版R1的95%以上,推理成本大幅降低。 技术革新:领域专精 模型融合研究团队使用「分治-融合」策略:基于DeepSeek-R1生成海量领域数据,分别训练数学、编程、科学三大垂直模型;通过Arcee团队Mergekit工具智能融合,突破单一模型性能上限,实现多任务均衡优化。
2/25/2025 2:50:16 PM
新智元

科学发现速度提高10倍?统计原则+智能体,斯坦福&哈佛提出自动化假设验证框架POPPER

编辑丨coisini假设验证在科学发现、决策制定和信息获取中具有基础作用。 无论是在生物学、经济学还是政策制定中,研究者往往依赖于检验假设来指导其结论。 传统上,这一过程涉及设计实验、收集数据并分析结果以确定假设的有效性。
2/25/2025 2:26:00 PM
ScienceAI

怎么实现一个神经网络?神经网络的组成结构

对学习神经网络技术的人来说,自己设计一个神经网络模型是很多人都想做的事情;也是神经网络技术学习过程中必不可少的一个环节;但是很多人又不知道应该怎么下手。 所以今天就介绍一下怎么设计一个神经网络模型。 实现一个神经网络很多人认为神经网络复杂的原因是因为没有了解过神经网络的组成结构;因此,就很难弄清楚神经网络模型中每个环节的作用,所以我们就先从神经网络的结构入手。
2/25/2025 2:13:31 PM
AI探索时代

只给一张图,AI找到对应合适BGM,央音清华等构建全球化音乐信息检索新范式

给AI看一眼图,它就能找到对应音乐。 比如一艘海上航行的海盗船,啪一下,就检索到了加勒比海盗经典配乐。 音乐信息检索(Music Information Retrieval, MIR)一直面临着多模态数据的复杂性和多语言文本理解的挑战。
2/25/2025 1:51:16 PM
量子位

AI蛋白质设计前沿教程,AAAI'25三大机构携手4小时全面剖析

精准预测和设计蛋白质的序列、结构及模拟其动态变化,一直是科学界的重大挑战。 在即将举行的AAAI 2025会议上,加拿大魁北克省人工智能研究所Mila、美国东北大学和MIT的学者将组织一场主题为“人工智能在蛋白质设计中的应用”的教程。 (文末附教程直通车)综观当下,AI与生命科学深度融合背景下,蛋白质研究正经历前所未有的AI驱动变革。
2/25/2025 1:46:26 PM
量子位