AI在线 AI在线

理论

谷歌发布最强「科研辅助神器」!能帮你提新idea,三大真实场景实证

在科学探索的过程中,研究人员需要对以往发表的文献进行观察总结,提出一些新颖、可行的研究方向,最后通过全面的实验进行idea验证。 科研人员需要对探索的宽度和深度进行平衡,由于精力有限,不能探索过多的研究方向,同时还要保证对目标主题的研究深度。 最近,谷歌、斯坦福大学等机构的研究人员开发了一个多智能体、基于Gemini 2.0的AI协同科研(AI co-scientist)系统,具备跨复杂主题的综合能力和进行长期规划、推理的能力,除了传统的文献综述、总结功能之外,还可以辅助科研人员提出新的、原创知识,或是基于先前的成果制定研究假设(hypotheses)和计划(proposal)。
2/26/2025 1:50:00 PM
新智元

DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口

就在最近,生成式AI行业,诞生了一个新赛道——所有文本模型,可以立刻秒变多模态了! 如今的大模型混战局势,情况已经很明显,去一味卷大模型供应商,投入产出比已经不高。 此时,这个产品的另辟蹊径,就格外显得独树一帜——他们要做的,是让任意大模型开口说话,甚至是DeepSeek!
2/26/2025 1:45:00 PM
新智元

CIO的生存之道:企业中AI早期采用者的经验教训

在AI浪潮席卷企业的今天,CIO如何从“被动求生”转向“主动破局”?全球顶尖CIO Tim Crawford与Isaac Sacolick指出了AI落地的核心矛盾:从战略对齐到数据治理,从企业变革到风险博弈。 这两位CIO不仅揭示了早期AI先行者的血泪教训,更给出了摆脱“试点困境”、重构商业价值的硬核路径。 要点概述:战略整合:CIO如何将AI举措与核心业务目标相结合,以推动业务增长和增强竞争优势。
2/26/2025 1:39:03 PM
Michael Krigsman

何恺明ResNet级神作,分形生成模型计算效率狂飙4000倍!清华校友一作

图像生成建模全新范式来了。 你是否曾凝视过雪花的精致对称,或惊叹于树枝的无穷分支? 这些都是大自然中的「分形」。
2/26/2025 1:23:08 PM
新智元

全自动驾驶真的来了!花6万4才能用!马斯克急忙上线阉割版!AI提醒驾驶员别走神,网友实测翻车:秒变移动路障;李想:在实战中分高下

出品 | 51CTO技术栈(微信号:blog51cto)千呼万唤,特斯拉FSD真的来了! 特斯拉已开始在中国向车主分批次推送FSD的软件更新了,版本号2024.45.32.12,与北美版一致。 不过,马斯克急急慌慌入华的FSD,槽点好像真的有点多。
2/26/2025 1:18:37 PM

多模态大模型对齐新范式,10个评估维度全面提升,快手&中科院&南大打破瓶颈

尽管多模态大语言模型(MLLMs)取得了显著的进展,但现有的先进模型仍然缺乏与人类偏好的充分对齐。 这一差距的存在主要是因为现有的对齐研究多集中于某些特定领域(例如减少幻觉问题),是否与人类偏好对齐可以全面提升MLLM的各种能力仍是一个未知数。 快手,中科院,南大合作从三个层面入手推动MLLM alignment的发展,包括数据集,奖励模型以及训练算法,最终的alignment pipeline使得不同基础模型在10个评估维度,27个benchmark上都取得了一致的性能增益,比较突出的是,基于本文提出的数据集和对齐算法对LLaVA-ov-7B模型进行微调后, conversational能力平均提升了19.5%,安全性平均提升了60%。
2/26/2025 1:00:00 PM
量子位

前端程序员请注意!首个截图就能生成现代前端代码的AI来了 | 已开源

现在截图生成代码,已经来到了一个新高度——⾸个⾯向现代前端代码⽣成的多模态⼤模型解决⽅案,来了! 而且是开源的那种。 (注:现代前端代码开发具有组件化、状态管理和数据驱动渲染、开发规范严格以及动态交互性强等特点。
2/26/2025 12:30:00 PM
量子位

利用RAG整合代码私有仓库实现私有化代码提示的流程

RAG流程RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与生成模型的技术,旨在通过外部知识库增强生成内容的准确性和相关性。 1. 数据预处理与索引构建(离线阶段)目标:构建可供检索的知识库。
2/26/2025 12:21:08 PM
demo123567

解锁AI机器人新时代:LeRobot如何让未来触手可及?

想象一下,一个普通人也能轻松打造属于自己的智能机器人,像玩乐高一样简单有趣? 这不是科幻电影的场景,而是Hugging Face最新开源项目LeRobot带来的现实革命。 作为AI领域的先锋,Hugging Face继Transformers席卷自然语言处理(NLP)领域后,又将目光投向了机器人技术,推出了LeRobot——一个旨在让AI机器人开发变得更普惠、更高效的开源平台。
2/26/2025 11:11:14 AM
未智翼

手把手演示 IDEA 如何接入 DeepSeek,你学会了吗?

本文介绍如何在 IntelliJ IDEA 中集成 DeepSeek , 并展示如何利用它来提升开发效率 。 1.安装 CodeGPT 插件图片在插件市场里,搜索 CodeGPT ,安装即可。 假如网络安装慢,可以从插件下载地址,直接下载。
2/26/2025 10:31:35 AM
勇哥

DeepSeek-R2曝5月前上线!第三弹DeepGEMM 300行代码暴击专家优化内核

第三天,DeepSeek发布了DeepGEMM。 这是一个支持稠密和MoE模型的FP8 GEMM(通用矩阵乘法)计算库,可为V3/R1的训练和推理提供强大支持。 仅用300行代码,DeepGEMM开源库就能超越专家精心调优的矩阵计算内核,为AI训练和推理带来史诗级的性能提升!
2/26/2025 10:24:51 AM

港理工OccProphet:纯视觉Occ SOTA!速度提升至2.6倍,内存占用减少60%

本文分享一篇由香港理工大学最近公开的发表于ICLR2025的论文『OccProphet: Pushing Efficiency Frontier of Camera-Only 4D Occupancy Forecasting with Observer-Forecaster-Refiner Framework』。 作者在文中提出了一个轻量级的观察器-预报器-细化器框架OccProphet来实现高效的未来4D占用预测。 OccProphet在nuScenes、 Lyft-Level5和nuScenes-Occupancy等多个数据集上取得最先进的4D占用预测性能,成本减少近80%!
2/26/2025 10:24:47 AM
Junliang Chen等

北航&滴滴!自动驾驶汽车的运动预测:综述

论文链接::综述。 近年来,自动驾驶领域吸引了越来越多的关注。 准确预测各种交通参与者的未来行为对于自动驾驶汽车(AVs)的决策是至关重要的。
2/26/2025 10:17:43 AM
自动驾驶专栏

香港科技大学提出YuE:Suno级别开源音乐生成模型,支持中文!

YuE是港科大提出的一个开源的音乐生成基础模型,专为音乐生成而设计,专门用于将歌词转换成完整的歌曲(lyrics2song)。 它可以生成一首完整的歌曲,时长几分钟,包括朗朗上口的声乐曲目和伴奏曲目。 YuE 能够模拟多种流派/语言/声乐技巧。
2/26/2025 10:14:12 AM
AIGC Studio

DeepSeek开源第三弹:惊人的300行代码驱动R1和V3的训练与推理,超越各种专家内核

DeepSeek开源周第三弹! DeepSeek-AI 重磅发布高效FP8 GEMM库 DeepGEMM:极致性能,代码精简,助力V3/R1模型训练与推理! 简单来说这是由 DeepSeek-AI 团队精心打造的 FP8 通用矩阵乘法 (GEMM) 加速库,专为追求极致性能和代码简洁而生我们一起来扒一扒:Hopper GPU 上狂飙 1350 FP8 TFLOPS!
2/26/2025 10:11:01 AM
AI寒武纪

中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”

当地时间 2 月 25 日,Anthropic 正式发布了 Claude 3.7 Sonnet,“这是迄今为止我们最智能的模型,也是市场上首个混合推理模型。 ”Anthropic 官方表示。 简单来说,Claude 3.7 Sonnet 既能提供近乎即时的响应(标准模式,standard),也可以向用户直观展示其长时间的逐步思考过程(扩展思考模式,extended thinking)。
2/26/2025 10:10:12 AM
架构师秋天

开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测来了!

当很多 AI 公司还就是否该走开源路线而感到左右为难时,阿里的技术团队又开源了一个新的模型 —— 万相(Wan)视频生成大模型(包括全部推理代码和权重,最宽松的开源协议)。 经常玩视频生成模型的同学应该知道,当前的很多模型仍然面临多方面挑战,比如难以还原复杂的人物动作,处理不好物体交互时的物理变化,遇到长文本指令就「选择性遵循」等。 如果三个方面都做得比较好,那模型厂商多半是不舍得开源的。
2/26/2025 9:44:14 AM
机器之心

苹果史上最大投资!4年5000亿美金重注AI+芯片,特朗普专门感谢

苹果CEO库克,发文纪念乔布斯诞辰70周年:乔布斯不仅看到了世界的现状,更看到了它的无限可能。 他的远见不断激励我们突破界限,创造未来。 今天,在他70岁诞辰之际,我们缅怀他的传承,并致敬他永恒的影响力。
2/26/2025 9:30:26 AM
新智元