理论
谷歌发布最强「科研辅助神器」!能帮你提新idea,三大真实场景实证
在科学探索的过程中,研究人员需要对以往发表的文献进行观察总结,提出一些新颖、可行的研究方向,最后通过全面的实验进行idea验证。 科研人员需要对探索的宽度和深度进行平衡,由于精力有限,不能探索过多的研究方向,同时还要保证对目标主题的研究深度。 最近,谷歌、斯坦福大学等机构的研究人员开发了一个多智能体、基于Gemini 2.0的AI协同科研(AI co-scientist)系统,具备跨复杂主题的综合能力和进行长期规划、推理的能力,除了传统的文献综述、总结功能之外,还可以辅助科研人员提出新的、原创知识,或是基于先前的成果制定研究假设(hypotheses)和计划(proposal)。
2/26/2025 1:50:00 PM
新智元
DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口
就在最近,生成式AI行业,诞生了一个新赛道——所有文本模型,可以立刻秒变多模态了! 如今的大模型混战局势,情况已经很明显,去一味卷大模型供应商,投入产出比已经不高。 此时,这个产品的另辟蹊径,就格外显得独树一帜——他们要做的,是让任意大模型开口说话,甚至是DeepSeek!
2/26/2025 1:45:00 PM
新智元
CIO的生存之道:企业中AI早期采用者的经验教训
在AI浪潮席卷企业的今天,CIO如何从“被动求生”转向“主动破局”?全球顶尖CIO Tim Crawford与Isaac Sacolick指出了AI落地的核心矛盾:从战略对齐到数据治理,从企业变革到风险博弈。 这两位CIO不仅揭示了早期AI先行者的血泪教训,更给出了摆脱“试点困境”、重构商业价值的硬核路径。 要点概述:战略整合:CIO如何将AI举措与核心业务目标相结合,以推动业务增长和增强竞争优势。
2/26/2025 1:39:03 PM
Michael Krigsman
何恺明ResNet级神作,分形生成模型计算效率狂飙4000倍!清华校友一作
图像生成建模全新范式来了。 你是否曾凝视过雪花的精致对称,或惊叹于树枝的无穷分支? 这些都是大自然中的「分形」。
2/26/2025 1:23:08 PM
新智元
全自动驾驶真的来了!花6万4才能用!马斯克急忙上线阉割版!AI提醒驾驶员别走神,网友实测翻车:秒变移动路障;李想:在实战中分高下
出品 | 51CTO技术栈(微信号:blog51cto)千呼万唤,特斯拉FSD真的来了! 特斯拉已开始在中国向车主分批次推送FSD的软件更新了,版本号2024.45.32.12,与北美版一致。 不过,马斯克急急慌慌入华的FSD,槽点好像真的有点多。
2/26/2025 1:18:37 PM
多模态大模型对齐新范式,10个评估维度全面提升,快手&中科院&南大打破瓶颈
尽管多模态大语言模型(MLLMs)取得了显著的进展,但现有的先进模型仍然缺乏与人类偏好的充分对齐。 这一差距的存在主要是因为现有的对齐研究多集中于某些特定领域(例如减少幻觉问题),是否与人类偏好对齐可以全面提升MLLM的各种能力仍是一个未知数。 快手,中科院,南大合作从三个层面入手推动MLLM alignment的发展,包括数据集,奖励模型以及训练算法,最终的alignment pipeline使得不同基础模型在10个评估维度,27个benchmark上都取得了一致的性能增益,比较突出的是,基于本文提出的数据集和对齐算法对LLaVA-ov-7B模型进行微调后, conversational能力平均提升了19.5%,安全性平均提升了60%。
2/26/2025 1:00:00 PM
量子位
前端程序员请注意!首个截图就能生成现代前端代码的AI来了 | 已开源
现在截图生成代码,已经来到了一个新高度——⾸个⾯向现代前端代码⽣成的多模态⼤模型解决⽅案,来了! 而且是开源的那种。 (注:现代前端代码开发具有组件化、状态管理和数据驱动渲染、开发规范严格以及动态交互性强等特点。
2/26/2025 12:30:00 PM
量子位
利用RAG整合代码私有仓库实现私有化代码提示的流程
RAG流程RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与生成模型的技术,旨在通过外部知识库增强生成内容的准确性和相关性。 1. 数据预处理与索引构建(离线阶段)目标:构建可供检索的知识库。
2/26/2025 12:21:08 PM
demo123567
解锁AI机器人新时代:LeRobot如何让未来触手可及?
想象一下,一个普通人也能轻松打造属于自己的智能机器人,像玩乐高一样简单有趣? 这不是科幻电影的场景,而是Hugging Face最新开源项目LeRobot带来的现实革命。 作为AI领域的先锋,Hugging Face继Transformers席卷自然语言处理(NLP)领域后,又将目光投向了机器人技术,推出了LeRobot——一个旨在让AI机器人开发变得更普惠、更高效的开源平台。
2/26/2025 11:11:14 AM
未智翼
手把手演示 IDEA 如何接入 DeepSeek,你学会了吗?
本文介绍如何在 IntelliJ IDEA 中集成 DeepSeek , 并展示如何利用它来提升开发效率 。 1.安装 CodeGPT 插件图片在插件市场里,搜索 CodeGPT ,安装即可。 假如网络安装慢,可以从插件下载地址,直接下载。
2/26/2025 10:31:35 AM
勇哥
DeepSeek-R2曝5月前上线!第三弹DeepGEMM 300行代码暴击专家优化内核
第三天,DeepSeek发布了DeepGEMM。 这是一个支持稠密和MoE模型的FP8 GEMM(通用矩阵乘法)计算库,可为V3/R1的训练和推理提供强大支持。 仅用300行代码,DeepGEMM开源库就能超越专家精心调优的矩阵计算内核,为AI训练和推理带来史诗级的性能提升!
2/26/2025 10:24:51 AM
港理工OccProphet:纯视觉Occ SOTA!速度提升至2.6倍,内存占用减少60%
本文分享一篇由香港理工大学最近公开的发表于ICLR2025的论文『OccProphet: Pushing Efficiency Frontier of Camera-Only 4D Occupancy Forecasting with Observer-Forecaster-Refiner Framework』。 作者在文中提出了一个轻量级的观察器-预报器-细化器框架OccProphet来实现高效的未来4D占用预测。 OccProphet在nuScenes、 Lyft-Level5和nuScenes-Occupancy等多个数据集上取得最先进的4D占用预测性能,成本减少近80%!
2/26/2025 10:24:47 AM
Junliang Chen等
北航&滴滴!自动驾驶汽车的运动预测:综述
论文链接::综述。 近年来,自动驾驶领域吸引了越来越多的关注。 准确预测各种交通参与者的未来行为对于自动驾驶汽车(AVs)的决策是至关重要的。
2/26/2025 10:17:43 AM
自动驾驶专栏
香港科技大学提出YuE:Suno级别开源音乐生成模型,支持中文!
YuE是港科大提出的一个开源的音乐生成基础模型,专为音乐生成而设计,专门用于将歌词转换成完整的歌曲(lyrics2song)。 它可以生成一首完整的歌曲,时长几分钟,包括朗朗上口的声乐曲目和伴奏曲目。 YuE 能够模拟多种流派/语言/声乐技巧。
2/26/2025 10:14:12 AM
AIGC Studio
DeepSeek开源第三弹:惊人的300行代码驱动R1和V3的训练与推理,超越各种专家内核
DeepSeek开源周第三弹! DeepSeek-AI 重磅发布高效FP8 GEMM库 DeepGEMM:极致性能,代码精简,助力V3/R1模型训练与推理! 简单来说这是由 DeepSeek-AI 团队精心打造的 FP8 通用矩阵乘法 (GEMM) 加速库,专为追求极致性能和代码简洁而生我们一起来扒一扒:Hopper GPU 上狂飙 1350 FP8 TFLOPS!
2/26/2025 10:11:01 AM
AI寒武纪
中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”
当地时间 2 月 25 日,Anthropic 正式发布了 Claude 3.7 Sonnet,“这是迄今为止我们最智能的模型,也是市场上首个混合推理模型。 ”Anthropic 官方表示。 简单来说,Claude 3.7 Sonnet 既能提供近乎即时的响应(标准模式,standard),也可以向用户直观展示其长时间的逐步思考过程(扩展思考模式,extended thinking)。
2/26/2025 10:10:12 AM
架构师秋天
开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测来了!
当很多 AI 公司还就是否该走开源路线而感到左右为难时,阿里的技术团队又开源了一个新的模型 —— 万相(Wan)视频生成大模型(包括全部推理代码和权重,最宽松的开源协议)。 经常玩视频生成模型的同学应该知道,当前的很多模型仍然面临多方面挑战,比如难以还原复杂的人物动作,处理不好物体交互时的物理变化,遇到长文本指令就「选择性遵循」等。 如果三个方面都做得比较好,那模型厂商多半是不舍得开源的。
2/26/2025 9:44:14 AM
机器之心
苹果史上最大投资!4年5000亿美金重注AI+芯片,特朗普专门感谢
苹果CEO库克,发文纪念乔布斯诞辰70周年:乔布斯不仅看到了世界的现状,更看到了它的无限可能。 他的远见不断激励我们突破界限,创造未来。 今天,在他70岁诞辰之际,我们缅怀他的传承,并致敬他永恒的影响力。
2/26/2025 9:30:26 AM
新智元
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
英伟达
Anthropic
智能体
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Sora
Agent
AI视频
GPU
百度
AI设计
华为
搜索
大语言模型
工具
场景
字节跳动
RAG
大型语言模型
预测
具身智能
深度学习
伟达
视觉
Transformer
神器推荐
AGI
亚马逊
视频生成
Copilot
DeepMind
模态
架构
LLaMA