资讯列表
大模型时代,通用视觉模型将何去何从?
过去几年,通用视觉模型(Vision Generalist Model,简称 VGM)曾是计算机视觉领域的研究热点。 它们试图构建统一的架构,能够处理图像、点云、视频等多种视觉模态输入,以及分类、检测、分割等多样的下游任务,向着「视觉模型大一统」的目标迈进。 然而,随着大语言模型 LLM 的迅猛发展,研究热点已经悄然发生转移。
7/2/2025 9:17:13 AM
Meta“1亿美元年薪”震荡硅谷!奥特曼回应:总有人唯利是图,而且都算不上TOP
疯狂,太疯狂。 这两天,硅谷乃至全球AI领域的注意力都被Meta老板扎克伯克带走了,毕竟也不是谁都能boss直聘,一举挖走8名OpenAI核心员工。 更何况其中大部分,还是以聪明能干吃苦耐劳著称的华人研究员。
7/2/2025 9:13:56 AM
荣耀打响 AI 语音技术新战役,全球首个端侧语音大模型即将上线!
荣耀官方微博@MagicOS宣布,荣耀成功实现全球首个端侧语音大模型的部署。 这项技术的进步不仅是荣耀的一次突破,更被誉为 “AI 语音技术再升级”。 这项重磅成果将在即将发布的荣耀 Magic V5海外版中首发亮相。
7/2/2025 9:00:44 AM
AI在线
xAI控制台新增Grok4及Grok4Code引用,标志着下一代AI模型即将发布
—xAI公司在其开发者控制台中新增了对Grok4及Grok4Code的引用,预示着其下一代人工智能模型的发布即将来临。 这一消息引发了业界对Grok4系列功能的广泛关注,标志着xAI在通用人工智能及开发者工具领域的又一重大进展。 根据AIbase的报道,xAI控制台的更新显示,Grok4将是xAI的旗舰模型,专注于自然语言处理、数学推理和综合推理能力的提升,被描述为“全能型AI的巅峰之作”。
7/2/2025 9:00:44 AM
AI在线
OpenAI CEO 奥特曼发声:Meta 挖角无损核心团队,承诺薪酬调整
近日,OpenAI 首席执行官萨姆・奥特曼(Sam Altman)对 Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)在人工智能领域的挖角行为进行了公开回应。 奥特曼表示,尽管 Meta 招募了一些优秀人才,但 OpenAI 仍然拥有其核心的顶尖团队,未受到实质性影响。 在周一的一份内部声明中,奥特曼明确表示,选择留在 OpenAI 对那些志在打造通用人工智能(AGI)的人来说是最明智的决定。
7/2/2025 9:00:44 AM
AI在线
华为又开源了个大的:超大规模MoE推理秘籍
超大规模MoE模型(如DeepSeek),到底该怎么推理才能做到又快又稳。 现在,这个问题似乎已经有了标准答案——华为一个新项目,直接把推理超大规模MoE背后的架构、技术和代码,统统给开源了! 这个新开源项目名叫Omni-Infer,整体来看,它对于企业用户来说是非常利好的。
7/2/2025 8:55:00 AM
马斯克 xAI 公司补充 100 亿美元弹药,火力聚焦打造地表最强 AI
CNBC 昨日(7 月 1 日)发布博文,报道称埃隆・马斯克(Elon Musk)为增强同 OpenAI 的竞争,通过 50 亿美元债务和 50 亿美元股权的方式,成功筹集了 100 亿美元(IT之家注:现汇率约合 716.35 亿元人民币),继续烧钱推进 AI 发展。
7/2/2025 8:54:09 AM
故渊
一文读懂数据标注:定义、最佳实践、工具、优势、挑战、类型等
想知道自动驾驶汽车或语音助手等尖端人工智能系统如何实现其惊人的准确性吗? 秘诀在于高质量的数据标注。 这一过程确保数据被精确标记和分类,从而使机器学习 (ML) 模型发挥最佳性能。
7/2/2025 8:54:01 AM
晓晓
超越微软,全球第一!上交AI智能体炼成「Kaggle特级大师」,登顶OpenAI MLE-bench
就在刚刚,一支来自中国高校的团队成功刷榜了OpenAI发布的权威基准测试MLE-bench! 这一次,荣耀属于上海交通大学人工智能学院Agents团队。 他们提出的AI专家智能体「ML-Master」,凭借着29.3%的平均奖牌率,拿下第一!
7/2/2025 8:50:00 AM
Meta抄袭DeepSeek大翻车?硅谷大佬爆料亮点满满,AI军备烧钱真相震碎硅谷
谁会首先到达ASI(超级智能)? 大佬斩钉截铁的回答,让主持人惊呆了几秒。 GPT-4.5到底哪里出了问题?
7/2/2025 8:47:00 AM
你的Agent电脑助手正在踩雷!最新研究揭秘Computer-Use Agent的安全漏洞
本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。 主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅。 通讯作者为刘东瑞和邵婧,上海 AI Lab 安全团队,研究方向为 AI 安全可信。
7/2/2025 8:46:00 AM
策略改写「一战历史」!中科院开源全新博弈智能体框架DipLLM
围棋、德州扑克曾是AI崛起的试炼场,从AlphaGo到Libratus,人工智能不断刷新策略上限。 但接下来的战场更难——Diplomacy:一款融合协作与竞争的七人博弈游戏,单轮动作空间高达10的64次方,其策略建模复杂度前所未有! 为此,Meta曾推出智能体Cicero[Meta, Science 2022],结合人类数据与策略搜索,在该领域实现突破,但其方法高度依赖超大规模均衡搜索与重资源训练,难以扩展与迁移。
7/2/2025 8:43:00 AM
伯克利&Meta面向具身智能的世界模型:让AI通过全身动作「看见」未来
本文基于 Yutong Bai、Danny Tran、Amir Bar、Yann LeCun、Trevor Darrell 和 Jitendra Malik 等人的研究工作。 论文标题:Whole-Body Conditioned Egocentric Video Prediction论文地址:::,人工智能领域一直在思考一个看似简单但非常根本的问题:如果一个智能体要在真实世界中行动、规划,并且和环境互动,它需要一个怎样的「世界模型」? 在很多早期研究中,世界模型就是一个预测引擎:只要给它一个抽象的控制指令,比如「向前走一米」或者「向左转 30 度」,它就能模拟出未来的图像。
7/2/2025 8:40:00 AM
借助氛围编程用Python编写一个速读应用程序,只需15分钟
译者 | 布加迪审校 | 重楼少些滚动,多点专注。 在这个用时15分钟的Python 项目中,我们将借助氛围编程编写一个简洁、无干扰的速读应用程序。 想象一下:你想构建一个速读应用程序。
7/2/2025 8:38:11 AM
布加迪
1080p飞升4k,浙大开源原生超高清视频生成方案,突破AI视频生成清晰度上限
为什么AI生成的视频总是模糊卡顿? 为什么细节纹理经不起放大? 为什么动作描述总与画面错位?
7/2/2025 8:30:00 AM
Meta“1亿美元年薪”震荡硅谷!奥特曼回应:总有人唯利是图,而且都算不上TOP
疯狂,太疯狂。 这两天,硅谷乃至全球AI领域的注意力都被Meta老板扎克伯克带走了,毕竟也不是谁都能boss直聘,一举挖走8名OpenAI核心员工。 更何况其中大部分,还是以聪明能干吃苦耐劳著称的华人研究员。
7/2/2025 8:17:58 AM
白交
当我们谈激活函数时,我们在谈什么?—— 从梯度消失到 ReLU 革命神经网络非线性的秘诀
激活函数本质上是神经网络的“秘密武器”,它使神经网络能够学习复杂的模式,并对现实世界中普遍存在的非线性关系进行建模。 但这些函数究竟是什么,为什么它们如此重要呢? 更重要的是,它们从何而来?
7/2/2025 7:30:13 AM
柏企阅文