AI在线 AI在线

资讯列表

当Search Agent遇上不靠谱搜索结果,清华团队祭出自动化红队框架SafeSearch

该文第一作者是清华大学博士生董建硕,研究方向是大语言模型运行安全;该文通讯作者是清华大学邱寒副教授;其他合作者来自南洋理工大学和零一万物。 在 AI 发展的新阶段,大模型不再局限于静态知识,而是可以通过「Search Agent」的形式实时连接互联网。 搜索工具让模型突破了训练时间的限制,但它们返回的并非总是高质量的资料:一个低质量网页、一条虚假消息,甚至是暗藏诱导的提示,都可能在用户毫无察觉的情况下被模型「采纳」,进而生成带有风险的回答。
10/16/2025 7:10:00 PM
机器之心

黄仁勋女儿直播亮相,聊了具身智能

时令 发自 凹非寺. 量子位 | 公众号 QbitAI黄仁勋大家都见得多了,但你见过他女儿讲具身智能吗? 这不,黄仁勋女儿Madison Huang首次公开亮相直播访谈节目,作为英伟达Omniverse与物理AI高级总监,与光轮智能CEO谢晨,以及光轮智能增长负责人穆斯塔法一起,对“如何缩小机器人在虚拟与现实之间的差距”展开深刻探讨。
10/16/2025 6:52:54 PM
时令

雷军公开发言了!呼吁抵制水军黑公关,资源集中技术研发

一凡 发自 北京. 智能车参考 | 公众号 AI4Auto只在地上跑,已经满足不了中国车企了。 刚刚,车圈大佬云集北京亦庄,在2025世界智能网联汽车大会上介绍了当前的成绩,展望了未来。
10/16/2025 6:23:30 PM
一凡

OpenAI 放宽 ChatGPT 成人内容引争议,奥尔特曼回应称“我们不是世界道德警察”

10 月 16 日消息,当地时间周三,OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)在面对外界对其放宽内容限制政策的批评时回应称,该公司“并非世界选出的道德警察”。 图源:OpenAI 官网此前,奥尔特曼宣布将放松对旗下聊天机器人 ChatGPT 的内容管制,允许包括情色内容在内的成人主题内容上线,此举引发了广泛争议。 作为回应,奥尔特曼于周三表示,OpenAI 并不打算充当全球用户行为的道德裁决者。
10/16/2025 6:10:22 PM
远洋

结盟芯片巨头,OpenAI意欲何为?

从与英伟达深化算力绑定,到与AMD构建“股权 算力”共生体系,再到联合博通推进定制芯片研发。 OpenAI在短时间内,就已搭建起覆盖通用算力采购、定制硬件开发、全链路基础设施建设的庞大合作网络。 我们看到,OpenAI每一步动作看似独立,实则围绕“掌控算力自主权”这一核心目标层层递进,既是对当下算力短缺危机的破局之举,更是对通用人工智能(AGI)时代产业规则的抢占先机。
10/16/2025 6:08:48 PM
Yu

​百度搜索推出 AI 短剧平台,开启公测助力创作者

10月16日,百度搜索正式宣布其 AI 短剧生成平台的公测上线。 这一平台旨在通过亿元创作基金和百亿流量的支持,全面提升创作者的内容创作能力,助力他们实现长久的 IP 变现。 该平台具备自动生成和人机协作等多种创作模式,可以有效辅助创作者完成超过80% 的内容创作任务。
10/16/2025 5:52:04 PM
AI在线

字节跳动的豆包大模型:日均调用超30万亿tokens,增长势头惊人!

火山引擎的总裁谭待在一次活动中披露了其豆包大模型的最新使用数据。 令人惊讶的是,豆包大模型的 tokens(即大模型文本单位)使用量从 2024 年 5 月的 1200 亿 tokens 猛增至 2025 年 9 月的超过 30 万亿 tokens,增长幅度达到了惊人的 253 倍。 这组数据不仅展示了豆包大模型在市场中的迅速普及,也反映了其在各行各业应用的潜力。
10/16/2025 5:52:03 PM
AI在线

甲骨文的 AI 超级集群建设新策略

在2025年10月13日至16日于美国拉斯维加斯举行的甲骨文人工智能世界大会上,甲骨文云基础设施(OCI)高级副总裁兼首席技术架构师普拉迪普・文森特(Pradeep Vincent)表示:“我们希望将云计算带到客户身边,而不是让客户来云端。 ” 他在会上分享了公司不断演变的云战略、人工智能基础设施的雄心以及印度在下一波人工智能浪潮中的潜力与机遇。 文森特回顾了自己二十多年来见证云计算发展的历程,他认为现在正是其职业生涯中最具变革性的时刻。
10/16/2025 5:52:01 PM
AI在线

阿里发布Qoder CLI,可在终端一键实现AI编程

10月16日凌晨,阿里全新AI编程工具Qoder CLI(命令行界面)正式上线,该工具具备强大的代码生成与理解能力,并大幅降低内存消耗和命令响应时间,进一步提升开发效率。 即日起,全球开发者可通过任意命令行终端使用Qoder CLI体验代码生成、调试和部署等任务。 随着大模型能力的跃升,国内外涌现了多款 AI原生IDE工具,传统IDE也纷纷拥抱AI Coding 赛道。
10/16/2025 4:43:01 PM
henry

全球计算机系统领域“奥运会”SOSP公布最佳论文 “星绽”OS入选

近日,被誉为全球计算机系统领域“奥运会”的顶级学术会议SOSP 2025公布奖项评选结果,“星绽”开源操作系统在高可扩展内存管理方面的研究论文,斩获今年的最佳论文奖(Best Paper Award)。 据悉,本届SOSP会议共收到368篇投稿,最终录用66篇,其中最佳论文奖仅设三席。 这标志着星绽OS在破解操作系统“性能与安全兼顾”这一难题上的探索,获得了国际学术界的认可。
10/16/2025 4:34:25 PM
henry

香港金管局公布AI沙盒名单,蚂蚁数科成核心技术合作伙伴

10月15日,香港金融管理局(HKMA)联合香港数码港公布第二期生成式 AI 沙盒计划名单,蚂蚁数科、中银香港、富邦香港等20家银行及14家技术合作伙伴的27个用例入选。 蚂蚁数科作为核心技术合作方之一,将为沙盒提供包括 AI 智能体服务与 AI 安全产品在内的创新解决方案,助力银行业在运营效率、用户体验与风险防控等方面全面升级。 本期沙盒计划重点聚焦「AI 治理」与「AI 对抗 AI」策略,多个用例尝试用 AI 自动检测、审查 AI 生成内容,以大规模方式提升系统准确性与一致性,推动香港金融体系的负责任 AI 应用落地。
10/16/2025 3:57:19 PM
AI在线

首个video2code基准IWR-Bench发布:让模型“看视频写网页”,SOTA仅36.35分

IWR-Bench由上海人工智能实验室联合浙大、2077AI、港中文、斯坦福等单位共同完成,第一作者陈杨是浙江大学硕士生,通讯作者为上海人工智能实验室沈宇帆、石博天。 引言多模态大模型在根据静态截图生成网页代码(Image-to-Code)方面已展现出不俗能力,这让许多人对 AI 自动化前端开发充满期待。 然而,一个网页的真正价值远不止于其静态布局。
10/16/2025 3:43:00 PM
新闻资讯

英特尔揭幕下一代服务器CPU至强6+:2nm制程,能效大幅提升

上周,英特尔首次披露了下一代消费级芯片架构 Panther Lake 的信息,与此同时,其 X86 服务器 CPU 至强 6 (代号 Clearwater Forest)也浮出水面。 在近日的活动中,英特尔的工程师们为我们分享了至强 6 产品架构、技术层面的信息。 Clearwater Forest 是英特尔首款基于 18A 节点(等效 2nm)的服务器处理器,预计将于 2026 年上半年推出。
10/16/2025 3:10:00 PM
李泽南

单细胞分析迈入新前沿:谷歌&耶鲁等发布270亿参数模型,为癌症治疗揭示全新潜在路径

编辑丨coisini今年早些时候,谷歌联合耶鲁大学等证实生物模型与自然语言处理类似,同样遵循扩展定律:模型规模越大,在生物学任务中的表现就越出色。 这引出了一个关键问题:扩大模型规模仅能提升现有任务性能,还是能催生全新能力? 谷歌认为:规模化的真正价值在于创造新思路、探索未知领域。
10/16/2025 2:42:00 PM
ScienceAI

OpenAI 为 ChatGPT 推出智能记忆清理功能,Plus 用户率先体验

OpenAI 近日为 ChatGPT 推出了全新的 自动记忆管理功能,该功能旨在帮助用户更轻松地管理 AI 的长期记忆,提升交互体验。 目前仅向 ChatGPT Plus 和 ChatGPT Pro 付费订阅用户 开放,并将从今日起陆续推送。 此前,ChatGPT 的记忆功能允许用户设置个性化偏好,让模型在回答时能参考用户的背景信息,从而提供更有针对性的内容。
10/16/2025 1:46:12 PM
AI在线

仅用三五条样本击败英伟达,国内首个超少样本具身模型登场,还斩获顶会冠军

国内首个少样本通用具身操作基础模型发布,跨越视觉语言与机器人操作的鸿沟。 具身智能领域终于要突破 “数据桎梏” 了吗? 相较于自然语言、视觉领域,具身智能的数据天然稀缺。
10/16/2025 1:15:00 PM
机器之心

「性价比王者」Claude Haiku 4.5来了,速度更快,成本仅为Sonnet 4的1/3

距离上次新品发布仅仅两周后,Anthropic 又出手了。 最新消息,Anthropic 发布轻量级模型 Claude Haiku 4.5,主打「更便宜、更快速」。 据 Anthropic 介绍,Claude Haiku 4.5 的编码性能可与中高端模型 Claude Sonnet 4(这是 Anthropic 于 5 个月前发布的模型)相媲美,但成本更低,每百万输入 token 的成本为 1 美元,每百万输出 token 的成本为 5 美元,仅为 Claude Sonnet 4 的三分之一。
10/16/2025 1:12:00 PM
机器之心

谷歌开源全栈平台Coral NPU,能让大模型在手表上全天候运行

今天,谷歌有点忙。 一方面,他们与耶鲁大学合作基于 Gemma 研发的 Cell2Sentence-Scale 27B (C2S-Scale) 首次预测了一种新的潜在癌症疗法,引发世界广泛关注。 另一方面,他们又更新上线了 Veo 3.1,为用户带来了大幅提升的视频生成能力,参阅报道《刚刚,谷歌 Veo 3.1 迎来重大更新,硬刚 Sora 2》。
10/16/2025 1:08:00 PM
机器之心