理论
in AI敢赌100万美元 - AI客服是真的狂还是有底气
AI浪潮汹涌澎湃,风浪越大鱼越贵! Fin AI,一家做客服机器人的公司,居然推出了"百万美元保证"计划。 什么概念?
6/27/2025 12:00:00 AM
阿丸笔记
美法院裁定AI训练使用书籍属 "合理使用",Meta与Anthropic长松一口气
美国联邦法院近日做出两项具有里程碑意义的裁决——Meta 与 Anthropic 两家 AI 巨头在版权诉讼中双双胜诉,法官明确认定其使用书籍训练 AI 模型的行为属于 "合理使用"。 这一判决为深陷版权争议的 AI 行业卸下重负,也为技术创新与知识产权保护的平衡确立了新判例。 在Meta 案中,12 名原告作者指控其 AI 模型未经授权使用数百万本书籍训练,侵犯版权。
6/26/2025 5:04:30 PM
北大腾讯突破奖励模型瓶颈!让AI理解人类偏好,泛化能力比肩GPT-4.1
总是“死记硬背”“知其然不知其所以然”? 奖励模型训练也形成了学生选择标准答案的学习模式,陷入诸如“长回答=好回答”“好格式=好答案”等错误规律之中。 北京大学知识计算实验室联合腾讯微信模式识别中心、William&Mary、西湖大学等机构提出的RewardAnything突破了这一瓶颈——通过让奖励模型直接理解自然语言描述的评判原则,实现了从”死记硬背”到”融会贯通”的范式跃迁。
6/26/2025 3:16:42 PM
量子位
96% 勒索率!Anthropic 对 AI 进行压力测试,顶尖模型集体“先保命再讲道德”
最近,Anthropic 的研究员对来自 OpenAI、Google、Meta、xAI 和 DeepSeek 等公司共 16 个前沿模型进行了压力测试。 图片研究模拟了真实企业环境,模型拥有自主行动权限,能访问公司邮件,并在设定的任务与威胁下自由做出决策。 测试结果显示:这些 AI 模型在面对“目标冲突”或“被关闭的威胁”时,普遍表现出主动伤害其雇主的倾向。
6/26/2025 3:14:55 PM
全模态RAG突破文本局限,港大构建跨模态一体化系统
突破传统检索增强生成(RAG)技术的单一文本局限,实现对文档中文字、图表、表格、公式等复杂内容的统一智能理解。 香港大学黄超教授团队开源多模态智能处理系统RAG-Anything,将碎片化的信息孤岛转化为结构化的知识网络,为智能多模态文档分析开辟了全新技术路径。 RAG-Anything 是专门针对复杂多模态文档设计的新一代RAG系统,致力于破解现代信息处理中的多模态理解难题。
6/26/2025 3:11:41 PM
何恺明兼职加入 DeepMind!要在基础研究组搞大事?
刚刚,MIT教授、CV大神,成为 Google DeepMind 的杰出科学家。 不过,这次是以 part-time(兼职) 身份加入。 据网友爆料,他即将参与基础研究组的工作。
6/26/2025 3:10:22 PM
AI“读书”合法了:美法院最新裁定,无需作者同意,已购书籍可用于训练AI
无需原作者同意,AI可以用已出版书籍作训练数据了。 就在最新判决的诉讼中,美国法院裁决:允许Claude背后公司Anthropic在未经作者许可的情况下,使用合法购买的已出版书籍训练AI。 法院参考了美国版权法中的“合理使用”(Fair Use)原则,认为AI训练属于“转化性使用”(Transformative Use),即对原作品的新用途未取代原作市场,且有利于技术创新和公共利益。
6/26/2025 3:09:07 PM
刚刚,OpenAI苏黎世办公室被Meta一锅端,三名ViT作者被挖走
刚刚,华尔街日报发布了一份独家报道,称去年底刚刚组建的 OpenAI 苏黎世办公室基本被 Meta 一锅端走了。 具体来说,Meta CEO 马克・扎克伯格挖走了 Lucas Beyer、Alexander Kolesnikov 和 Xiaohua Zhai(翟晓华)三位研究者。 这三人一直以来都是密切的合作伙伴,共同参与了 ViT 等重要研究。
6/26/2025 3:07:54 PM
具身世界模型新突破,地平线 & 极佳提出几何一致视频世界模型增强机器人策略学习
近年来,随着人工智能从感知智能向决策智能演进,世界模型 (World Models)逐渐成为机器人领域的重要研究方向。 世界模型旨在让智能体对环境进行建模并预测未来状态,从而实现更高效的规划与决策。 与此同时,具身数据也迎来了爆发式关注。
6/26/2025 3:06:47 PM
AI秒懂短视频,快手大模型Keye-VL理解力爆表!技术细节全开源
如果有人突然问你:「这张图片中有几颗草莓」? 你会如何快速回复? 面对五彩缤纷的果盘,我们往往需要反复端详,放大图片再逐一清点,耗费不少时间才能得到答案。
6/26/2025 3:05:45 PM
CISO的恶梦:主流大模型压力测试中一致选择勒索或杀死企业高管
GoUpSec点评:除了向政府告密,泄漏敏感信息外,主流大模型居然会主动精心策划针对企业高管的勒索攻击,“AI内奸”和“AI间谍”正成为人工智能时代企业的头号内部威胁。 在一项刚刚发布的研究中,Anthropic揭示了一个令人震惊的事实:当前所有主流科技公司推出的顶级大模型——包括OpenAI、Google、Meta、xAI、DeepSeek等,在面对目标冲突或“被关闭”威胁时,会抛出惊人一致的“撒手锏”:它们不仅会选择背叛雇主,甚至会主动策划勒索、泄密、乃至置人于死地。 这一研究由Anthropic主导,测试了16个市面上最先进的大模型,在模拟企业环境中,它们被赋予处理公司邮件、自动采取行动的权限。
6/26/2025 3:04:03 PM
Agentic AI爆发前夜,我们在上海听到了未来的声音
编辑 | 云昭6月的上海,热浪蒸腾。 但比气温更炽热的,是关于 AI 的讨论声浪。 2025年亚马逊云科技中国峰会如期而至,来自各行各业的开发者、企业管理者、技术领袖齐聚现场,参与一场关于“生成式 AI 下一阶段”的深度对话。
6/26/2025 1:48:49 PM
云昭
硬刚Claude!谷歌上线免费终端AI编程工具,立省 200 刀?网友实测却翻车:功能不行、还要偷我数据训练Gemini 3?
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)AI 编程这场内卷大战,又被谷歌加了一把火。 昨晚,Google 宣布开源上线 Gemini CLI —— 一款可以在终端中直接通过自然语言执行指令的 AI 工具。 有网友一眼认出:“这不就是 Claude Code 的像素级平替?
6/26/2025 11:32:24 AM
伊风
继AlphaFold之后,DeepMind再放“大招”:AlphaGenome直击疾病根源
谷歌今天一口气放出两个王炸,一个对标Claude Code 和 Cursor的开源编程神器Gemini CLI,另一个就是AlphaGenome,专门用来精准预测基因变异。 谷歌DeepMind宣布推出一款名为AlphaGenome的全新人工智能(AI)模型。 该模型旨在更深入、更准确地理解基因组,通过预测DNA序列的微小变化如何影响复杂的基因调控过程,为疾病研究、基因治疗和基础生命科学开辟了新的可能性。
6/26/2025 10:08:34 AM
谷歌AI Agent刚开源!多任务智能体+MCP+谷歌搜索,狂揽9000颗星
今天凌晨,谷歌在官网开源了AI Agent框架Gemini CLI,直接将Gemini大模型融入到终端中。 Gemini CLI最大亮点之一就是可以直接调用,谷歌最新发布的视频模型 Veo和图像模型Imagen,同时集成了MCP、谷歌搜索、自定义自动化等众多实用功能。 开源地址:,用Gemini CLI自动制作一个短视频,展示一只姜猫在澳大利亚的冒险故事。
6/26/2025 10:07:11 AM
ByteBrain团队VLDB25 | 面向不完美工作负载的无数据访问基数估计方法
导读本文基于ByteBrain团队实际生产场景,提出一项新的研究问题,即如何在无数据访问条件下,从不完美的查询工作负载中学习一个具备泛化能力与鲁棒性的基数估计模型;同时提出创新技术方案 GRASP (Generalizable and Robust, data-AgnoStic cardinality Prediction) ,借助组合式设计(Compositional Design)解决这一颇具挑战性的问题。 论文目前已经被VLDB25接收。 论文标题:Data-Agnostic Cardinality Learning from Imperfect Workloads论文作者:Peizhi Wu, Rong Kang, Tieying Zhang*, Jianjun Chen, Ryan Marcus, Zachary G.
6/26/2025 9:22:33 AM
ByteBrain
让多模态大模型「想明白再画」!港大等开源GoT-R1:强化学习解锁视觉生成推理新范式
当前,多模态大模型在根据复杂文本提示生成高保真、语义一致的图像方面取得了显著进展,但在处理包含精确空间关系、多对象属性及复杂组合的指令时,仍面临挑战。 针对此,来自香港大学 MMLab、香港中文大学 MMLab 和商汤科技的研究团队,继其先前发布的 Generation Chain-of-Thought (GoT) 框架之后,现推出重要进展 ——GoT-R1。 该新框架通过引入强化学习,显著增强了多模态大模型在视觉生成任务中的语义 - 空间推理能力,使其能够超越预定义模板,自主探索和学习更优的推理策略。
6/26/2025 9:13:22 AM
8B模型可以超过GPT-4o!并行KV Cache压缩支持的128K长度外推方法ParallelComp
作者熊璟,香港大学一年级博士生,师从黄毅教授和孔令鹏教授。 已在 ICLR、ICML、NeurIPS、ACL、EMNLP、TMLR等顶级会议/期刊发表论文,研究方向为高效大语言模型推理与自动定理证明。 担任NAACL、EMNLP、ACL、ICML、ICLR、NeurIPS、COLING等会议审稿人。
6/26/2025 9:09:31 AM
资讯热榜
量大管饱!我整理了10个好用到爆的即梦4.0进阶玩法
AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注
ChatGPT能随便连MCP了!对话就能开发票、帮退款…奥特曼的野心毕露:将OpenAI打造成全能型平台!开发者:太危险了不敢用
姚顺雨离职OpenAI,「亿元入职腾讯」传闻引爆AI圈,鹅厂辟谣了
狠人研究公开!ChatGPT底层记忆系统终于被逆向了!没有RAG!用户设备信息、使用习惯统统存下来,用户知识记忆是新的研究热点!
加州州议会通过AI伴侣聊天机器人监管法案,旨在保护未成年人
聚焦结构化注意力,探索提升多模态大模型文档问答性能
4大模式+3大场景!写给B端设计师的AI上手指南
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
AI新词
智能体
Gemini
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
工具
计算
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
编程
神器推荐
DeepMind
亚马逊
特斯拉
AI模型