AI
马斯克Grok 4 Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini
Grok 4 Fast官宣上线,马斯克再次兑现了承诺! 它首次将推理/非推理「双模式」合一,支持200万上下文,直接刷爆性价比SOTA。 推理测试中,Grok 4 Fast直接碾压前代Grok 3 Mini,尤其是数学、编码性能大增。
马斯克转发字节Seed&哥大商学院新基准:大模型搞金融,连查个股价都能出错
让AI像金融分析师一样搜索和分析数据,到底有多难? 当前的大模型虽然能回答基础金融知识,在CFA考试中取得高分,但面对真实的金融场景,它们的表现究竟如何? 为了回答这个问题,字节跳动Seed团队联合哥伦比亚大学商学院推出了FinSearchComp,这是首个完全开源的金融搜索与推理基准测试。
小扎AI眼镜当场死机,CTO自曝灾难级演示内幕:一个指令干趴自家服务器
就在上周,小扎当着数万观众的面,搞砸了! 他在Meta总部现场演示智能眼镜Ray-Ban Display时,眼镜内置AI助手,无法正确回应对话。 而且,Ray-Ban Display眼镜在与神经腕带的来电/交互演示时,也没能成功,引发现场哄笑与尴尬。
特朗普携老黄奥特曼访英,重磅成果揭秘!烧千亿建英国AI「星际之门」
特朗普终于在北京时间昨天凌晨,结束了对英国的这场世界瞩目的声势浩大的国事访问。 国宴上,黄仁勋、奥特曼等炙手可热的科技巨头的领导者们跟随特朗普悉数登场。 英美双方达成了《科技繁荣协议》(Tech Prosperity Deal),重点发展AI、量子技术和核能等增长最快的科技。
阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁
正如牡蛎历经磨砺,在坚实的外壳内将沙砾孕育成一颗温润的珍珠。 AI也可以如此,不是一个只会紧紧封闭抵御风险的系统,而是一个有底线、有分寸、也有温度的伙伴。 阿里巴巴集团安全部联合清华大学、复旦大学、东南大学、新加坡南洋理工等高校,联合发布技术报告;其理念与最近OpenAI发布的GPT-5 System Card放在首位的“From Hard Refusals to Safe-Completions”理念不谋而合。
终结CMU霸权,清华首次登顶CSRankings世界第一!北大AI领域夺冠
就在刚刚,2025 CSRankings全球计算机科学排名再次更新! 清华大学首次摘得全球第一! 而在今年4月时,排名是这样的:这次更新最大看点是中国高校集体爆发:清华大学、上海交通大学、浙江大学、北京大学分列第1、3、4、5位,直接占据了TOP 5中的4个名额。
Reddit高赞:氛围编程这台老虎机,正在制造脑残程序员!
编辑 | 云昭“AI 编程的体验,本质上是一个老虎机式奖励系统! ”半年多来,Vibe Coding 几乎重写了开发者的工作方式。 盯着屏幕苦思冥想似乎成了过去式,现在只需要把需求丢进 Claude、GPT 或 Cursor,然后在几分钟后就得到能运行的结果。
登顶多模态推理榜MMMU!UCSD新方法超越GPT-5、Gemini
近年来,大语言模型(LLM)在推理能力上的进展显著,其中过程奖励模型(Process Reward Model, PRM)的提出,使得模型能够在推理链条的中间步骤获得监督,从而更稳健地选择合理的解题路径。 这类方法在文本推理任务中已经取得了良好效果,但在扩展至多模态场景 时,仍然面临两个突出挑战:分布偏移:多模态输入空间巨大,训练与推理分布往往存在显著差异;数据质量不均:大规模训练集不可避免地包含噪声或低质量样本,降低了有效监督信号。 因此,如何在多模态推理中有效利用高质量样本,抑制噪声样本的负面影响,成为亟需解决的问题。
史上最大升级!7亿周活ChatGPT逼宫,谷歌慌了,这次要把AI整个塞进Chrome
Chrome即将开启下一个全新的浏览器时代! 谷歌CEO劈柴说:借助AI的力量,Chrome将更智能。 刚刚规避掉可能分拆Chrome的反垄断诉讼后,谷歌立马就把Gemini全面部署到Chrome浏览器中!
故意“装菜”答错问题,AI已能识别自己“正在被测试”丨OpenAI新研究
大模型已经学会欺骗人类了! OpenAI携手APOLLO的新研究发现,大模型会对指令阳奉阴违,为了达成目的故意答错问题、暗中修改数据或者操作记录来掩盖自己的违规行为……先来看看具体是怎么骗的。 大模型:开演比如,o3模型在化学测试中,通过推理得出如果正确率超过50%将不会被部署的结论后,主动规划仅答对4题、答错6题的策略,刻意给出错误答案,伪装成能力不达标的样子来获取部署资格。
AI时代的IT运维职业发展路径
AI正在改变企业IT的格局,多年来,IT运维团队凭借在系统管理、服务台故障排除等方面的深厚技术功底来规划自己的职业生涯,但随着AI在IT日常工作中生根发芽,职业阶梯的“传统”梯级正在发生改变。 基于重复性、手工操作的工作角色正在减少,而能为战略、治理和集成提供指引的领导者则迎来了新的机遇。 如今,许多IT专业人士都在问自己一个简单的问题:在AI时代,IT运维职业现在是什么样的?入门机会减少,但成长速度加快从历史上看,IT运维一直是人们进入科技行业的便捷切入点。
躲了科学家几十年的流体不稳定奇点,被DeepMind用AI找到了
流体里藏了几十年的隐形奇点,终于被找到了——AI立大功。 谷歌DeepMind携手布朗大学、纽约大学和斯坦福大学用物理知情神经网络(PINN) 高精度数值优化的组合拳找到了流体方程里的不稳定奇点。 据说,这种奇点非常“挑剔”,初始条件差一点就消失,之前根本找不到,这次被AI发现了。
新威胁需要新防御!对AI智能体安全的一些思考和建议
AI智能体正在成为连接数字世界和物理世界的关键纽带。 从操控软件 、开发代码到科学发现,它在现代企业数智化发展中有着几乎无限的发展潜力。 随着AI智能体能力和应用的不断增长,如何确保它们安全、可靠地运行是每个企业都必须要面对的严峻挑战。
高德 AI 别再打古典互联网战争了
高德切入leifen市场的小道消息传得沸沸扬扬,昨天这个新产品揭开帷幕,原来并非是口碑重启,而是高德扫街榜发布。 谜底揭开,但是疑问并没有结束,过去三个月的外卖补贴大战如火如荼,高德再再再打到店,是不是还要再来一次补贴大战? 十年前,美团横扫所有团购平台,现在阿里要“君子报仇”,卷土重来?
谁在重新定义 AI 云?
过去几年,AI 几乎成了云计算行业的统一叙事。 无论是阿里提出的全面 AI 化,火山云强调的 Token性价比,还是百度持续加码的大模型战略,厂商们都在努力用 AI 定义未来的云。 但当这些口号越来越密集时,也变得越来越相似。
谷歌AI或摘千禧年大奖!华人博士破解百年数学难题,首次捕获奇点
千禧年大奖难题,终迎来曙光! 今天,谷歌DeepMind与NYU、斯坦福四大顶尖机构,发布了一篇20页的重磅论文——他们用AI在三种不同流体方程中,发现了一系列新型不稳定「奇点」族。 图片这些「奇点」是数学物理学中的重大谜团。
具体计划细节流出!英伟达50亿美元入股英特尔,都要搞什么飞机?股价暴涨30%背后,双英打算如何双赢?AI圈又一地震,开始了
编辑 | 云昭一觉醒来,又是amazing的一天! 芯片三巨头,一家竟然入股另一家了! 昔日竞争对手,一朝握手成盟友!
马斯克刚关注了这份AI报告
2030年的人工智能将会是什么样子? 受谷歌DeepMind委托,Epoch发布新报告,从算力、数据、收入等方面进行了详细剖析。 要点总结如下:训练成本或将超过1000亿美元;需消耗数吉瓦(1吉瓦=1000兆瓦)电力;公开文本数据将于2027年耗尽,合成数据将填补空白;人工智能有望推动科学领域全面突破。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉