AI
1.58bit不输FP16!微软推出全新模型蒸馏框架,作者全是华人
1.58bit量化,内存仅需1/10,但表现不输FP16? 微软最新推出的蒸馏框架BitNet Distillation(简称BitDistill),实现了几乎无性能损失的模型量化。 该框架在4B及以下的Qwen、Gemma上已被证实有效,理论上可用于其他Transformer模型。
10/20/2025 5:15:35 PM
Nature点赞!哈佛MIT最新作:AI科学家时代来了
随着近期大模型和智能体的飞速发展,这条路径正在通向一种全新的阶段:「AI科学家」。 在AI赋能科研的前沿,我们正见证一个重要的里程碑:从证明AI智能体「能否」解决特定科学问题,转向思考如何让它「高效、可靠、规模化」地参与整个研究过程。 Nature近期发布的新闻解析, 报道了由哈佛大学Marinka Zitnik和高尚华团队与MIT发布的首款大规模工具开源框架ToolUniverse。
10/20/2025 5:06:19 PM
GEO 实操指南:内容如何被“AI搜索”引用?
在传统的搜索引擎优化(SEO)时代,内容是为了“被人找见”而写的。 如今,随着人工智能(AI)、大语言模型(LLM)与生成式搜索(Generative Search)开始普及,内容不仅要“被人看到”,更要“被AI系统看到、理解、引用”。 这一演变催生了一个新的术语:生成式引擎优化(GEO = Generative Engine Optimization)。
10/20/2025 2:56:24 PM
AI在线
印度顶尖 IT 公司稳住员工队伍,推动 AI 技能再培训
印度四大 IT 公司 —— 塔塔咨询服务公司(TCS)、印孚瑟斯(Infosys)、HCL 科技(HCLTech)和威普罗(Wipro)正在经历一场以重塑为主的员工转型,而非简单的扩张。 2026财年第二季度的数据显示,这一行业的招聘活动减缓,员工流失率趋于稳定,人工智能(AI)已成为推动人力资源策略的核心。 图源备注:图片由AI生成,图片授权服务商Midjourney在最新的数据中,Wipro 的员工流失率为14.9%,HCL 为12.6%,印孚瑟斯为14.3%,而塔塔咨询服务则为13.3%。
10/20/2025 11:32:11 AM
AI在线
高盛:人工智能热潮并非泡沫,才刚刚起步
10 月 19 日消息,尽管市场对人工智能(AI)泡沫的担忧日益加剧,但高盛(Goldman Sachs)认为,这场 AI 繁荣才刚刚拉开序幕。 这家华尔街巨头的分析师指出,当前的投资规模与 AI 所能带来的潜在经济回报相比仍然较小。 高盛分析师在周三发布的一份报告中写道:“生成式 AI 所承诺的巨大经济价值,足以支撑当前对 AI 基础设施的投资。
10/20/2025 9:51:38 AM
远洋
开源对机器人的价值,远超大模型时代的想象丨唐文斌深度对谈抱抱脸创始人
“很多模型在模拟器里完美运行,但一到现实就彻底失灵。 ”在最新一次线上对谈中,Dexmal联合创始人唐文斌与Hugging Face联合创始人Thomas Wolf指出了当前机器人研究的最大痛点。 唐文斌是旷视科技联合创始人兼CTO,原力灵机(Dexmal)CEO、清华大学“姚班”出身、首届“Yao Award”金牌得主。
10/20/2025 9:30:15 AM
OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬
太尴尬了。 就在周末,GPT-5又双叒带来了数学方面的新突破,一道难题被宣称解决…然鹅……很快就被发现是OpenAI的“营销过度”,小题大作,根本算不上什么突破。 友商大咖们也都不装了。
10/20/2025 9:22:56 AM
「死亡互联网理论」刷屏硅谷!Reddit创始人预警,奥特曼公开发声
当互联网被AI内容淹没,真正由人类创作的内容正在日益缩减。 「如今的互联网,大部分已经死了」,近日Reddit联合创始人Alexis Ohanian一语惊人。 Reddit联合创始人Alexis Ohanian他口中的「互联网死亡」并不是指互联网被关闭了,而是被铺天盖地的AI生成内容所淹没,失去了真实的生命力。
10/20/2025 9:15:00 AM
扎克伯格急了!Meta内部文件曝光:宁用竞品,也要废掉祖传系统
九位数年薪抢人、数百亿美元押注、部署从「小时级」压到「分钟级」。 在Meta,时间就是唯一敌人。 据报道,Meta的「超级智能实验室」(Meta Superintelligence Lab, MSL)正在发起一场深度内部革命,旨在引导团队转向更快的工程工具,全面加速AI的开发进程。
10/20/2025 9:14:00 AM
GPT-5破解世纪难题,竟是上网抄来的!哈萨比斯:太尴尬了
OpenAI团队狂吹了一波GPT-5,结果竟是闹剧一场......事情是这样的。 几天前,OpenAI科学家Sebastien Bubeck激动转发,两位研究员联手GPT-5 Pro,仅用了一个周末,破解了10个「百年悬案」——埃尔德什难题(Erdos problems)紧接着,OpenAI科学副总裁Kevin Weil等人纷纷加入,大肆宣传。 然而,真相很快浮出水面:这十道难题,早就被学界解决,并非由GPT-5独立解决,它只是通过检索网络文献给出了答案。
10/20/2025 9:13:00 AM
浙大推出首个「多图应用题」基准GSM8K-V,全面评估 VLM数学推理能力
「小明买了3个苹果,每个5元,他付了20元,应该找回多少钱? 」这是典型的小学数学应用题。 但在日常生活中,我们更常遇到的是它的视觉版本:看到货架上的苹果标价牌,数出购物篮里的苹果数量,估算总价,再从收银员手中接过找零,快速判断对不对。
10/20/2025 9:12:00 AM
超越纯视觉模型!不改VLM标准架构,实现像素级深度预测
在当前多模态AI发展浪潮中,视觉语言模型(Vision Language Models, VLMs)因其能通过「看图 文字交互」处理多样任务而备受关注。 然而,尽管在语义理解、视觉问答、图像指令等任务上表现优异,它们在从 2D 图像理解 3D 空间结构方面仍显薄弱。 相比之下,纯视觉模型(pure vision models)在 绝对深度估计(metric depth estimation) 等三维理解任务上,凭借专门设计的网络结构与损失函数,早已达到了超越人类的精度。
10/20/2025 9:09:00 AM
5万美元筛选「超级婴儿」, 智商提升15点?马斯克被曝是客户!
马斯克,这个誓言要将人类文明送上火星的男人,正在地球上进行一场更私密、也更具争议的实验——「优化」自己的孩子。 据《华盛顿邮报》披露,他至少有一名子女使用了胚胎多基因筛查服务。 这项技术,正被硅谷的VC和创业者们包装成通往「超级婴儿」的金色门票,吸引着富豪们斥巨资入场。
10/20/2025 9:08:00 AM
无需再训练即可增强性能!港大团队提出GPC框架,实现机器人「策略组合」
本文一作曹嘉航,香港大学在读博士生,前北京人形机器人创新中心实习生;共同一作黄翊泽,上海交通大学在读本科生;通讯导师 Andrew F. Luo,香港大学助理教授。 在机器人学习领域,提升基于生成式模型的控制策略(Policy)的性能通常意味着投入巨额成本进行额外的数据采集和模型训练,这极大地限制了机器人能力的快速迭代与升级。
10/20/2025 9:07:00 AM
长上下文窗口、Agent崛起,RAG已死?
在技术飞速更新迭代的今天,每隔一段时间就会出现「XX 已死」的论调。 「搜索已死」、「Prompt 已死」的余音未散,如今矛头又直指 RAG。 向量数据库 Chroma 创始人兼 CEO Jeff Huber 在播客与访谈中抛出「RAG 已死,上下文工程当立」的表述,主张以上下文工程框架取代对「RAG」这一术语的狭义依赖。
10/20/2025 9:06:00 AM
教多模态大模型学会“反思”和“复盘”,上交&上海AI Lab重磅发布MM-HELIX&AHPO,破解多模态复杂推理难题
多模态大模型表现越来越惊艳,但人们也时常困于它的“耿直”。 无论是生成代码、分析图表还是回答问题,诸多多模态大模型(MLLM)都倾向于给出一个“一步到位”的答案。 它们就像一个从不检查作业的“学霸”,虽然知识渊博,但一旦在复杂的、需要反复试错的问题上走错一步,就很难回头。
10/20/2025 9:02:00 AM
让模型“看视频写网页”,GPT-5仅得36.35分!上海AI Lab联合发布首个video2code基准
多模态大模型在根据静态截图生成网页代码(Image-to-Code)方面已展现出不俗能力,这让许多人对AI自动化前端开发充满期待。 然而,一个网页的真正价值远不止于其静态布局。 用户的点击、筛选、表单提交,乃至游戏中的每一步操作,都构成了其核心的交互功能。
10/20/2025 9:01:00 AM
企业云+AI融合的未来图景与应对策略
作者 | 孙杰审校 | 重楼引言:AI浪潮驱动云战略转型随着人工智能技术的迅猛发展,尤其是大模型应用的广泛落地,企业对云计算的需求已从基础设施的“资源上云”逐步转向业务与智能不断融合的“深度用云”。 据Canalys统计,2024年中国云服务总支出达400亿美元,同比增长13%,而DeepSeek于2025年初推出的高性能低成本大模型DeepSeek R1,更是进一步点燃了市场对“云 AI”融合的热情。 调研显示,已有33%的中国企业认识到,云与AI的深度融合能够推动产品与服务创新。
10/20/2025 9:00:00 AM
孙杰
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
芯片
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
大语言模型
具身智能
生成
百度
Sora
工具
GPU
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
架构
DeepMind
亚马逊
编程
特斯拉
视觉
Transformer
AI模型
预测
MCP