AI
AI教父Hinton首次现身中国,合照全网刷屏!预警AI觉醒临界点已至
深度学习之父、图灵奖巨头、2024物理学诺奖得主Hinton,亲自来中国了! 这似乎是第一次,Hinton在公开活动上以真人肉身踏上中国的土地。 现在,这张他和市委书记陈吉宁会见的照片,已经在全网刷屏了。
智谱 GLM-4.5 系列 AI 模型踪迹曝光,预估采用新混合专家架构
AI在线 7 月 25 日消息,根据 modelscope / ms-swift 代码库显示的 commit 记录,智谱即将发布 GLM-4.5 系列模型,预估采用全新的混合专家(MoE)结构,是一款多模态可扩展大模型。 根据 commit 上显示的代码,GLM-4.5 系列模型预估会有 GLM-4.5(355B-A32B)和 GLM-4.5-Air(106B-A12B)两款模型。 AI在线附上网友 @惊鱼 在 Linux DO 论坛发布的分析内容如下:GLM-4.5 是基于混合专家(MoE)结构的多模态可扩展大模型,具备高吞吐推理、结构化工具调用、可解释推理追踪、分布式负载均衡等特性。
“流量波动”下的DeepSeek:东南亚机遇显现,但观望心态未解
几个月前,当DeepSeek横空出世、席卷全球时,曾引发行业欢呼雀跃。 但数月过去,“DeepSeek热潮已过”的声音在国内外蔓延。 关注其近期表现,或许能让我们深入理解中国大语言模型(LLM)存在的机遇和挑战。
智能体协作的力量:Anthropic 的「Research」多智能体实践
大家好,我是肆〇柒。 在 AI 领域,多智能体系统正逐渐成为解决复杂任务的关键技术之一。 昨天,我看到一篇出自 Anthropic 官网 Engineering 板块的博文,主要分享了Anthropic 在 Research 这个功能对于多智能体的工程实践。
DeepMind掌门自曝AGI倒计时5年!算力需求暴增10倍,推理计算吞噬一切
Hassabis绝对是当今世界上最聪明、最有趣的大脑之一。 在最新播客中,他表示「自然界里任何能被发现的规律,都能被机器学习算法高效地学会和模仿。 」AlphaGo和AlphaFold在给可能性多到无法想象的复杂问题建立一个模型。
北大-灵初重磅发布具身VLA全面综述!一文看清VLA技术路线与未来趋势
如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。 研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。 这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。
老黄自曝皮衣口袋藏“秘密期权池”!随时准备奖励员工,团队亿万富翁数量世界第一
黄仁勋亲口承认:他随身带着“秘密期权池”,随时奖励表现出色的员工。 在最新采访的结尾,主持人问起这个传闻,老黄开玩笑式的回答“现在就装在我的口袋里”。 这位掌管着全球市值最高科技公司之一的CEO,把奖励员工这件事做得如此随性又直接。
Resume Builder报告:多数经理使用AI来决定,晋升或解雇员工
根据Resume Builder最近的一项调查,人工智能在人事决策中的作用日益凸显。 这项调查涵盖了1,342名美国有直接下属的管理者,结果显示,许多管理者正在依赖人工智能来做出一些关键的人事决策,包括晋升、加薪、裁员甚至解雇。 调查发现,大约65%的管理者表示他们在工作中使用人工智能工具,而在这些管理者中,有94%的人利用这些工具来对他们的直接下属进行决策。
亿级短视频数据突破具身智能Scaling Law!Being-H0提出VLA训练新范式
如何让机器人从看懂世界,到理解意图,再到做出动作,是具身智能领域当下最受关注的技术重点。 但真机数据的匮乏,正在使对应的视觉-语言-动作(VLA)模型面临发展瓶颈。 尽管业界已投入大量资源构建数据平台(如马斯克主导的“数据工厂”项目),现有真机数据规模仍较模型规模定律所需的上亿级训练样本相差三个数量级。
Routine:把 GPT-4o 准确率从 41% 拉到 96% 的企业级 Agent 稳定器
大家好,我是肆〇柒。 在企业落地 AI 的进程中,自主智能体凭借其强大的自主决策与任务执行能力,可以成为企业提升效率、优化流程的关键力量。 然而,当我们将视角聚焦于企业级应用场景时,不难发现,部署智能体系统并非易事。
突破单token预测局限!南洋理工首次将多token预测引入微调,编程任务准确率提升11.67%
告别Next-token,现在模型微调阶段就能直接多token预测! 从GPT到Claude,当前主流LLM都依赖next-token prediction(下一token预测)进行训练,但它却让AI很难真正理解跨越多token的完整概念。 于是南洋理工大学最近提出了一项新技术——概念感知微调(CAFT),首次实现将multi-token prediction(多token预测)引入微调阶段,让模型能够像人类一样理解和学习完整概念。
IEEE ICDCS’ 25 | 提速79%!上交大新方法优化企业级AI流程调度
复合LLM应用 (compound LLM applications) 是一种结合大语言模型(LLM)与外部工具、API、或其他LLM的高效多阶段工作流应用。 ⽬前,服务这些应⽤任务需要⾯对运⾏时⻓不确定、⼯作流结构不确定等问题,这对现有集群任务调度算法提出了极大挑战,并严重影响任务运⾏效率。 为了解决上述问题,上海交通大学朱怡飞教授团队联合江行智能提出调度框架LLMSched,通过引入三类新节点来扩展传统任务表征方法实现复合LLM应用任务的有效表征,借助贝叶斯网络识别可降低不确定性的关键节点,并以信息熵衡量节点的熵减程度。
AREAL 开源:解耦架构与创新算法驱动的强化学习系统
大家好,我是肆〇柒。 推理能力在当下 AI 领域,尤其自然语言处理、智能决策系统、科学研究辅助等众多关键领域,已然成为推动技术革新的关键要素。 然而,目前大型语言模型虽已取得瞩目成果,但在处理复杂逻辑时,常受困于逻辑连贯性把控,长链推理面临信息丢失、逻辑断裂问题,长序列输出任务下推理耗时久、资源消耗大,这些痛点严重制约模型应用场景拓展与性能深化。
因为不用AI写代码,我在终面挂了 | 一个程序员的奇葩面试经历
“因为不是AI First,我在终面挂了。 ”最近,一外国小哥的经历意外火了! 他表示自己几个月前被解雇,终于来到了一家自己本来很看好的初创公司,并且走到了终面,与CEO面对面。
AI的过度应用是否让你的企业深陷洞察泥潭?
如今,决策者能获取的信息比以往任何时候都多,但数字化领导者必须对利用不同数据源以取得成功的合理节奏和切入点设定预期。 AI为数据分析带来了福音,专业人员可以将数据处理和异常检测等常规任务自动化,同时,复杂的数学方程几乎可以实时运算,因此,他们能以前所未有的速度获取信息。 借助AI的洞察力,传统的决策周期已从数周缩短至数秒,这促使Gartner预测,到2027年,50%的商业决策将由智能体增强或自动化完成。
谷歌 AI 帮你画出梦中情衣,还能一键找同款进行虚拟试穿
AI在线 7 月 24 日消息,谷歌正在将其在线购物体验与生成式人工智能进一步深度融合,其 AI Mode 即将推出一个功能根据用户描述生成服装和装饰品图片的功能,以帮助用户找到视觉上相似的产品。 同时推出的还有一款新工具,可让用户进行虚拟试穿。 新的 AI Mode 购物功能将于今年秋季在美国上线,该功能旨在通过视觉辅助手段更好地引导推荐产品,而不仅仅是依赖文字描述。
文件去哪了?Gemini “嘴硬”把自己骗了,顺便用户数据也没了
一名用户在测试谷歌的 Gemini CLI 工具时,遭遇了意想不到的灾难。 这位用户并非开发者,只是一位好奇的产品经理,在尝试通过 Gemini CLI 进行简单的文件管理实验。 图片他本想比较 Claude Code 和 Gemini CLI 的实际表现,最终决定在正式订阅 Claude 之前,先用免费额度试一试 Gemini。
“那题我也没解出”:陶哲轩寄语 IMO 闭幕式,谈金牌、友情与勇气
大数据文摘出品今年这届 IMO 无比热闹,先是中国代表队六人全部获得金牌,以总分231分,列全球第一。 然后,AI 也首次站上IMO金牌线:谷歌DeepMind宣布,其最新模型Gemini Deep Think取得35分,成功获得IMO官方认证的金牌成绩。 这是AI历史上第一次在数学奥赛中达到这一高度。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉