理论
“零人”搞医学研究:清华AI智能体从灵感到论文全程自主
医学研究迎来“零人工”时代了? 清华大学自动化系索津莉课题组,发布首个专为医疗信息学设计的全自主AI研究框架——OpenLens AI。 首次实现从文献挖掘→实验设计→数据分析→代码生成→可投稿论文的全链条自动化闭环。
9/26/2025 10:47:35 AM
云栖通道上演AI“实战秀”:守护珊瑚、助盲出行、千元机器人勾勒落地新图景
9月25日正午,杭州云栖大会现场2号馆小舞台,云栖通道如期开通。 这是一个为广大AI产业从业者、创业者以及大模型开发者提供的专属交流平台。 在今年的主题分享中,四位嘉宾带着各自的AI创新成果登台:从南海珊瑚礁的守护,到视障人群的出行辅助;从低成本具身智能开发,到农牧场的智能管理,用真实案例勾勒出人工智能落地现实的鲜活图景。
9/26/2025 10:40:33 AM
ChatGPT 开始“管你的闲事”了
过去我们用 ChatGPT,大多是“有问题→它回答”。 这种即时反馈很神奇,但也有个缺点:它只会在你开口时帮忙,下一步怎么走还是得靠自己。 现在,OpenAI 正在测试一个新功能——ChatGPT Pulse。
9/26/2025 10:13:12 AM
Nature重磅:AI和人脑的根本区别找到了,我们对“聪明”的理解可能全错了
一篇发表在2025年《自然·机器智能》(Nature Machine Intelligence)上的研究,像一颗深水炸弹,炸开了人工智能和人类认知之间最深的那道墙。 这篇由二十多位国际顶尖专家联手的研究,它告诉我们,AI和人类在“泛化能力”上,压根就不是一回事。 什么叫泛化能力?
9/26/2025 9:37:06 AM
“iFold”,苹果AI新成果
起猛了,苹果怎么搞起跨界AI模型了? ? 发布了一个基于流匹配的蛋白质折叠模型SimpleFold,被网友戏称为“iFold”。
9/26/2025 9:34:35 AM
攻克结构化长文档检索难题!新框架让模型告别“结构性失明”
AI读不懂HTML、Markdown长文档的标题和结构,找信息总踩坑? 解决方案来了——SEAL全新对比学习框架通过带结构感知 元素对齐,让模型更懂长文。 该方法创新性地将文档的宏观层级结构和微观元素语义同时融入到统一的Embedding空间中,显著增强了预训练语言模型对结构化数据的理解和表示能力。
9/26/2025 9:32:47 AM
为什么“具身智能”是 AI 的下一个前沿
过去十年,人工智能的突破几乎都发生在“去身化”的语境中。 无论是自然语言处理的GPT 系列,还是计算机视觉的 ViT、SAM,它们大多存在于数据与算力的虚拟空间里,擅长处理符号、文本和图像,却与真实世界的物理交互保持着距离。 这样的 AI 可以写诗、画画、回答问题,却无法真正走进现实,理解环境、操纵物体、与人类并肩完成任务。
9/26/2025 9:27:47 AM
Flearkens
中国团队重新定义“星际之门”!全球首个太空计算星座已实现常态化商用
飞在太空中的卫星,已经成为算力中枢给地面交通设施充当大脑了? 在一场视觉算法挑战中,一组参赛团队将道路识别模型部署至在轨卫星,完成了从图像采集、模型推理到结构化结果回传的全过程。 图像未落地,模型也并未运行在地面,所有计算任务均在轨道上完成,最终仅回传识别结果。
9/26/2025 9:26:23 AM
GPT-5通过“哥德尔测试”!独创性解决博士生都得花几天时间的开放数学问题
GPT-5,你这家伙! 究竟还有什么事是我不知道的? 在一篇最新论文中,研究人员让它挑战了5个尚未解决的优化猜想。
9/26/2025 9:24:46 AM
刚刚,谷歌发布机器人最新「大脑」模型!思考能力SOTA,还能「跨物种」学习
谷歌又给机器人「换大脑」了! 刚刚,DeepMind发布了针对机器人和具身智能的Gemini Robotics 1.5系列家族模型,专为机器人和具身智能打造的新一代「大脑」。 Gemini Robotics 1.5系列包括Gemini Robotics 1.5和Gemini Robotics-ER 1.5。
9/26/2025 9:15:40 AM
NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数
论文一作李放,美国伊利诺伊大学香槟分校 (UIUC) 博二学生,研究方向为 4D 视觉定位、重建/新视角合成以及理解。 第二作者为美国伊利诺伊大学香槟分校博四学生张昊。 通讯作者是 Narendra Ahuja, 美国伊利诺伊大学香槟分校 Donald Biggar Willet Professor(Ming-hsuan Yang, Jia-bin Huang 博士导师)。
9/26/2025 9:12:49 AM
ChatGPT新功能Pulse,GPT-5主动给你推消息,大家玩得停不下来
这是 OpenAI CEO 山姆・奥特曼迄今为止最喜欢的 ChatGPT 功能。 本周五凌晨,OpenAI 宣布推出 ChatGPT 新功能「Pulse」的预览版,首先向 Pro 订阅用户开放。 ChatGPT 现在会每天晚上主动进行研究,根据你每天的聊天记录、反馈以及日历等关联应用提供个性化更新。
9/26/2025 9:09:32 AM
15 分钟吃透核心:卷积 / 池化 / 全连接 + 六大经典模型对比
卷积神经网络(Convolutional Neural Network,简称CNN)是一种深度学习模型,专门用于处理和分析视觉数据,在图像识别、目标检测等任务中表现尤为出色。 然而,CNN的架构因其固有的复杂性和快速演进的特性,往往难以掌握。 在本文中,将详细介绍标准CNN架构及CNN家族中的各类模型,并拆解其核心组成部分,包括:卷积层、池化层、全连接层同时讲解步长(stride)、卷积核(kernel)、池化(pooling)等关键概念。
9/26/2025 9:08:27 AM
阿里云无影Agentic Computer云栖大会首秀 :一台跨模态、跨终端的超级PC
9月25日,杭州云栖大会期间,阿里云宣布旗下Agent Infra重要组件——无影AgentBay迎来重大升级,推出自进化引擎、内存状态管理、安全围栏的全新能力。 并首次展示全新的个人计算产品——无影Agentic Computer,拥有全新的人机交互方式,革命性的“记忆”能力和近乎无穷的云上算力。 AI Agent是当下全球科技和商业的焦点,过去半年涌现的Agent相关产品,超过了2024年的总和,10个创业者有8个在做各种各样的Agent。
9/26/2025 9:04:26 AM
一文入门Agent:从理论到代码实战
Agent(智能体)比较权威的定义出自 Stuart Russell 与 Peter Norvig 的《Artificial Intelligence: A Modern Approach》(1995, 《人工智能:一种现代方法》)。 An agent is anything that can be viewed as perceiving its environment through sensors and acting upon that environment through actuators.通常指一个能够自主感知环境、决策并执行动作以完成特定目标的智能系统 。 图片简单来说,它就像是一个智能代理,可以接受我们的指令,在一定程度上自己想办法去完成任务,而不仅仅是被动响应。
9/26/2025 8:52:57 AM
windliang
AI CLI 大战:GitHub Copilot CLI 开放测试
GitHub Copilot CLI 是 GitHub 推出的智能命令行工具,它将 AI 的强大能力直接带到您的终端中,为开发者提供智能的代码生成建议、代码生成和自动化任务处理能力。 本文将全面介绍 Copilot CLI 的功能特性、使用场景和最佳实践。 界面截图什么是 GitHub Copilot CLI?
9/26/2025 8:39:24 AM
PIG AI
运维新突破:Prometheus+DeepSeek+Dify实现自动巡检
作者 | 崔皓审校 | 重楼整体思路在日常运维中,经常会遇到类似的问题:明明系统前一天运行正常,第二天登录量突然下降,却要花费大量时间去手工检查日志、排查 Prometheus 指标,再整理成报告发给业务方。 这类重复、耗时的工作不仅影响效率,还容易出现遗漏。 于是,我就产生了一个想法:能不能把这种巡检工作自动化?
9/26/2025 8:36:43 AM
崔皓
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉