应用

全球首次：AI 机器人画作首登苏富比拍卖，成交价 108 万美元

全球首次：AI 机器人画作首登苏富比拍卖，成交价 108 万美元

英国卫报今天（11 月 8 日）发布博文，报道称由类人机器人创作的艺术品，一幅英国数学家艾伦・图灵（Alan Turing）的肖像画，以 108 万美元（IT之家备注：当前约 772.7 万元人民币）的价格成交。

11/8/2024 2:08:20 PM 故渊

LeCun赞转！类Sora模型能否理解物理规律？字节豆包大模型团队系统性研究揭秘

LeCun赞转！类Sora模型能否理解物理规律？字节豆包大模型团队系统性研究揭秘

视频生成模型虽然可以生成一些看似符合常识的视频，但被证实目前还无法理解物理规律！自从 Sora 横空出世，业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Yann LeCun 明确表示，基于文本提示生成的逼真视频并不代表模型真正理解了物理世界。

11/8/2024 1:29:00 PM 机器之心

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

11/8/2024 1:18:00 PM 机器之心

智能体首次达到Kaggle Grandmaster水平，华为用结构化推理补齐思维链短板

智能体首次达到Kaggle Grandmaster水平，华为用结构化推理补齐思维链短板

前些时日，AI 大模型开始掌握操作计算机的能力，但整体而言，它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现，研究者们提出了各种提示策略来提升大模型的推理和规划能力，比如思维链、思维树和思维图谱。这些进步与工具集成一起，推动着通用 AI 智能体的发展，让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问题（不过依然还相对简单）。

11/8/2024 1:06:00 PM 机器之心

谷歌 DeepMind 研究再登 Nature 封面，隐形水印让 AI 无所遁形

谷歌 DeepMind 研究再登 Nature 封面，隐形水印让 AI 无所遁形

近日，谷歌 DeepMind 发表的一项研究登上了 Nature 期刊的封面，研究人员开发了一种名为 SynthID-Text 的水印方案，已经在自家的 Gemini 上投入使用，跟踪 AI 生成的文本内容，使其无所遁形。

11/8/2024 12:32:02 PM 汪淼

杨笛一团队：一个弹窗，就能把AI智能体操控电脑整懵了

杨笛一团队：一个弹窗，就能把AI智能体操控电脑整懵了

弹窗攻击很有效，控制计算机的智能体根本顶不住。前些天，Anthropic 为 Claude 带来一个极具变革意义的功能：Computer Use，也就是控制用户的计算机。当时，Anthropic 在博客中写到：「在 OSWorld 这项测试模型使用计算机的能力的评估基准上，Claude 当前的准确度为 14.9%，虽然远远不及人类水平（通常为 70-75%），但却远高于排名第二的 AI 模型（7.8%）。

11/8/2024 11:02:00 AM 机器之心

AMD 发布首个 10 亿开源 AI 模型 OLMo，用 Instinct MI250 GPU 集群训练而成

AMD 发布首个 10 亿开源 AI 模型 OLMo，用 Instinct MI250 GPU 集群训练而成

AMD 公司于 10 月 31 日发布博文，宣布推出首个完全开放的 10 亿参数语言模型系列 AMD OLMo，为开发者和研究人员提供强大的 AI 研究工具。

11/8/2024 10:13:11 AM 故渊

类Sora模型到底懂不懂物理？字节完成系统性实验，图灵奖得主杨立昆赞转!

类Sora模型到底懂不懂物理？字节完成系统性实验，图灵奖得主杨立昆赞转!

Sora爆火以来，“视频生成模型到底懂不懂物理规律”受到热议，但业界一直未有研究证实。近日，字节跳动豆包大模型团队公布最新论文，研究历时8个月，围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论：视频生成模型可以记忆训练案例，但暂时还无法真正理解物理规律，做到“举一反三”。图灵奖得主、Meta首席AI科学家杨立昆点赞并转发了该研究，表示“结论不令人意外，但很高兴终于有人做了这个尝试！

11/8/2024 9:24:00 AM 新闻助手

5000字干货！大厂高手竟然把 AI 玩得这么出神入化！

5000字干货！大厂高手竟然把 AI 玩得这么出神入化！

用快手三农的实战案例，帮你完整学会制定设计语言一、前言从内容运营角度看，提升用户对内容认知受内容质量、内容形式、品牌形象、内容传播与推广等多个因素影响。阅读文章 . 一、AI 时代下的设计.

11/8/2024 1:39:47 AM 快手运营设计团队

数字病理与AI辅助诊断，助力肿瘤精准诊疗

数字病理与AI辅助诊断，助力肿瘤精准诊疗

图：前沿对话-数字病理与AI辅助诊断赋能疾病精准诊疗编辑 | ScienceAI作为疾病诊断的「金标准」，病理诊断是指导肿瘤临床治疗、评估预后的最可靠依据，在精准医疗时代，准确、高效的病理诊断所发挥的价值日益凸显。近年来，数字化浪潮席卷全球，病理诊断领域也积极拥抱数字化、智慧化变革，为提质增效开辟创新路径。今日，罗氏诊断携整体数字化智慧病理解决方案亮相第七届中国国际进口博览会，并分享与探讨了数字病理和人工智能（AI）辅助诊断在疾病精准诊疗中所发挥的重要价值。

11/7/2024 6:52:00 PM ScienceAI

大模型小爱能力升级，多端设备支持「音乐问答」功能

大模型小爱能力升级，多端设备支持「音乐问答」功能

据介绍，该功能基于 AI 能力升级，支持歌曲信息追问、搜索专业音乐知识等内容。用户将小爱同学大模型升级至最新版本后，可在手机、车载端体验。

11/7/2024 6:03:01 PM 归泷（实习）

AI“电子舌头”问世，可辨别味道、检测食品安全

AI“电子舌头”问世，可辨别味道、检测食品安全

宾州州立大学的研究人员开发出一种基于人工智能的“电子舌头”，能够准确识别食品的酸度、新鲜度，甚至检测出有害物质。

11/7/2024 6:01:43 PM 远洋

快手“可灵 AI”独立应用上线苹果 App Store，支持生成视频与图片

快手“可灵 AI”独立应用上线苹果 App Store，支持生成视频与图片

快手公司近期在苹果 App Store 上线了独立的“可灵 AI”应用，进一步加强其在移动端的 AI 内容创作布局。目前，“可灵 AI”已形成了多平台的产品矩阵，包括网页版、App、小程序以及海外版本。

11/7/2024 5:14:37 PM 远洋

具身智能GPT-2时刻到了！这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

具身智能GPT-2时刻到了！这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

近日，关于 Open AI 被投企业 Physical Intelligence (PI) 的一系列报道，让人们关注到具身智能大模型引发的机器人时代变革。目光转回国内，我们同样在中国公司中发现了这场变革浪潮的先行者。据AI在线了解，国内初创公司自变量机器人（X Square），是国内唯一一家从第一天就选择了端到端统一大模型技术路线的公司，与 PI 的技术路线不谋而合。

11/7/2024 2:41:00 PM 机器之心

结构化表格也成模态！浙大TableGPT2开源，最强表格AI问世

结构化表格也成模态！浙大TableGPT2开源，最强表格AI问世

当结构化数据也变成一个模态，哪家的大语言模型能脱颖而出呢？现在正是多模态大模型的时代，图像、视频、音频、3D、甚至气象运动都在纷纷与大型语言模型的原生文本模态组合。而浙江大学及其计算机创新技术研究院的一个数十人团队也将结构化数据（包括数据库、数仓、表格、json 等）视为了一种独立模态。

11/7/2024 2:25:00 PM 机器之心

价值万亿的具身智能市场，大佬们如何从世界模型下刀？

价值万亿的具身智能市场，大佬们如何从世界模型下刀？

具身智能，简单来说，就是赋予 AI 一个「身体」，让这颗聪明的大脑在物理世界中行动自如。把这颗大脑升级成世界模型 —— 它拥有记忆、直觉和常识时，机器人可以不再机械地按训练行事，而是能够灵活变通，具体问题具体分析。于是，在这两个火热的概念齐头并进之时，这样的展示层出不穷，机器人为你扫地、喂猫、铺床、做饭，以后养老不用愁，放心交给机器人就好了。

11/7/2024 2:20:00 PM 机器之心

字节跳动 AI 助手豆包被曝开启视频生成内测

字节跳动 AI 助手豆包被曝开启视频生成内测

《科创板日报》称，字节跳动旗下大模型 AI 助手豆包正式推出视频生成内测，支持图片文字一键成片、动态运镜和多镜头一致性、风格比例随意挑选。

11/7/2024 12:35:35 PM 问舟

微软推出 Magentic-One：多 AI 智能体协同完成复杂任务

微软推出 Magentic-One：多 AI 智能体协同完成复杂任务

微软本月发布 Magentic-One 系统，通过协调多个专用 AI 智能体，高效处理复杂工作流程。

11/7/2024 12:11:24 PM 故渊

资讯热榜

AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉