AI在线 AI在线

资讯列表

AI能经营实体店吗?Anthropic的Claude尝试后,结果糟糕得既离谱又滑稽

想象一下这样的场景:你让AI完全掌控一家小店,不仅负责收银机,而且负责整个店铺的运营,包括定价、库存管理、客户服务、与供应商的谈判,那么,可能会出什么错呢?新的研究给出了明确的答案:一切皆有可能出错。 Anthropic公司的AI助手Claude在旧金山办公室管理了一家小店约一个月,结果读起来就像是一个从未真正经营过业务的人写的商学院案例研究——而事实证明,确实如此。 这项名为“Project Vend”的实验,是与AI安全评估公司Andon Labs合作进行的,是对具有显著经济自主权的AI系统进行的首次现实世界测试之一。
7/3/2025 7:07:00 AM
Michael

第一波!2025年7月精选实用设计干货合集

大家好,这是 2025 年 7 月第一波干货合集! 这一期干货合集从在线的常用设计和开发工具合集开始,之后有面向设计师的免费高品质设计素材合集网站,有在线免费的 LOGO 设计平台,免费的高品质 Notion Banner 制作工具,有专门生成沿着路径分布的字体效果的在线工具,以及面向 AI 大模型爱好者的可视化编程工具。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:.
7/3/2025 4:05:57 AM
陈子木

AI在不安全代码上训练后变得邪恶

研究揭示,用不安全代码微调 LLM 会导致“突发不一致”,模型可能产生有害建议。 GPT-4o 等模型在编码无关查询中表现出反人类、赞扬纳粹等行为。 需警惕数据投毒和后门攻击,加强 AI 对齐,防范 ASI 风险。
7/3/2025 4:00:00 AM
岱军

爆改RAG!让你的AI检索“见人说人话,见鬼说鬼话”——自适应检索的魔法揭秘

一、RAG的“尴尬”与“觉醒”1.1 传统RAG的“直男式”检索RAG系统的基本套路大家都懂:用户提问,系统先去知识库里“搜一搜”,然后把搜到的内容丢给大模型“写一写”,最后输出一段看似高大上的答案。 但问题来了:用户问“XAI是什么? ”——你给我一堆论文段落,啰嗦半天没说重点。
7/3/2025 4:00:00 AM
许泽宇

深入浅出RAG详解:语言模型的“开卷考试”——让模型答案锚定现实的外部“记忆”

引言大型语言模型(LLMs)彻底革新了自然语言处理领域,但其对静态内部知识的依赖,在事实准确性和时效性方面暴露出根本性局限。 检索增强生成(RAG)作为一种强大的范式应运而生,它构建了一种混合架构,将模型输出动态锚定于外部可验证信息。 本文将深入探讨RAG框架的核心机制——从检索器与生成器组件到参数化记忆与非参数化记忆的关键区别,揭示其在知识密集型应用中实现前沿性能的奥秘。
7/3/2025 2:12:00 AM
柏企阅文

机器学习实战:糖尿病预测及可视化分析

你一生中可能已经多次听说过糖尿病。 它如此普遍地流行。 根据国际糖尿病联合会的数据,2024年有超过340万人死于糖尿病。
7/3/2025 1:45:00 AM
云朵君

Bengio亲手戳穿CoT神话!LLM推理是假象,25%顶会论文遭打脸

图灵奖大牛Bengio新作上线了! 这篇由牛津、谷歌DeepMind、Mila多家机构联手论文指出——思维链并非可解释性。 这一观点彻底打破了许多人的认知:CoT看似一步步给出答案,实则并不一定是其真实的推理过程。
7/3/2025 1:45:00 AM
新智元

荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的

在今日晚间的荣耀 Magic V5 暨 AI 终端生态发布会上,荣耀宣布打造全新荣耀 YOYO 智能体,通过全栈个人知识库、全域智能体协同、全品牌终端互联三大 AI 闭环核心技术,拓展 1 小时的生命宽度。
7/2/2025 8:14:55 PM
汪淼

李飞飞最新访谈:没有空间智能,AGI就不完整

这是“AI教母”李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。 不过她有自己的表述,从进入人工智能领域开始,她就确定了她终身奋斗的梦想:让智能体能够讲述世界的故事。 而这,离不开空间智能。
7/2/2025 6:15:02 PM

机构:下调 2025 年AI服务器出货量同比增幅

北美大型CSP仍是AI服务器市场需求的主要驱动力,叠加tier-2数据中心及中东、欧洲主权云项目的支持,整体需求保持稳定。 受北美CSP与OEM客户需求推动,预计2025年AI服务器出货量将继续保持双位数增长,但由于国际形势变化,2025年全球AI服务器出货量年增率被下调至24.3%。
7/2/2025 6:00:45 PM
AI在线

微信AI搜索被指"强行开盒"姓名秒变超链接 腾讯回应:仅整合公开信息

微信新推出的AI搜索功能因涉嫌泄露个人隐私引发广泛关注。 近日,多名网友在社交平台反映,该功能可通过姓名超链接一键生成个人简历,引发用户对隐私安全的担忧。 据用户反馈,微信AI搜索的争议主要集中在其自动识别机制上。
7/2/2025 6:00:45 PM
AI在线

京东具身智能战略全面提速 JoyInside合作版图曝光

据网易科技报道,京东在具身智能领域的布局正在全面提速。 京东旗下具身智能品牌JoyInside已与十余家头部机器人企业达成合作,成为京东抢占智能机器人市场的核心引擎。 据知情人士透露,JoyInside由京东大模型技术支持,专注于提供机器人与消费者的智能互动能力,其产品策略聚焦于"一人一狗一玩具"的场景化应用。
7/2/2025 6:00:45 PM
AI在线

百度发布全球首个中文音视频生成模型 MuseSteamer,颠覆创作方式

近日,百度商业研发团队于7月2日宣布推出一款革命性的视频生成模型 “MuseSteamer”,并同时发布了创作平台 “绘想”。 这一创新的技术标志着全球首个实现中文音视频一体化生成的模型正式问世,必将为内容创作领域带来深远的影响。 MuseSteamer 的最大亮点在于其卓越的协同创作能力,能够将画面、音效以及人声台词完美结合,生成高质量的视频内容。
7/2/2025 6:00:45 PM
AI在线

富士康推出首款AI推理大模型 “FoxBrain”,商标申请已提交

近日,鸿海精密工业股份有限公司(也就是大家熟悉的富士康)在国家知识产权局商标局提交了 “FoxBrain” 商标注册申请。 这款 AI 推理大模型不仅是富士康的首次尝试,更是台湾省首个该类型的 AI 模型。 根据公开资料显示,该商标的国际分类为科学仪器,目前正处于 “等待实质审查” 的状态。
7/2/2025 6:00:45 PM
AI在线

重大突破!研究团队揭示大语言模型内部潜藏的 “奖励机制”

近日,南京大学的周志华教授团队发布了一项重要研究,首次理论证明了在大语言模型中可以发现内源性奖励模型,并有效应用强化学习(RL)来提升模型表现。 当前,许多对齐方法依赖于人类反馈强化学习(RLHF),这种方法需要大量高质量的人类偏好数据来训练奖励模型。 然而,构建这样一个数据集不仅耗时费力,还面临成本高昂的挑战。
7/2/2025 6:00:45 PM
AI在线

MoE那么大,几段代码就能稳稳推理 | 开源

混合专家网络模型架构(MoE)已经成为当前大模型的一个主流架构选择,以最近开源的盘古Pro MoE为例,其基于MoGE架构构建的混合专家架构,总参数量达720亿,激活参数量为160亿,专门针对昇腾硬件优化,在性能与效率上表现突出。 盘古还实现了在推理时做到又快又稳。 在技术特性上,盘古模型引入 “快思考” 和 “慢思考” 双系统,可根据问题复杂度自动切换响应模式,并在推理性能上实现突破——在昇腾800I A2上单卡推理吞吐性能达1148 tokens/s,经投机加速技术可提升至1528 tokens/s,显著优于同等规模稠密模型。
7/2/2025 5:56:09 PM
十三

市场监管总局批准发布人工智能、信息技术、物联网等7项国家标准

市场监管总局(国家标准委)近日批准发布一批重要国家标准。 在新兴产业方面,发布人工智能、信息技术、物联网等7项国家标准,为释放数字化服务与应用能力提供技术保障。 发布数据中心、网络安全技术、系统与软件工程等5项国家标准,助力数字经济深层次互联互通。
7/2/2025 5:00:55 PM
AI在线

​蚂蚁集团医疗 AI 平台荣获 2025 世界人工智能大会 SAIL 奖

在2025世界人工智能大会(WAIC)上,蚂蚁集团自主研发的 “医疗 AI 驱动的全流程健康管理平台” 成功入选大会最高奖项 “SAIL 奖” 的 TOP30榜单。 该奖项不仅表彰了蚂蚁集团的创新成果,同时也与小米、科大讯飞等多家企业一同获奖。 蚂蚁健康应用 AQ 已应用该平台,为超过8亿用户和数千家医疗机构提供全方位的 AI 医疗服务。
7/2/2025 5:00:55 PM
AI在线