AI在线 AI在线

资讯列表

同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等

通过单阶段监督微调与强化微调结合,让大模型在训练时能同时利用专家演示和自我探索试错,有效提升大模型推理性能。 中国科学院自动化研究所深度强化学习团队联合美团,提出一种单阶段监督-强化微调方法——SRFT (Supervised Reinforcement Fine-Tuning)。 该方法通过基于熵的动态加权机制,将两种训练范式结合。
7/3/2025 8:33:00 AM

一文详解Character AI:实用指南+ ChatGPT、Gemini对比分析

译者 | 晶颜审校 | 重楼本指南将深入剖析Character AI的运行机制、功能特性及其存在的局限性。 近年来,生成式人工智能领域发展态势迅猛,其应用范畴已远超单纯的文本生成领域。 在众多备受瞩目的新兴平台中,Character AI是一款支持用户以对话形式与人工智能生成角色进行交互的工具。
7/3/2025 8:03:54 AM
晶颜

OpenAI播客再谈AI编程大战!开发者是最有福的人:特定需求的代码模型将涌现!主持人说漏嘴:我最喜欢Claude!

编译、整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)OpenAI第二期播客来了! 阵容也是相当重磅! 嘉宾是OpenAI 首席研究官 马克·陈(Mark Chen)和ChatGPT 负责人 尼克·特利(Nick Turley)。
7/3/2025 7:55:29 AM
伊风

AI能经营实体店吗?Anthropic的Claude尝试后,结果糟糕得既离谱又滑稽

想象一下这样的场景:你让AI完全掌控一家小店,不仅负责收银机,而且负责整个店铺的运营,包括定价、库存管理、客户服务、与供应商的谈判,那么,可能会出什么错呢?新的研究给出了明确的答案:一切皆有可能出错。 Anthropic公司的AI助手Claude在旧金山办公室管理了一家小店约一个月,结果读起来就像是一个从未真正经营过业务的人写的商学院案例研究——而事实证明,确实如此。 这项名为“Project Vend”的实验,是与AI安全评估公司Andon Labs合作进行的,是对具有显著经济自主权的AI系统进行的首次现实世界测试之一。
7/3/2025 7:07:00 AM
Michael

第一波!2025年7月精选实用设计干货合集

大家好,这是 2025 年 7 月第一波干货合集! 这一期干货合集从在线的常用设计和开发工具合集开始,之后有面向设计师的免费高品质设计素材合集网站,有在线免费的 LOGO 设计平台,免费的高品质 Notion Banner 制作工具,有专门生成沿着路径分布的字体效果的在线工具,以及面向 AI 大模型爱好者的可视化编程工具。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:.
7/3/2025 4:05:57 AM
陈子木

AI在不安全代码上训练后变得邪恶

研究揭示,用不安全代码微调 LLM 会导致“突发不一致”,模型可能产生有害建议。 GPT-4o 等模型在编码无关查询中表现出反人类、赞扬纳粹等行为。 需警惕数据投毒和后门攻击,加强 AI 对齐,防范 ASI 风险。
7/3/2025 4:00:00 AM
岱军

爆改RAG!让你的AI检索“见人说人话,见鬼说鬼话”——自适应检索的魔法揭秘

一、RAG的“尴尬”与“觉醒”1.1 传统RAG的“直男式”检索RAG系统的基本套路大家都懂:用户提问,系统先去知识库里“搜一搜”,然后把搜到的内容丢给大模型“写一写”,最后输出一段看似高大上的答案。 但问题来了:用户问“XAI是什么? ”——你给我一堆论文段落,啰嗦半天没说重点。
7/3/2025 4:00:00 AM
许泽宇

深入浅出RAG详解:语言模型的“开卷考试”——让模型答案锚定现实的外部“记忆”

引言大型语言模型(LLMs)彻底革新了自然语言处理领域,但其对静态内部知识的依赖,在事实准确性和时效性方面暴露出根本性局限。 检索增强生成(RAG)作为一种强大的范式应运而生,它构建了一种混合架构,将模型输出动态锚定于外部可验证信息。 本文将深入探讨RAG框架的核心机制——从检索器与生成器组件到参数化记忆与非参数化记忆的关键区别,揭示其在知识密集型应用中实现前沿性能的奥秘。
7/3/2025 2:12:00 AM
柏企阅文

机器学习实战:糖尿病预测及可视化分析

你一生中可能已经多次听说过糖尿病。 它如此普遍地流行。 根据国际糖尿病联合会的数据,2024年有超过340万人死于糖尿病。
7/3/2025 1:45:00 AM
云朵君

Bengio亲手戳穿CoT神话!LLM推理是假象,25%顶会论文遭打脸

图灵奖大牛Bengio新作上线了! 这篇由牛津、谷歌DeepMind、Mila多家机构联手论文指出——思维链并非可解释性。 这一观点彻底打破了许多人的认知:CoT看似一步步给出答案,实则并不一定是其真实的推理过程。
7/3/2025 1:45:00 AM
新智元

荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的

在今日晚间的荣耀 Magic V5 暨 AI 终端生态发布会上,荣耀宣布打造全新荣耀 YOYO 智能体,通过全栈个人知识库、全域智能体协同、全品牌终端互联三大 AI 闭环核心技术,拓展 1 小时的生命宽度。
7/2/2025 8:14:55 PM
汪淼

李飞飞最新访谈:没有空间智能,AGI就不完整

这是“AI教母”李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。 不过她有自己的表述,从进入人工智能领域开始,她就确定了她终身奋斗的梦想:让智能体能够讲述世界的故事。 而这,离不开空间智能。
7/2/2025 6:15:02 PM

机构:下调 2025 年AI服务器出货量同比增幅

北美大型CSP仍是AI服务器市场需求的主要驱动力,叠加tier-2数据中心及中东、欧洲主权云项目的支持,整体需求保持稳定。 受北美CSP与OEM客户需求推动,预计2025年AI服务器出货量将继续保持双位数增长,但由于国际形势变化,2025年全球AI服务器出货量年增率被下调至24.3%。
7/2/2025 6:00:45 PM
AI在线

微信AI搜索被指"强行开盒"姓名秒变超链接 腾讯回应:仅整合公开信息

微信新推出的AI搜索功能因涉嫌泄露个人隐私引发广泛关注。 近日,多名网友在社交平台反映,该功能可通过姓名超链接一键生成个人简历,引发用户对隐私安全的担忧。 据用户反馈,微信AI搜索的争议主要集中在其自动识别机制上。
7/2/2025 6:00:45 PM
AI在线

京东具身智能战略全面提速 JoyInside合作版图曝光

据网易科技报道,京东在具身智能领域的布局正在全面提速。 京东旗下具身智能品牌JoyInside已与十余家头部机器人企业达成合作,成为京东抢占智能机器人市场的核心引擎。 据知情人士透露,JoyInside由京东大模型技术支持,专注于提供机器人与消费者的智能互动能力,其产品策略聚焦于"一人一狗一玩具"的场景化应用。
7/2/2025 6:00:45 PM
AI在线

百度发布全球首个中文音视频生成模型 MuseSteamer,颠覆创作方式

近日,百度商业研发团队于7月2日宣布推出一款革命性的视频生成模型 “MuseSteamer”,并同时发布了创作平台 “绘想”。 这一创新的技术标志着全球首个实现中文音视频一体化生成的模型正式问世,必将为内容创作领域带来深远的影响。 MuseSteamer 的最大亮点在于其卓越的协同创作能力,能够将画面、音效以及人声台词完美结合,生成高质量的视频内容。
7/2/2025 6:00:45 PM
AI在线

富士康推出首款AI推理大模型 “FoxBrain”,商标申请已提交

近日,鸿海精密工业股份有限公司(也就是大家熟悉的富士康)在国家知识产权局商标局提交了 “FoxBrain” 商标注册申请。 这款 AI 推理大模型不仅是富士康的首次尝试,更是台湾省首个该类型的 AI 模型。 根据公开资料显示,该商标的国际分类为科学仪器,目前正处于 “等待实质审查” 的状态。
7/2/2025 6:00:45 PM
AI在线

重大突破!研究团队揭示大语言模型内部潜藏的 “奖励机制”

近日,南京大学的周志华教授团队发布了一项重要研究,首次理论证明了在大语言模型中可以发现内源性奖励模型,并有效应用强化学习(RL)来提升模型表现。 当前,许多对齐方法依赖于人类反馈强化学习(RLHF),这种方法需要大量高质量的人类偏好数据来训练奖励模型。 然而,构建这样一个数据集不仅耗时费力,还面临成本高昂的挑战。
7/2/2025 6:00:45 PM
AI在线