AI在线 AI在线

AI

搜索智能体RAG落地不佳?UIUC开源s3,仅需2.4k样本,训练快效果好

当前,Agentic RAG(Retrieval-Augmented Generation)正逐步成为大型语言模型访问外部知识的关键路径。 但在真实实践中,搜索智能体的强化学习训练并未展现出预期的稳定优势。 一方面,部分方法优化的目标与真实下游需求存在偏离,另一方面,搜索器与生成器间的耦合也影响了泛化与部署效率。
6/17/2025 9:04:33 AM

2天完成人类12年工作,AI自动更新文献综述,准确率碾压人类近15%

当碳基生物还在为写文献综述,打开了一百个浏览器窗口时,隔壁AI已经卷起来了。 (doge)两天完成人类12年工作——医学研究领域中,系统评价(SRs)作为临床决策的黄金标准,平均耗时超过16个月,花费10万美元以上,且容易延长无效或有害治疗方法的使用。 于是多伦多大学、哈佛医学院等机构联合开发了AI端到端工作流程——otto-SR。
6/17/2025 9:00:00 AM

一个数据集,一年产稿7876篇!AI强力加持,垃圾论文海量爆发

假如你是一位科研期刊的编辑,每天打开邮箱,迎接的却是一堆似曾相识的论文。 它们主题各异,数据整齐,措辞流畅,但总有种让人不安的「模板感」。 这可不是一个瞎编的场景,而是2024年发生在《Scientific Reports》编辑Matt Spick身上的真实经历。
6/17/2025 8:53:00 AM

Claude与人类共著论文,苹果再遭打脸!实验黑幕曝光

几天前,苹果怒斥大模型根本不会推理论文,引发全网无数讨论与争议。 在许多人看来,没有站在AI前沿的人, 却质疑当今最领先推理模型o3-mini、DeepSeek-R1推理能力,实在没有说服力。 论文一出,备受质疑。
6/17/2025 8:52:00 AM

MIT工科生跨界AI,独作论文登Nature:只需3.5小时修复600年前名画

MIT理工男跨界艺术,一不小心就以一篇独作论文登上Nature? 由他设计的AI算法,将原本需要数月/数年才能搞定的名画修复工作,极限压缩至几小时。 Alex Kachkine,打破画作修复只能对原作数字扫描品进行“缝缝补补”的传统艺能,提出一种“以数字方式修复一幅画,并在物理上实现效果”的全新方法。
6/17/2025 8:50:00 AM

SFT+RL双管齐下:ReasonGen-R1如何破解文生图「指令不遵」难题?

近年来,链式推理和强化学习已经被广泛应用于大语言模型,让大语言模型的推理能力得到了显著提升。 然而,在图像生成模型中,这种成功经验尚未得到充分探索。 图像生成模型往往直接依据给定文本生成图像,缺乏类似人类创作过程中的推理,导致生成的图像在语义遵循上仍有一定局限。
6/17/2025 8:47:00 AM

C#与AI联姻:零依赖!用Keras.NET训练深度学习模型实录

在C#中实现深度学习通常需要依赖复杂的框架,但通过Keras.NET,我们可以在零外部依赖的情况下训练强大的深度学习模型。 下面我将分享一个完整的实战案例,展示如何用C#和Keras.NET训练一个图像分类模型。 这个实现具有以下特点:零外部依赖:仅使用Keras.NET和Numpy.NET库,无需安装Python或其他深度学习框架完整的训练流程:包括模型构建、数据加载、训练、评估和保存卷积神经网络:使用现代CNN架构进行图像分类模型检查点:自动保存验证集表现最佳的模型灵活的配置:可调整图像尺寸、批次大小和训练轮数要运行此代码,你需要安装以下NuGet包:Keras.NETNumpy.NETSciSharp.TensorFlow.Redist在实际应用中,你需要替换LoadData方法中的模拟数据加载逻辑,使用真实的图像数据。
6/17/2025 7:28:51 AM
CONAN

系统集成商在投标方案中使用AI时的六大安全防护策略

GenAI正在迅速改变系统集成商与企业之间的互动方式,特别是在这些供应商回应提案请求(RFP)的过程中。 随着越来越多的系统集成商利用AI来起草和优化他们的回应,企业必须重新考虑如何评估这些回应,并确保供应商的责任感。 在此,我们将探讨这一微妙的平衡,并讨论AI取证能力的重要性、加强合同条款以保护你的企业,以及AI素养培训如何帮助你在面对AI驱动的系统集成商提案时保持控制。
6/17/2025 7:00:00 AM
Ted Rogers

DouBao large model evolves again! Global leading AI Agent applications accelerate落地!

Recently, the DouBao large language model has welcomed its brand new version 1.6, marking another leap in its comprehensive capabilities. In core areas such as reasoning, mathematics, and instruction-following, DouBao 1.6 has achieved significant performance improvements while greatly reducing the barriers for user adoption, driving the rapid application of AI Agents in industries such as consumer electronics, automobiles, and finance.According to the latest released data, DouBao 1.6 has ranked among the global leaders in complex reasoning, competitive-level mathematics, multi-turn dialogue, and instruction-following tests. For instance, in the evaluation based on Beijing Haidian District's simulated college entrance exam papers, DouBao 1.6 improved the science score by 154 points and the liberal arts score by 90 points compared to last year.
6/17/2025 6:01:36 AM
AI在线

Xiaomi Announces New Product Release Tide in Late July: First True AI Glasses Officially Unveiled, Targeting Meta Ray-Ban

The press conference held by Xiaomi in late July will be the focus of attention for technology enthusiasts. In addition to the highly anticipated Xiaomi car, Xiaomi will also bring several重磅 new products, including the powerful Redmi K80 Ultimate Edition and the upgraded functions of the Mi Pad 7S Pro.However, the most awaited one is the first public appearance of Xiaomi's first true AI glasses. According to well-known blogger Digital Chat Station, the market positioning of this AI glasses will be aligned with Meta Ray-Ban, which is currently the best-selling AI glasses product globally.Prior leaks have indicated that as Xiaomi's pioneering work in this field, this true AI smart glasses will adopt an advanced dual-core architecture and come with a high-definition lens, expected to achieve shooting effects comparable to those of Meta Ray-Ban.
6/17/2025 2:02:32 AM
AI在线

Apple AI chief Giannandrea demoted, absence at WWDC25 draws attention

At the recently held WWDC25 Global Developers Conference in 2025, the absence of John Giannandrea, head of Apple's artificial intelligence department, drew widespread attention and speculation. According to a report by Bloomberg journalist Mark Gurman, Giannandrea seems to have gradually faded from Apple's core management team and may leave the company in the near future.Since joining Apple in 2018, Giannandrea was highly anticipated. As the former head of Google’s search and AI department, he accumulated rich experience in the industry.
6/17/2025 2:02:26 AM
AI在线

Another top-level Grade-A hospital reaches a cooperation with Ant Group to promote the implementation of AI medical achievements

On June 16, Beijing Friendship Hospital, Capital Medical University (referred to as "Friendship Hospital"), and Ant Group officially signed a cooperation agreement to deepen collaboration in areas such as AI medical innovation services, major clinical discipline projects, and research data sharing. The two parties aim to explore new paradigms for the integration of AI in healthcare. Currently, the gastrointestinal specialty intelligent assistant "Gastrointestinal Assistant" jointly developed by both parties has been launched.
6/17/2025 2:02:26 AM
AI在线

英国电信裁员 5.5 万,AI 或将加速员工规模缩减

英国电信(BT)最近宣布了一项大规模裁员计划,预计在本十年末之前将裁减多达55,000名员工。 该公司的首席执行官艾莉森・柯克比(Allison Kirkby)在采访中表示,随着人工智能技术的快速发展,未来可能会有更多的裁员。 BT 在两年前就曾公布计划,表示希望到2030年前削减40,000至55,000个岗位,旨在实现业务的 “精简”。
6/16/2025 3:01:33 PM
AI在线

ACL 2025|为什么你设计的 Prompt 会成功?新理论揭示大模型 Prompt 设计的奥秘与效能

本文共同一作是张翔和曹峻泰。 张翔是英属哥伦比亚大学研究生,主要研究兴趣集中在大模型推理和 AI for Science;曹峻泰是英属哥伦比亚大学研究生,主要研究兴趣集中在大模型推理和可解释性研究;本文通讯作者是来自纽约大学石溪分校的助理教授尤晨羽,以及来自 Meta Gen AI 的研究员丁渡鉴。 近年来,大型语言模型(LLM)在自然语言处理领域取得了革命性进展。
6/16/2025 2:44:14 PM

20瓦就能运行下一代AI?科学家瞄上了神经形态计算

「西部世界」真的要来了! 科学家们正试图为AI装上人类大脑。 最新进展由美国国家实验室主导。
6/16/2025 2:42:12 PM

10% KV Cache实现无损数学推理!这个开源方法解决推理大模型「记忆过载」难题

推理大模型虽好,但一个简单的算数问题能推理整整三页,还都是重复的“废话”,找不到重点……一种可以把大模型的“碎碎念”转化为可控记忆条目的高效压缩方法,出现了! R-KV开源登场:显存↓90%、吞吐×6.6、准确率=100%。 它可以通过实时对token进行排序,兼顾重要性和非冗余性,仅保留信息丰富且多样化的token,从而解决大模型推理时的冗余问题。
6/16/2025 2:41:07 PM

网页智能体新突破!引入协同进化世界模型,腾讯AI Lab提出新框架

让网页智能体自演进突破性能天花板! 腾讯AI Lab提出WebEvolver框架,通过引入协同进化的世界模型(World Model),让智能体在真实网页环境中实现10%的性能提升。 由此突破现有基于大语言模型(LLM)的网页智能体“自我迭代演进的性能最终会停滞”的瓶颈。
6/16/2025 2:40:40 PM

性能提升 90%,Anthropic 首次公开多智能体系统构建全流程

人工智能公司Anthropic发文,详细披露其Research功能背后的多智能体系统构建历程。该系统采用“协调者-执行者”架构,由一个主导智能体规划任务,并并行生成多个子智能体协同检索与分析信息。内部评测显示,该系统在处理复杂研究任务时,性能较单智能体Claude Opus 4提升了90.2%。
6/16/2025 2:40:04 PM
易句