AI在线 AI在线

资讯列表

科学界论文高引第一人易主!AI站上历史巅峰

魔镜魔镜,谁是有史以来被引用次数最多的科学家? 答案:深度学习三巨头之一、图灵奖得主Yoshua Bengio。 如你所见,之所以提出这个问题,其实是因为相关消息正在引起热议ing。
8/26/2025 9:10:00 AM

最新智能体自动操作手机电脑,10个榜单开源SOTA全拿下|通义实验室

能自动操作手机、电脑的智能体新SOTA来了。 通义实验室推出Mobile-Agent-v3智能体框架,在手机端和电脑端的多个核心榜单上均取得开源最佳。 它不仅能做交互界面的问答、描述、定位,也能一条指令独立完成复杂任务,甚至可以在多智能体框架中无缝扮演不同角色。
8/26/2025 9:08:00 AM

为防AI刷题,Nature等顶刊最新封面被做成数据集,考验模型科学推理能力|上海交通大学

近年来,以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型,在各大基准测试(如MMMU)中捷报频传,纷纷刷榜成功。 然而,这些令人瞩目的进展也带来了一个愈发严峻的问题:当现有的“题库”逐渐被提前预训练进模型,我们如何才能持续、准确地评估这些顶尖AI的真实能力? 为了应对这一挑战,上海交通大学王德泉教授课题组巧妙地将“动态基准”这一理念与不断更新的科学前沿相结合,提出了MAC(多模态学术封面)基准:既然科学知识本身在不断演进,为什么不用最新的科学内容来测试AI呢?
8/26/2025 9:07:00 AM

2025临界点:AI智商超越人类,经济规则即将改写

在人类经济活动数字化的浪潮中,互联网和移动互联网走完了前两步,正在浮现中的AI经济,可能带来更大的变化。 人类经济活动正在数字化:1946年,人类发明了计算机,这标志着人类的计算经过几千年的演化,从手动到机械,终于到了电子形式。 计算机的出现,把计算能力提高到了远超过人脑计算能力的程度。
8/26/2025 9:06:00 AM

刚刚,马斯克将OpenAI和苹果告上法庭:指控ChatGPT垄断iPhone,自家Grok被打压

当地时间周一,马斯克向 OpenAI 和苹果「开炮」了! 据多家外媒报道,马斯克旗下 xAI 一纸讼书,控告它们通过 ChatGPT 和苹果 App Store 进行非法垄断。 在一则推文中,马斯克表示,自家 Grok 有 100 万条评论,评论分高达 4.9,但苹果仍然拒绝在任何排名中将 Grok 列入其中。
8/26/2025 9:04:00 AM

Karpathy氛围编程最新指南!三层AI编程结构:顺境Cursor,逆境Claude,绝境GPT-5 Pro

刚刚,大神Karpathy发布全新Vibe Coding指南! 在这份指南中,Karpathy不死磕单一模型,而是集众模之所长,总结出了一套AI编程的三层结构:Cursor——主要负责自动补全与小范围代码修改,高效传达任务意图。 Claude Code/Codex——用于实现较大功能块,快速原型开发和跨领域代码尝试。
8/26/2025 9:00:00 AM

售价2万5!英伟达推出机器人“最强大脑”:AI算力飙升750%配128GB大内存,宇树已经用上了

英伟达直接把服务器级别的算力塞进了机器人体内。 全新的机器人计算平台Jetson Thor正式发售,基于最新的Blackwell GPU架构,AI算力直接飙升到2070 TFLOPS,比上一代Jetson Orin提高至整整7.5倍,同时能效提高至3.5倍。 128GB的超大内存配置,在边缘计算设备里是前所未有。
8/26/2025 7:20:20 AM
梦晨

开发者每日分心1200次——MCP如何破解这一难题

软件开发人员的大部分时间并非用于编写代码,近期行业研究发现,实际编码仅占开发人员工作时间的16%,其余时间则被运营和支持性任务所消耗。 随着工程团队面临“用更少的资源做更多的事”的压力,以及CEO们吹嘘其代码库有多少是由AI编写时,一个问题依然存在:如何优化工程师正在处理的其他84%的任务?让开发人员保持最高效的状态影响开发人员效率的一个主要因素是在工具和平台之间的切换:即在构建和交付软件所需不断增多的工具和平台之间频繁切换。 哈佛商业评论的一项研究发现,普通数字工作者每天要在应用程序和网站之间切换近1200次,每一次中断都很重要。
8/26/2025 7:05:00 AM
Sylvain

Qwen-Image-Edit:千问编图,这次真的很强

在图像生成赛道上,新模型层出不穷,但真正能把“图像编辑”做得又稳又强的,还屈指可数。 比如上周刚发布的 Qwen-Image-Edit 真的很强! 这是 Qwen-Image 的图像编辑版本,基于千问自研的 20B 参数 Qwen-Image 模型进一步训练而成,它不仅延续了 Qwen-Image 独特的 文本渲染能力,更将这一能力拓展到图像编辑领域,实现了对图片中内容的精准增删改。
8/26/2025 4:25:00 AM
wayn

揭秘大语言模型的“开挂神器”:ReAct 框架与推理应用

大语言模型看似神通广大,但其实也有犯迷糊的时候。 今天就带大家揭开一个能让大语言模型瞬间“开挂”的秘密武器——ReAct 引导式学习框架,还有超厉害的 ReACT 推理应用。 想知道它们到底有多神?
8/26/2025 4:11:00 AM
demo123567

精准改图!手把手教你打造Kontext局部重绘工作流

大家好,我是叁石。 继上次发布的文章干货分享:大家发现 kontext 能通过自然语言进行图片处理,如风格迁移、文字替换、角色一致等,所以有好多的小伙伴问我要工作流,我也一一分享给了大家。 但是,在和大家沟通的时候,我发现 kontext 的这个工作流还存在一些缺陷,就是描述很费劲,尤其是遇到一张图中有多个相似元素的情况,大家可以看下面两个工作流的案例。
8/26/2025 1:52:19 AM
体验设计

RAG(检索增强)当前主要的问题以及评估方法

RAG(检索增强生成)虽然极大地提升了大型模型(LLM)回答问题的准确性和时效性,但在实际落地过程中,它远非一个完美的解决方案。 下面,我们将详细梳理当前 RAG 系统遇到的主要问题,以及业界为解决这些问题而探索出的先进解决实践和涌现出的优秀开源产品。 一、 当前 RAG 系统面临的核心问题RAG 的问题可以归结为一句话:“垃圾进,垃圾出”(Garbage In, Garbage Out)。
8/26/2025 1:45:00 AM
朱洁

Java融合AI,手把手教你整合大语模型

人工智能(AI)正加速重构各行业发展模式,大型语言模型(LLM)无疑是这场技术革命的核心驱动力。 对于Java开发者而言,如何将LLM的强大能力融入现有应用,是拓展技术边界、提升产品价值的重要方向。 本文聚焦LLM与Java集成的核心流程,从实际操作步骤、工具选型到行业最佳实践展开讲解,为Java开发者提供清晰的入门路径,助力快速落地AI集成需求。
8/26/2025 1:32:00 AM
学研妹

FastAPI开发AI应用教程:新增用户历史消息

本文将深入介绍如何在 FastAPI AI 聊天应用中实现用户历史消息功能,当用户切换助手,刷新页面时,都可以保留当前会话历史消息。 图片本项目已经开源至 Github,项目地址::本文全文约一万字,看完约需 15 分钟。 文章概述重点讲解每个助手区分 sessionid、获取历史消息接口以及发送消息时携带上下文信息的核心技术实现。
8/26/2025 1:11:00 AM
wayn

AI正在颠覆DevOps生命周期的六种方式

AI重塑DevOps! 自动修复、预测性监控革新运维;GenAI驱动代码生成与优化,加速开发;智能测试自动化提升效率;AI优化基础设施和工具链(CI/CD),实现数据驱动的战略规划,速享AI红利! 译自:6 Ways AI Is Upending the DevOps Lifecycle[1]作者:Hannah CulverAI革命并非敲响DevOps的大门,而是已经在重新装修房子。
8/26/2025 1:10:00 AM
岱军

微信悄悄上线AI播客,新闻主播们的活儿可能真要被抢了

起猛了,周末发现,微信又上一个新的跟AI相关的功能了。 他们正在灰度内测AI播客。 入口在一个非常隐蔽且神奇的地方,叫快讯。
8/26/2025 12:52:11 AM
数字生命卡兹克

全球开源大模型,前十五名全是中国的

国产开源力量的集中爆发。 都在说国内大模型正在驰骋开源领域,具体的情况如何? 近日,随着新一代大语言模型(LLM)的一波更新,开源大模型再次成为了热门讨论话题。
8/25/2025 6:31:00 PM
机器之心

唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力

作者:孙伟高 上海人工智能实验室近年来,大语言模型(LLMs)展现出强大的语言理解与生成能力,推动了文本生成、代码生成、问答、翻译等任务的突破。 代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等,已经深刻改变了人机交互方式。 LLMs 的边界也不止于语言和简单问答。
8/25/2025 6:26:00 PM
机器之心