AI在线 AI在线

理论

AI是否知道什么时候该"思考"?Thinkless教会大模型何时该动脑筋

你是否曾经问过简单问题,却得到AI长篇大论的回答? 或者问复杂问题时,AI却草草了事? 今天我要和大家分享一项突破性研究,它让AI学会了"什么时候该思考,什么时候该直接回答"。
5/23/2025 6:47:33 PM
无影寺

AI实战派:解密DeepSeek企业级项目!AI不是炫技,而是回归需求的必然答案

嘉宾 | 陈亮、张云波主持人 | 薛彦泽撰稿 | 李美涵在AI创业的浪潮里,最迷人的地方莫过于人人都知道这里是风口,却仍然能够各自找到属于自己的机会点。 在众多试图乘上AI风口的创业者中,亨宝科技的CEO张云波和AI创智坊的主理人陈亮无疑是特别的存在。 张云波早年投身于鸿蒙生态,今年年初就敏锐捕捉到DeepSeek大模型兴起的契机,迅速将注意力投向AI领域的应用开发。
5/23/2025 6:28:04 PM
李美涵

曝Claude 4胆儿肥变“勇”了,竟敢举报用户!但Cursor、Manus反而更爱用它了!

编辑 | 云昭近期大模型竞赛又开始热闹起来了。 上周谷歌刚放出来 Gemini 2.5 Pro 在榜单上大杀四方,今天 Anthropic 就深夜放出新模型来屠榜了。 关于 Claude4,一大早不少媒体都进行了报道,这里不再浪费篇幅,就像Anthropic 的 CEO Dario 在开场时就对台下观众所说的,自己不喜欢炒作。
5/23/2025 6:19:45 PM
云昭

英伟达再破世界纪录,每秒1000 token!刚刚,全球最快Llama 4诞生

你以为,AI推理的速度已经够快了? 不,英伟达还能再次颠覆你的想象——就在刚刚,他们用Blackwell创下了AI推理的新纪录。 仅仅采用单节点(8颗Blackwell GPU)的DGX B200服务器,英伟达就实现了Llama 4 Maverick模型每秒单用户生成1000个token(TPS/user)的惊人成绩!
5/23/2025 1:50:39 PM

耶鲁大学联合Adobe提出SynthLight:智能重塑人像照明,打造完美光影!

耶鲁大学和Adobe提出一种用于人像重新照明的扩散模型SynthLight,该方法将图像重新照明视为重新渲染问题,其中像素会根据环境照明条件的变化而变化。 在真实肖像照片上可以产生逼真的照明效果,包括颈部的明显投射阴影和皮肤上的自然镜面高光。 相关链接论文:: 是一种用于人像重新照明的扩散模型。
5/23/2025 11:07:54 AM

Windsurf 发 SWE-1:以数据+智能飞轮驱动软件工程 AI 进化

大家好,我是肆〇柒。 软件开发行业正经历一场前所未有的AI变革。 AI 辅助编程从曾经的新兴尝试,迅速成长为开发领域不可或缺的关键力量。
5/23/2025 9:45:01 AM
肆零柒

谷歌黑科技炸场!LightLab:只需一张图+AI,光影编辑像呼吸一样简单,废片秒变电影级大片!

在之前的文章中以及和大家介绍过需要关于图像&视频重打光的方法,在今天的推送文章中,已经帮大家重新整理好了,欢迎大家点击阅读~今天给大家介绍谷歌提出的一种基于扩散模型的方法LightLab,可以实现对单张图像中光源的细粒度、参数化控制。 该方法能够调整可见光源的强度和颜色、环境光照的强度,并可在场景中插入虚拟光源。 LightLab方法能够对图像中的光源进行显式的参数化控制,同时生成物理上合理的阴影和环境光效应。
5/23/2025 9:36:53 AM

突发!美国新法案,10年内禁止监管AI

今天凌晨,TechPolicy消息,美国众议院通过了《HR1》法案,将禁止美国各州在未来10年内监管AI。 在禁止期间,任何州或其政治分支机构不得执行任何监管AI模型、AI系统或自动决策系统的法律或法规。 这个法案的对于微软、OpenAI、谷歌、亚马逊等科技巨头非常重要,彻底打开了枷锁,可以进行更多的AI技术创新尝试了。
5/23/2025 9:26:30 AM

2030年前必须实现AGI!谷歌祖师爷现场「催更」DeepMind CEO

谷歌的I/O大会证明蓝星的科技正统还在谷歌。 除了发布Gemini 2.5最新版本继续遥遥领先OpenAI的奥特曼以外,还掏出两幅眼镜来拳打苹果,脚踢Meta。 会后还把谷歌的「开山老祖」谢尔盖·布林(Sergey Brin)请了出来,逼Demis Hassabis赶紧在2030年前(也就5年内了)实现AGI。
5/23/2025 9:08:00 AM

字节开源高精度文档解析大模型Dolphin:轻量高效,性能超GPT4.1、Mistral-OCR!

字节跳动刚刚开源一款全新文档解析模型——Dolphin。 与目前市面上各类大模型相比,这款轻量级模型不仅体积小、速度快,并且取得了令人惊艳的性能突破,解析效率提升近2倍。 测试结果显示,Dolphin在文档解析任务上解析准确率超越了GPT-4.1、Claude3.5-Sonnet、Gemini2.5-pro、Qwen2.5-VL等通用多模态大模型,以及最近推出的号称最强OCR大模型的Mistral-OCR等垂类大模型。
5/23/2025 9:03:00 AM

小学数学题,大模型集体不及格!达摩院推出新基准VCBench

大模型做数学题的能力很强,可是它们真的能够理解基本的数学原理吗? 拿小学生的数学题进行测试,人类平均得分为93.30%,而大模型的表现让人意外:闭源模型中Gemini2.0-Flash(49.77%)、Qwen-VL-Max(47.03%)、Claude-3.7-Sonnet(46.63%)的综合表现最佳,但仍未突破50%准确率。 因为大模型可能并不能真正理解基本数学元素和视觉概念。
5/23/2025 8:47:00 AM

最强编码模型Claude 4!7小时不间断写代码,连玩24小时宝可梦,GitHub已选为Copilot底层模型

AI圈子好热闹。 今天凌晨,Claude终于迎来了它的重大版本升级——Claude 4来了! 此次主要发布的有两个模型:Claude Opus 4和Claude Sonnet 4。
5/23/2025 8:34:30 AM
量子位

当AI邂逅向量数据库:重新定义智能时代的数据检索

译者 | 晶颜审校 | 重楼探究人工智能与向量数据库如何实现语义搜索,为更智能的推荐系统、聊天机器人及非结构化数据处理工具提供支撑。 在互联网时代,你是否期待搜索引擎不再局限于关键词匹配,而是能理解用户真实意图? 这正是人工智能与向量数据库结合的价值所在。
5/23/2025 8:26:11 AM
晶颜

大语言模型究竟为何会在对话中“迷失”​

译者 | 张哲刚审校 | 重楼微软研究院和 Salesforce的一篇新论文发现,即使是功能最强大的大型语言模型,如果面临的指令是分阶段而非一次性给出,往往也会表现不佳。 该文作者运行六项任务进行研究,最终发现:当提示被拆分成多个回合时,大语言模型的性能平均下降了39%。 单轮次对话(左图)可获得最佳结果,但对最终用户而言显得并不自然。
5/23/2025 8:18:52 AM
张哲刚

通用人工智能将如何重塑未来?

通用人工智能(AGI)是一种人工智能,具有与人类一样的获取知识、应用知识解决问题和理解能力。 与专门处理受限任务的狭义人工智能系统不同,AGI寻求发展先进的认知技能,以促进在不同情况下完成复杂任务。 AGI是一种人工智能,试图模仿人类的思维过程、解决问题的能力和决策能力。
5/23/2025 6:30:00 AM
chris han

RAG系列:系统评估 - 五个主流评估指标详解

引言在 RAG系列:一文让你由浅到深搞懂RAG实现 中,我们将 RAG 系统主要分为问题理解、检索召回以及答案生成这三个模块,因此对 RAG 系统的评估也是围绕问题(Question)、检索到的上下文(Retrieved Context)、实际答案(Actual Answer)、参考答案(Reference Answer)这四个维度开展,通过衡量这四个维度之间的相关性来评估 RAG 系统的有效性。 下面我们对每个指标一一展开讲解。 评估指标上下文召回率(Context Recall)衡量检索到的上下文是否覆盖参考答案所需的所有关键信息,避免遗漏关键信息。
5/23/2025 6:00:00 AM
燃哥讲AI

IT主管如何应对AI的巨大变化

自主式AI时代已经到来,它不仅带来了运营上的巨大变革,还承诺将提高生产力。 尽管前景光明,但CIO仍在努力应对早期创新浪潮遗留下来的深度变革任务。 在第22届麻省理工学院斯隆管理学院CIO研讨会上,这种紧张氛围尤为明显,技术高管们齐聚一堂,讨论了AI采用的长期影响。
5/23/2025 4:00:00 AM
Roberto

进化智能体 AlphaEvolve:科学发现与算法优化的新引擎

大家好,我是肆〇柒。 今天,我们来聊一个非常有趣且前沿的Agent技术——AlphaEvolve。 这是一个由 Google DeepMind 开发的进化型编码智能体,它通过结合大型语言模型(LLM)和进化算法,为科学发现和算法优化带来了另外一种可能性。
5/23/2025 3:00:00 AM
肆零柒