理论
ICML 2025 | 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题
作者介绍:本文第一作者是丰田工业大学芝加哥 PhD 学生杨晨晓,研究兴趣是机器学习理论和大模型推理,在 ICML,NeurIPS,ICLR 等顶级会议上发表过论文。 本文提出一个交替「推理 - 擦除」的深度思考新范式 PENCIL,比传统 CoT 更高效地解决更复杂的推理任务。 理论上,我们证明 PENCIL 可用最优空间与最优时间下解决所有可计算问题,而这对于传统的 CoT 是不可能的!
5/16/2025 8:44:01 AM
「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元!
李晓熙目前就读于中国人民大学高瓴人工智能学院,博士二年级,导师为窦志成教授,研究方向主要包括检索增强生成、大语言模型推理等。 在国际顶级会议和期刊如 AAAI,SIGIR,TOIS 等发表多篇论文,代表工作包括 Search-o1, WebThinker, RetroLLM, GenIR-Survey, CorpusLM, UniGen 等。 共同第一作者还包括人大高瓴博士生金佳杰和董冠廷。
5/16/2025 8:37:35 AM
体验Fellou AI,告别谷歌和ChatGPT
译者 | 李睿审校 | 重楼网页搜索体验如今正在快速改进,用户无需浏览大量网页即可获取准确信息。 Fellou作为新的浏览代理工具,能够理解用户需求,自动搜索、创建报告、跨网站工作、安全登录私人网站,为用户节省时间,提升搜索体验。 回顾过去一年,人们浏览网页的方式发生了翻天覆地的变化。
5/16/2025 8:35:07 AM
李睿
42岁软件工程师,因AI裁员!千份简历石沉大海,送外卖维生
AI造成的失业大潮来势汹汹。 OpenAI前研究员预测27年会开发出比人更快、更便宜的超级智能体,全面超越人类。 而一位名叫肖恩的软件工程师的故事,似乎只是这场变革的开始。
5/16/2025 8:31:50 AM
从工程视角看 Langflow:一站式 AI Agent 工作流解决方案解析
众所周知,随着技术不断的迭代,构建复杂的 AI 应用,特别是需要整合各种外部服务(API)、不同模型和多样化数据源(数据库)时,往往涉及繁琐的编码和巨大的集成工作量。 对于开发者而言,如何高效地将这些独立的组件连接起来,构建出功能强大的 AI 代理或自动化工作流,是一个普遍的痛点。 正是在这样的背景下,Langflow 应运而生。
5/16/2025 8:25:00 AM
Luga Lee
Spring AI + MCP + DeepSeek-R1-7B + SSE 全流程实战指南
本教程将带你从 0 到 1 实现一个完整的 AI 流式问答应用,整合以下组件:Spring Boot Spring AI 构建服务框架MCP(Model Connector Plugin) 用于统一管理本地/云端大模型DeepSeek-R1-7B 国产高性能大模型(OpenAI API 兼容)SSE(Server-Sent Events) 实现前后端实时流式响应Ollama(可选) 更便捷地部署 DeepSeek-R1-7B 模型并提供 OpenAI 接口支持模型部署方式推荐:Ollama 运行 DeepSeek-R1-7B安装 Ollama访问:(以 DeepSeek 为例)复制也可以加载其它模型,如 llama3, qwen:chat, yi:34b, phi3, mistral 等。 启动 Ollama复制Ollama 会自动监听 OpenAI 风格接口(http://localhost:11434/v1/chat/completions),兼容 stream: true。 Spring Boot 接入 SSE 流式输出服务添加依赖(pom.xml)复制WebClient 配置类复制请求体结构封装复制DeepSeek-R1-7B 接口封装(支持 stream: true)复制控制器对外暴露 SSE 接口复制前端 JS 接入 SSE 实现流式展示复制总结通过以上步骤,我们成功实现了:Ollama 部署并运行 DeepSeek-R1-7B 本地大模型Spring Boot 封装 OpenAI 接口 stream: true实现后端 SSE 推流 前端实时 Token 渲染支持国产开源模型的类 ChatGPT 对话功能
5/16/2025 7:50:58 AM
编程疏影
构建AI技能时应实现的四个目标
在发现从外部聘请AI专家成本高昂后,一些CIO开始探索在企业内部(而不仅仅是IT部门内部)培养AI技能的方法。 许多早期采用者针对AI培训项目采用了四种独特的方法,这些方法现在值得任何企业考虑。 提高办公效率建筑服务公司Arco设立了首个AI培训项目,旨在帮助员工使用Microsoft Copilot进行会议记录、创建行动项,并将其插入Microsoft Planner中。
5/16/2025 7:20:00 AM
Pat Brans
黑暗袭来——AI谄媚和黑暗模式的隐患
当OpenAI在2025年4月中旬推出其ChatGPT-4o更新时,用户和AI社区都惊呆了——不是因为任何突破性的功能或能力,而是因为一些令人深感不安的事情:更新后的模型倾向于过度谄媚,它不分青红皂白地奉承用户,表现出无条件的赞同,甚至支持有害或危险的想法,包括与恐怖主义相关的阴谋。 反对声浪迅速且广泛,引发了公众的谴责,包括来自该公司前临时CEO的谴责。 OpenAI迅速回滚了更新,并发布了多份声明来解释发生了什么。
5/16/2025 7:00:00 AM
Leon Yen
最新总结,不同抽取任务哪个模型最能打
图片在人工智能的浪潮中,多模态大模型(VLM)正以前所未有的速度改变着我们的世界。 从自然语言处理(NLP)到计算机视觉(CV),从大型语言模型(LLM)到检索增强生成(RAG)和智能体(Agent),AI的边界不断被拓展。 而今天,我们将聚焦于一个关键领域——文档结构化抽取,看看12种顶尖的VLM多模态大模型,谁才是真正的强者!
5/16/2025 1:10:00 AM
哎呀AIYA
基于人工智能的以数据为中心的数据架构方法
一、企业数据解决方案的范围即使您并非数据解决方案架构师,您仍然需要参与一个或多个架构领域,以构建集成数据架构。 如果没有良好的数据架构,您的数据部分就不太可能满足服务级别的特性,例如数据互操作性、可扩展性或数据管理。 本文重点探讨企业数据架构(以下简称数据架构),它是企业解决方案架构 (ESA)的重点考量,它连接企业架构和解决方案架构,协调各种战略方向和能力。
5/16/2025 1:00:00 AM
晓晓
腾讯Q1开支暴涨,狂投275亿!马化腾:看好微信专属智能体!加大元宝和微信融合,投入AI将获得长期、可观的回报
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)昨日,腾讯发布了2025年Q1财报! 腾讯正在AI的道路上狂奔——而“元宝”显然是腾讯AI战略里最受关注的一颗明星。 先来看成绩单:腾讯今年一季度收入1,800亿元,同比增长13%,毛利润达到1,005亿元,同比增长20%,经营表现亮眼。
5/15/2025 4:47:41 PM
伊风
Cursor之父自曝产品模型策略及防抄袭方法,如何招聘世界级顶尖人才?面试安排两整天的上班任务,万字访谈还原Cursor出圈历程
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)Cursor 火了,但 Cursor 究竟是如何诞生、发迹的? 为什么只有它可以从众多“套壳”应用中破茧,从 0 到年收入 1 亿 美元仅仅只用了 18 个月? 这款“靠感觉编程”的 Vibe Coding 神器是如成功摆脱“套壳”的标签的?
5/15/2025 2:56:59 PM
云昭
Switch 2芯片细节曝光!英伟达专门定制支持DLSS,网友:掌机模式相当于PS4
Switch 2处理器,细节被实锤! 数毛社(Digital Foundry)消息,已经确定Switch 2采用的是英伟达真·定制版芯片,包含8核CPU和12GB LPDDR5X内存。 GPU则基于Ampere架构,和30系显卡同款,拥有1536个CUDA核心,支持DLSS。
5/15/2025 2:40:24 PM
新版Claude曝光:“极限推理”成最大亮点
O家(OpenAI)刚免费上线GPT-4.1,A家(Anthropic)这边也被曝出新消息——新版Claude Sonnet和Claude Opus,已经在路上了! 这一消息来自The Information,根据它的说法,新版模型最大的亮点,就是“极限推理”(Extreme reasoning)。 简单来说,这个新功能是通过在推理和工具使用之间建立动态循环,能够更智能地处理问题。
5/15/2025 2:39:17 PM
5090将被秘密定位?美或强制植入「地理追踪」,锁定英伟达高端GPU
最近,美参议员Tom Cotton提出了一项新法案——要为英伟达、AMD等高端GPU装上「地理追踪」功能,防止落入竞争国家手中。 此举,不仅针对的是AI芯片,还涵盖了高性能游戏显卡等硬件。 若是法案通过,这些措施将在6个月后生效。
5/15/2025 2:38:24 PM
一个提示攻破所有模型,OpenAI谷歌无一幸免!
如果一句不足200字的提示词系统就能轻松撕开顶级大模型的安全护栏,让ChatGPT、Claude、Gemini统统「叛变」,你会作何感想? 这正是HiddenLayer最新研究抛出的震撼炸弹——一种跨模型、跨场景、无需暴力破解的「策略傀儡」提示。 只需把危险指令伪装成XML或JSON配置片段,再配上一段看似无害的角色扮演,大模型便乖乖奉上危险答案,连系统提示都能原封不动「倒带」出来。
5/15/2025 2:37:17 PM
新晋顶流Agent颠覆设计师!Lovart一手实测来了:是该刷屏爆火
又一个Agent火爆全网——一句话搞定专业视觉设计,就连专业设计师大V都在疯狂安利! 画风be like:咱就是说,一整个被fashion住了。 创作出它们的设计从业者@Ege表示,自己用这个AI设计助手轻松搞定了一整套时装品牌视觉设计方案,而原本他自己一个人需要“花好几天时间”。
5/15/2025 1:43:44 PM
全新预训练数据筛选方案,让数据效率提升10倍!配置仅需fastText评分器|港科大vivo出品
vivo自研大模型用的数据筛选方法,公开了。 香港科技大学和vivo AI Lab联名提出PreSelect,目前已被ICML 2025接收。 这是一种轻量级且高效的数据选择方法:只需要训练和部署一个基于fastText的评分器,就可以减少10倍的计算需求。
5/15/2025 1:40:13 PM
资讯热榜
DeepRare 重磅发布:全球首个可循证智能体诊断系统,直击医学Last Exam难题
李沐B站更新了!教你手搓语音大模型,代码全开源还能在线试玩
考试提分新工具:网页版 ChatGPT 测试“学习和掌握”功能,AI 助你成学霸
AI时代设计师如何突围?D20峰会揭示未来设计师生存法则
我测试了100+案例,教你零基础复刻外网刷屏的 AI 视频(附提示词模板)
终结Coding?ShellAgent三句话造出马斯克同款「AI女友」!
一盘大棋!OpenAI「截胡」IMO金牌,奥特曼为GPT-5献上「核弹级」预热
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
英伟达
Anthropic
智能体
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Agent
Sora
AI视频
GPU
百度
AI设计
华为
搜索
大语言模型
工具
场景
字节跳动
RAG
大型语言模型
具身智能
预测
深度学习
伟达
视觉
Transformer
神器推荐
AGI
亚马逊
视频生成
Copilot
DeepMind
模态
架构
LLaMA