理论
微软CEO吹爆「智能体」:AI不仅要“杀死”SaaS,操作系统也会“格式化”重来
微软CEO最新采访,分享给大家。 一个冷知识:微软作为IT巨头,虽然拥有OpenAI模型优先使用权,但到现在为止没有自己的拿得出手的模型,我们可以感受一下一个没有自研模型的大厂是如何思考未来满是AI的世界,微软如何通过AI来重塑产品和应用,如何挣钱。 这是微软CEO萨蒂亚·纳德拉(Satya Nadella)在Build 2025 大会后深度访谈,回应了备受争议的“SaaS已死”论,更抛出了“零成本智能”和“无代码操作系统”的颠覆性愿景。
5/28/2025 10:27:08 AM
我们真的能信任人工智能的链式思考推理吗?
译者 | 涂承烨审校 | 重楼随着人工智能(AI)在医疗和自动驾驶等领域的广泛应用,我们对其信任程度的问题变得愈发关键。 一种名为链式思考(CoT)的推理方法备受关注。 它帮助人工智能将复杂问题分解为步骤,展示其如何得出最终答案。
5/28/2025 10:10:20 AM
涂承烨
ETT:打破原生多模态学习视觉瓶颈,重塑视觉tokenizer优化范式
本文由北京智源研究院多模态大模型研究中心(团队负责人王鑫龙,团队代表作 EMU 系列、EVA 系列、Painter & SegGPT)、中科院自动化所和大连理工大学联合完成。 在多模态学习蓬勃发展的当下,视觉 tokenizer 作为连接视觉信息与下游任务的关键桥梁,其性能优劣直接决定了多模态模型的表现。 然而,传统的视觉 tokenization 方法存在一个致命缺陷:视觉 tokenizer 的优化与下游任务的训练是相互割裂的。
5/28/2025 9:17:00 AM
One RL to See Them All?一个强化学习统一视觉-语言任务!
强化学习 (RL) 显著提升了视觉-语言模型 (VLM) 的推理能力。 然而,RL 在推理任务之外的应用,尤其是在目标检测和目标定位等感知密集型任务中的应用,仍有待深入探索。 近日,国内初创公司 MiniMax 提出了 V-Triune,一个视觉三重统一强化学习系统,它能使 VLM 在单一的训练流程中同时学习视觉推理和感知任务。
5/28/2025 9:15:00 AM
大厂程序员:AI正在将我们变成高速流水线工人,受不了了
万万没想到,大厂程序员真要成流水线工人了。 这不是谁危言耸听,而是亚马逊不少程序员最近的亲身感受——很早开始,亚马逊官方就鼓励大伙儿在工作中用AI。 结果发展到今天,“鼓励”更像是一种变相强迫:高层认为AI能提效,所以不少团队人员直接砍半,项目ddl却大大提前。
5/28/2025 9:13:00 AM
阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜
推理大模型开卷新方向,阿里开源长文本深度思考模型QwenLong-L1,登上HuggingFace今日热门论文第二。 其32B参数版本超过OpenAI-o3-mini、Qwen3-235B-A22B等,取得与Claude-3.7-Sonnet-Thingking相当的性能。 除测评分数外,论文中还详细展示了一个金融文档推理的案例。
5/28/2025 9:09:00 AM
谷歌·搜索:献给AI的第一个「祭品」?
谷歌打算用AI先革了自己的命,从搜索引擎开始。 在搜索的主页上,谷歌已经将AI Overviews和AI Mode排在了最前面。 谷歌搜索长期免费,主要依靠在搜索结果中投放广告来创收。
5/28/2025 9:04:00 AM
一文读懂 RAG Fixed-Size Chunking 策略解析与优秀实践
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的 RAG 架构的切块策略—Fixed-Size Chunking(固定切块)。 众所周知,在构建 RAG(Retrieval-Augmented Generation,检索增强生成)系统的过程中,文档切块策略往往决定了模型检索质量的上限。 切得好,信息命中更精准,生成回答更有上下文逻辑;切得差,模型则容易“答非所问”。
5/28/2025 9:00:00 AM
Luga Lee
告别卡脖子,华为黑科技破局!昇腾推理加速1.6倍打破LLM降智魔咒
LLM发展到今天,下一步该往哪个方向探索? 显然,如今最明显的一个问题就是,大模型的参数规模还是太大了——DeepSeek-V3的参数为671B,Llama 3.1系列最大为405B,GPT-4o为200B,Claude 3.5 Sonnet为175B。 参数规模在不断增长,高昂的计算成本和推理延迟,该怎么破?
5/28/2025 8:51:00 AM
测试技术弹性并制定90天行动计划的五个问题
重大事件要求公司迅速作出反应,这意味着你的技术架构需要具备足够的敏捷性,以应对前所未有的环境变化。 技术演进的前所未有的速度、持续的地缘政治不稳定以及不断变化的贸易协定格局,只是许多公司近期不得不适应的几个动态因素。 最成功的企业是那些能够有效应对宏观事件的企业,无论是监管变化、技术发展、供应链调整还是市场准入重新调整。
5/28/2025 7:00:00 AM
Koenraad
性能优化!七个策略,让Spring Boot 处理每秒百万请求
环境:SpringBoot3.4.21. 简介在实施任何优化前,我首先明确了性能基准。 这一步至关重要——若不清楚起点,便无法衡量进展,也无法定位最关键的改进方向。
5/28/2025 5:10:00 AM
Springboot实战案例锦集
我的RAG开源项目300+star了,十分适合新手入门(日志级详细拆解)
三个月前,我在 Github 上开源的一个 RAG 练手项目,目前已经有了 327 个 star,总共解决了 22 个 issues。 结合过去几个月的项目实践,我重新对项目做了轻量化重构,降低资源消耗与部署门槛。 项目地址:,五脏俱全。
5/28/2025 5:00:00 AM
韦东东
AI重塑数据治理的底层逻辑
上个月,一位老友约我喝茶。 他是某知名互联网公司的数据总监,聊天时满脸愁容。 "润总,我们公司数据治理团队有50多人,每天忙得团团转,可数据质量还是一团糟。
5/28/2025 4:00:00 AM
有趣有用有姿态的
MMaDA:多模态大型扩散语言模型的创新突破
大家好,我是肆〇柒。 今天,我们来聊聊一篇来自普林斯顿大学、北京大学、清华大学和字节跳动的研究团队的最新成果——MMaDA(Multimodal Large Diffusion Language Models)。 这项研究在多模态人工智能领域带来了新的突破,其创新的统一扩散架构和先进的后训练策略,为多模态任务的处理提供了全新的思路和解决方案。
5/28/2025 3:30:00 AM
肆零柒
AI问答系统的挑战之语义鸿沟与知识盲点,让大模型理解行业黑话
许多企业在引入通用型AI问答系统后,普遍面临两大核心技术挑战:语义理解的精准度不足和领域知识的深度缺失。 这直接导致系统在处理行业特定术语(黑话)时表现不佳,进而影响问答的准确性和用户体验。 行业黑话识别难题的技术根源通用AI模型主要依赖大规模、多领域的公开语料进行预训练。
5/28/2025 3:00:00 AM
贝塔街的万事屋
Dify、n8n、扣子、Fastgpt、Ragflow到底该怎么选?超详细指南来了
一直以来,我分享了不少关于工作流平台、LLM应用平台的不少干货文章。 主要包含:Dify、Coze、n8n、Fastgpt、Ragflow但是几乎每一篇文章的评论区都有小伙伴问,xxx平台和xxx平台比怎么样,该怎么选? 确实,面对日新月异的AI技术,还有飞速发展的各种LLM平台,我们很容易患上选择困难症但我想说的是,每个平台各有优势,需要根据自身需求,选择合适的即可。
5/28/2025 2:45:00 AM
袋鼠帝
AdaptThink:推理模型的自适应思考范式
大家好,我是肆〇柒。 我前几天就看到这么一篇论文关于 AdaptThink。 它主要讲的是如何通过强化学习,来实现Reason Model(推理模型如o1,R1)根据问题难度自适应选择思考模式(思考或不思考),以优化推理质量和效率的平衡。
5/28/2025 2:40:00 AM
肆零柒
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
英伟达
Anthropic
智能体
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Agent
Sora
AI视频
GPU
百度
AI设计
华为
搜索
大语言模型
工具
场景
字节跳动
RAG
大型语言模型
具身智能
预测
深度学习
伟达
视觉
Transformer
神器推荐
AGI
亚马逊
视频生成
Copilot
DeepMind
模态
架构
LLaMA