理论
全新语义分块算法 Late Chunking:让文本检索更精准的秘密武器
在RAG全链路中,高质量的文本分块技术是RAG检索效果的关键一环。 前面介绍了基于Sentence-Transformer的语义分块方法,今天来看一种名为Late Chunking的新型分块方法,不同于传统的 “先分割再嵌入” 模式,而是通过 “先嵌入再分割” 的创新思路,让文本块的语义表示更加精准。 下面,将从研究动机、算法详解、实验结果和总结四个方面,详细了解下这个方法。
8/15/2025 10:45:45 AM
Goldma
MiroMind-M1:如何用CAMPO算法打造高效且可复现的全栈开源推理模型
大家好,我是肆〇柒。 今天为大家介绍MiroMind-M1,这是一个开源的数学推理语言模型项目,它通过创新的"上下文感知多阶段策略优化"(CAMPO)算法,在保持高性能的同时显著提升了推理效率。 该项目解决了当前推理语言模型(RLM)领域的主要痛点:闭源模型主导市场导致研究不透明,以及开源项目缺乏完整可复现的训练数据和配置。
8/15/2025 10:30:53 AM
肆零柒
RAGFlow v0.20的Agent重大更新:text2sql的Agent案例测试
RAGFlow 在 8 月 4 号更新了 v0.20 版本,这是时隔两个多月之后,更新的一个里程碑式的版本,RAGFlow 在 Agent 板块的拼图这次终于算是完整了。 其实早在一年前,RAGFlow 就有了 Agent 模块,但是一直只包含 Workflow。 而且相比于 Dify 而言,社群对这部分的工具/插件的丰富度、易用性和 UI 美观度而言,一直也有吐槽。
8/15/2025 10:16:49 AM
韦东东
Claude Code价格翻倍背后:Anthropic的技术自信与AI编程市场的大洗牌
昨天有朋友在微信群里发了个截图,说Claude的API费用怎么突然涨了这么多。 我点开一看,确实有点意外——Claude一夜之间价格翻倍了。 说实话,AI圈最近一直在打价格战,各家都在降价。
8/15/2025 9:23:41 AM
阿丸笔记
Claude Code 史诗级更新!AI 编程进入“反向教学”模式,写到一半会停下考你:这行代码你来写
Claude code又更新了,最近claude几乎一天一更新,今天,Claude Code 和 Claude App 推出了学习模式,感觉Claude Code正在朝着万能Agent发展先说 Claude Code:现在支持用 /output-style 来定制沟通风格,Output styles允许你把 Claude Code 调整为任意类型的Agent来配合你的工作流程,同时保留它的核心能力(运行本地脚本、读写文件、维护 TODO)这次主打两种风格,专为学生和开发者提升技能而来:Explanatory(解释)——Claude 会把它的思考过程摊开说,为什么这么设计、有哪些权衡、最佳实践是什么,一边写代码一边讲门道Learning(学习)——更像结对编程的导师。 Claude 会不时暂停,把部分任务交给你来写,再给出指导与反馈,边做边学实操上,如果你想更深入理解它在做什么、为什么这么做,选 Explanatory;如果你想通过亲手编码快速进步,选 Learning,把 Claude 当成带你升级打怪的搭档就好。 更多细节可看官方文档:,对所有 Claude App 用户也有好消息:此前在 Claude for Education首发的 Learning 风格,现在全面开放。
8/15/2025 9:16:16 AM
Meta刚刚开源DINOv3,横扫60+任务,无标注封神!
今天凌晨,全球社交、科技巨头Meta开源了,最新视觉大模型DINOv3。 DINOv3的主要创新使用了自我监督学习,无需标注数据就能大幅度降低训练所需要的时间和算力资源。 并且与前一代相比,DINOv3的训练数据大12倍扩大至17亿张图像以及大7倍的70亿参数。
8/15/2025 9:07:09 AM
链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防
思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段,通过在输入中加入「Let’s think step by step」等提示,模型会生成类似人类的中间推理步骤,显著提升复杂任务的表现。 然而,这些流畅的推理链条是否真的反映了模型的推理能力? 亚利桑那州立大学的一项最新研究却发现,CoT 推理可能并不是真正的推理,而更像是对训练数据分布内模式的复现。
8/15/2025 9:03:24 AM
混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab
近年来,AI大模型在数学计算、逻辑推理和代码生成领域的推理能力取得了显著突破。 特别是DeepSeek-R1等先进模型的出现,可验证强化学习(RLVR)技术展现出强大的性能提升潜力。 然而,现有关于强化学习和模型的研究多聚焦于单一领域优化,缺乏对跨领域知识迁移和协同推理能力的系统性探索,让模型能够在多领域协同工作,发挥更好的推理能力。
8/15/2025 9:00:00 AM
LeetCode刷够100小时,学会找人内推,OpenAI员工下场教你拿Offer
OpenAI 在 AI 领域引领了一波又一波浪潮,想必很多人好奇,这些创新背后的研究人员是如何通过面试的? 尤其是现在,OpenAI 已经成为全球最受瞩目的 AI 公司之一,吸引了无数顶尖人才投递简历。 想要加入这个团队,着实不容易。
8/15/2025 8:57:02 AM
微软都劝他早点收费!设计界巨头Figma创始人自曝自家产品的推出模式,坦承跟Cursor非竞对,犀利点评:我们还停留在DOS时代
编辑 | 云昭5岁时入行演员、19岁辍学、押注一项冷门的浏览器图形技术,十多年后,Figma成了全球设计协作的代名词。 有意思的是,这家超级独角兽的联合创始人Dylan Field却爆料说,自己创业的“最坏打算”只是能和偶像共事几年,没想到竟闯出了一个改变设计行业的爆品。 近期Dylan接受了YCombinator的对话邀约。
8/15/2025 8:31:24 AM
云昭
OpenAI回归开源:gpt-oss-120b和gpt-oss-20b完整指南
译者 | 陈峻审校 | 重楼本文将向你介绍OpenAI新发布的两个开源模型--gpt-oss-120b和gpt-oss-20b,它们的特点,以及在何种场景下该使用哪个模型。 近期,OpenAI发布了两个开源的大语言模型(LLM)--gpt-oss-120b和gpt-oss-20b。 它们是自GPT-2以来,由OpenAI第一个公开许可的LLM。
8/15/2025 8:17:41 AM
陈峻
我用 AI 代理“顶班”7 天——客户毫无察觉
如果几年前有人跟我说:把 80% 的客户沟通自动化,没人会发现,我大概率会礼貌点头、笑两声,然后回去继续修 Flask 路由。 然而,周末一时兴起做了个小助手,结果就失控成了整整一周的全面自动化试验。 没亲自回一条客户消息、没亲自写一封文档邮件、也没手动批过一次轻量 PR——更意外的是:没有任何客户起疑。
8/15/2025 8:14:48 AM
前端小智
腾讯混元开源游戏AI生成新工具!RTX 4090就能制作3A级动态内容
随手拍的一张图,就能秒变3A级游戏大作? ! 刚刚,腾讯全新开源游戏视频生成框架Hunyuan-GameCraft,专为游戏环境设计,让任何人都能轻松搞定游戏制作。
8/14/2025 6:23:20 PM
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
离职掀桌! Mistral被曝“蒸馏”DeepSeek。 网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。
8/14/2025 6:22:29 PM
GPT-4o替代爹味GPT-5!奥特曼光速滑跪,OpenAI连夜回滚「赛博舔狗」
GPT-5发布之后,奥特曼面临的是从未想象过的愤怒民意。 许多网友激动反抗说:GPT-5太冷漠无情,太爹味了,赶快把我的GPT-4o「男友/女友」还给我! 铺天盖地的吐槽和骂声中,奥特曼不得不连夜让GPT-4o等一众旧模型回归,不过只有Pro用户能看到,而且还需手动设置。
8/14/2025 6:20:04 PM
奥特曼爆冷改口:AGI没用?MIT预测2028年降临,50%概率
算力膨胀、模型堆叠,提示词像燃料一样被反复输入。 AI的脚步没有停下,反而越来越快。 有人预言,AGI遥遥无期,至少要等上半个世纪。
8/14/2025 6:16:24 PM
ChatGPT会让大脑退化?OpenAI高管用它救下自己「读写障碍」的女儿
ChatGPT会导致大脑退化吗? 它只是一个作弊工具吗? 加入OpenAI之前,Leah Belsky已经在教育领域工作了15年,从世界银行到Coursera,专注于「让教育惠及全球」这一使命。
8/14/2025 6:15:33 PM
OpenAI们都错了!AI教父辛顿再发警告:控制AI是妄想!必须让AI成为“母亲”,学会主动关心人类!李飞飞当场反驳:构想不对!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)人类试图控制AI的方式犯了本质错误! 昨日,“AI教父”辛顿(Geoffrey Hinton)在Ai4 行业大会上的发言再次掀起热议。 这位曾警告“AI消灭人类的概率在10%到20%之间”的人工智能先驱,这次把矛头直接对准科技巨头——他质疑,那些试图让人类在所谓“顺从”的AI面前维持“主导地位”的做法,根本行不通。
8/14/2025 3:42:55 PM
伊风
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型