AI在线 AI在线

理论

大模型应用的能力分级

对大模型应用的能力分级就像给学生打分一样,能让我们更清楚它的本事有多大。 能力分级能帮我们设定目标,知道AI现在能干什么,未来还要学什么。 有了统一的分级方式,大家就能公平比较不同AI的水平,推动技术进步。
4/2/2025 1:25:00 AM
曹洪伟

SpringAI用嵌入模型操作向量数据库!

嵌入模型(Embedding Model)和向量数据库(Vector Database/Vector Store)是一对亲密无间的合作伙伴,也是 AI 技术栈中紧密关联的两大核心组件,两者的协同作用构成了现代语义搜索、推荐系统和 RAG(Retrieval Augmented Generation,检索增强生成)等应用的技术基础。 “PS:准确来说 Vector Database 和 Vector Store 不完全相同,前者主要用于“向量”数据的存储,而 Vector Store 是用于存储和检索向量数据的组件。 在 Spring AI 中,嵌入模型 API 和 Spring AI Model API 和嵌入模型的关系如下:系统整体交互流程如下:接下来我们使用以下技术:Spring AI阿里云文本嵌入模型 text-embedding-v3SimpleVectorStore(内存级别存储和检索向量数据组件)实现嵌入模型操作内存级别向量数据库的案例。
4/2/2025 12:00:00 AM
磊哥

小米SU7高速上碰撞爆燃,细节披露!事故发生前车辆处于NOA智能辅助驾驶状态,曾触发“脱手预警”

就“小米SU7高速上碰撞爆燃”事件,小米公司发言人官微发文回应。 称“2025年3月29日22时44分,一辆小米SU7标准版在德上高速公路池祁段行驶过程中遭遇严重交通事故。 ”据公告内容,“事故发生前车辆处于NOA智能辅助驾驶状态,以116km/h时速持续行驶。
4/1/2025 5:05:10 PM

DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文

近日,Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。 在过去的几周里,研究人员推出了许多改进推理的新策略,包括扩展简单测试 - 时间规模化(S1)、关联思维链(Chain of Associated thoughts)、Inner Transformer 等方法。 不仅如此,还有来自腾讯实验室的研究人员探索了 Thoughts Are All Over the Place,通过衡量不正确答案中的 token 效率来鼓励模型对每条推理路径进行更深入的探索;来自美国马里兰大学和橡树岭国家实验室等机构联合提出了 Recurrent Block,通过重复调用同一个循环体的方式,在推理阶段可以迭代任意多次;以及来自美国 Zoom 视频通讯公司的研究团队提出了 Chain of Draft(CoD),基于更接近人类推理的提示策略提出了草稿图,这是一种优先考虑效率和推理的提示词策略。
4/1/2025 4:14:00 PM
机器之心

我下下决心再给老板发哈哈哈

编辑 | 萝卜皮原子结构的高分辨率可视化对于理解材料微观结构与宏观性质之间的关系具有重要意义。 然而,在原子分辨率显微镜中,快速、准确、稳健地自动解析复杂模式的方法仍然难以实现。 北京大学、厦门大学、中南大学以及深势科技等组成的研究团队,提出了一种基于 Trident 策略增强的解缠结表示学习方法(生成模型)。
4/1/2025 2:30:00 PM
ScienceAI

关于大模型智能体意图识别不准确问题:function call 的缺陷

最近在研究大模型智能体也就是Agent的过程中,遇到了一个很严重的问题,直接影响到Agent的质量和效果;那就是意图识别不准确,也可以说是Agent的幻觉问题。 其产生的原因就在于大模型有时无法准确识别出用户意图,无法准确调用相应的函数。 意图识别不准确现在大模型技术在应用方面,主要有两大方向;其一就是大模型的创作能力,简单来说就是内容生成方面,如生成图片,文字,视频,也包括RAG等。
4/1/2025 12:10:00 PM
DFires

GPT-2后首次!OpenAI将开源带推理能力的开源权重模型!网友:能比DeepSeek R1强吗?

出品 | 51CTO技术栈(微信号:blog51cto)奥特曼发布X文,宣布了一个重磅推理开源权重模型:长话短说:我们即将在未来几个月发布一个强大的开源语言模型,具备推理能力,并希望与开发者交流如何让它更有用:! 我们计划发布自 GPT-2 以来的首个开源语言模型。 我们已经考虑了很久,但之前有其他优先事项。
4/1/2025 10:35:37 AM

打工人必看!5步解锁Coze黑科技:文本秒变专业流程图/脑图

前言在很多工作场景中,尤其是项目管理、团队协作和知识整理时,流程图和思维导图已经成为不可或缺的工具。 然而,尽管市面上有许多绘图软件,如XMind、MindManager、Draw.io等,它们依然要求用户花费大量时间进行手动绘制和调整。 对于很多人来说,每次绘制图表时,不仅要花费时间去整理布局,还要在多个细节上不断修改,才能确保图表清晰、逻辑准确。
4/1/2025 10:11:12 AM
后端小肥肠

RAG回答准确率暴涨300%!用Coze工作流进行数据结构化(附完整提示词)

前言在生成式人工智能(Generative AI)快速发展的当下,大语言模型(LLMs)的幻觉问题始终是制约其落地应用的关键瓶颈。 检索增强生成(RAG)技术通过引入外部知识库,将动态检索与生成能力结合,为解决这一难题提供了重要思路。 然而,RAG系统的核心性能——数据召回率,高度依赖于底层数据的质量与组织形式。
4/1/2025 10:01:42 AM
后端小肥肠

AI算法 | 如何训练自己的大模型?

1、第一阶段:二次预训练模型选择与转换在开始训练之前,需要选择一个合适的基础模型。 本文以LLaMA-7B为例,简单介绍下。 为了方便后续的操作,将LLaMA-7B模型转换为Hugging Face格式。
4/1/2025 9:54:09 AM
Goldma

打工人自救指南:Manus+DeepSeek+Coze破局AI淘汰

前言2025年的中国AI竞技场中,三股技术浪潮正深度重构普通人的生存法则——DeepSeek让普通人年也能享受硅谷级智囊服务;Manus让小微企业人力成本直降70%(简历筛选、财务核算等);Coze的智能体孵化出了新兴职业(智能体架构师、智能体调教师等)。 当人们还在争论AI是否替代人类时,这三个现象级工具已悄然定义了智能技术的三种进化路径:认知突破、执行闭环与生态革命。 这场技术革命的核心分野,在于三者对人类能力的增强坐标差异:• DeepSeek强化认知维度:用强化学习与模型蒸馏技术,将专业决策的颗粒度细化至人类难以企及的层级(如投资策略模拟准确率达97.3%);• Manus重构执行范式:通过规划-执行-验证(PEV)架构,替代HR筛选、财务核算等流程性工作,实现企业人力成本大幅度降低;• Coze激活创新生态:其插件市场增长率达200%,催生“智能体调教师”“智能体架构师”等新职业,让技术民主化从口号变为现实。
4/1/2025 9:49:06 AM
后端小肥肠

OpenAI要Open了!奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户

OpenAI终于要Open AI了! 一大早,奥特曼郑重官宣,「未来几个月,将开源一款强大的推理模型」。 这是自GPT-2以来,OpenAI首个开源的模型。
4/1/2025 9:46:08 AM
新智元

中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失

在视觉强化学习中,许多方法未考虑序列决策过程,导致所学表征缺乏关键的长期信息的空缺被填补上了。 来自中科大的研究人员在信息瓶颈(Information Bottleneck)框架下,提出了一种新颖的鲁棒动作价值表征学习方法ROUSER。 作者从理论上证明了ROUSER能够使用学习到的鲁棒表征准确估计动作价值,从而避免了智能体在测试环境中的决策能力遭到削弱。
4/1/2025 9:32:00 AM
量子位

使用PyTorch和Hugging Face构建一个自动语音识别系统

译者 | 布加迪审校 | 重楼从语音助手到转录服务,自动语音识别(ASR)是许多应用中的一项关键技术。 我们在本教程中旨在使用Hugging Face的预训练模型构建一条能够将语音转录为文本的ASR管道。 我们将使用轻量级数据集来提高效率,并使用Wav2Vec2这种强大的语音识别自监督模型。
4/1/2025 9:31:34 AM
布加迪

RAG(八)自反思检索增强生成--Self-RAG

大语言模型具有显著的能力,但它们常常因为仅依赖于其参数化知识而产生包含事实错误的响应。 传统的检索增强生成(Retrieval-Augmented Generation, RAG)方法虽然能减少这些问题,但是存在无差别地检索和结合固定数量的段落,没有考虑检索是否必要或检索结果的相关性,都会削弱语言模型的灵活性,或者导致无益的响应生成。 现在LLM RAG(检索增强)的技术方案已成为LLM在众多应用场景的主流。
4/1/2025 9:25:09 AM
Goldma

奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品

为了进一步挑战AI系统,大家已经开始研究一些最困难的竞赛中的问题,特别是国际奥林匹克竞赛和算法挑战。 但目前尚无奥林匹克级别的、多学科的基准,能够全面评估综合解决问题的能力,以全面检验人工智能的综合认知能力。 上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队推出多学科认知推理基准OlympicArena,即使是GPT-4o 也只达到了 34.01% 的整体准确率,而其他开源模型的整体准确率也难以达到20%。
4/1/2025 9:25:00 AM
量子位

OpenAI惊人内幕曝光!赶走奥特曼的PDF,是Ilya发的

奥特曼宫斗事件的背后推手,果然是Ilya! 他发出的两份PDF,掀起了此后OpenAI的惊天巨浪。 奥特曼的3个谎言被戳穿后,Ilya找到Murati和董事会成员,策划了一场「政变」。
4/1/2025 9:23:00 AM
新智元

推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出

当Scaling Law应用于推荐场景,模型又将如何表现? 中科大认知智能全国重点实验室陈恩红团队联合华为诺亚方舟实验室推出推荐模型性能定律,首次对模型的性能与模型、数据的规模和质量进行了定量分析。 针对现有工作只能对推荐大模型Scaling Law(扩展定律)做定性分析的局限性,论文首次尝试对推荐大模型性能扩展定律给出明确的定量预测。
4/1/2025 9:20:00 AM
量子位