技术
“一代更比一代强”:现代 RAG 架构的演进之路
基于 RAG(检索增强生成)的 AI 系统,过去是,现在仍然是企业利用大语言模型(LLM)的最有价值的应用之一。 我记得差不多两年前我写了第一篇关于 RAG 的文章,那时候这个术语还未被广泛采用。 我当时描述的是一个以最基础方式实现的 RAG 系统。
6/6/2025 1:15:00 AM
Baihai IDP
AI Agent落地面临的三大挑战
前面为大家介绍过AI Agent的发展史和工程结构模型,并对Agent的典型代表——Manus的技术架构进行了详细解析。 不少同学看完后纷纷留言说,他们在工作中也尝试在推动落地Agent,但结果总是不尽如意,希望我能给出一些建议。 我自己目前对AI Agent也处在探索实践阶段,并无法给出很好的建议。
6/5/2025 1:55:00 AM
写文章老张
冲击自回归,扩散模型正在改写下一代通用模型范式
上个月 21 号,Google I/O 2025 开发者大会可说是吸睛无数,各种 AI 模型、技术、工具、服务、应用让人目不暇接。 在这其中,Gemini Diffusion 绝对算是最让人兴奋的进步之一。 从名字看得出来,这是一个采用了扩散模型的 AI 模型,而这个模型却并非我们通常看到的扩散式视觉生成模型,而是一个地地道道的语言模型!
6/4/2025 1:55:03 PM
李飞飞空间智能独角兽开源底层技术!AI生成3D世界在所有设备流畅运行空间智能的“着色器”来了
李飞飞空间智能创业公司World Labs,开源一项核心技术! Forge渲染器,可在桌面端、低功耗移动设备、XR等所有设备上实时、流畅地渲染AI生成的3D世界。 具体来说,Forge是一款Web端3D高斯泼溅渲染器,无缝集成three.js,实现完全动态和可编程的高斯泼溅。
6/3/2025 2:14:59 PM
函数向量对齐技术,让大模型持续学习不“失忆”丨ICLR 2025
LLMs为什么总是灾难性遗忘? 原来是功能激活在搞怪。 最近来自中国科学技术大学、香港城市大学和浙江大学的联合研究团队,通过对多个语言模型、任务序列和评估指标的系统分析,终于破解了LLMs的灾难性遗忘之谜——遗忘行为具有高度的模型依赖性,而导致遗忘发生的本质却是功能激活的变化。
6/3/2025 8:35:00 AM
舍弃自回归!国内团队打造纯扩散多模态大模型LLaDA-V,理解任务新SOTA
本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。 游泽彬和聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。 该研究基于团队前期发布的、首个性能比肩 LLaMA 3 的 8B 扩散大语言模型 LLaDA。
5/27/2025 3:35:02 PM
突发!美国新法案,10年内禁止监管AI
今天凌晨,TechPolicy消息,美国众议院通过了《HR1》法案,将禁止美国各州在未来10年内监管AI。 在禁止期间,任何州或其政治分支机构不得执行任何监管AI模型、AI系统或自动决策系统的法律或法规。 这个法案的对于微软、OpenAI、谷歌、亚马逊等科技巨头非常重要,彻底打开了枷锁,可以进行更多的AI技术创新尝试了。
5/23/2025 9:26:30 AM
华硕CEO预测:AI电脑距离全面落地仍需两年
在台北举行的 Computex 展会上,华硕共同首席执行官胡镇荣(Samson Hu)表示,当前一波新型人工智能(AI)电脑的普及将需要到2026年甚至更久才能真正推动市场发展。 尽管去年的 AI 电脑发布引发了不少期待,但胡镇荣指出,市场前景并没有因此而显著改善,尤其是在当前全球经济形势不佳的背景下。 随着技术的不断进步,从华硕到联想等众多厂商都推出了 AI 电脑,希望能够为疲软的笔记本市场带来新的生机。
5/21/2025 12:01:16 PM
AI在线
黄仁勋最新访谈:中国 AI 人才“制霸”全球,人工智能开启1万亿→50万亿级别市场
最近,Nvidia的 CEO 黄仁勋,人称“黄教主”,在科技圈又发表了一系列引人注目的观点。 这次是在知名科技博主Ben Thompson的“Stratechery”访谈里,黄教主分享了他的诸多见解,从中美AI聊到自家公司的发展方向,信息量不小。 图片一、中国AI实力?
5/20/2025 1:55:28 PM
蚂蚁集团CTO揭示大模型 “幻觉” 根源:数据短缺是关键
在近日举行的 OceanBase 开发者大会上,蚂蚁集团的首席技术官何征宇发表了关于人工智能(AI)发展的一番看法。 他指出,数据是推动 AI 进步的基石,而数据的量和质量直接影响大模型的能力和表现。 他强调,缺乏足够的数据将导致 AI 技术产生 “幻觉”,而这种现象在当前的技术环境中愈发明显。
5/19/2025 11:01:06 AM
AI在线
最新总结,不同抽取任务哪个模型最能打
图片在人工智能的浪潮中,多模态大模型(VLM)正以前所未有的速度改变着我们的世界。 从自然语言处理(NLP)到计算机视觉(CV),从大型语言模型(LLM)到检索增强生成(RAG)和智能体(Agent),AI的边界不断被拓展。 而今天,我们将聚焦于一个关键领域——文档结构化抽取,看看12种顶尖的VLM多模态大模型,谁才是真正的强者!
5/16/2025 1:10:00 AM
哎呀AIYA
SpringAI更新:废弃tools方法、正式支持DeepSeek!
AI 技术发展很快,同样 AI 配套的相关技术发展也很快。 这不今天刚打开 Spring AI 的官网就发现它又又又又更新了,而这次更新距离上次更新 M7 版本才不过半个月的时间,那这次 Spring AI 给我们带来了哪些惊喜呢? 一起来看。
5/15/2025 3:00:00 AM
磊哥
AI搜索初创公司Perplexity 即将完成5亿美元融资,估值达140亿美元
人工智能搜索初创公司 Perplexity 正在接近其六个月内的第二次融资,估值达到140亿美元。 这一轮融资将由风险投资公司 Accel 领投,预计金额将达到5亿美元。 Perplexity 以其先进的人工智能搜索技术受到市场的广泛关注,正逐渐成为行业内的一匹黑马。
5/13/2025 11:00:52 AM
AI在线
连续思维机器来了!Transformer八子之一创企推出,让AI不再「一步到位」拍脑袋做决定
科学界的一个共识是:即使是最复杂的现代人工智能,也难以媲美人类大脑的表现和效率。 研究者经常从大自然中寻找灵感,了解如何在人工智能领域取得进步,例如利用进化来合并模型、为语言模型进化出更高效的记忆或探索人工生命的空间。 虽然人工神经网络近年来让人工智能取得了非凡的成就,但它们仍然是其生物对应物的简化表征。
5/13/2025 8:56:54 AM
一文了解!MCP 技术生态全面解析:核心组件、工作流程、生命周期
在 AI 领域,模型上下文协议(MCP)的出现,就像是一场及时雨,完美地解决了 AI 模型与外部工具和资源交互的难题,让它们之间的协作变得轻松又自然,彻底打破了数据孤岛的困境,让不同系统之间的互操作性不再是梦想。 一、MCP 核心组件:架构精解MCP 架构 :MCP 主要有三个核心组件,分别是 MCP 主机、MCP 客户端和 MCP 服务器,它们三个相互配合,让 AI 应用和外部工具、数据源之间能够无缝通信。 MCP 主机 :就好比是一个大舞台,为执行 AI 任务提供了演出环境,并且在这个舞台上运行着 MCP 客户端,没有它,整个表演就没办法开始。
5/13/2025 1:45:00 AM
小智
突破性技术MCA-Ctrl:中科院团队引领AI图像定制化新范式
中国科学院计算技术研究所研究团队近日推出的MCA-Ctrl技术在生成式AI领域引发广泛关注,这一文本到图像(T2I)新方法正为图像定制化市场带来革命性变革。 在个性化需求日益增长的当下,该技术通过独特的多方协同注意力控制机制,让用户无需繁琐的模型微调,即可根据文本或图像条件生成高度个性化的图像内容。 MCA-Ctrl最大的技术亮点在于其三大核心应用能力:主题替换、主题生成和主题添加。
5/12/2025 5:00:52 PM
AI在线
FDA 宣布使用 AI 技术加速药品审批流程
美国食品药品监督管理局(FDA)近日宣布,将立即在其所有中心引入人工智能(AI)技术,以缩短药品审批的时间。 此次决定是在 FDA 完成了一项针对科学审查员的生成性 AI 试点后做出的。 FDA 表示,借助这项 AI 工具,科学家们可以减少大量重复性、单调的工作,从而提升审核效率。
5/12/2025 10:01:16 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用