资讯列表
图驱动的自然语言接口:混合LLM与意图分类方法
在当今数据驱动的商业环境中,数据分析人员和营销人员经常需要与复杂的数据库交互以获取洞察。 然而,并非所有人都精通SQL等结构化查询语言,这就催生了对自然语言接口的需求。 本文将深入探讨一种创新的意图驱动自然语言接口,该接口结合了大型语言模型(LLM)和意图分类技术,为数据洁净室(Data Clean Rooms, DCRs)等隐私敏感环境提供了安全、高效的解决方案。
7/1/2025 9:00:00 AM
大模型之路
会“思考”的目标检测模型来了!IDEA提出Rex-Thinker:基于思维链的指代物体检测模型,准确率+可解释性双突破
Caption: Rex-Thinker 的思考过程在日常生活中,我们常通过语言描述寻找特定物体:“穿蓝衬衫的人”“桌子左边的杯子”。 如何让 AI 精准理解这类指令并定位目标,一直是计算机视觉的核心挑战。 现有方法常被两大问题困扰: 决策过程不透明 (“黑箱” 预测)和 拒识能力不足 (对不存在物体输出错误结果)。
7/1/2025 8:53:26 AM
RAG系统的“聪明药”:如何用反馈回路让你的AI越用越聪明?
大家好,我是你们的AI技术侃侃而谈小能手。 今天我们来聊聊RAG(Retrieval-Augmented Generation,检索增强生成)系统的进化之路——如何让它像喝了聪明药一样,越用越聪明,越聊越懂你。 你是不是也有这样的体验?
7/1/2025 8:37:13 AM
许泽宇
模型极简主义:为企业节省数百万的新型AI策略
大型语言模型(LLM)的出现使企业更容易构想出它们可以承担的项目类型,从而推动了试点项目向部署阶段的迅猛发展。 然而,随着这些项目的推进,企业意识到之前使用的大型语言模型不仅笨重,而且成本高昂。 于是,小型语言模型和模型蒸馏技术应运而生。
7/1/2025 7:05:00 AM
Emilia David
自研模型进度缓慢,古尔曼称苹果 Siri 正考虑转向 Anthropic 或 OpenAI 技术合作
彭博社记者古尔曼爆料,苹果正考虑放弃自研AI模型,转而与Anthropic或OpenAI合作,以提升Siri性能。测试显示Anthropic的Claude模型表现优于ChatGPT,但高昂授权费或成障碍。#苹果AI##Siri升级#
7/1/2025 7:02:54 AM
问舟
运行时攻击如何让盈利的AI变成预算黑洞
AI以其带来变革性洞察和效率提升的潜力吸引了企业界的目光,然而,随着各企业急于将其模型投入运营,一个严峻的现实正浮现出来:AI将投资转化为实时业务价值的推理阶段正受到围攻,这一关键节点正以初始商业案例未能预测到的方式推高总拥有成本。 那些因AI项目的变革性优势而批准项目的安全主管和CFO,如今正面临捍卫这些系统的隐性开支。 对手已发现,推理是AI为企业“创造价值”的环节,也正是他们能造成最大破坏的地方。
7/1/2025 7:00:00 AM
Louis Columbus
AI 智能体通信:潜力与挑战并存的未来
大家好,我是肆〇柒,大型语言模型(LLM)进步,以其卓越的自然语言理解和生成能力,催生了 LLM 驱动的 AI 智能体这一创新技术。 这些 AI 智能体,作为 LLM 的进阶应用形态,不仅具备传统 LLM 的语言处理能力,更集成了感知、推理、决策与行动执行等多元化功能,实现了从单纯的信息处理向自主任务操作的跨越。 其应用范围横跨科学研究、工业生产、社会服务等多个关键领域,展现出改变世界运行模式的巨大潜力,市场预计将以年均 40% 的速度增长,至 2035 年市场规模有望突破 2168 亿美元。
7/1/2025 5:00:00 AM
肆零柒
马斯克Neuralink脑机接口新成果!看完头皮发麻
注意看,这些人正在用意念玩马里奥赛车。 他们的手没有动一下,靠脑电波控制就完成了移动、转弯、吃道具等一系列动作。 帮助他们通过“心灵感应”完成游戏操作的,就是马斯克Neuralink的脑机接口N1。
7/1/2025 4:45:00 AM
量子位
工业4.0中的人工智能应用及案例
想象一下,在一家工厂里,机器之间可以互相窃窃私语,在故障发生前预测故障,机器人实时调整任务来制造定制汽车。 这不是科幻小说,而是工业4.0的现实。 两年前,我通过VR参观了西门子的安贝格工厂,亲眼目睹机器人与人工智能协作,以99.9%的精度组装设备。
7/1/2025 3:00:00 AM
晓晓
RAG搭建个人LLM知识库助手,很多人第一步就走错了...
基于RAG技术搭建本地知识库问答助手,已经是相当普遍的应用方案了。 前一阵我在公司实践过,用我们过往积累的、对业务重要的内部知识构建知识库,开发了一个智能问答Agent,能减少团队一部分的答疑时间。 构建知识库时,我们将内部知识整理成了 MarkDown 格式。
7/1/2025 2:22:00 AM
渡码
AI Agent 体如何改变我们与网页的互动方式
AI 智能体(像 OpenAI Operator 这样的)能帮你自动完成网上找产品、管理浏览器标签等任务,简直是解放双手! 但要让这些智能体真正派上用场,挑战可不小。 这篇文章会聊聊 AI 智能体在网页互动中的现状、痛点,以及一个叫 Agentic Web Interfaces (AWIs) 的新解决方案。
7/1/2025 2:10:00 AM
AI研究生
视觉语言模型如何突破感知边界?上海 AI 新势力提出“世界意识”赋能真实环境规划
——如何让多模态智能体真正“看懂”世界并做出复杂决策“把切好的苹果片冰一下再丢进垃圾桶”——这样一条看似普通的自然语言指令,若让一台具身智能体(Embodied Agent)执行,其背后实则隐藏了多步规划、常识应用、环境理解、工具使用等一系列交互复杂度极高的子任务。 如何让 AI 理解任务的潜台词、合理分解步骤,并在真实视觉输入中找准对象并正确执行,正是当前具身智能与多模态学习面临的最大挑战之一。 具身智能与多模态规划的研究背景具身智能(Embodied Intelligence)可以被视为 AI 研究“从认知走向行为”的转折点。
7/1/2025 1:35:00 AM
FlerkenS
VSCode AI 编程必装!五款DeepSeek集成插件,每款都让开发效率飙升
AI 大模型对编程的影响已深入技术前沿,以 Cursor 为代表的对话式编程工具正融入开发工作流。 作为 AI 编程领域的明星产品,Cursor 功能虽强,但价格较高,因此开发者们需要寻找免费替代品。 VSCode 的性价比优势明显,其免费 AI 编程插件在性能上与 Cursor 相当,且伴随 DeepSeek 等国产大模型崛起,插件生态已完成对其适配。
7/1/2025 1:33:00 AM
学研君
微软新推出的小语言模型Mu,是端侧AI的最优解吗?
上周,微软宣布推出一款名为“Mu”的新型生成式人工智能(GenAI)系统,它让我们得以一窥未来我们使用各种设备(从个人电脑到烤面包机)的方式。 借助“Mu”,用户能够通过日常语言来操控电脑。 例如,你可以键入或说出“打开暗黑模式”或“让我的鼠标指针变大”等指令,电脑便会照做。
7/1/2025 1:00:00 AM
React + AI = ?
AI 的飞速发展正在重塑前端开发的边界。 除了生成 UI、编写代码,AI 现在具备了更强的“执行能力”——而 MCP,正是实现这一能力的关键技术。 2024 年 11 月,Anthropic 提出了 MCP(Model Context Protocol),一个开放协议,旨在为 AI 模型提供标准化的接口,用于调用外部工具与数据源,从而生成更准确、更具上下文理解的响应。
7/1/2025 12:00:00 AM
CUGGZ
谷歌“送 AI 进校园”新举措:推出师生专享 Gemini 教育项目
年满 18 岁的学生还可以使用“Gemini Canvas”,依据任意主题生成个性化测验题,辅助复习。谷歌表示,未来数周内将逐步拓展至更年轻的学生群体。
6/30/2025 10:13:07 PM
清源
英特尔 Day0 完成文心大模型 4.5 系列开源模型的端侧部署
据英特尔中国消息,在此次文心系列模型的发布过程中,英特尔借助 OpenVINO 在模型发布的第零日即实现对文心端侧模型的适配和在英特尔酷睿 Ultra 平台上的端侧部署。
6/30/2025 9:45:48 PM
归泷
微软被曝将“AI 使用量”纳入员工考核:不再是“可选项”,直接挂钩绩效
微软开发者工具部门总裁 Julia Liuson 最近发出内部邮件,要求各级主管在评估员工绩效时,将其使用 GitHub Copilot 等内部 AI 工具的情况纳入考量。
6/30/2025 7:55:39 PM
清源