资讯列表
OpenAI 内部文件曝光:欲将 ChatGPT 打造成超级助手,挑战苹果 Siri 市场地位
OpenAI战略文件曝光,计划将ChatGPT打造成“超级助手”,挑战苹果Siri。文件显示,ChatGPT将具备广泛基础技能和深度专业能力,目标是成为用户随时可用的智能助手。#ChatGPT挑战Siri# #OpenAI战略#
谷歌 Gemini Live 功能登陆苹果 iOS / iPadOS 平台,美区可体验 AI 识屏识场景
谷歌宣布Gemini Live功能已登陆iOS平台(需美区),用户可通过Gemini App体验AI识别场景和屏幕内容。只需点击摄像头按钮,Gemini Live即可调用设备后置摄像头进行AI识别,快速回应并提出见解。#谷歌AI# #iOS新功能#
微软必应推出 Bing 视频创作器,首次免费开放 OpenAI Sora 模型视频生成能力
微软必应推出基于OpenAI Sora模型的视频创作器,用户可通过文本提示免费生成视频。目前仅支持移动端,生成速度较慢,每次最多可生成3段5秒视频。未来将支持横屏视频生成。#AI视频生成# #微软必应#
为什么非要做Agent?我用传统方法也能实现啊!
"我硬编码10分钟就能搞定的功能,你用Agent折腾半天还不稳定,图啥? " 技术群里,老王又开始质疑我们的Agent项目了。 作为一个写了15年代码的资深工程师,他的话很有代表性。
AI大模型踩过的坑,每一个都价值千万
看着你们公司几十台服务器嗡嗡作响,显卡温度报警声此起彼伏,老板又在催问"大模型什么时候能上线? " 这个熟悉的场景,是不是让你想起了那句话——"理想很丰满,现实很骨感"。 训练一个千亿参数的大模型,好比盖一栋摩天大楼。
人工智能和知识图谱二:构建和使用知识图谱的工具包和算法
一、知识表示标准RDF 和 SPARQL许多知识图谱的核心是资源描述框架 (RDF),它是 W3C 标准,用于以主语-谓语-宾语三元组的形式表示信息。 RDF 提供了一个灵活的图形数据模型,其中每个三元组(例如Alice worksAt CompanyX)都断言资源之间的关系。 它带有形式语义(RDF Schema、OWL 本体),可实现丰富的知识建模(例如类层次结构、域/范围限制)。
MARFT:多智能体协作与强化学习微调的协同进化
大家好,我是肆〇柒。 今天,继续 RL 相关话题,我们来探讨一个在人工智能领域极具应用潜力的话题 —— Multi-Agent Reinforcement Fine-Tuning(MARFT)。 这个概念融合了大型语言模型(LLM)、多智能体系统(LaMAS)和强化学习(RL)的精华,为解决复杂任务提供了全新的视角和方法论。
人工智能和知识图谱一:人工智能中知识图谱的概述
知识图谱 (KG) 是由现实世界实体(节点)及其相互关系(边)组成的结构化网络,以机器可读的形式对知识进行编码。 在人工智能领域,知识图谱是语义理解、推理和数据集成的强大工具。 它们为人工智能系统提供上下文,通过链接不同的数据源并揭示隐藏的关系,实现更易于解释、更准确的决策。
AI投顾时代:你是否信任 “机器人理财师”?
在科技飞速发展的今天,人工智能(AI)早已不是科幻电影里的概念,它正在悄然渗透进我们的生活。 在与财富息息相关的金融领域,当 “机器人理财师” 开始为你规划资产,你会选择信任吗? 我们该拥抱效率,还是警惕失控?
首次解释LLM如何推理反思!西北大学谷歌新框架:引入贝叶斯自适应强化学习,数学推理全面提升
推理模型常常表现出类似自我反思的行为,但问题是——这些行为是否真的能有效探索新策略呢? 对此,西北大学与Google、谷歌DeepMind团队质疑了传统强化学习与反思的关系,并提出了贝叶斯自适应的强化学习方法,首次解释了为什么、如何、以及何时应该反思并探索新策略。 图片通过对比分别使用传统强化学习和新方法训练的模型,研究人员发现:在完成“模型需要在3步内输出三个连续相同字符”这一合成任务中,传统RL往往一条路走到黑,而新方法懂得排除无效假设,适时切换新策略。
基于Gemini与Qdrant构建生产级RAG管道:设计指南与代码实践
一、RAG技术的核心价值与应用场景在人工智能领域,检索增强生成(Retrieval-Augmented Generation, RAG)正成为解决大语言模型(LLM)知识更新滞后、生成内容不可追溯等问题的关键技术。 传统的微调(Fine-Tuning)方法将知识固化在模型参数中,难以应对动态领域的快速变化;而RAG通过将检索与生成解耦,实现了知识的实时更新与可追溯性,尤其适用于政策频繁变动、对准确性要求极高的场景,如医疗、法律和航空管理。 本文以构建机场智能助理为例,结合Google的Gemini多模态模型与Qdrant向量数据库,详细阐述如何设计并实现一个高可靠、可扩展的生产级RAG管道。
RAG中基于图的重排序:利用图神经网络革新信息检索(含代码)
一、信息检索的演进与图重排序的崛起在大数据与人工智能技术爆发的时代,信息检索(IR)系统面临着前所未有的挑战:用户查询日益复杂,跨领域知识需求激增,传统基于词法匹配或单一语义向量的检索模型逐渐暴露局限性。 两阶段检索架构——初始检索与重排序——虽已成为主流,但第一阶段的快速检索常因忽略文档间关联而引入噪声,第二阶段的传统重排序器(如交叉编码器)又难以捕捉结构化知识与全局语义关系。 在此背景下,基于图的重排序(Graph-Based Re-ranking)技术应运而生,通过图神经网络(GNN)建模文档、实体与查询间的复杂关系,为信息检索领域注入了全新的活力。
AI Agents vs Agentic AI:有何区别?为何如此重要?
如果你最近一直在关注 AI,你可能听说过 “AI Agents” 和 “Agentic AI” 这两个术语。 虽然它们听起来像是高深的科技术语,但实际上指的是两种不同类型的人工智能,它们都对我们的世界产生了巨大的影响。 它们究竟是什么?
AI Agent 五大工作模式详解
在AI Agent的架构设计中,工作模式决定了智能体如何规划、执行任务并优化自身行为。 本文将深入解析五大主流工作模式:提示链 (Prompt Chaining)、路由 (Routing)、并行化 (Parallelization)、协调者-工作者 (Orchestrator-Workers) 和 **评估者-优化者 (Evaluator-Optimizer)**,通过技术图解与实例揭示其运作机制。 一、提示链 (Prompt Chaining):分步拆解的思维链核心思想:将复杂任务拆解为顺序执行的子任务链,前一步输出作为后一步输入,形成推理流水线。
轻松配置Cursor玩转MCP,你学会了吗?
我们来看如何配置 Cursor。 需要注意,低版本 Cursor 也支持 MCP 服务,我用的是 0.48.7 版本。 在 Cursor 设置中,先将版本切换到 Early Access(抢先体验)。
构建强大AI Agent的关键 = Pydantic AI + MCP + Advanced Web Scraping
引言在文中,我将展示一个超快速教程,教你如何使用 Pydantic AI、MCP 和高级网页抓取技术,构建一个强大的智能聊天机器人,适用于商业或个人用途。 MCP 逐渐被接受,因为它是一个开放标准。 我制作了一些非常酷的视频,你一定会喜欢。
AI辅助编程工具深度评测与企业选型指南
今天继续分享Google DeepResearch的AI编程工具研发分析报告。 具体的提示语如下:请对Cursor,Winsurf, Copilot,Augument 四款AI辅助编程工具进行详细分析和研究和评测。 需要从功能(核心是编程能力,上下文长度支持等),效率性能,质量,成本,易用性,开放性(mcp协议适配),差异化亮点多方面进行分析和研究。
阿里发布 QwenLong-L1 超长文本杀器!已开源、支持 120k 长上下文、具备“翻书回溯”能力
业界普遍认为AI上下文越长越好,但这存在一个核心矛盾:模型能“吞下”海量信息,却难以真正“消化”。 面对长文,它们会忘记要点、无法深入推理,这已成为一大瓶颈。 例如,AI 能记住第1页的内容,同时理解第100页的观点,并将两者联系起来进行推理吗?