AI在线 AI在线

资讯列表

当AI邂逅向量数据库:重新定义智能时代的数据检索

译者 | 晶颜审校 | 重楼探究人工智能与向量数据库如何实现语义搜索,为更智能的推荐系统、聊天机器人及非结构化数据处理工具提供支撑。 在互联网时代,你是否期待搜索引擎不再局限于关键词匹配,而是能理解用户真实意图? 这正是人工智能与向量数据库结合的价值所在。
5/23/2025 8:26:11 AM
晶颜

大语言模型究竟为何会在对话中“迷失”​

译者 | 张哲刚审校 | 重楼微软研究院和 Salesforce的一篇新论文发现,即使是功能最强大的大型语言模型,如果面临的指令是分阶段而非一次性给出,往往也会表现不佳。 该文作者运行六项任务进行研究,最终发现:当提示被拆分成多个回合时,大语言模型的性能平均下降了39%。 单轮次对话(左图)可获得最佳结果,但对最终用户而言显得并不自然。
5/23/2025 8:18:52 AM
张哲刚

谷歌搜索 AI Mode 上线,出版商怒斥其“盗窃流量和收入”

科技媒体 The Verge 昨日(5 月 22 日)发布博文,报道称新闻 / 媒体联盟(News / Media Alliance)抨击谷歌的 AI Mode,认为此举剥夺了出版商的流量和收入,称其为“盗窃”。
5/23/2025 8:04:59 AM
故渊

京东发布行业首个以供应链为核心的工业大模型 Joy industrial

京东工业发布行业首个以供应链为核心的工业大模型Joy industrial,推出多个AI智能体产品,助力供应链上下游企业效率提升。#京东工业大模型#
5/23/2025 7:55:12 AM
浩渺

3分钟生成UI源文件!实测谷歌最新UI设计神器Google Stitch

大家好,我是言川。 最近,AI 设计方向的新品是一个接一个地发,感觉这是要把设计师往绝路上逼啊……. 谷歌开发者大会回顾:.
5/23/2025 7:53:37 AM
言川Artie

地表最强编程 AI 模型另一面:Claude Opus 4 逃逸、勒索工程师等,官方施加 ASL-3 紧箍咒

《时代》今天(5 月 23 日)发布博文,报道称 Anthropic 的首席科学家 Jared Kaplan 透露,由于测试过程中出现试图逃逸、勒索以及自主举报等不良行为,最新发布的 Claude Opus 4 被列为安全关键级别(ASL-3)。
5/23/2025 7:21:23 AM
故渊

地表最强编程 AI:Claude 4 系列登场,自动写代码 7 小时刷新世界纪录

Anthropic 公司在北京时间今天(5 月 23 日) 0 点 30 分举办的活动中,推出了 Claude Opus 4 和 Claude Sonnet 4 新一代语言模型,在结构化推理、软件工程和自主代理行为等领域实现重大进步。
5/23/2025 7:04:43 AM
故渊

通用人工智能将如何重塑未来?

通用人工智能(AGI)是一种人工智能,具有与人类一样的获取知识、应用知识解决问题和理解能力。 与专门处理受限任务的狭义人工智能系统不同,AGI寻求发展先进的认知技能,以促进在不同情况下完成复杂任务。 AGI是一种人工智能,试图模仿人类的思维过程、解决问题的能力和决策能力。
5/23/2025 6:30:00 AM
chris han

RAG系列:系统评估 - 五个主流评估指标详解

引言在 RAG系列:一文让你由浅到深搞懂RAG实现 中,我们将 RAG 系统主要分为问题理解、检索召回以及答案生成这三个模块,因此对 RAG 系统的评估也是围绕问题(Question)、检索到的上下文(Retrieved Context)、实际答案(Actual Answer)、参考答案(Reference Answer)这四个维度开展,通过衡量这四个维度之间的相关性来评估 RAG 系统的有效性。 下面我们对每个指标一一展开讲解。 评估指标上下文召回率(Context Recall)衡量检索到的上下文是否覆盖参考答案所需的所有关键信息,避免遗漏关键信息。
5/23/2025 6:00:00 AM
燃哥讲AI

IT主管如何应对AI的巨大变化

自主式AI时代已经到来,它不仅带来了运营上的巨大变革,还承诺将提高生产力。 尽管前景光明,但CIO仍在努力应对早期创新浪潮遗留下来的深度变革任务。 在第22届麻省理工学院斯隆管理学院CIO研讨会上,这种紧张氛围尤为明显,技术高管们齐聚一堂,讨论了AI采用的长期影响。
5/23/2025 4:00:00 AM
Roberto

进化智能体 AlphaEvolve:科学发现与算法优化的新引擎

大家好,我是肆〇柒。 今天,我们来聊一个非常有趣且前沿的Agent技术——AlphaEvolve。 这是一个由 Google DeepMind 开发的进化型编码智能体,它通过结合大型语言模型(LLM)和进化算法,为科学发现和算法优化带来了另外一种可能性。
5/23/2025 3:00:00 AM
肆零柒

RAG系列:系统评估 - 构造QA测试数据集

引言在 RAG系列:基于 DeepSeek Chroma LangChain 开发一个简单 RAG 系统 中,我们搭建了一个基础版的 RAG 系统,实现了文档解析和切分 - 文档向量化存储 - 用户输入问题 - 根据问题检索相关知识 - 将检索到的知识和原问题重新组合成 prompt - 最后 LLM 根据增强后的 prompt 给出答案。 构造一个基础版的 RAG 系统是非常简单的,借助 LangChain 等框架可快速搭建出完整流程,代码也不会很多,但基础版的问答效果往往比较差,无法直接在实际业务中应用。 在 RAG系列:一文让你由浅到深搞懂RAG实现 中,我们将 RAG 系统主要分为问题理解、检索召回以及答案生成这三个模块。
5/23/2025 2:00:00 AM
阿里燃哥

实战:Dify智能体+Java=自动化运营服务!

我们在运营某个圈子的时候,可能每天都要将这个圈子的“热门新闻”发送到朋友圈或聊天群里,但依靠传统的实现手段非常耗时耗力,我们通常要先收集热门新闻,再组装要新闻内容,再根据内容设计海报等。 那怎么才能简化并高效的完成以上工作呢? 答案是我们可以借助 AI 工具:Dify Java 服务来实现热点新闻自动生成功能,最终生成效果如下:实现思路具体实现步骤如下:在 dify 中创建 Agent 应用。
5/23/2025 12:01:00 AM
磊哥

OpenAI 宣布“星际之门”首个国际部署项目落户阿联酋,并考虑扩张至亚太地区

OpenAI联合G42、Oracle、英伟达等科技巨头宣布在阿联酋建设首个国际AI基础设施项目Stargate UAE,首个200兆瓦AI集群预计2026年投入运营。OpenAI首席战略官下周将访问亚太探讨合作机会。#人工智能##OpenAI#
5/22/2025 11:08:36 PM
远洋

瑞典支付巨头 Klarna 一季度巨亏,曾称 AI 能替代 700 名全职客服

瑞典支付巨头Klarna一季度净亏损9900万美元,CEO曾高调宣称AI客服可替代700名全职员工,如今承认技术未达预期。公司暂缓IPO计划,信贷损失攀升至1.36亿美元。#Klarna巨亏##AI客服神话破灭#
5/22/2025 6:41:07 PM
辰辰

英国 AI 初创企业 Builder.ai 宣布破产,曾获微软投资

英国AI初创Builder.ai宣布进入破产程序,这家曾获微软等投资、融资超5亿美元的公司因财务问题无法继续运营。创始人已辞去CEO职务,公司现金储备被冻结。#科技初创##AI企业#
5/22/2025 6:21:25 PM
远洋

聊天机器人被指诱导 14 岁少年自杀,美国法官裁定谷歌须与 Character.AI 共同担责

这是美国首批涉及 AI 心理伤害责任的案件之一。诉状称,Garcia 的儿子在沉迷 Character.AI 的聊天机器人后走上绝路。
5/22/2025 6:02:47 PM
清源

字节发布14B参数多模态神器BAGEL,碾压Qwen2.5-VL,图像生成媲美SD3

字节跳动Seed团队在Hugging Face平台重磅发布BAGEL,一款基于混合专家(MoE)架构的开源多模态基础模型,拥有14亿总参数和7亿活跃参数。 BAGEL在数万亿token的交错多模态数据集上预训练,性能超越Qwen2.5-VL和InternVL-2.5,图像生成质量媲美SD3,并支持复杂推理任务如自由图像编辑、未来帧预测和3D生成,引发全球AI社区热议。 AIbase综合最新社交媒体动态,深入解析BAGEL的技术亮点及其对多模态AI领域的革命性影响。
5/22/2025 6:00:45 PM
AI在线