AI在线 AI在线

人工智能

揭秘 RAG:为什么说它是让大语言模型(LLM)更聪明的秘密武器?

现在人工智能(AI)很火,尤其是像 ChatGPT 这样的大语言模型(LLM),它们能聊天、写文章、写代码,感觉无所不能。 但有时候,它们也会犯一些小错误,比如信息过时了,或者一本正经地胡说八道(这叫“幻觉”),或者你问它一些你们公司内部的事情,它就完全不知道了。 为了解决这些问题,科学家们想出了一个聪明的办法,叫做RAG。
4/25/2025 10:03:12 AM
用户007

报道称苹果重组管理层,AI 与机器人项目分离

有媒体报道苹果公司对其管理层进行了一次重要的调整,尤其是在人工智能(AI)和机器人项目方面。 根据彭博社的消息,苹果的人工智能负责人约翰・贾南德雷亚(John Giannandrea)将不再负责公司秘密的机器人部门,而是将重心放在人工智能的开发上。 这一变动标志着苹果在优化内部结构、提升 AI 项目推进效率方面迈出了重要一步。
4/25/2025 10:00:59 AM
AI在线

再也不用愁画架构图了,AI帮你画

作为技术人,你一定有过这样的经历:项目文档需要一张专业的架构图,你打开draw.io或Visio,从一个空白画布开始,拖拽组件、调整布局、设置样式...一张像样的架构图往往需要耗费数小时。 画架构图一直是我最头疼的事情,不仅公司项目,我做的一些开源项目也需要画架构图,画的崩溃时我就想到,现在代码都可以通过AI从零生成,为什么还要手动绘制架构图? 通过我的实践发现,Claude在生成draw.io格式的XML架构图方面表现尤为出色——只需描述你的系统,它就能生成格式规范、结构合理的draw.io架构图,导入后即可直接使用或微调,将数小时的工作压缩至几分钟内完成。
4/25/2025 10:00:00 AM
贝塔街的万事屋

AI语音革命新纪元:Sesame模型让聊天AI“活”出表情包式情绪声线

译者 | 朱先忠审校 | 重楼Sesame使用一种名为残差向量量化的深度学习技术对语音进行编码最近,Sesame人工智能公司发布了他们最新的语音转语音(Speech-to-Speech)模型的演示。 这是一个非常擅长说话的对话式人工智能代理,它们能够提供相关的答案,并带有表情地说话,而且说实话,它们非常有趣,互动性很强。 请注意,有关这方面的系统的技术论文尚未发布,但他们确实发布了一篇简短的博客文章,并提供了有关他们使用的技术和他们所构建的先前算法的大量信息。
4/25/2025 8:19:05 AM
朱先忠

谷歌:员工若使用 AI 处理行政任务,每年可节省 122 小时工作时间

谷歌今日发布的试点报告指出,若员工可以使用AI,且企业能提供数小时的基础培训,不仅能迅速提升技术普及率,甚至可能对整体经济增长产生推动。
4/25/2025 7:59:14 AM
清源

企业中最常用的十种GenAI工具

从AI聊天机器人和虚拟助手,到音频和视频生成器,这些都是当今最前沿的GenAI工具。 自OpenAI于2022年推出ChatGPT以来,GenAI已大规模进入企业领域。 根据Precedence Research的数据,2024年全球GenAI市场规模已超过250亿美元,并预计到2033年将达到惊人的8030亿美元。
4/25/2025 7:10:00 AM
Thor Olavsrud

智能体的五大商业用例

AI的下一代已经到来,它具有自主性。 智能体与聊天机器人由相同的AI系统提供支持,但可以独立行动、协作以实现更大的目标,并接管整个业务流程,这项技术相对较新,但所有主要参与者都已经加入。 去年10月,微软宣布包括标准银行、路透社、Virgin Money和苏黎世保险在内的10万家组织正在使用Copilot .
4/25/2025 1:10:00 AM
Maria

DeepSeek在数据领域的30个应用场景

在这个数据AI的时代,DeepSeek作为新一代AI模型正在改变我们处理、分析和理解数据的方式。  本文为您揭秘DeepSeek在数据领域的30个颠覆性应用场景,带大家一窥AI如何重塑数据价值链。 一、数据获取与处理篇1.
4/25/2025 12:50:00 AM
大数据AI智能圈

谷歌I/O2025展望:Material3、Android XR与生成式AI重塑开发者体验

在今天上午的谷歌I/O2025会议上,谷歌宣布了一系列令人激动的新技术,进一步展示了其在人工智能、沉浸式体验和开发工具方面的最新进展。 以下是我们可以期待的主要亮点:1. Material3Expressive:情感化设计的未来谷歌将在此次大会上推出Material3Expressive,这一全新设计系统被形容为“谷歌用户体验设计的未来”。
4/24/2025 3:00:47 PM
AI在线

红杉投资AI初创公司Listen Labs筹集2700万美元,颠覆市场研究行业

近日,红杉资本投资的人工智能初创公司Listen Labs宣布,已成功筹集到2700万美元的融资,旨在颠覆传统的市场研究行业。 公司通过创新的人工智能技术,实现了在数千个语音访谈中同时进行客户研究,极大提升了调研效率和精度。 AI驱动的语音访谈,打破市场研究的时间与成本壁垒Listen Labs的核心技术依赖于先进的人工智能模型,能够在短短几小时内完成传统市场研究方法数天甚至数周才能完成的工作。
4/24/2025 3:00:47 PM
AI在线

国家知识产权局:中国成为全球AI专利最大拥有国,占比达60%

国家知识产权局局长申长雨在国务院新闻办公室的发布会上透露,中国在人工智能领域正展现出强劲的发展势头。 根据世界知识产权组织的报告,中国已成为全球人工智能专利的最大拥有国,专利数量占全球总量的60%。 这一成就不仅反映了中国在科技创新方面的突破,也彰显了其在新兴产业中的领导地位。
4/24/2025 2:00:46 PM
AI在线

LLM 推理引擎之争:Ollama or vLLM ?

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的模型推理框架。 在人工智能领域,模型的推理能力是衡量其性能的核心指标之一,直接影响其在复杂任务中的表现。 随着自然语言处理(NLP)和大规模语言模型(LLM)技术的迅猛发展,众多创新模型不断涌现,为开发者提供了多样化的选择。
4/24/2025 10:26:40 AM
Luga Lee

大模型数据味蕾论

AI大模型就像一位厨师,预训练数据就是这位厨师的味蕾。  没有经过训练的味蕾,再好的食材也无法变成美味佳肴。 没有优质的预训练数据,再强大的计算资源也打造不出卓越大模型。
4/24/2025 9:26:13 AM
大数据AI智能圈

礼貌寒暄推高AI问答成本!OpenAI每年为此多花数千万美元?

近日,美国科技公司OpenAI的首席执行官萨姆·奥尔特曼在社交平台上透露了一个令人意外的现象:用户在与ChatGPT互动时频繁使用“请”“谢谢”等礼貌用语,这一行为竟然导致公司每年需额外承担数千万美元的运营成本。 这一消息引发了广泛讨论,人们不禁好奇,为何简单的礼貌寒暄会带来如此高昂的成本? 礼貌寒暄背后的成本根据《今日美国》及美国《石英》杂志的报道,当用户在ChatGPT的用户界面说“谢谢”时,大模型会按照算法回复“不客气”。
4/24/2025 9:11:09 AM
小菲

理解 RAG 第三部分:融合检索与重新排序

我们之前介绍了什么是 RAG、它在大型语言模型 (LLM) 中的重要性,以及 RAG 的经典检索器、生成器系统是什么样的,本系列的第三篇文章探讨了一种构建 RAG 系统的升级方法:融合检索。 在深入探讨之前,值得简要回顾一下我们在本系列第二部分中探讨过的基本 RAG 方案。 融合检索解析融合检索方法涉及在检索增强生成(RAG)系统的检索阶段中融合或聚合多个信息流。
4/24/2025 9:04:42 AM
晓晓

OpenAI 新模型 GPT-4.1 可靠性遭质疑:独立测试显示其对齐性下降

IT之家 4 月 24 日消息,本月早些时候 OpenAI 推出了 GPT-4.1 人工智能模型,并声称该模型在遵循指令方面表现出色。 然而,多项独立测试的结果却显示,与 OpenAI 以往发布的模型相比,GPT-4.1 的对齐性(即可靠性)似乎有所下降。 据IT之家了解,通常情况下,OpenAI 在推出新模型时,会发布一份详细的技术报告,其中包含第一方和第三方的安全评估结果。
4/24/2025 8:29:59 AM
远洋

全网首曝!用 C# 调用本地大模型:Llama3 中文对话实战

在人工智能蓬勃发展的当下,大模型技术已成为众多领域的核心驱动力。 Llama3作为Meta开发并公开发布的最新大型语言模型(LLMs),凭借其卓越的性能和丰富的功能,备受开发者关注。 以往,调用大模型往往依赖云端服务,面临着网络延迟、数据隐私等诸多问题。
4/24/2025 8:20:00 AM
后端Q

理解 RAG 第二部分:经典 RAG 的工作原理

在本系列的第一篇文章中,我们介绍了检索增强生成 (RAG) ,并解释了扩展传统大型语言模型 (LLM)功能的必要性。 我们还简要概述了 RAG 的核心思想:从外部知识库中检索上下文相关的信息,以确保 LLM 生成准确且最新的信息,而不会产生幻觉,也无需不断地重新训练模型。 本系列的第二篇文章将揭秘传统 RAG 系统运行的机制。
4/24/2025 1:10:00 AM
晓晓