AI在线 AI在线

人工智能

我的RAG开源项目300+star了,十分适合新手入门(日志级详细拆解)

三个月前,我在 Github 上开源的一个 RAG 练手项目,目前已经有了 327 个 star,总共解决了 22 个 issues。 结合过去几个月的项目实践,我重新对项目做了轻量化重构,降低资源消耗与部署门槛。 项目地址:,五脏俱全。
5/28/2025 5:00:00 AM
韦东东

AI重塑数据治理的底层逻辑

上个月,一位老友约我喝茶。 他是某知名互联网公司的数据总监,聊天时满脸愁容。  "润总,我们公司数据治理团队有50多人,每天忙得团团转,可数据质量还是一团糟。
5/28/2025 4:00:00 AM
有趣有用有姿态的

MMaDA:多模态大型扩散语言模型的创新突破

大家好,我是肆〇柒。 今天,我们来聊聊一篇来自普林斯顿大学、北京大学、清华大学和字节跳动的研究团队的最新成果——MMaDA(Multimodal Large Diffusion Language Models)。 这项研究在多模态人工智能领域带来了新的突破,其创新的统一扩散架构和先进的后训练策略,为多模态任务的处理提供了全新的思路和解决方案。
5/28/2025 3:30:00 AM
肆零柒

AI问答系统的挑战之语义鸿沟与知识盲点,让大模型理解行业黑话

许多企业在引入通用型AI问答系统后,普遍面临两大核心技术挑战:语义理解的精准度不足和领域知识的深度缺失。 这直接导致系统在处理行业特定术语(黑话)时表现不佳,进而影响问答的准确性和用户体验。 行业黑话识别难题的技术根源通用AI模型主要依赖大规模、多领域的公开语料进行预训练。
5/28/2025 3:00:00 AM
贝塔街的万事屋

AdaptThink:推理模型的自适应思考范式

大家好,我是肆〇柒。 我前几天就看到这么一篇论文关于 AdaptThink。 它主要讲的是如何通过强化学习,来实现Reason Model(推理模型如o1,R1)根据问题难度自适应选择思考模式(思考或不思考),以优化推理质量和效率的平衡。
5/28/2025 2:40:00 AM
肆零柒

RAG(检索增强生成):提升大语言模型性能的终极指南

一、大语言模型的困境:从“鹦鹉学舌”到“知识饥渴”在人工智能领域,大语言模型(LLMs)的出现曾让我们惊叹于其语言能力——它们能流畅对话、撰写文章,甚至模仿人类的逻辑推理。 然而,随着应用场景的深入,这些“超级智能鹦鹉”的局限性逐渐暴露:时效性缺失模型训练数据往往截止到某个固定时间点,无法回答“昨晚比赛结果”“最新政策变化”等实时问题。 知识边界模糊面对企业内部文档、专业领域知识等私有数据时,传统LLMs因缺乏访问权限而无法准确响应。
5/28/2025 1:25:00 AM
大模型之路

DeepSeek-V3:硬件与模型的完美统协,奏响 AI 高效新乐章

大家好,我是肆〇柒。 DeepSeek-V3 曾经一度备受全球瞩目,从 V3 发布至今,这一开源模型已经在众多企业场景中成功落地。 然而,在落地过程中,由于其复杂的工程细节,相信许多团队也遇到了不少挑战。
5/28/2025 1:20:00 AM
肆零柒

北京市发布人工智能赋能新型工业化行动方案,助力制造业智能化转型

近期,北京市经济和信息化局正式印发了《北京市人工智能赋能新型工业化行动方案(2025年)》。 该方案旨在通过推动人工智能与工业的深度融合,促进制造业的智能化升级,全面提升生产效率。 图源备注:图片由AI生成,图片授权服务商Midjourney方案的首要任务是建设高质量的行业数据集,鼓励制造业企业和科研机构积极进行数据的采集和处理,形成具有实用价值的数据集,并对相关工作给予奖励。
5/27/2025 6:00:50 PM
AI在线

最高法院重申声音权利,遏制人工智能滥用现象

近日,中国最高法院发布了一项重要裁决,强调必须严格遵循《民法典》的规定,以促进经济与社会的高质量发展。 这一裁决不仅突显了在科技飞速发展的背景下,保护个人权利的重要性,还为人工智能的合理应用树立了法律界限。 在一个标志性的案件中,声优艺术家殷女士发现,她的声音在未经授权的情况下被用于网络有声书中,并且这些录音还通过人工智能技术进行了加工。
5/27/2025 6:00:50 PM
AI在线

北京:针对 AI 手机等智能产品,支持有条件的企业牵头建设中试平台、智能产品柔性生产线

北京市经信局印发《人工智能赋能新型工业化行动方案》,提出支持企业建设中试平台、智能产品柔性生产线,最高给予5000万元支持。方案还涵盖行业数据集建设、公共数据治理、企业数据模型训练等内容,推动AI与工业深度融合。#人工智能##智能制造#
5/27/2025 5:49:13 PM
远洋

​Duolingo CEO 回应 AI 转型争议,重申不会裁员

Duolingo 的首席执行官兼联合创始人路易斯・冯・安(Luis von Ahn)近日在社交媒体上对员工关于人工智能(AI)转型的担忧进行了回应。 在公司宣布 “AI 优先” 战略后,部分员工感到不安,冯・安在 LinkedIn 上发表了一篇声明,试图澄清公司未来的发展方向。 他表示,早先的沟通缺乏清晰度,并承认自己没有充分传达公司的意图。
5/27/2025 10:01:25 AM
AI在线

​苹果设计大师艾维因 OpenAI 收购获巨额财富,或成亿万富翁

据《福布斯》报道,苹果传奇设计师乔纳森・艾维(Jonathan Ive)因其创办的人工智能硬件公司 io 被 OpenAI 收购,获得了价值7.15亿美元的股票。 这一交易预计将使艾维的净资产在未来几年突破10亿美元,可能让他跻身亿万富翁行列。 图源备注:图片由AI生成,图片授权服务商MidjourneyOpenAI 在上周宣布,将通过全股票交易的方式收购艾维的公司 io,交易的估值达65亿美元。
5/27/2025 9:00:50 AM
AI在线

RAG 架构实战:Fixed-Size Chunking(固定切块) 解析

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的 RAG 架构的切块策略—Fixed-Size Chunking(固定切块)。 众所周知,在构建 RAG(Retrieval-Augmented Generation,检索增强生成)系统的过程中,文档切块策略往往决定了模型检索质量的上限。 切得好,信息命中更精准,生成回答更有上下文逻辑;切得差,模型则容易“答非所问”。
5/27/2025 8:35:00 AM
Luga Lee

AI和分析如何改变供应链弹性

在一个充满波动性和前所未有的挑战的时代,供应链正面临着来自各方的巨大压力。 预见并缓解干扰的能力已成为企业成功的决定性因素。 “供应链比以往任何时候都更加关键,但也更加脆弱,”Qlik公司EMEA地区现场CTO马丁·汤姆斯强调,“从原材料短缺到地缘政治不稳定,从消费者需求的不断变化到自然灾害,任何干扰都可能破坏运营并损害信任。
5/27/2025 7:05:00 AM
Tom Chapman

在工作中与GenAI工具共享内容时要谨慎

我们在工作中使用GenAI来简化任务,但我们是否意识到其中的风险?据Netskope称,现在平均每个企业每月与AI工具共享的数据量超过7.7GB,75%的企业用户正在使用具有GenAI功能的应用程序。 GenAI的阴暗面事实上,89%的企业对AI的使用情况一无所知,这暴露了监督和控制方面的空白,更重要的是,71%的GenAI工具是通过个人非工作账户访问的。 即使使用了公司账户,也有58%的登录绕过了单点登录(SSO),这意味着安全团队无法看到员工使用的工具或共享的信息。
5/27/2025 7:00:00 AM
Sinisa

智能体「Agent」技术全景:挑战、机遇与未来

大家好,我是肆〇柒。 这篇论文的研究来自 MetaGPT、Montréal & Mila人工智能研究所、南洋理工大学、美国阿贡国家实验室、悉尼大学、宾夕法尼亚州立大学、微软亚洲研究院、伊利诺伊大学厄巴纳-香槟分校、香港科技大学、南加州大学、耶鲁大学、斯坦福大学、佐治亚大学、俄亥俄州立大学、阿卜杜拉国王科技大学、杜克大学、香港理工大学、谷歌 DeepMind 以及加拿大高等研究院(CIFAR)等众多研究者的集体智慧与前瞻思考,历时半年创作而成。 这篇论文的质量很高,为我们综述了 AI Agent 领域的全景现状,能看的出来是花了大心思的。
5/27/2025 2:00:00 AM
肆零柒

硅基模型vs.碳基大脑:AI能否成为超越人类的超级预测者?

如果能精准预测未来,就能在生活中占尽先机,无论是预判房价涨跌,还是捕捉下一个产业风口,预测的魅力都无人可挡。 随着 AI 技术的蓬勃发展,一个核心问题开始引发思考:人工智能能否成为超越人类的超级预测者? 在这一思潮的推动下,预测领域正加速构建 AI 预测机器人。
5/27/2025 1:00:00 AM
小刀

RAG系列:问题优化 - 意图识别&同义改写&多视角分解&补充上下文

在实际业务场景中,知识库不会只有单一领域的知识,可能会存在多个领域的知识,如果对用户问题不提前做领域区分,在对基于距离的向量数据库进行检索时,可能会检索出很多与用户问题不属于同一个领域的文档片段,这样的上下文会存在较多的噪音或者不准确的信息,从而影响最终的回答效果。 另一方面知识库中涵盖的知识表达形式也是有限的,但用户的提问方式却是千人千面的,用户遣词造句的方式以及描述问题的角度可能会与向量数据库中存储的文档片段存在差异,这就可能导致用户问题和知识库之间不能很好匹配,从而降低检索效果。 为了解决此问题,我们可以对用户问题进行查询增强,比如对用户问题进行意图识别、同义改写、多视角分解以及补充上下文,通过这几个查询增强方式来更好地匹配知识库中的文档片段,提升检索效果和回答效果。
5/27/2025 12:40:00 AM
燃哥讲AI