AI在线 AI在线

资讯列表

IT领导者阻碍AI成功的五大障碍

AI,尤其是GenAI,正迅速成为提高整个企业生产力的有效解决方案,但成功的几个常见障碍仍然存在。 IT领导者越早识别并克服这些问题,他们的企业就能越快地从基于AI的系统中获得更多价值。 以下是企业在实现AI价值过程中需要克服的一些更具挑战性的障碍,以及IT领导者可以采取的应对措施。
6/11/2025 7:00:00 AM
Bob Violino

上下文窗口错觉:为什么你的 128K token 不起作用

一、当理论容量遭遇现实困境在大语言模型(LLM)的技术竞赛中,上下文窗口长度早已成为各家标榜的核心指标。 从GPT-4o的128K到Gemini 1.5的1M,模型厂商不断突破Token容量的上限,仿佛更长的上下文就意味着更强的信息处理能力。 然而,这场“军备竞赛”背后却隐藏着一个残酷的现实:模型对长上下文的利用率远低于理论预期。
6/11/2025 4:25:00 AM
大模型之路

构建AI Agent的最优学习路线总结:MCP、CrewAI和Streamlit

如何通过 MCP(Model Context Protocol) 创建一个结合网络搜索、AI 代理和图像生成的现代研究助手引言:AI 驱动的研究未来已来想象一下,您拥有一个个人研究助手,可以即时搜索网络、分析信息、生成全面的总结,甚至创建相关图像——所有这些都通过一个美观的 Web 界面完成。 如果这个助手还能由尖端的 AI 代理驱动,与外部工具和 API 无缝协作,会怎样? 欢迎体验 MCP-Powered Study Assistant —— 一款结合现代 AI 技术的革命性应用:• 🤖 CrewAI 代理,用于智能研究和写作• 📡 Model Context Protocol (MCP),实现无缝工具集成• 🌐 Streamlit,提供直观的 Web 界面• 🔍 通过 Brave Search API 实现实时网络搜索• 🎨 通过 Segmind API 进行 AI 图像生成这不仅仅是另一个 ChatGPT 包装器——它是一个完整的研究生态系统,展示了 AI 驱动应用的未来。
6/11/2025 3:22:00 AM
AI研究生

OCR 识别质量如何影响 RAG 系统的性能?有何解决办法?

检索增强生成(RAG)已成为连接大语言模型与企业数据的标准范式,但该方法存在一个鲜少被讨论的致命缺陷:当前生产环境中的 RAG 系统几乎全部依赖光学字符识别(OCR)技术处理 PDF、扫描件、演示文稿等文档,并默认假设识别结果足以支撑下游 AI 任务。 我们的深度分析表明,这一假设存在根本性缺陷。 OCR 的识别质量形成了一个隐形的天花板,甚至限制了最先进 RAG 系统的性能。
6/11/2025 3:10:00 AM
Baihai IDP

AI Agent!一个万亿市场正在觉醒

"你能帮我订个周末的餐厅吗? " 这句话,你可能每周都要说一遍。 打开手机,搜索餐厅,对比评分,查看菜单,打电话预订...整个流程下来,至少要花15分钟。
6/11/2025 3:00:00 AM
大数据AI智能圈

什么时候GraphRAG超越传统RAG:突破医学等知识密集任务的AI新范式和GraphRAG-Bench评估框架

核心速览研究背景研究问题:这篇文章要解决的问题是如何在检索增强生成(RAG)系统中有效利用图结构来提升大型语言模型(LLMs)的性能,特别是在知识密集型任务中。 研究难点:该问题的研究难点包括:现有基准测试(如HotpotQA、MultiHopRAG和UltraDomain)未能充分评估图结构在RAG系统中的有效性;现有数据集缺乏领域特定知识和明确的逻辑连接;现有基准测试的任务复杂度划分不细致,无法全面评估模型的复杂推理能力。 相关工作:该问题的研究相关工作有:传统的RAG系统通过将文本分块进行索引和检索,但这种方法会牺牲上下文信息;GraphRAG系统通过构建外部结构化图来改进LLMs的上下文理解能力,但其在实际任务中的表现不一致。
6/11/2025 2:55:00 AM
知识图谱科技

LLM 推理引擎综述:优化与效率的多维探索

大家好,我是肆〇柒,玩开源模型蛮久了,做开源模型项目的各位,应该都了解推理引擎在工程落地上的重要性。 一个好的推理引擎,不仅要具备算力的精准调度能力,还需要符合工程基线的稳定性指标,更重要的,还要保障模型的推理精度符合业务标准。 然而,随着模型规模的指数级膨胀,如何高效地部署和运行这些模型,成为了技术发展道路上的关键挑战。
6/11/2025 2:30:00 AM
肆零柒

Chrome内置AI多模态提示功能详解与实战

距离我上次撰写关于Chrome内置AI功能的博客已经过去了几周,随着本周Google IO大会的召开,涌现了许多新公告和更新。 您可以在Chrome开发者博客上找到近期变化的详细说明:"AI API现已进入稳定版和原始试用阶段,并推出新的早期预览计划API"。 最让我期待的一项功能终于发布了——多模态提示。
6/11/2025 2:13:00 AM
前端小石匠

两万字详解,如何为开放平台设计一个安全好用的 OpenAPI

前言为了确保软件接口的标准化和规范化,实现业务模块的重用性和灵活性,并提高接口的易用性和安全性,OpenAPI规范应运而生。 这一规范通过制定统一的接口协议,规定了接口的格式、参数、响应和使用方法等内容,从而提高了接口的可维护性和可扩展性。 同时,为了也需要考虑接口的安全性和稳定性,本文将针对这些方面介绍一些具体的实践方式。
6/11/2025 2:11:00 AM

Qwen:PARSCALE 让语言模型在并行中飞跃

大家好,我是肆〇柒。 今天,我们来聊聊大型语言模型(LLM)领域的一项研究——PARSCALE。 在人工智能快速发展的当下,大型语言模型应用前景无比广阔,然而,随着模型规模的不断膨胀,我们正面临着前所未有的挑战。
6/11/2025 2:00:00 AM
肆零柒

Java 代码居然能玩转 AI?这个神器把机器学习干懵了

兄弟们,是不是每次刷到 AI 相关的文章,看到满屏的 Python 代码就犯嘀咕:咱 Java 程序员在 AI 领域就只能当看客吗? 今天咱就来聊聊这个能让 Java 玩转 AI 的神器 ——Deeplearning4j(简称 DL4J),让咱们手里的 Java 代码也能在 AI 圈儿支棱起来! 一、当 Java 遇上 AI:一场迟到的双向奔赴说起机器学习框架,Python 阵营的 TensorFlow、PyTorch 那是相当风光,仿佛 AI 领域就是 Python 的天下。
6/11/2025 1:10:00 AM
儒猿团队

消息称 OpenAI 已同谷歌敲定一份云 AI 算力交易,减少对微软依赖

路透社报道称 OpenAI 在经历数月谈判后已于 5 月同谷歌达成一项云 AI 算力购买协议。
6/10/2025 11:01:44 PM
溯波(实习)

突破传统!FUDOKI 模型让多模态生成与理解更灵活、更高效

近年来人工智能领域发生了翻天覆地的变化,尤其是大型语言模型(LLMs)在多模态任务上取得了显著进展。 这些模型在理解和生成语言的能力上展现出了强大的潜力,但目前大多数多模态模型依然采用自回归(AR)架构,推理过程较为单一、缺乏灵活性。 为此,香港大学和华为诺亚方舟实验室的研究团队提出了一种全新的模型 ——FUDOKI,旨在打破这一局限。
6/10/2025 7:00:56 PM
AI在线

小红书重磅出击!全新开源大模型 “dots.llm1” 震撼登场,参数量达 1420 亿!

近日,小红书的 hi lab 团队正式推出了其首个开源文本大模型 ——dots.llm1。 这一新模型以其卓越的性能和庞大的参数量引起了业界的广泛关注。 dots.llm1是一款大规模的混合专家(MoE)语言模型,拥有惊人的1420亿个参数,其中激活参数达到140亿。
6/10/2025 6:00:56 PM
AI在线

蚂蚁数科加速推进AI战略,设立“AI+产业创新”实验室

6月10日,在2025第九届数字金融与金融安全大会上,蚂蚁数科宣布天玑实验室全面升级,从原“数字身份安全实验室”升级为“人工智能 产业创新”实验室。 实验室将聚焦AI大模型在产业应用中的关键技术突破,通过打造'产学研用'协同创新生态,推动AI技术创新与产业深度融合。 十三届全国政协委员、原保监会党委副书记、副主席周延礼,北京工业大学教授,信息系统工程领域专家沈昌祥,全国政协委员、九三学社中央常委王汝芳,北京市海淀区地方金融管理局局长杨颖,中关村互联网金融研究院院长、中关村金融科技产业发展联盟秘书长刘勇,蚂蚁数科首席技术官、蚂蚁集团副总裁王维共同出席实验室升级的揭牌仪式。
6/10/2025 6:00:56 PM
AI在线

Mistral 将推出其首个推理模型 Magistral,与 OpenAI 和 DeepSeek 展开竞争

在伦敦科技周的炉边谈话中,门施告诉 CNBC:Mistral 的新模型“擅长数学,也擅长编码”。他强调,该模型“具备与所有其他模型的竞争力”,包括 OpenAI o1 及 DeepSeek R1。
6/10/2025 6:00:35 PM
问舟

李飞飞团队新作:DiT不训练直接改架构,模型深度减半,质量还提高了

模型架构设计在机器学习中扮演着核心角色,与数据、算法、算力和基准测试一样重要。 它定义了模型函数、算子选择(如注意力机制、卷积)和配置设定(如模型深度、宽度)等等模型要素。 尽管如此,由于从头训练模型的成本过高 —— 尤其人们难以获得关于架构设计的深刻洞见(即哪些方案有效、哪些无效)。
6/10/2025 5:07:44 PM
机器之心

苹果再轰AI推理能力,GitHub大佬怒怼:这不是推理能力的真实面貌!

最近,苹果公司发布了一篇引发热议的论文,指出当前的大语言模型(LLM)在推理方面存在重大缺陷。 这一观点迅速在社交媒体上引起热议,尤其是 GitHub 的高级软件工程师 Sean Goedecke 对此提出了强烈反对。 他认为,苹果的结论过于片面,并不能全面反映推理模型的能力。
6/10/2025 5:00:56 PM
AI在线