理论

AI数据自动化如何克服供应链数据挑战

当今的供应链比以往任何时候都更加互联互通且复杂，公司经常求助于AI来提高可见性、效率和韧性，但许多企业发现，它们的AI计划并未达到高期望值，真正的问题并不总是技术本身，而是为这些系统提供数据的数据的质量和可用性。现代供应链中的数据挑战供应链产生海量数据，这些数据来自众多系统、格式和合作伙伴。根据IBM的研究，大约80%的供应链数据仍是非结构化的，因此难以分析，这种碎片化的方法导致了重大的运营问题。

6/11/2025 7:11:00 AM Deepak

IT领导者阻碍AI成功的五大障碍

AI，尤其是GenAI，正迅速成为提高整个企业生产力的有效解决方案，但成功的几个常见障碍仍然存在。 IT领导者越早识别并克服这些问题，他们的企业就能越快地从基于AI的系统中获得更多价值。以下是企业在实现AI价值过程中需要克服的一些更具挑战性的障碍，以及IT领导者可以采取的应对措施。

6/11/2025 7:00:00 AM Bob Violino

上下文窗口错觉：为什么你的 128K token 不起作用

一、当理论容量遭遇现实困境在大语言模型（LLM）的技术竞赛中，上下文窗口长度早已成为各家标榜的核心指标。从GPT-4o的128K到Gemini 1.5的1M，模型厂商不断突破Token容量的上限，仿佛更长的上下文就意味着更强的信息处理能力。然而，这场“军备竞赛”背后却隐藏着一个残酷的现实：模型对长上下文的利用率远低于理论预期。

6/11/2025 4:25:00 AM 大模型之路

构建AI Agent的最优学习路线总结：MCP、CrewAI和Streamlit

如何通过 MCP(Model Context Protocol) 创建一个结合网络搜索、AI 代理和图像生成的现代研究助手引言：AI 驱动的研究未来已来想象一下，您拥有一个个人研究助手，可以即时搜索网络、分析信息、生成全面的总结，甚至创建相关图像——所有这些都通过一个美观的 Web 界面完成。如果这个助手还能由尖端的 AI 代理驱动，与外部工具和 API 无缝协作，会怎样？欢迎体验 MCP-Powered Study Assistant —— 一款结合现代 AI 技术的革命性应用：• 🤖 CrewAI 代理，用于智能研究和写作• 📡 Model Context Protocol (MCP)，实现无缝工具集成• 🌐 Streamlit，提供直观的 Web 界面• 🔍 通过 Brave Search API 实现实时网络搜索• 🎨 通过 Segmind API 进行 AI 图像生成这不仅仅是另一个 ChatGPT 包装器——它是一个完整的研究生态系统，展示了 AI 驱动应用的未来。

6/11/2025 3:22:00 AM AI研究生

OCR 识别质量如何影响 RAG 系统的性能？有何解决办法？

检索增强生成（RAG）已成为连接大语言模型与企业数据的标准范式，但该方法存在一个鲜少被讨论的致命缺陷：当前生产环境中的 RAG 系统几乎全部依赖光学字符识别（OCR）技术处理 PDF、扫描件、演示文稿等文档，并默认假设识别结果足以支撑下游 AI 任务。我们的深度分析表明，这一假设存在根本性缺陷。 OCR 的识别质量形成了一个隐形的天花板，甚至限制了最先进 RAG 系统的性能。

6/11/2025 3:10:00 AM Baihai IDP

AI Agent！一个万亿市场正在觉醒

"你能帮我订个周末的餐厅吗？ " 这句话，你可能每周都要说一遍。打开手机，搜索餐厅，对比评分，查看菜单，打电话预订...整个流程下来，至少要花15分钟。

6/11/2025 3:00:00 AM 大数据AI智能圈

什么时候GraphRAG超越传统RAG：突破医学等知识密集任务的AI新范式和GraphRAG-Bench评估框架

核心速览研究背景研究问题：这篇文章要解决的问题是如何在检索增强生成（RAG）系统中有效利用图结构来提升大型语言模型（LLMs）的性能，特别是在知识密集型任务中。研究难点：该问题的研究难点包括：现有基准测试（如HotpotQA、MultiHopRAG和UltraDomain）未能充分评估图结构在RAG系统中的有效性；现有数据集缺乏领域特定知识和明确的逻辑连接；现有基准测试的任务复杂度划分不细致，无法全面评估模型的复杂推理能力。相关工作：该问题的研究相关工作有：传统的RAG系统通过将文本分块进行索引和检索，但这种方法会牺牲上下文信息；GraphRAG系统通过构建外部结构化图来改进LLMs的上下文理解能力，但其在实际任务中的表现不一致。

6/11/2025 2:55:00 AM 知识图谱科技

LLM 推理引擎综述：优化与效率的多维探索

大家好，我是肆〇柒，玩开源模型蛮久了，做开源模型项目的各位，应该都了解推理引擎在工程落地上的重要性。一个好的推理引擎，不仅要具备算力的精准调度能力，还需要符合工程基线的稳定性指标，更重要的，还要保障模型的推理精度符合业务标准。然而，随着模型规模的指数级膨胀，如何高效地部署和运行这些模型，成为了技术发展道路上的关键挑战。

6/11/2025 2:30:00 AM 肆零柒

Chrome内置AI多模态提示功能详解与实战

距离我上次撰写关于Chrome内置AI功能的博客已经过去了几周，随着本周Google IO大会的召开，涌现了许多新公告和更新。您可以在Chrome开发者博客上找到近期变化的详细说明："AI API现已进入稳定版和原始试用阶段，并推出新的早期预览计划API"。最让我期待的一项功能终于发布了——多模态提示。

6/11/2025 2:13:00 AM 前端小石匠

两万字详解，如何为开放平台设计一个安全好用的 OpenAPI

前言为了确保软件接口的标准化和规范化，实现业务模块的重用性和灵活性，并提高接口的易用性和安全性，OpenAPI规范应运而生。这一规范通过制定统一的接口协议，规定了接口的格式、参数、响应和使用方法等内容，从而提高了接口的可维护性和可扩展性。同时，为了也需要考虑接口的安全性和稳定性，本文将针对这些方面介绍一些具体的实践方式。

6/11/2025 2:11:00 AM

Qwen：PARSCALE 让语言模型在并行中飞跃

大家好，我是肆〇柒。今天，我们来聊聊大型语言模型（LLM）领域的一项研究——PARSCALE。在人工智能快速发展的当下，大型语言模型应用前景无比广阔，然而，随着模型规模的不断膨胀，我们正面临着前所未有的挑战。

6/11/2025 2:00:00 AM 肆零柒

Java 代码居然能玩转 AI？这个神器把机器学习干懵了

6/11/2025 1:10:00 AM 儒猿团队

李飞飞团队新作：DiT不训练直接改架构，模型深度减半，质量还提高了

模型架构设计在机器学习中扮演着核心角色，与数据、算法、算力和基准测试一样重要。它定义了模型函数、算子选择（如注意力机制、卷积）和配置设定（如模型深度、宽度）等等模型要素。尽管如此，由于从头训练模型的成本过高 —— 尤其人们难以获得关于架构设计的深刻洞见（即哪些方案有效、哪些无效）。

6/10/2025 5:07:44 PM 机器之心

苹果在AI领域取得重大进展，图像生成技术可与DALL-E和Midjourney相媲美

苹果公司的机器学习研究团队开发出了一种突破性的AI系统，该系统能够生成高分辨率图像，可能对以DALL-E和Midjourney等流行图像生成器所依赖的扩散模型的主导地位构成挑战。这项在上周发表的研究论文中详细介绍的技术名为“STARFlow”，是由苹果研究人员与学术合作伙伴共同开发的，该系统结合了标准化流(normalizing flows)与自回归Transformer，实现了研究团队所称的“与最先进的扩散模型相比具有竞争力”的性能。这一突破发生在苹果面临AI领域批评声浪日益高涨的关键时刻。

6/10/2025 4:38:06 PM Michael

华为创造AI算力新纪录：万卡集群训练98%可用度，秒级恢复、分钟诊断

大模型的落地能力，核心在于性能的稳定输出，而性能稳定的底层支撑，是强大的算力集群。其中，构建万卡级算力集群，已成为全球公认的顶尖技术挑战。但是，在华为，昇腾万卡算力集群，已经可以做到近乎“永不罢工”了：训练可用度达98%：这就好比你开着一辆车，全年365天里，有358天无论刮风下雨都能一脚油门就出发，从不掉链子，有问题可以随时检修，几乎不会耽误你的任何行程。

6/10/2025 4:36:29 PM

Ilya回归，获授「第四学位」！AI将完成人类能做的一切，毕业演讲实录

近日，消失了半年的Ilya突然现身多伦多大学，接受母校授予他的荣誉理学博士学位。现场演讲亮点如下：AI将能够完成我们能做的所有事情，不仅仅是其中的一部分，而是全部。大脑是一个生物计算机，而AI是数字计算机、一个数字大脑。

6/10/2025 4:29:25 PM 新智元

刚刚，2025哥德尔奖出炉！破解30年难题，十年论文摘桂冠

就在刚刚，理论计算机科学界迎来喜讯！康奈尔大学副教授Eshan Chattopadhyay与导师David Zuckerman，荣获2025年哥德尔奖！凭借2016年合著的论文《Explicit Two-Source Extractors and Resilient Functions》，他们共享此奖。

6/10/2025 4:27:16 PM

OpenAI年化收入突破100亿美元过去一年亏损约50亿美元

在人工智能领域，OpenAI无疑是一颗耀眼的明星。自2022年底推出ChatGPT聊天机器人以来，短短不到三年时间，其年经常性收入（annual recurring revenue, ARR）便实现了惊人的飞跃，达到了100亿美元。据OpenAI方面透露，这100亿美元的年经常性收入涵盖了公司消费者产品、ChatGPT企业产品以及应用程序接口（API）的销售所得。

6/10/2025 4:24:59 PM 小菲

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

AI数据自动化如何克服供应链数据挑战

IT领导者阻碍AI成功的五大障碍

上下文窗口错觉：为什么你的 128K token 不起作用

构建AI Agent的最优学习路线总结：MCP、CrewAI和Streamlit

OCR 识别质量如何影响 RAG 系统的性能？有何解决办法？

AI Agent！一个万亿市场正在觉醒

什么时候GraphRAG超越传统RAG：突破医学等知识密集任务的AI新范式和GraphRAG-Bench评估框架

LLM 推理引擎综述：优化与效率的多维探索

Chrome内置AI多模态提示功能详解与实战

两万字详解，如何为开放平台设计一个安全好用的 OpenAPI

Qwen：PARSCALE 让语言模型在并行中飞跃

Java 代码居然能玩转 AI？这个神器把机器学习干懵了

李飞飞团队新作：DiT不训练直接改架构，模型深度减半，质量还提高了

苹果在AI领域取得重大进展，图像生成技术可与DALL-E和Midjourney相媲美

华为创造AI算力新纪录：万卡集群训练98%可用度，秒级恢复、分钟诊断

Ilya回归，获授「第四学位」！AI将完成人类能做的一切，毕业演讲实录

刚刚，2025哥德尔奖出炉！破解30年难题，十年论文摘桂冠

OpenAI年化收入突破100亿美元 过去一年亏损约50亿美元

OpenAI年化收入突破100亿美元过去一年亏损约50亿美元