理论

AI幻觉引爆网络安全危机专家揭示了三大防御策略

对现实世界的影响“如果一家公司的智能体利用了过时或不准确的数据，AI幻觉可能会虚构出并不存在的漏洞，或错误解读威胁情报，导致不必要的警报或忽视真正的风险。此类错误可能会分散对真正威胁的注意力，创造新的漏洞，并浪费本已紧张的安全运营团队资源。 ”Tanium的AI副总裁HarmanKaur在接受采访时表示。

5/21/2025 1:00:00 AM Mirko Zorz

几行代码让自家网站秒变ChatGPT！微软Build上神秘开源协议，掀起第四次计算革命！网友：OpenAI的霸主时代被终结？

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）昨天的微软 Build 2025 开发者大会，用一句话总结就是：信息密度爆表，炸点不断！如果你是开源党的信徒——这次微软几乎把压箱底的宝贝都掏了出来：GitHub Copilot for VS Code 项目正式开源！而且直接采用了 MIT 协议，意味着全球开发者不仅能免费访问源码、研究核心逻辑，还能亲自下场参与改进，Copilot 从此变成了真正意义上的“全民AI助手”。

5/20/2025 6:33:37 PM 伊风

60+头部企业关于AI的思想碰撞，都在这场大会里

最近由150位全球顶尖AI创始人参与的红杉资本AI峰会刷爆AI产业圈，关于大热的智能体经济、大模型、机器人商业化...来自OpenAI、英伟达、谷歌等公司的AI大佬们给出了他们的洞察——AI不再卖工具，而是卖收益。它正在从“技术产品”进化为一种新的经济运行方式。这一观点通俗来讲，就是客户不会因为你的AI产品功能好不好来买单，他们只为能帮他挣钱的产品买单。

5/20/2025 3:36:54 PM

手机流畅处理128K长文本，vivo端侧新算法突破内存限制 | ACL 2025

在端侧设备上处理长文本常常面临计算和内存瓶颈。 vivo AI研究院推出的EdgeInfinite算法专为端侧设备设计，让设备处理超长文本时更加高效流畅，该方法能够在不到10GB GPU内存的设备上处理长达128K tokens的输入。该研究成果已中稿ACL 2025。

5/20/2025 3:14:39 PM

急于实施AI时被忽视的八个安全风险

在追求GenAI带来的生产力提升的过程中，大多数企业都忽视了这样做可能带来的安全影响，转而倾向于寄希望于具有变革性的创新，而非采用可靠的安全实践。根据世界经济论坛与埃森哲合作进行的一项研究，63%的企业在部署AI工具之前未能评估其安全性，从而给企业带来了一系列风险。这既包括现成的AI解决方案，也包括与软件开发团队合作创建的内部实现。

5/20/2025 2:37:33 PM John

老黄唱衰编程，GitHub CEO硬刚：放弃写代码等于放弃智能体未来话语权

5/20/2025 1:57:42 PM

黄仁勋最新访谈：中国 AI 人才“制霸”全球，人工智能开启1万亿→50万亿级别市场

最近，Nvidia的 CEO 黄仁勋，人称“黄教主”，在科技圈又发表了一系列引人注目的观点。这次是在知名科技博主Ben Thompson的“Stratechery”访谈里，黄教主分享了他的诸多见解，从中美AI聊到自家公司的发展方向，信息量不小。图片一、中国AI实力？

5/20/2025 1:55:28 PM

Build大会最硬核发布：微软把RAG技术塞进Windows，结构化检索让AI拥有"超忆症"

科技圈的目光无疑高度聚焦于微软的年度Build开发者大会。正如许多人预期的那样，微软一开场就亮出了其核心主题——智能体（Agent）。微软的意图很明确：将自身定位在“开放智能体网络”（Open Agentic Web）的中心。

5/20/2025 1:45:19 PM

多模态检索大升级！智源三大SOTA模型，代码、图文理解能力拉满

检索增强技术在代码及多模态场景中的发挥着重要作用，而向量模型是检索增强体系中的重要组成部分。针对这一需求，近日，智源研究院联合多所高校研发了三款向量模型，包括代码向量模型BGE-Code-v1，多模态向量模型BGE-VL-v1.5以及视觉化文档向量模型BGE-VL-Screenshot。这些模型取得了代码及多模态检索的最佳效果，并以较大优势登顶CoIR、Code-RAG、MMEB、MVRB等领域内主要测试基准。

5/20/2025 1:02:23 PM 新智元

AI发现新物质，仅用200小时！不写一行代码，筛选36.7万种物质

一行代码都不用写，全靠AI，在200小时内发现一种全新物质！如果使用传统方法，这个过程可能需要花费几个月甚至几年时间。这个立大功的AI，就是微软刚刚在Build大会上推出的Microsoft Discovery。

5/20/2025 11:56:08 AM

一文读懂 Vision RAG 模型

众所周知，检索增强生成（RAG）技术已在大语言模型（LLM）应用中证明了其巨大价值，通过从外部知识库检索相关文本信息，显著提升了模型回复的准确性、时效性和可追溯性。然而，我们所感知和理解的世界并非只由文本构成：大量的现实信息和复杂语境，深刻地蕴含在图像、图表、视频等视觉内容之中。传统的 RAG 模型难以直接“看”懂并利用这些丰富的视觉信息。

5/20/2025 11:55:22 AM Luga Lee

代码智能体占领GitHub！自动修bug、加功能、写文档，一台手机就能指挥

GitHub上新代码智能体Copilot Coding Agent，从此可以bug自动修，功能自动加，文档自动写。有开发者表示真的很棒，已经用它解决了一个拖延很久的小问题。甚至在手机版APP就能完成全部操作。

5/20/2025 9:59:15 AM

深入了解如何通过 LM Studio 优化本地 LLM 性能

Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景 - 如何通过 LM Studio 优化本地 LLM 性能。在人工智能浪潮席卷全球的 2025年，本地大语言模型（LLM）的性能优化已成为开发者和企业关注的焦点。随着计算资源需求激增，如何在本地环境中提升模型的效率、降低延迟并释放其最大潜力，成为了亟待解决的关键挑战。

5/20/2025 9:24:15 AM Luga Lee

字节提出从单一主题发展到多主题定制的通用框架UNO，通过情境生成释放更多可控性

字节跳动的智能创作团队提出了一个从单一主题发展到多主题定制的通用框架UNO，从少到多的泛化：通过情境生成释放更多可控性。能够将不同的任务统一在一个模型下。在单主题和多主题驱动的生成中都能实现高度一致性，同时确保可控性。

5/20/2025 9:13:45 AM AIGC Studio

谢赛宁团队提出BLIP3-o：融合自回归与扩散模型的统一多模态架构，开创CLIP特征驱动的图像理解与生成新范式!

BLIP3-o 是一个统一的多模态模型，它将自回归模型的推理和指令遵循优势与扩散模型的生成能力相结合。与之前扩散 VAE 特征或原始像素的研究不同，BLIP3-o 扩散了语义丰富的CLIP 图像特征，从而为图像理解和生成构建了强大而高效的架构。此外还发布了包含 2000 万张带详细标题的图片（BLIP3o Pretrain Long Caption）和 400 万张带短标题的图片（BLIP3o Pretrain Short Caption）的数据集。

5/20/2025 9:08:59 AM

震撼全网，AlphaEvolve矩阵乘法突破被证明为真！开发者用代码证实

就在刚刚，有人用Claude写代码证实——谷歌DeepMind的AlphaEvolve求解矩阵乘法的突破，100%正确！即使已经过去好几天，AI圈依然有许多人沉浸在这个AI的余震中。在时隔半个世纪（56年）后，AlphaEvolve将4×4的复数矩阵计算次数，从1969年Strassen的49次减少到了48次。

5/20/2025 9:07:00 AM

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

英伟达官宣新办公室落户中国台湾省台北市，但居然是从太空飞下来的吗？当然，这只是黄仁勋在Computex大会上展示的CG特效，但背后还有这样一层意思：如此逼真的画面中，只有1/10的像素是显卡渲染的，剩下全部内容为AI预测。当初是GeForce显卡让AI成为现实，现在AI反过来给GeForce显卡带来颠覆性变革。

5/20/2025 9:02:00 AM

一文揭秘专为 RAG 打造的高性能开源图向量数据库：HelixDB

在人工智能技术尤其是大语言模型（LLM）蓬勃发展的浪潮中，检索增强生成（Retrieval-Augmented Generation，简称 RAG）正迅速成为提升生成式 AI 系统内容准确性、实时性与上下文相关性的核心手段。 RAG 通过将外部知识检索与语言模型推理相结合，显著缓解了模型“幻觉”问题，使其在问答系统、智能助手、企业知识中台等应用中展现出广阔前景。然而，随着业务需求的不断升级，传统 RAG 系统所依赖的扁平向量表示与单一类型数据库架构，已难以满足对复杂语义结构建模与海量非结构化数据高效检索的双重需求。

5/20/2025 8:50:00 AM Luga Lee

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

AI幻觉引爆网络安全危机 专家揭示了三大防御策略

几行代码让自家网站秒变ChatGPT！微软Build上神秘开源协议，掀起第四次计算革命！网友：OpenAI的霸主时代被终结？

60+头部企业关于AI的思想碰撞，都在这场大会里

手机流畅处理128K长文本，vivo端侧新算法突破内存限制 | ACL 2025

急于实施AI时被忽视的八个安全风险

老黄唱衰编程，GitHub CEO硬刚：放弃写代码等于放弃智能体未来话语权

黄仁勋最新访谈：中国 AI 人才“制霸”全球，人工智能开启1万亿→50万亿级别市场

Build大会最硬核发布：微软把RAG技术塞进Windows，结构化检索让AI拥有"超忆症"

多模态检索大升级！智源三大SOTA模型，代码、图文理解能力拉满

AI发现新物质，仅用200小时！不写一行代码，筛选36.7万种物质

一文读懂 Vision RAG 模型

代码智能体占领GitHub！自动修bug、加功能、写文档，一台手机就能指挥

深入了解如何通过 LM Studio 优化本地 LLM 性能

字节提出从单一主题发展到多主题定制的通用框架UNO，通过情境生成释放更多可控性

谢赛宁团队提出BLIP3-o：融合自回归与扩散模型的统一多模态架构，开创CLIP特征驱动的图像理解与生成新范式!

震撼全网，AlphaEvolve矩阵乘法突破被证明为真！开发者用代码证实

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

一文揭秘专为 RAG 打造的高性能开源图向量数据库：HelixDB

AI幻觉引爆网络安全危机专家揭示了三大防御策略