AI

AI 应用安全挑战与测评实践指南

AI 应用安全挑战与测评实践指南

作者 | 陈达在人工智能蓬勃发展的时代，AI应用广泛融入人们的生活与工作，从智能客服到智能推荐系统，从医疗影像诊断到金融风险预测，AI的身影无处不在。然而，随着AI应用的普及，其潜在风险也逐渐凸显，AI风险测评成为保障应用可信的关键环节。本文将围绕“AI风险测评助力应用可信”这一主题，深入探讨AI应用面临的风险、业界测评方法、实践思路及关键要点。

4/18/2025 9:45:47 AM Thoughtworks洞见

突发！特朗普禁止英伟达，向DeepSeek等提供AI芯片

突发！特朗普禁止英伟达，向DeepSeek等提供AI芯片

华尔街日报消息，特朗普政府已禁止在无许可证的情况下，向中国出售H20等AI芯片。未来的相关销售也将需要许可证，这是特朗普政府首次对半导体海外销售实施重大限制，强化了拜登政府此前制定的规则。由于该政策的实施，英伟达股票遭遇重创下跌了5%左右，并且季度营收会因无法按原计划销售损失55亿美元。

4/18/2025 9:43:38 AM AIGC开放社区

物理视频真实生成！大连理工&莫纳什大学团队提出物理合理的视频生成框架

物理视频真实生成！大连理工&莫纳什大学团队提出物理合理的视频生成框架

最近，来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。通过利用视觉语言模型来将物理规律注入到视频扩散模型的方法来提升视频生成中的物理真实性。论文主页: : ，能够生成高度逼真的视频内容，其作为世界模拟器的潜力已引起学界广泛关注。

4/18/2025 9:25:00 AM 机器之心

最强o1也刚刚及格！中科大等团队测试视频CoT推理能力：多数模型不及格

最强o1也刚刚及格！中科大等团队测试视频CoT推理能力：多数模型不及格

视频理解的CoT推理能力，怎么评？中科大等团队提出了评估基准——VCR-Bench，里面包含七个独立评估维度的任务框架，每个维度针对性地考察模型的不同能力（如时空推理、因果推断等）。为确保评估的全面性和可靠性，每个维度都设计了100余条高质量样本。

4/18/2025 9:13:00 AM 量子位

异议！顶流AI决战「逆转裁判」：o1险胜Gemini 2.5登顶、Llama 4零分垫底

异议！顶流AI决战「逆转裁判」：o1险胜Gemini 2.5登顶、Llama 4零分垫底

当谈到AI为何能从「预测下一个词」中诞生智慧时，Ilya Sutskever曾用一个生动的比喻来解释。想象你在读一本悬疑小说，如果仅凭前面的线索就能在最后一页推断出罪犯是谁，那么你对这个故事的理解无疑是深刻的。同样，AI通过学习海量文本，掌握了从字面到语义的「线索」，展现出惊人的智能。

4/18/2025 9:07:00 AM 新智元

微软 BitNet b1.58 2B4T 登场：内存占用仅 0.4GB，20 亿参数模型颠覆 AI 计算

微软 BitNet b1.58 2B4T 登场：内存占用仅 0.4GB，20 亿参数模型颠覆 AI 计算

微软研究团队推出了一款开源大型语言模型 BitNet b1.58 2B4T，区别于传统训练后量化的方式，这款拥有 20 亿参数的大型语言模型（LLM）以 1.58 位低精度架构原生训练而成。

4/18/2025 8:54:22 AM 故渊

UC伯克利：让推理模型少思考，准确率反而更高了！

UC伯克利：让推理模型少思考，准确率反而更高了！

让推理模型不要思考，得到的结果反而更准确？ UC伯克利新研究发现，强制要求模型跳过思考过程，推理能力却比正常思考还好。例如在定理证明任务当中，“不思考”模式仅使用30%的Token，就能实现和完整思考一样的准确率。

4/18/2025 8:42:52 AM 量子位

使用LangGraph构建你的第一个AI Agent-附完整代码

使用LangGraph构建你的第一个AI Agent-附完整代码

AI Agent 指的是有能力主动思考和行动的智能体，能够以类似人类的方式工作，通过大模型来“理解”用户需求，主动“规划”以达成目标，使用各种“工具”来完成任务，并最终“行动”执行这些任务。从模型到 Agent在 Agent 出现之前，我们将 AI 模型建为独立且互不关联的组件——一个模型用于理解文本，一个模型用于生成代码，还有一个模型用于处理图像。这种碎片化的方法迫使用户手动管理工作流程导致在不同系统之间切换时上下文信息消失需要为每个流程步骤集成 ai 模型Agent 的出现就是为了解决这一碎片问题。

4/18/2025 8:01:21 AM wayn

AI 与非结构化数据：简单 RAG 的局限及生产级解决方案全解析

AI 与非结构化数据：简单 RAG 的局限及生产级解决方案全解析

非结构化数据涵盖了电子邮件、PDF 文件、会议记录等多种形式，它们充斥在各个角落，却由于缺乏固定的格式，给传统的数据处理工具带来了巨大的挑战。而人工智能（AI）的出现，尤其是大型语言模型（LLMs），为解决非结构化数据的难题带来了新的希望。但在实际应用中，简单的检索增强生成（RAG）方法却存在诸多不足，无法满足复杂的生产级场景需求。

4/18/2025 2:55:00 AM 大模型之路

自主式AI对安全专家来说既是福音也是祸患

自主式AI对安全专家来说既是福音也是祸患

网络安全在自主式AI面前站在了一个十字路口，我们从未拥有过如此强大的工具，它可以在眨眼之间创建大量的代码，发现并解除威胁，并且可以被如此果断且防御性地使用，这已经被证明是一个巨大的力量倍增器和生产力红利。但虽然功能强大，自主式AI却并不可靠，这就是目前的困境。所创建的代码可能包含微妙的缺陷，并且最终可能会弊大于利，比如通过助长网络钓鱼诱饵和构建新型恶意软件。

4/18/2025 12:10:00 AM David Strom

阿里、蚂蚁、腾讯纷纷推出 AI 组件库，React / Vue 全覆盖，AI 组件库超全汇总来啦！

阿里、蚂蚁、腾讯纷纷推出 AI 组件库，React / Vue 全覆盖，AI 组件库超全汇总来啦！

随着 AI 技术的快速发展，阿里、蚂蚁、腾讯都相继发布了各自的 AI 组件库。这些组件库支持 React 和 Vue 技术栈，为开发者提供了高效的解决方案。 Ant DesIgn XAnt Design X 是蚂蚁集团开发的 AI 组件库。

4/18/2025 12:04:00 AM 前端充电宝

超实用！用FunctionCall实现快递AI助手

超实用！用FunctionCall实现快递AI助手

昨天晚上直播，我们用 RAG（Retrieval-Augmented Generation，检索增强生成）实现了数据库 AI 助手，今天我们准备换一个技术使用 function call 来实现快递 AI 助手。执行效果快递 AI 助手的业务逻辑很清晰，就是我通过 LLM 大语言模型的对话来查询我的快递详情，例如，我问 AI 我有几个“运送中”的快递，他把这些快递查询并展示出来，效果如下图所示：图片什么是 function call？定义： Function Call（也称为 Tool Call）它允许大模型与一组 API 或工具进行交互，从而增强其功能。

4/18/2025 12:00:00 AM 磊哥

联想展示 AI换脸防诈技术，精准识别 Deepfake伪造视频

联想展示 AI换脸防诈技术，精准识别 Deepfake伪造视频

随着人工智能和大模型技术的迅猛发展，它们为人们的生活带来了前所未有的便利与变革。从DeepSeek等应用的爆火，到AI PC等端侧AI设备的加速普及，AI 的身影无处不在。然而，AI 技术的滥用也带来了新的安全威胁。

4/17/2025 6:19:00 PM 新闻助手

攻克胰腺癌早筛难题，阿里AI模型获国际权威认定“突破性医疗器械”

攻克胰腺癌早筛难题，阿里AI模型获国际权威认定“突破性医疗器械”

4月17日消息，阿里巴巴AI模型DAMO PANDA被FDA认定为“突破性医疗器械”。 DAMO PANDA是阿里巴巴达摩院研发的胰腺癌筛查AI模型，可精准识别平扫CT影像中的细微病灶，攻克了胰腺癌早期筛查的国际难题。这也是中国头部科技企业首次拿下该项权威认可。

4/17/2025 6:08:00 PM 新闻助手

上海人工智能实验室推出升级版多模态大模型 “书生・万象 3.0”

上海人工智能实验室推出升级版多模态大模型 “书生・万象 3.0”

在人工智能迅速发展的今天，上海人工智能实验室再次引领潮流，推出了全新的多模态大模型 “书生・万象3.0”。这一升级版本不仅在技术上进行了全面提升，还在多模态预训练和后训练方法的加持下，展现出了更强大的基础能力和应用潜力。 “书生・万象3.0” 具备同时处理文本和多种多模态输入的能力，这使得它在多个应用场景中都能表现出色。

4/17/2025 2:01:15 PM AI在线

阿里巴巴AI模型DAMO PANDA获FDA认定为“突破性医疗器械”，攻克胰腺癌早期筛查难题

阿里巴巴AI模型DAMO PANDA获FDA认定为“突破性医疗器械”，攻克胰腺癌早期筛查难题

，阿里巴巴AI模型DAMO PANDA正式获得美国食品药品监督管理局（FDA）认定为“突破性医疗器械”。这一认证标志着阿里巴巴在人工智能医疗领域的突破性进展，也是中国头部科技企业首次获得这一权威认可。图源备注:图片由AI生成，图片授权服务商MidjourneyDAMO PANDA是由阿里巴巴达摩院研发的胰腺癌筛查AI模型，旨在通过精准分析CT影像中的细微病灶，实现早期胰腺癌的筛查。

4/17/2025 11:01:19 AM AI在线

DeepSeek创始人梁文锋荣登《时代》“2025年全球最具影响力100人”榜单

DeepSeek创始人梁文锋荣登《时代》“2025年全球最具影响力100人”榜单

近日，DeepSeek创始人梁文锋入选《时代》杂志“2025年全球最具影响力100人”榜单，成为全球科技与金融领域的领军人物之一。与此同时，梁文锋还凭借330亿元人民币的财富首次登上了2025年3月27日发布的《胡润全球富豪榜》，进一步巩固了他在全球商业界的影响力。梁文锋的成功之路始于2008年，当时他开始带领团队利用机器学习等前沿技术，探索全自动量化交易。

4/17/2025 11:00:49 AM AI在线

揭秘大模型的魔法：从零开始你的AI冒险

揭秘大模型的魔法：从零开始你的AI冒险

你好，我是写代码的中年人！你有没有想过，那些能写诗、答题、甚至帮你 debug 代码的 AI 到底是怎么回事？它们其实是“大型语言模型”（Large Language Models，简称 LLM）的产物。

4/17/2025 9:00:00 AM 写代码的中年人

资讯热榜

AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉