检测

工业异常检测新突破，复旦等多模态融合监测入选CVPR 2025

多模态融合检测，工业异常检测领域新突破！复旦大学、荣旗工业科技、腾讯优图实验室上海交通大学、上海海洋大学等机构联合发布高精度多模态数据集Real-IAD D³，并基于此数据集提出了一种创新的多模态融合检测方法。相关成果已被计算机视觉顶会CVPR 2025收录。

6/17/2025 2:25:00 AM

LUD-YOLO：兼顾精度与速度的无人机小目标检测轻量新方案

一眼概览LUD-YOLO 提出了一种基于 YOLOv8 的轻量级小目标检测网络，结合自适应多尺度特征融合和稀疏注意力机制，在保持高检测精度的同时实现高效 UAV 部署。核心问题现有 UAV 目标检测面临图像复杂背景、小目标难识别、设备资源受限等问题。如何在有限算力和存储条件下实现高精度的小目标实时检测，是本文关注的关键挑战。

5/27/2025 3:20:00 AM 萍哥学AI

Barracuda推出多模态AI升级，提升网络安全威胁检测能力

Barracuda Networks 近日发布了其新一代的威胁检测技术，利用多模态人工智能（AI）提升对网络攻击的防护能力。这项技术能够实时分析并关联多种数据类型，包括网址、文档、图像和二维码，从而最大限度地提高威胁检测的准确性和速度。 Barracuda 表示，最新的多模态 AI 整合了其现有的人工智能和机器学习能力，使系统能够并行处理和解读多条数据流。

5/9/2025 6:01:11 PM AI在线

多模态大模型改造人脸防伪检测，厦大腾讯优图等研究入选CVPR 2025

4/22/2025 9:22:00 AM 量子位

YOLOe问世，实时观察一切，统一开放物体检测和分割

它能像人眼一样，在文本、视觉输入和无提示范式等不同机制下进行检测和分割。自 2015 年由华盛顿大学的 Joseph Redmon 研究团队提出 YOLO（You Only Look Once）以来，这项突破性的目标检测技术就像为机器装上了「闪电之眼」，凭借单次推理的实时性能刷新了计算机视觉的认知边界。传统的 YOLO 系列如同我们人工效准的精密仪器，其识别能力被严格框定在预定义的类别目录之中，每个检测框的背后，都需要工程师手动输入认知词典。

3/13/2025 11:11:04 AM 机器之心

灵敏度高达94.9%！牛津团队AI多模态ctDNA检测方法，进行癌症早期筛查

编辑 | 2049在癌症诊疗的漫长征程中，早期检测始终是最具挑战性的环节之一，液体活检技术因其无创性和高灵敏度而备受关注。然而，现有的检测方法大多依赖于深度靶向测序，难以同时整合多模态数据，导致检测灵敏度和特异性受限。正是基于这一技术痛点，牛津大学的研究团队开发了一种基于全基因组 TET 辅助吡啶硼烷测序（TAPS）的多模态循环肿瘤 DNA（ctDNA）检测方法。

1/22/2025 6:28:00 PM ScienceAI

CCF-CV携手合合信息打造技术分享论坛，聚焦大模型时代中的视觉安全前沿热点

近期，《咬文嚼字》杂志发布了2024年度十大流行语，“智能向善”位列其中，过去一年时间里，深度伪造、AI诈骗等话题屡次登上热搜，AI技术“野蛮生长”引发公众担忧。今年9月，全国网络安全标准化技术委员会发布了《人工智能安全治理框架》，指出人工智能既面临自身技术缺陷、不足带来的内生风险，也面临不当使用、滥用甚至恶意利用带来的外部风险。为探寻AI安全治理道路，近期，由中国计算机学会计算机视觉专委会主办，合合信息承办，中国运筹学会数学与智能分会协办的《打造大模型时代的可信AI》论坛（简称“论坛”）顺利举行。

12/13/2024 11:22:00 AM 机器之心

北大王选最新OpenAD！助力自动驾驶迈向开放3D世界

写在前面 & 笔者的个人理解开放世界自动驾驶包括域泛化和开放词汇。领域泛化是指自动驾驶系统在不同场景和传感器参数配置下的能力。开放词汇是指识别训练中没有遇到的各种语义类别的能力。

12/4/2024 10:00:00 AM 自动驾驶之心

如何精准识别伪装场景

11月27日，中央党校权威刊物《学习时报》（全党唯一一份专门讲学习的中央级报纸）的科技前沿版，特别刊登了南开大学教授范登平先生的文章《如何精准识别伪装场景》。该文深入浅出地介绍了伪装场景理解技术的最新进展，展现了很强的专业价值与前瞻性，目前在党政领导干部内反响不错。相信随着这一前沿科技的持续发酵，将会逐步跨越专业界限，进入大众视野，成为推动科技军事和社会进步与创新的重要力量。

11/29/2024 10:31:00 AM 新闻助手

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

北京大学的研究人员开发了一种新型多模态框架 FakeShield，能够检测图像伪造、定位篡改区域，并提供基于像素和图像语义错误的合理解释，可以提高图像伪造检测的可解释性和泛化能力。随着生成式人工智能（AIGC）的迅猛发展，图像编辑与合成技术变得愈加成熟与普及。这一趋势为图像内容创作带来了便捷的同时，也显著增加了篡改检测的难度。

10/24/2024 11:36:51 PM 问舟

国内金融领域虚假人脸检测标准“零的突破”，《虚假数字人脸检测金融应用技术规范》发布

感谢据 21 财经今天傍晚报道，为提升金融信息系统的安全性，9 月 6 日北京国家金融科技认证中心联合 10 多家金融机构发布的《虚假数字人脸检测金融应用技术规范》（AI在线注：下称《应用规范》）正式施行。《应用规范》规定了面向金融领域应用的虚假数字人脸检测服务的技术框架、功能要求、性能要求等，并提出对应的测试评估方法，专门针对通过生成式 AI、Deepfake（深度伪造）等技术制作的虚假人脸内容进行检测。其为金融机构防御虚假数字人脸攻击提供了重要参考，这是国内首个面向 Deepfake 进行安全检测的标准。《应用

9/14/2024 7:04:41 PM 清源

AI 模型提早 5 年预警乳腺癌，MIT 研究登 Science 获 LeCun 转发

科学家正在通过 AI 的力量，改变乳腺癌的现状。在全球范围内，每年有超过 60 万名女性因乳腺癌而无法存活。美国有八分之一的女性一生中会被诊断出患有乳腺癌。这些数字听起来很可怕，但并非毫无希望。当处于最早的局部阶段时，5 年相对生存率为 99%。近年来，早期检测和治疗方法的进步显著提高了乳腺癌的生存率，目前美国有超过 400 万乳腺癌幸存者。AI，就是这项进步背后的一个重要推动性力量。近日，Science 在 X 上连发多篇帖子，展现了 AI 在乳腺癌检测方面的应用潜力。「人工智能提前 5 年检测出乳腺癌」。这条推

8/7/2024 1:29:23 PM 清源

突破传统缺陷检测的界限，"Defect Spectrum"首次实现超高精度丰富语义的工业缺陷检测。

在现代制造业中，精准的缺陷检测不仅是保证产品质量的关键，更是提升生产效率的核心。然而，现有的缺陷检测数据集常常缺乏实际应用所需的精确度和语义丰富性，导致模型无法识别具体的缺陷类别或位置。为了解决这一难题，由香港科技大学广州和思谋科技组成的顶尖研究团队，创新性地开发出了“Defect Spectrum”数据集，为工业缺陷提供了详尽、语义丰富的大规模标注。如表一所示，相比其他工业数据集，“Defect Spectrum”数据集提供了最多的缺陷标注（5438张缺陷样本），最细致的缺陷分类（125种缺陷类别），并为不同种类

7/26/2024 2:45:00 PM 机器之心

多所高校开始检测毕业论文“含 AI 量”，学生称自己原创论文被检出“AI 率”较高、无法过审

据澎湃新闻今日报道，今年有一些高校开始针对 2024 届毕业生发布有关生成式 AI 检测的通知，明确学生在进行毕业设计（论文）时，应严格遵守学术规范和学术道德，避免过度依赖智能生成内容，确保毕业设计（论文）的独立性和原创性。但是，报道提到多名学生的原创论文被检测为“AI”生成，且没有申诉途径，只能按照机器的运行逻辑修改。接受采访的学生都认为，AI 检测“某种程度上”确实可以防止学生用 AI 代写论文，但目前的 AI 检测功能尚不成熟。其中一名学生舒然（AI在线注：化名，下同）经过半个月的时间完成了两万三千字的论文初

7/22/2024 9:12:52 PM 清源

ICML 2024| 大语言模型助力基于CLIP的分布外检测任务

当训练数据集和测试数据集的分布相同时，机器学习模型可以表现出优越的性能。然而在开放世界环境中，模型经常会遇到分布外（Out-of-Distribution, OOD，下称“OOD”）样本，OOD样本可能会导致模型做出不可预测的行为，而错误的后果可能是致命的，尤其是在自动驾驶等高风险场景中 [1, 2]。因此OOD检测对于保障机器学习模型在实际部署中的可靠性至关重要。大多数OOD检测方法 [1, 3] 可以基于训练有素的分布内 (In-Distribution, ID) 分类器有效地检测 OOD 样本。然而，对于不同

7/1/2024 4:41:00 PM 新闻助手

美国多家汽车经销商将 AI 用于车辆初步检查：一分钟内可生成全面报告

当前 AI 几乎是“无处不在”，以汽车领域为例，有车载大模型语音助手，还有各种各样的智能辅助驾驶，不过 AI 的潜力还远不止于此。据 Carscoops 今日报道，美国多家经销商采用了 AI 系统用于车辆初步检查。▲ 图源 Carscoops报道称，相关技术已经在全美 300 家经销商展开部署，为它们显著提高了工作效率并缩短了工时。拉斯维加斯一家安装了自动化车辆检测系统的凯迪拉克经销商表示，整个扫描过程非常简单，只需不到一分钟。客户将车开过大型扫描仪，扫描仪便可以从各个角度（IT之家注：包括车底）拍摄多张照片。然后

6/24/2024 2:27:53 PM 清源

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

在机器学习模型日益应用于开放世界场景中，如何有效识别和处理分布外（Out-of-Distribution, OOD）数据成为一个重要研究领域[1]。分布外数据的存在可能导致模型过度自信和错误预测，这在安全关键应用（如自动驾驶和医疗诊断）中尤为危险。因此，发展一种有效的OOD检测机制，对于提高模型在实际应用中的安全性和可靠性至关重要。传统的OOD检测方法主要集中在单一模态，特别是图像数据上，而忽视了其他潜在有用的信息源，例如文本数据。随着视觉-语言模型（VLMs）的兴起，它们在多模态学习场景中展示了强大的性能，特别是

5/6/2024 12:12:00 PM TMLRGroup

人工智能顶会AAAI 2024放榜！联汇科技赵天成博士团队两篇论文入选

近日，第38届国际顶级人工智能学术会议AAAI（Association for the Advancement of Artificial Intelligence）正式发布了2024年会议的录用通知，联汇科技赵天成博士团队两篇论文入选。AAAI 是由国际人工智能促进协会主办的年会，是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一，也是中国计算机学会（CCF）推荐的 A 类国际学术会议。据了解，本届AAAI会议共有12100篇投稿（主赛道），打破历史纪录，经过全面而严格的审查程序，共有2342篇论文

12/12/2023 10:52:00 AM 新闻助手

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉