检测
LUD-YOLO:兼顾精度与速度的无人机小目标检测轻量新方案
一眼概览LUD-YOLO 提出了一种基于 YOLOv8 的轻量级小目标检测网络,结合自适应多尺度特征融合和稀疏注意力机制,在保持高检测精度的同时实现高效 UAV 部署。 核心问题现有 UAV 目标检测面临图像复杂背景、小目标难识别、设备资源受限等问题。 如何在有限算力和存储条件下实现高精度的小目标实时检测,是本文关注的关键挑战。
5/27/2025 3:20:00 AM
萍哥学AI
Barracuda推出多模态AI升级,提升网络安全威胁检测能力
Barracuda Networks 近日发布了其新一代的威胁检测技术,利用多模态人工智能(AI)提升对网络攻击的防护能力。 这项技术能够实时分析并关联多种数据类型,包括网址、文档、图像和二维码,从而最大限度地提高威胁检测的准确性和速度。 Barracuda 表示,最新的多模态 AI 整合了其现有的人工智能和机器学习能力,使系统能够并行处理和解读多条数据流。
5/9/2025 6:01:11 PM
AI在线
多模态大模型改造人脸防伪检测,厦大腾讯优图等研究入选CVPR 2025
近年来,人脸合成技术在快速发展,相关检测任务也逐渐从“看得出来”向“说明白为什么”演进。 除了判断一张脸是真还是假,更需要模型能“说出个所以然”。 在CVPR 2025的工作《Towards General Visual-Linguistic Face Forgery Detection》中,研究团队尝试从视觉 语言的多模态视角来改进伪造检测方法。
4/22/2025 9:22:00 AM
量子位
YOLOe问世,实时观察一切,统一开放物体检测和分割
它能像人眼一样,在文本、视觉输入和无提示范式等不同机制下进行检测和分割。 自 2015 年由华盛顿大学的 Joseph Redmon 研究团队提出 YOLO(You Only Look Once)以来,这项突破性的目标检测技术就像为机器装上了「闪电之眼」,凭借单次推理的实时性能刷新了计算机视觉的认知边界。 传统的 YOLO 系列如同我们人工效准的精密仪器,其识别能力被严格框定在预定义的类别目录之中,每个检测框的背后,都需要工程师手动输入认知词典。
3/13/2025 11:11:04 AM
机器之心
灵敏度高达94.9%!牛津团队AI多模态ctDNA检测方法,进行癌症早期筛查
编辑 | 2049在癌症诊疗的漫长征程中,早期检测始终是最具挑战性的环节之一,液体活检技术因其无创性和高灵敏度而备受关注。 然而,现有的检测方法大多依赖于深度靶向测序,难以同时整合多模态数据,导致检测灵敏度和特异性受限。 正是基于这一技术痛点,牛津大学的研究团队开发了一种基于全基因组 TET 辅助吡啶硼烷测序(TAPS)的多模态循环肿瘤 DNA(ctDNA)检测方法。
1/22/2025 6:28:00 PM
ScienceAI
CCF-CV携手合合信息打造技术分享论坛,聚焦大模型时代中的视觉安全前沿热点
近期,《咬文嚼字》杂志发布了2024年度十大流行语,“智能向善”位列其中,过去一年时间里,深度伪造、AI诈骗等话题屡次登上热搜,AI技术“野蛮生长”引发公众担忧。 今年9月,全国网络安全标准化技术委员会发布了《人工智能安全治理框架》,指出人工智能既面临自身技术缺陷、不足带来的内生风险,也面临不当使用、滥用甚至恶意利用带来的外部风险。 为探寻AI安全治理道路,近期,由中国计算机学会计算机视觉专委会主办,合合信息承办,中国运筹学会数学与智能分会协办的《打造大模型时代的可信AI》论坛(简称“论坛”)顺利举行。
12/13/2024 11:22:00 AM
机器之心
北大王选最新OpenAD!助力自动驾驶迈向开放3D世界
写在前面 & 笔者的个人理解开放世界自动驾驶包括域泛化和开放词汇。 领域泛化是指自动驾驶系统在不同场景和传感器参数配置下的能力。 开放词汇是指识别训练中没有遇到的各种语义类别的能力。
12/4/2024 10:00:00 AM
自动驾驶之心
如何精准识别伪装场景
11月27日,中央党校权威刊物《学习时报》(全党唯一一份专门讲学习的中央级报纸)的科技前沿版,特别刊登了南开大学教授范登平先生的文章《如何精准识别伪装场景》。 该文深入浅出地介绍了伪装场景理解技术的最新进展,展现了很强的专业价值与前瞻性,目前在党政领导干部内反响不错。 相信随着这一前沿科技的持续发酵,将会逐步跨越专业界限,进入大众视野,成为推动科技军事和社会进步与创新的重要力量。
11/29/2024 10:31:00 AM
新闻助手
图像伪造照妖镜:北大发布多模态 LLM 图像篡改检测定位框架 FakeShield
北京大学的研究人员开发了一种新型多模态框架 FakeShield,能够检测图像伪造、定位篡改区域,并提供基于像素和图像语义错误的合理解释,可以提高图像伪造检测的可解释性和泛化能力。 随着生成式人工智能(AIGC)的迅猛发展,图像编辑与合成技术变得愈加成熟与普及。 这一趋势为图像内容创作带来了便捷的同时,也显著增加了篡改检测的难度。
10/24/2024 11:36:51 PM
问舟
国内金融领域虚假人脸检测标准“零的突破”,《虚假数字人脸检测金融应用技术规范》发布
感谢据 21 财经今天傍晚报道,为提升金融信息系统的安全性,9 月 6 日北京国家金融科技认证中心联合 10 多家金融机构发布的《虚假数字人脸检测金融应用技术规范》(AI在线注:下称《应用规范》)正式施行。《应用规范》规定了面向金融领域应用的虚假数字人脸检测服务的技术框架、功能要求、性能要求等,并提出对应的测试评估方法,专门针对通过生成式 AI、Deepfake(深度伪造)等技术制作的虚假人脸内容进行检测。其为金融机构防御虚假数字人脸攻击提供了重要参考,这是国内首个面向 Deepfake 进行安全检测的标准。《应用
9/14/2024 7:04:41 PM
清源
AI 模型提早 5 年预警乳腺癌,MIT 研究登 Science 获 LeCun 转发
科学家正在通过 AI 的力量,改变乳腺癌的现状。在全球范围内,每年有超过 60 万名女性因乳腺癌而无法存活。美国有八分之一的女性一生中会被诊断出患有乳腺癌。这些数字听起来很可怕,但并非毫无希望。当处于最早的局部阶段时,5 年相对生存率为 99%。近年来,早期检测和治疗方法的进步显著提高了乳腺癌的生存率,目前美国有超过 400 万乳腺癌幸存者。AI,就是这项进步背后的一个重要推动性力量。近日,Science 在 X 上连发多篇帖子,展现了 AI 在乳腺癌检测方面的应用潜力。「人工智能提前 5 年检测出乳腺癌」。这条推
8/7/2024 1:29:23 PM
清源
突破传统缺陷检测的界限,"Defect Spectrum"首次实现超高精度丰富语义的工业缺陷检测。
在现代制造业中,精准的缺陷检测不仅是保证产品质量的关键,更是提升生产效率的核心。然而,现有的缺陷检测数据集常常缺乏实际应用所需的精确度和语义丰富性,导致模型无法识别具体的缺陷类别或位置。为了解决这一难题,由香港科技大学广州和思谋科技组成的顶尖研究团队,创新性地开发出了“Defect Spectrum”数据集,为工业缺陷提供了详尽、语义丰富的大规模标注。如表一所示,相比其他工业数据集,“Defect Spectrum”数据集提供了最多的缺陷标注(5438张缺陷样本),最细致的缺陷分类(125种缺陷类别),并为不同种类
7/26/2024 2:45:00 PM
机器之心
多所高校开始检测毕业论文“含 AI 量”,学生称自己原创论文被检出“AI 率”较高、无法过审
据澎湃新闻今日报道,今年有一些高校开始针对 2024 届毕业生发布有关生成式 AI 检测的通知,明确学生在进行毕业设计(论文)时,应严格遵守学术规范和学术道德,避免过度依赖智能生成内容,确保毕业设计(论文)的独立性和原创性。但是,报道提到多名学生的原创论文被检测为“AI”生成,且没有申诉途径,只能按照机器的运行逻辑修改。接受采访的学生都认为,AI 检测“某种程度上”确实可以防止学生用 AI 代写论文,但目前的 AI 检测功能尚不成熟。其中一名学生舒然(AI在线注:化名,下同)经过半个月的时间完成了两万三千字的论文初
7/22/2024 9:12:52 PM
清源
ICML 2024| 大语言模型助力基于CLIP的分布外检测任务
当训练数据集和测试数据集的分布相同时,机器学习模型可以表现出优越的性能。然而在开放世界环境中,模型经常会遇到分布外(Out-of-Distribution, OOD,下称“OOD”)样本,OOD样本可能会导致模型做出不可预测的行为,而错误的后果可能是致命的,尤其是在自动驾驶等高风险场景中 [1, 2]。因此OOD检测对于保障机器学习模型在实际部署中的可靠性至关重要。大多数OOD检测方法 [1, 3] 可以基于训练有素的分布内 (In-Distribution, ID) 分类器有效地检测 OOD 样本。然而,对于不同
7/1/2024 4:41:00 PM
新闻助手
美国多家汽车经销商将 AI 用于车辆初步检查:一分钟内可生成全面报告
当前 AI 几乎是“无处不在”,以汽车领域为例,有车载大模型语音助手,还有各种各样的智能辅助驾驶,不过 AI 的潜力还远不止于此。据 Carscoops 今日报道,美国多家经销商采用了 AI 系统用于车辆初步检查。▲ 图源 Carscoops报道称,相关技术已经在全美 300 家经销商展开部署,为它们显著提高了工作效率并缩短了工时。拉斯维加斯一家安装了自动化车辆检测系统的凯迪拉克经销商表示,整个扫描过程非常简单,只需不到一分钟。客户将车开过大型扫描仪,扫描仪便可以从各个角度(IT之家注:包括车底)拍摄多张照片。然后
6/24/2024 2:27:53 PM
清源
ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务
在机器学习模型日益应用于开放世界场景中,如何有效识别和处理分布外(Out-of-Distribution, OOD)数据成为一个重要研究领域[1]。分布外数据的存在可能导致模型过度自信和错误预测,这在安全关键应用(如自动驾驶和医疗诊断)中尤为危险。因此,发展一种有效的OOD检测机制,对于提高模型在实际应用中的安全性和可靠性至关重要。传统的OOD检测方法主要集中在单一模态,特别是图像数据上,而忽视了其他潜在有用的信息源,例如文本数据。随着视觉-语言模型(VLMs)的兴起,它们在多模态学习场景中展示了强大的性能,特别是
5/6/2024 12:12:00 PM
TMLRGroup
人工智能顶会AAAI 2024放榜!联汇科技赵天成博士团队两篇论文入选
近日,第38届国际顶级人工智能学术会议AAAI(Association for the Advancement of Artificial Intelligence)正式发布了2024年会议的录用通知,联汇科技赵天成博士团队两篇论文入选。AAAI 是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的 A 类国际学术会议。据了解,本届AAAI会议共有12100篇投稿(主赛道),打破历史纪录,经过全面而严格的审查程序,共有2342篇论文
12/12/2023 10:52:00 AM
新闻助手
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊