深度学习

使用 YOLO 和 EasyOCR 从视频文件中检测车牌

本文将介绍如何通过Python中的YOLO（ou Only Look Once）和EasyOCR（光学字符识别）技术来实现从视频文件中检测车牌。本技术依托于深度学习，以实现车牌的即时检测与识别。从视频文件中检测车牌先决条件在我们开始之前，请确保已安装以下Python包：复制实施步骤步骤1：初始化库我们将首先导入必要的库。

11/28/2024 3:56:05 PM

二旺

压缩率达10的48次方，实现蛋白序列空间极端压缩，清华EvoAI登Nature子刊

编辑 | 萝卜皮设计功能更佳的蛋白质需要深入了解序列和功能之间的关系，这是一个难以探索的广阔空间。通过识别功能上重要的特征来有效压缩这一空间的能力极其宝贵。清华大学的研究团队建立了一种称为 EvoScan 的方法，用于全面分割和扫描高适应度序列空间，以获得能够捕捉其基本特征（尤其是在高维度中）的锚点。

11/27/2024 3:55:00 PM

ScienceAI

如何为深度学习选择优秀 GPU ？

Hello folks，我是 Luga，今天我们继续来聊一下人工智能生态相关技术 - 用于加速构建 AI 核心算力的 GPU 硬件技术。众所周知，对于绝大多数的深度学习模型的训练，尤其是参数规模较为庞大的模型，其往往是整个开发流程中最耗时、资源消耗最大的环节。在传统的 CPU .

11/25/2024 4:15:14 PM

架构驿站

基于视觉 Transformer（ViT）进行图像分类

近年来，Transformer 架构彻底改变了自然语言处理（NLP）任务。视觉Transformer（ViT）将这一创新更进一步，将变换器架构适应于图像分类任务。本教程将指导您使用ViT对花卉图像进行分类。

11/21/2024 4:06:02 PM

二旺

为了了解DNA与疾病的关系，美国洛斯阿拉莫斯国家实验室的科学家开发了第一个多模态深度学习模型EPBDxDNABERT-2，该模型能够利用DNA“呼吸”，即双螺旋结构自发打开和关闭，来确定转录因子（调节基因活动的蛋白质）之间的精确关系。该模型有可能帮助设计用于治疗源于基因活性疾病的药物。与DNA链结合的转录因子蛋白的表示洛斯阿拉莫斯国家实验室研究员、该论文的第一作者Anowarul Kabir说：“转录因子有很多种，人类基因组的规模大得令人生畏。

11/19/2024 1:13:54 PM

AI情报室

提高深度学习模型效率的三种模型压缩方法

译者 | 李睿审校 | 重楼近年来，深度学习模型在自然语言处理（NLP）和计算机视觉基准测试中的性能稳步提高。虽然这些收益的一部分来自架构和学习算法的改进，但数据集大小和模型参数的增长是重要的驱动因素。下图显示了top-1 ImageNet分类精度作为GFLOPS的函数，GFLOPS可以用作模型复杂性的指标。

11/18/2024 8:08:21 AM

李睿

多模态大模型技术方向和应用场景

多模态大模型（Multimodal Large Language Models，MLLM）是一种结合了大型语言模型（LLM）和大型视觉模型（LVM）的深度学习模型，它们能够处理和理解多种类型的数据，如文本、图像和音频，从而在跨模态任务中展现出卓越的性能。核心特点对于多模态输入-文本输出的典型 MLLM，其架构一般包括编码器、连接器以及 LLM。如要支持更多模态的输出(如图片、音频、视频)，一般需要额外接入生成器，如下图所示:MLLM 架构图模态编码器负责将原始的信息(如图片)编码成特征，连接器则进一步将特征处理成LLM 易于理解的形式，即视觉 Token。

11/11/2024 3:11:23 PM

天涯咫尺TGH

PyTorch 深度学习的十个核心概念

深度学习是当前最热门的技术之一，而 PyTorch 是一个非常受欢迎的深度学习框架。今天，我们将深入探讨 PyTorch 中的 10 个核心概念，帮助你更好地理解和使用这个强大的工具。张量（Tensor）张量是 PyTorch 中最基本的数据结构，类似于 NumPy 的数组，但可以在 GPU 上运行，从而加速计算。

11/11/2024 8:00:00 AM

小白PythonAI编程

优化计算机视觉和图像处理中的图像格式：OpenCV 中的 PNG、JPG 和 WEBP

在计算机视觉和图像处理应用中，选择正确的图像格式可以影响性能和质量。无论你是在预处理数据以训练深度学习模型、在实时系统上运行推理，还是处理大型数据集，了解PNG、JPG和WEBP的优势和劣势可以帮助你做出明智的选择。让我们深入了解每种格式在图像处理方面的独特特性，并提供实际的代码示例，展示如何使用Python中的OpenCV加载和保存这些格式。

11/7/2024 4:03:09 PM

二旺

Keras vs JAX，我该选哪个？

译者 | 布加迪审校 | 重楼近年来，Keras和Tensorflow组合遇到了一种与之竞争的框架：JAX，它在深度学习开发者社区逐渐变得很重要。那么JAX到底是什么？它有哪些功能？

11/6/2024 4:07:39 PM

布加迪

一种实现符号钢琴音乐声音和谱表分离的GNN新方法

译者 | 朱先忠审校 | 重楼本文涵盖了我最近在ISMIR 2024上发表的论文《聚类和分离：一种用于乐谱雕刻的声音和谱表预测的GNN方法》的主要内容。简介以MIDI等格式编码的音乐，即使包含量化音符、拍号或小节信息，通常也缺少可视化的重要元素，例如语音和五线谱信息。这种限制也适用于音乐生成、转录或编曲系统的输出。

11/5/2024 8:19:11 AM

朱先忠

快多个数量级，清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊

编辑 | KX两年前，清华大学物理系徐勇、段文晖研究组开发出高效精确的第一性原理电子结构深度学习方法 DeePH，可极大加速电子结构计算。近日，该团队开发了一种准确而有效的实空间重构方法（real-space reconstruction），将 DeepH 方法从原先仅支持原子基组推广至适用于平面波基组，使得 DeepH 方法可与所有密度泛函理论（DFT）程序兼容。而且，该重构方法比传统的基于投影的方法快几个数量级。这给深度学习电子结构计算方法带来了更高的精度和更好的泛化能力，并打通了其利用电子结构大数据作深度学习

10/10/2024 12:09:00 PM

ScienceAI

用最直观的动画，讲解LLM如何存储事实，3Blue1Brown的这个视频又火了

本文根据视频整理而来，有听错或理解不当之处欢迎在评论区指出。向大模型输入「Michael Jordan plays the sport of _____（迈克尔・乔丹从事的体育运动是……）」，然后让其预测接下来的文本，那么大模型多半能正确预测接下来是「basketball（篮球）」。这说明在其数以亿计的参数中潜藏了有关这个特定个人的相关知识。用户甚至会感觉这些模型记忆了大量事实。但事实究竟如何呢？近日，3Blue1Brown 的《深度学习》课程第 7 课更新了，其中通过生动详实的动画展示了 LLM 存储事实的方式。

9/2/2024 2:53:00 PM

机器之心

预测蛋白质-DNA结合特异性，南加州大学团队开发几何深度学习新方法

编辑 | 萝卜皮预测蛋白质-DNA 结合特异性是一项具有挑战性但又至关重要的任务，有助于理解基因调控。蛋白质-DNA 复合物通常与选定的 DNA 靶位结合，而蛋白质则以不同程度的结合特异性与广泛的 DNA 序列结合。这些信息无法在单一结构中直接获取。为了获取这些信息，南加州大学（University of Southern California）和华盛顿大学（University of Washington）的研究人员提出了深度结合特异性预测器（DeepPBS），这是一种几何深度学习模型，旨在根据蛋白质-DNA 结

8/19/2024 10:34:00 AM

ScienceAI

百万级原子模拟，从头算精度，北京科学智能研究院提出AI+大尺度电子结构模拟新方法

编辑 | KX在计算材料科学领域，准确高效地模拟材料的电子结构一直是一个非常关键而又极具挑战性的问题。基于密度泛函理论的第一性原理计算方法的高计算需求依然是大尺寸长时间材料模拟所面临的难题。北京科学智能研究院 (AI for Science Institute, Beijing) 提出了一种基于深度学习的高效紧束缚方法，称为 DeePTB，从而高效地表示具有从头算精度的材料电子结构，极大地简化了计算复杂度，并实现百万级大尺寸结构的电子、光电响应性质的计算模拟。当与分子动力学相结合时，DeePTB 可以同时促进原子和

8/15/2024 4:09:00 PM

ScienceAI

八问八答搞懂Transformer内部运作原理

七年前，论文《Attention is all you need》提出了 transformer 架构，颠覆了整个深度学习领域。如今，各家大模型都以 transformer 架构为基础，但 transformer 内部运作原理，仍是一个未解之谜。去年，transformer 论文作者之一 Llion Jones 宣布创立人工智能公司 Sakana AI。近期，Sakana AI 发表了一篇题为《Transformer Layers as Painters》的论文，探究了预训练 transformer 中的信息流，并

8/7/2024 2:23:00 PM

机器之心

Nature子刊，快10倍，基于Transformer的逆向蛋白质序列设计方法

编辑 | 萝卜皮借助深度学习的进步，蛋白质设计和工程正以前所未有的速度发展。然而，目前的模型无法在设计过程中自然地考虑非蛋白质实体。在这里，瑞士洛桑联邦理工学院（EPFL）的研究人员提出了一种完全基于原子坐标和元素名称的几何 transformer 的深度学习方法，该方法可以根据不同分子环境所施加限制的主链支架，预测蛋白质序列。使用该方法，研究人员可以以高成功率生产出高热稳定性、催化活性的酶。这有望提高蛋白质设计流程的多功能性，以实现所需的功能。该研究以「Context-aware geometric deep l

8/5/2024 3:37:00 PM

ScienceAI

生成394,760种蛋白质表征，哈佛团队开发AI模型，全面理解蛋白质上下文

编辑 | 萝卜皮了解蛋白质功能和开发分子疗法，需要破译蛋白质发挥作用的细胞类型，解析蛋白质之间的相互作用。然而，对跨生物背景蛋白质相互作用进行建模对于现有算法来说仍然具有挑战性。在最新的研究中，哈佛医学院的研究人员开发了 PINNACLE，这是一种生成情境感知蛋白质表征的几何深度学习方法。PINNACLE 利用多器官单细胞图谱，在情境化蛋白质相互作用网络上进行学习，从 24 种组织的 156 种细胞类型情境中生成 394,760 种蛋白质表征。该研究以「Contextual AI models for single

7/26/2024 3:12:00 PM

ScienceAI

资讯热榜

Bilibili开源动漫视频生成模型AniSora V3版，一键生成多种风格动漫视频镜头 Chai Discovery发布Chai- 2 模型：零样本抗体设计突破16-20%命中率 xAI控制台新增Grok4及Grok4Code引用，标志着下一代AI模型即将发布 Chai-2震撼发布：AI驱动零样本抗体设计，药物研发提速百倍 PerMAXity：AI驱动投资分析，自动生成综合财务报告 Cursor手机版震撼发布！随时随地编码，开发者迎来新自由 OpenAI四位华人学者集体被挖，还是Meta重金出手 Qwen-TTS新版发布新增支持生成三种中文方言

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌数据机器人大模型 Midjourney 用户智能开源微软 Meta GPT 学习图像技术 Gemini AI创作马斯克论文代码 Anthropic 英伟达算法 Stable Diffusion 芯片智能体训练开发者生成式腾讯蛋白质苹果 AI新词神经网络 3D 研究生成 Claude 机器学习 LLM 计算 Sora AI设计 AI for Science AI视频 GPU xAI 人形机器人百度华为搜索大语言模型场景 Agent 字节跳动预测深度学习伟达工具大型语言模型 Transformer RAG 视觉神器推荐模态 Copilot 亚马逊具身智能 LLaMA 文本算力驾驶 DeepMind

深度学习

使用 YOLO 和 EasyOCR 从视频文件中检测车牌

压缩率达10的48次方，实现蛋白序列空间极端压缩，清华EvoAI登Nature子刊

如何为深度学习选择优秀 GPU ？

基于视觉 Transformer（ViT）进行图像分类

新AI模型提高与疾病相关基因组学的预测能力

提高深度学习模型效率的三种模型压缩方法

多模态大模型技术方向和应用场景

PyTorch 深度学习的十个核心概念

优化计算机视觉和图像处理中的图像格式：OpenCV 中的 PNG、JPG 和 WEBP

Keras vs JAX，我该选哪个？

一种实现符号钢琴音乐声音和谱表分离的GNN新方法

快多个数量级，清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊

用最直观的动画，讲解LLM如何存储事实，3Blue1Brown的这个视频又火了

预测蛋白质-DNA结合特异性，南加州大学团队开发几何深度学习新方法

百万级原子模拟，从头算精度，北京科学智能研究院提出AI+大尺度电子结构模拟新方法

八问八答搞懂Transformer内部运作原理

Nature子刊，快10倍，基于Transformer的逆向蛋白质序列设计方法

生成394,760种蛋白质表征，哈佛团队开发AI模型，全面理解蛋白质上下文