算法
3DDFA-V3:引领三维人脸重建新纪元
一、引言从二维图像中重建三维人脸是计算机视觉和图形学领域的一项重要任务,它在虚拟现实(VR)、增强现实(AR)、计算机生成图像(CGI)等领域有着广泛的应用。 近年来,随着深度学习技术的不断发展,三维人脸重建技术取得了显著的进步。 本文将对最新提出的3DDFA-V3算法进行详细介绍,展示其如何凭借创新的几何引导策略和面部区域分割技术,实现高精度和高鲁棒性的三维人脸重建。
12/12/2024 8:28:11 AM
AGI
终于把图神经网络算法搞懂了!!!
今天给大家分享一个强大的算法模型,GNN。 图神经网络(GNN)是一类专门处理图结构数据的深度学习模型。 在传统的深度学习中,输入数据通常是结构化的(如图像、文本、时间序列等),这些数据都可以表示为一个规则的网格或序列。
12/12/2024 12:29:03 AM
程序员小寒
RARE: 提升LLM推理准确性和事实完整性的检索增强框架思路浅尝
MCTS & rStar蒙特卡洛树搜索(MCTS)蒙特卡洛树搜索(MCTS)是一种用于解决复杂决策问题的算法,常用于游戏等领域。 它的基本思想是通过构建一棵搜索树并模拟各种可能的行动来估计每个行动的价值。 MCTS的过程可以分为四个主要步骤:选择(Selection):从根节点开始,根据某种策略(如UCT)遍历子节点,直到找到一个叶节点。
12/11/2024 8:12:24 AM
余俊晖
十大必知的人工智能算法
随着人工智能技术(AI)的日益普及,各种算法在推动这一领域的发展中发挥着关键作用。 从预测房价的线性回归到自动驾驶汽车的神经网络,这些算法在背后默默支撑着无数应用的运行。 今天,我们将带您一览这些热门的人工智能算法(线性回归、逻辑回归、决策树、朴素贝叶斯、支持向量机(SVM)、集成学习、K近邻算法、K-means算法、神经网络、强化学习Deep Q-Networks ),探索它们的工作原理、应用场景以及在现实世界中的影响力。
12/3/2024 1:19:47 PM
花哥
终于把 LSTM 算法搞懂了!!!
今天给大家分享一个强大的算法模型,LSTMLSTM(长短期记忆网络)是一种特殊类型的循环神经网络(RNN),它能够有效地解决传统 RNN 在处理长序列时遇到的梯度消失和梯度爆炸问题。 LSTM 的核心思想是通过多个门控机制来控制信息的流动,这些门控机制可以选择性地保留或丢弃输入数据,从而帮助网络捕捉长时间跨度的依赖关系。 LSTM的工作原理LSTM 的核心思想是通过引入记忆单元来存储信息,并使用三个主要的门(输入门、遗忘门、输出门)来决定哪些信息应该保留,哪些信息应该遗忘,以及哪些信息应该更新。
12/3/2024 8:16:57 AM
程序员小寒
人工智能的“记忆”:个人和组织的革命性生产力
随着人工智能的不断发展,一个概念脱颖而出,成为实现个性化体验的关键:记忆(Memory)。 在Madrona与微软人工智能首席执行官Mustafa Suleyman的IA峰会炉边谈话中,他强调记忆不仅是一种功能,而且是一种重塑人工智能与人类互动方式的变革力量。 记忆使人工智能不仅可以结合智商(IQ),还可以结合情商(EQ),从而创造一种更有意义、更像人类的关系。
12/2/2024 2:30:46 PM
AI情报室
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。 该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。 该工作由上海交通大学和阿里巴巴通义实验室共同完成。
12/2/2024 1:30:00 PM
机器之心
审稿人直呼简洁,单点PageRank终极版!人大STOC论文让复杂度优化至「理论最优」
在信息爆炸的互联网时代,应如何根据重要性对搜索得到的网页进行排名并呈现给用户? 这个问题困扰了无数早期的搜索引擎。 破局者来自Google,创始人Sergey Brin和Lawrence Page提出的网页排名算法PageRank为这个难题提供了一个开创性的解决方案:为每个网页都计算了一个重要性得分,即PageRank得分,得分越高表示该网页质量越好,在信息检索时的重要性越高。
11/29/2024 2:00:07 PM
新智元
扩散模型=进化算法!生物学大佬用数学揭示本质
扩散模型居然就是生物的进化算法! 这个结论来自「新常春藤」塔夫茨大学(Tufts University)于近日发表的一项研究:论文地址: Levin,博士毕业于哈佛大学,目前担任塔夫茨大学Allen Discovery Center主任。 Michael Levin长期从事生物电、人工生命和许多其他生物学相关主题的研究,曾在NeurIPS 2018上发表了题为「What Bodies Think About:Bioelectric Computation Outside the Nervous System」的精彩演讲:视频地址: 2020上,Michael Levin还阐述了有关「机器人癌症」的话题:「what the bioelectrics of embryogenesis and regeneration can teach us about unconventional computing, cognition, and the software of life」。
11/26/2024 9:30:00 AM
新智元
AdaBoost分类器完全图解
译者 | 朱先忠审校 | 重楼本文将通过完整的源码与图解方式向你展示AdaBoost算法运行逻辑,并指出其优点与不足,还将其与随机森林算法进行对比分析。 简介每个人都会犯错,即使是机器学习领域最简单的决策树也存在这个问题。 AdaBoost(自适应增强)算法不会忽略这些错误,而是会做一些不同的事情:它会从这些错误中学习(或适应)以变得更好。
11/20/2024 8:29:26 AM
朱先忠
澳门大学最新!CVPR'24 ALOcc:自适应再出山,精度与速度的完美均衡!
写在前面 & 笔者的个人理解基于视觉的语义占用和流量预测在为自动驾驶等现实世界任务提供时空线索方面发挥着至关重要的作用。 现有方法优先考虑更高的精度,以满足这些任务的需求。 在这项工作中,通过引入一系列针对3D语义占用预测和流量估计的有针对性的改进来提高性能。
11/19/2024 9:40:00 AM
Dubing Chen等
终于把 Seq2Seq 算法搞懂了!!
Seq2Seq(Sequence-to-Sequence)模型是一种用于处理序列数据的神经网络架构,广泛应用于自然语言处理(NLP)任务,如机器翻译、文本生成、对话系统等。 它通过编码器-解码器架构将输入序列(如一个句子)映射到输出序列(另一个句子或序列)。 图片模型结构Seq2Seq 模型由两个主要部分组成。
11/14/2024 12:16:46 AM
程序员小寒
快速学会一个算法,卷积神经网络
大家好,我是小寒今天给大家介绍一个强大的算法模型,卷积神经网络卷积神经网络(CNN)是一种专门用于处理图像、视频等具有网格结构数据的深度学习模型。 CNN 通过局部连接和参数共享的方式,大幅减少了模型的计算量,能有效提取数据的局部和全局特征,被广泛应用于计算机视觉领域,如图像分类、物体检测、图像分割等。 图片卷积神经网络的基本结构卷积神经网络的主要包括卷积层、池化层和全连接层。
11/11/2024 12:00:02 AM
程序员小寒
AI开源项目 | FastGPT- 深入解析 FastGPT 的知识库逻辑与检索机制:让 AI 更聪明的秘密
如何让 AI 更加智能化、精准化,成为了研究者和开发者们关注的焦点。 FastGPT 作为一款前沿的 AI 模型,其知识库逻辑与检索机制无疑是其成功的关键所在。 本文将为您详细解析 FastGPT 的知识库逻辑与检索机制,并结合知识库的特性,提供实用的教学意义,帮助您更好地理解这一技术背后的原理与应用。
11/5/2024 1:16:11 PM
hpstream
大模型压缩KV缓存新突破,中科大提出自适应预算分配,工业界已落地vLLM框架
改进KV缓存压缩,大模型推理显存瓶颈迎来新突破——中科大研究团队提出Ada-KV,通过自适应预算分配算法来优化KV缓存的驱逐过程,以提高推理效率。 打破KV Cache压缩将所有注意力头分配相同压缩预算的常规做法,针对不同的注意力头进行适配性压缩预算分配展开来说,由于大模型在自回归生成过程中,每生成一个新token都需要将对应的KV矩阵存储下来,这导致缓存随着生成序列长度的增加而急剧膨胀,引发内存和I/O延迟问题,尤其在长序列推理中尤为突出。 因此,KV缓存压缩成为了一项必要的优化。
11/4/2024 8:30:00 AM
量子位
提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架
字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。 官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。 该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。
11/3/2024 3:24:59 PM
沛霖(实习)
豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍
强化学习(RL)对大模型复杂推理能力提升有关键作用,但其复杂的计算流程对训练和部署也带来了巨大挑战。 近日,字节跳动豆包大模型团队与香港大学联合提出 HybridFlow。 这是一个灵活高效的 RL/RLHF 框架,可显著提升训练吞吐量,降低开发和维护复杂度。
11/1/2024 2:44:00 PM
新闻助手
养猪业新神器,AI 工具可解读猪叫声背后的情绪
路透社于 10 月 24 日发布博文,报道称欧洲科学家开发了一种能够解读猪叫声的人工智能(AI)算法,从而帮助猪农了解猪的情绪和压力状态。 根据共同领导该研究的哥本哈根大学行为生物学家埃洛迪・曼德尔-布里费尔的说法,该算法有可能提醒农民注意猪的负面情绪,从而改善它们的福祉。 该研究由来自丹麦、德国、瑞士、法国、挪威和捷克共和国的科学家共同进行,核心是通过分析数千个不同情境下的猪叫声,理解它们所表达的情感。
10/30/2024 1:41:24 PM
故渊
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉