AI在线 AI在线

资讯列表

NeurIPS 2024线下论文分享会启动,机器之心邀你共赴学术盛会

大模型的火爆,已经将各大 AI 顶会带到了新的高度。 NeurIPS 是当前全球最负盛名的 AI 学术会议之一,近年来受到的关注度也不断攀升。 根据官方公布的数据,NeurIPS 2023 大会收到的论文投稿有 13321 篇,有超过 1 万名优秀的 AI 研究人员聚集于新奥尔良的大会现场,盛况空前。
11/12/2024 10:24:00 AM
机器之心

即插即用ChatTracker:多模态大模型重塑目标跟踪

写在前面 & 笔者的个人理解视觉对象跟踪旨在基于初始边界框在视频序列中定位目标对象。 最近,视觉语言(VL)跟踪器已经提出利用额外的自然语言描述来增强各种应用中的通用性。 然而,VL跟踪器在跟踪性能方面仍然不如最先进的视觉跟踪器(SoTA)。
11/12/2024 10:20:00 AM
自动驾驶Daily

通用场景拉满了!GenXD:生成任何3D&4D场景(新加坡国立&微软最新)

写在前面&笔者的个人理解近年来,利用扩散和自回归建模生成2D视觉内容已经取得了显著成功,并已在实际应用中进行广泛使用。 除了 2D 生成之外,3D 内容生成也至关重要,可应用于视频游戏、视觉效果和可穿戴混合现实设备。 然而,由于 3D 建模的复杂性和 3D 数据的局限性,3D 内容生成仍然远远不能令人满意,并且正在引起学术界和工业界越来越多的关注。
11/12/2024 9:34:48 AM
Yuyang Zhao等

如何简单理解视觉语言模型以及它们的架构、训练过程?

关于视觉语言模型(VLMs),以及它们的架构、训练过程和如何通过VLM改进图像搜索和文本处理的多模态神经网络。 可以参考这篇文章:(VLMs),它们是未来的复合AI系统。 文章详细描述了VLMs的基本原理、训练过程以及如何开发一个多模态神经网络,用于图像搜索。
11/12/2024 9:20:03 AM
ketchum

o1/Claude集体翻车!陶哲轩等60+顶尖数学家合力提出新数学基准,大模型正确率通通不足2%

让大模型集体吃瘪,数学题正确率通通不到2%! 获大神卡帕西力荐,大模型新数学基准来势汹汹——一出手,曾在国际数学奥赛中拿下83%解题率的o1模型就败下阵来,并且Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro等全都未攻破2%这一防线。 所以,新挑战者到底啥来头?
11/12/2024 9:14:52 AM
量子位

克服机器学习转换器的局限性——从位置嵌入到RoPE和ALiBi方法

译者 | 朱先忠审校 | 重楼引言近年来开发出的机器学习模型的指数级进步与转换器架构的出现密切相关。 以前,人工智能科学家必须先为手头的每项任务选择架构,然后再进行超参数优化以获得最佳性能。 限制科学家们潜力的另一个挑战是难以处理数据的长期依赖性,难以解决梯度消失、长序列上下文丢失以及因局部约束而无法捕获全局上下文的问题。
11/12/2024 8:20:25 AM
朱先忠

AI 设计神器 BlendBox 支持分图层控制!Ps 地位岌岌可危了

大家好,我是花生~. 上周一直在忙着探索 Recraft 的玩法,一口气出了 2 篇相关文章,大家现在对它应该很熟悉了。 而除了 Recraft,上周其实还出了一款新的工具,同样在 AI 绘画和设计圈引起了不小的关注,它就是 Blockabe Labs 的 Blendbox。
11/12/2024 1:43:57 AM
夏花生

浙大开源“最懂Excel的GPT”!首次将结构化数据作为独立模态训练,刷榜提升40百分点

大模型理解复杂表格,能力再次飞升了! 不仅能在不规则表格中精准找到相关信息,还能直接进行计算。 比如提问:如果2022年出口总额的人民币计价比实际数值少了10%,请计算新的出口总额并与实际数据比较。
11/11/2024 5:37:27 PM
量子位

国地共建具身智能机器人创新中心正式发布天工开源计划

11月11日,国家地方共建具身智能机器人创新中心召开天工开源计划发布会,对外公布创新中心成立一年以来取得的建设成就,并就已有技术成果面向行业陆续开源开放,推动具身智能加快落地。 创新中心旨在打造具身智能机器人生态圈,涵盖关键技术及产品开源开放、产学研协同技术攻关、行业标准体系制定、具身智能机器人应用示范合作落地、具身智能机器人俱乐部及面向全球征集人形机器人参加马拉松比赛等多项内容,实现具身智能机器人生态的闭环。 创新中心总经理熊友军表示,自10月正式升级为国地共建具身智能机器人创新中心后,作为引领具身智能技术突破与产业协同的关键平台,创新中心将专注于解决发展具身智能机器人关键共性技术问题,持续迭代推出全球领先的标志性创新产品,创建繁荣的具身智能产业生态体系。
11/11/2024 5:24:00 PM
新闻助手

大模型应用系列:从Ranking到Reranking

每个搜索引擎背后都隐藏着一个至关重要却往往被忽视的组成部分——Reranking(重新排名)。 那么,什么是Rerank呢? 简而言之,这一过程旨在优化并调整搜索结果的顺序,使之更加精准地匹配用户的查询需求。
11/11/2024 5:16:44 PM
曹洪伟

改进蛋白突变稳定性预测,清华龚海鹏团队AI蛋白工程模型登Nature子刊

编辑 | KX准确预测蛋白质突变效应在蛋白质工程和设计中至关重要。 近日,清华大学龚海鹏团队提出了一套基于几何学习的模型套件——GeoStab-suite,其中包含 GeoFitness、GeoDDG 和 GeoDTm 三个模型,分别用于预测蛋白质突变后的适应度得分、ΔΔG 和 ΔTm。 GeoFitness 采用专门的损失函数,允许使用深度突变扫描数据库中的大量多标记适应度数据对统一模型进行监督训练。
11/11/2024 4:37:00 PM
ScienceAI

一文揭开 NVIDIA CUDA 神秘面纱

Hello folks,我是 Luga,今天我们继续来聊一下人工智能生态相关技术 - 用于加速构建 AI 核心算力的 GPU 编程框架 - CUDA 。 CUDA,作为现代图形处理器(GPU)的计算单元,在高性能计算领域扮演着日益重要的角色。 通过将复杂的计算任务分解为数千个线程并行执行,CUDA 显著提升了计算速度,为人工智能、科学计算、高性能计算等领域带来了革命性的变革。
11/11/2024 4:36:41 PM
架构驿站

探讨营销技术的六个AI用例

随着营销越来越依赖数据,AI在营销技术(martech)行业中发挥着变革性作用。 从自动化日常任务到深入洞察客户行为,AI驱动的工具正在帮助营销人员在营销活动中实现更高的效率和精准度。 无论是优化广告支出、个性化客户体验还是增强预测分析,AI工具都在重塑企业与受众互动的方式。
11/11/2024 4:22:15 PM
Scott Clark

多模态大模型技术方向和应用场景

多模态大模型(Multimodal Large Language Models,MLLM)是一种结合了大型语言模型(LLM)和大型视觉模型(LVM)的深度学习模型,它们能够处理和理解多种类型的数据,如文本、图像和音频,从而在跨模态任务中展现出卓越的性能。 核心特点对于多模态输入-文本输出的典型 MLLM,其架构一般包括编码器、连接器以及 LLM。 如要支持更多模态的输出(如图片、音频、视频),一般需要额外接入生成器,如下图所示:MLLM 架构图模态编码器负责将原始的信息(如图片)编码成特征,连接器则进一步将特征处理成LLM 易于理解的形式,即视觉 Token。
11/11/2024 3:11:23 PM
天涯咫尺TGH

贝叶斯统计中常见先验分布选择方法总结

在贝叶斯统计中,选择合适的先验分布是一个关键步骤。 本文将详细介绍三种主要的先验分布选择方法:经验贝叶斯方法信息先验无信息/弱信息先验经验贝叶斯方法经验贝叶斯方法是一种最大似然估计(MLE)方法,通过最大化先验分布下数据的边际似然来估计先验分布的参数。 设X表示数据,θ表示参数,则经验贝叶斯估计可表示为:θ = argmax P(X|θ)信息先验信息先验是一种基于先前知识或以前研究结果,纳入了关于估计参数信息或信念的先验分布。
11/11/2024 3:02:16 PM
Ganesh Bajaj

自动驾驶界秋名山车神!CoRL杰出论文让自驾车学会漂移,机器人整出新活

今年的机器人顶会 CoRL 杰出论文,竟然帮自动驾驶车稳稳地完成了漂移。 先来个甜甜圈漂移热个身:然后,上点难度,来个「8 字」: 最后来个蛇形绕桩(Slalom,这次没有实体的桩)。 可以听见,在绕到一半的时候,工作人员忍不住欢呼了一下。
11/11/2024 2:59:00 PM
机器之心

RAG技术落地的两个问题及应对策略

什么是RAG? RAG的全称是检索增强生成(Retrieval-Augmented Generation,简称RAG),它结合了检索和和生成技术,通过整合检索系统和生成模型的优势,来提升模型生成文本的质量和上下文相关性。 这种技术主要是为了解决生成式模型在面对需要具体、实时或领域专业知识时可能产生的准确性不足和上下文不敏感的问题。
11/11/2024 2:23:11 PM
fxcc

两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

知识图谱(Knowledge Graphs)是一种结构化的,用于展示和管理信息,组织现实世界知识的形式。 其通常被表达为三元组形式(头实体,关系,尾实体)。 KGs 为问答系统、推荐系统和搜索引擎等各种实际应用提供了极其重要支持。
11/11/2024 2:20:00 PM
新智元