AI在线 AI在线

数据

Bengio参与的首个《AI安全指数报告》出炉,最高分仅C、国内一家公司上榜

图片安全话题,在人工智能(AI)行业一向备受关注。 尤其是诸如 GPT-4 这样的大语言模型(LLM)出现后,有不少业内专家呼吁「立即暂停训练比 GPT-4 更强大的人工智能模型」,包括马斯克在内的数千人纷纷起身支持,联名签署了一封公开信。 这封公开信便来自生命未来研究所(Future of Life Institute),该机构由麻省理工学院教授、物理学家、人工智能科学家、《生命 3.0》作者 Max Tegmark 等人联合创立,是最早关注人工智能安全问题的机构之一,其使命为 “引导变革性技术造福生活,避免极端的大规模风险”。
12/16/2024 2:20:00 PM
机器之心

NeurIPS神仙打架:李飞飞180页PPT谈视觉智能,Bengio同OpenAI员工吵架,何恺明谈AI宿命论

李飞飞最新采访来了,继续延伸她在NeurIPS有关视觉智能的话题。 她表示,解决空间智能问题是迈向全面智能化的基础和关键一步。 不过从现场传出的NeurIPS演讲PPT中竟然有写:AI将取代人类?
12/13/2024 3:00:00 PM
量子位

再也不怕显存爆炸了!高效重建「几何精准」的大规模复杂三维场景,中科院提出CityGaussianV2

三维场景重建旨在基于围绕目标场景拍摄的一组图像恢复出场景的三维结构,其核心追求是精准的几何结构以及逼真的图像渲染。 随着近两年的发展,3D Gaussian Splatting(3DGS)因其训练和渲染效率上的优势逐渐成为该领域的主流算法。 这一技术使用一组离散的高斯椭球来表示场景,并使用高度优化的光栅器进行渲染。
12/13/2024 1:00:00 PM
新智元

扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性

扩散模型和流匹配实际上是同一个概念的两种不同表达方式吗? 从表面上看,这两种方法似乎各有侧重:扩散模型专注于通过迭代的方式逐步去除噪声,将数据还原成清晰的样本。 而流匹配则侧重于构建可逆变换系统,目标是学习如何将简单的基础分布精确地映射到真实数据分布。
12/13/2024 12:07:15 PM
机器之心

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

传闻反转了,Claude 3.5 Opus没有训练失败。 只是Anthropic训练好了,暗中压住不公开。 semianalysis分析师爆料,Claude 3.5超大杯被藏起来,只用于内部数据合成以及强化学习奖励建模。
12/12/2024 2:10:00 PM
量子位

一周发明GAN!时间检验奖得主分享背后故事:每件发明都不是最后的发明

引用超85000次的经典论文GAN获NeurIPS2024时间检验奖后,它的起源和背后故事也被抛了出来。 要从Yoshua Bengio实验室的一次头脑风暴说起。 Bengio召集实验室成员,提出了一个富有挑战性的设想:训练一个确定性的生成网络g,该网络仅在输入z中包含随机噪声。
12/11/2024 2:10:00 PM
量子位

数据不够?Meta刚刚发布的Llama 3.3正好拿来搞定!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)7日凌晨,Meta 推出了 Llama 3.3。 虽然参数没有太高,只有700亿参数,但与之前开源的Llama 3.1 4050亿参数模型性能相当,而推理、部署成本却降低了很多。 例如,输入成本降低了10倍,输出成本降低了近5倍。
12/9/2024 5:32:37 PM
言征

白话告诉你大模型到底是怎么工作的

图片本文转载自微信公众号「程序反思录」,作者程序反思录 。 转载本文请联系程序反思录公众号。 前言2022年底“大模型”在国内突然遍地开花,不管你身处什么行业,都或多或少听说或使用过大模型相关的工具,也听说过大模型训练是一件超级烧钱的事情。
12/9/2024 9:55:25 AM
程序反思录

陶哲轩对谈OpenAI高管:AI也能做数据稀疏推理,“也许很快OpenAI就能证明陶哲轩是错的”

“也许很快OpenAI将能证明陶哲轩是错的。 ”好家伙! 隔着屏幕都能闻到“硝烟”味了(bu shi~事情是这样的。
12/9/2024 9:35:00 AM
量子位

快速学会一个算法,卷积神经网络!!!

今天给大家分享一个强大的算法模型,卷积神经网络。 卷积神经网络(CNN)是一类专门用于处理具有网格结构数据(如图像)的深度学习模型,广泛应用于图像处理、计算机视觉等领域。 CNN 通过模仿生物视觉系统的结构,通过层级化的卷积和池化操作,自动从输入数据中提取特征并进行分类或回归。
12/4/2024 10:33:17 AM
程序员小寒

Andrej Karpathy 首次公开私人邮件:揭秘Transformer 注意力机制真相

近年来,Transformer 成为深度学习领域的绝对主角,而支撑其核心的“注意力”机制更是掀起了一场革命。 但这项改变 AI 格局的技术究竟是如何诞生的? Andrej Karpathy 分享了与“注意力”机制最初开发者 Dzmitry Bahdanau 的私人邮件,首次披露了这段被误解和简化的历史。
12/4/2024 9:25:00 AM

让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命

在实际应用中,数据集的数据分布往往随着时间而不断变化,预测模型需要持续更新以保持准确性。 时域泛化旨在预测未来数据分布,从而提前更新模型,使模型与数据同步变化。 然而,传统方法假设领域数据在固定时间间隔内收集,忽视了现实任务中数据集采集的随机性和不定时性,无法应对数据分布在连续时间上的变化。
12/2/2024 2:35:01 PM

谷歌推出 Caravan MultiMet,利用各种气象数据增强水文预报

编辑 | KX大样本水文学致力于解决紧迫的全球挑战,例如气候变化、洪水预测和水资源管理。 通过利用不同地区的大量水文和气象信息数据集,研究人员开发了预测与水有关的现象的模型。 这有助于保护社区和生态系统免受与水有关的挑战。
11/28/2024 3:08:00 PM
ScienceAI

超越GPT-4o!开源科研神器登场,4500万篇论文检索增强生成靠谱回答

只需几秒钟,开源模型检索4500篇论文,比GPT-4o还靠谱! 这就是由华盛顿大学和艾伦人工智能研究所(Ai2)打造的最新模型OpenScholar。 它还是首个从论文到数据集、模型检查点都完全开源的科研助手模型。
11/26/2024 2:30:00 PM
量子位

AI智能体失控时,谁来负责?

保护AI堆栈中的数据意味着了解数据流向何处以及防止滥用。 译自Who’s Responsible When AI Agents Go Rogue?,作者 Vrajesh Bhavsar。 无论您身处科技界还是与家人共进晚餐,如今都无法逃脱AI的影响。
11/26/2024 12:14:08 AM
岱军

指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务

在大语言模型(LLMs)不断发展的背景下,如何评估这些模型在多轮对话和多语言环境下的指令遵循(instruction following)能力,成为一个重要的研究方向。 现有评估基准多集中于单轮对话和单语言任务,难以揭示复杂场景中的模型表现。 最近,Meta GenAI团队发布了一个全新基准Multi-IF,专门用于评估LLM在多轮对话和多语言指令遵循(instruction following)中的表现,包含了4501个三轮对话的多语言指令任务,覆盖英语、中文、法语、俄语等八种语言,以全面测试模型在多轮、跨语言场景下的指令执行能力。
11/25/2024 3:30:00 PM
新智元

20种复杂Excel操作一句话搞定!北大ChatExcel全新升级,所有人免费可用

AI做Excel表,现在next level了——北大团队ChatExcel最新升级,一句话搞定线性分析,图表、文字总结全都有。 比如分析各地区数据增长与时间之间是否存在相关性。 它清晰列出具体步骤计划:先对数据预处理,计算每年增长率,绘制各地区增长率和时间的折线图,最后进行分析。
11/25/2024 10:12:00 AM
量子位

RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势

受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接外部数据源,检索增强生成(RAG)技术也逐渐获得业内的关注。 但并不是接入外部数据即可万事大吉,有很多用户查询非常难处理,从检索相关数据、准确解释用户意图,再到充分利用LLMs的推理能力都需要进行优化处理,才能得到一个相对满意的RAG系统来执行复杂任务,并不存在一种万能的解决方案。 在实践中,如果RAG效果不佳,通常是由于未能准确识别任务的核心问题,或者是因为该任务本身就需要混合多种技术才能解决,必须将复杂任务拆解开才能获得更好的表现。
11/21/2024 3:20:00 PM
新智元