AI在线 AI在线

资讯列表

AI助力脑机接口研究,纽约大学突破性神经语音解码技术,登Nature子刊

作者 | 陈旭鹏 编辑 | ScienceAI由于神经系统的缺陷导致的失语会导致严重的生活障碍,它可能会限制人们的职业和社交生活。近年来,深度学习和脑机接口(BCI)技术的飞速发展为开发能够帮助失语者沟通的神经语音假肢提供了可行性。然而,神经信号的语音解码面临挑战。近日,纽约大学 VideoLab 和 Flinker Lab 的研究者开发了一个新型的可微分语音合成器,可以利用一个轻型的卷积神经网络将语音编码为一系列可解释的语音参数(如音高,响度,共振峰频率等)并通过可微分语音合成器重新合成语音。通过将神经信号映射到
4/16/2024 6:14:00 PM
ScienceAI

药物分子设计新策略,微软条件扩散模型DiffLinker登Nature子刊

编辑 | 紫罗药理学领域的化学空间高达 10^60,在广阔的化学空间中进行搜索,给药物设计带来了巨大的挑战。基于片段的药物发现一直是早期药物开发的有效范例。然而,该领域面临的一个挑战是,如何设计断开的感兴趣分子片段之间的连接子(linker),生成化学上合理的候选药物分子。在此,来自微软研究院科学智能中心(AI4Science)、洛桑联邦理工学院、牛津大学和 MIT 的研究团队,提出了一种用于分子 linker 设计的 E(3) 等变三维条件扩散模型 DiffLinker。与以前只能连接分子片段对的方法不同,新方法
4/16/2024 6:13:00 PM
ScienceAI

李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

如何复盘大模型技术爆发的这一年?除了直观的感受,你还需要一份系统的总结。今天,斯坦福 HAI 研究所发布了第七个年度的 AI Index 报告,这是关于人工智能行业现状的最全面的报告之一。访问地址:,人工智能的发展正以惊人的速度向前推进,开发人员每月都在制造出越来越强大、越来越复杂的模型。然而,尽管发展速度加快,人工智能行业在解决人们对人工智能可解释性的担忧以及对其对人们生活影响的日益紧张方面却进展甚微。在今年的报告中,斯坦福 HAI 研究所增加了有关负责任人工智能的扩展章节,有关科学和医学领域人工智能的新章节,以
4/16/2024 3:32:00 PM
机器之心

模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收

在深度学习时代,联邦学习(FL)提供了一种分布式的协作学习的方法,允许多机构数据所有者或客户在不泄漏数据隐私的情况下协作训练机器学习模型。然而,大多数现有的 FL 方法依赖于集中式服务器进行全局模型聚合,从而导致单点故障。这使得系统在与不诚实的客户打交道时容易受到恶意攻击。本文中,FLock 系统采用了点对点投票机制和奖励与削减机制,这些机制由链上智能合约提供支持,以检测和阻止恶意行为。FLock 理论和实证分析都证明了所提出方法的有效性,表明该框架对于恶意客户端行为具有鲁棒性。现今,机器学习(ML),更具体地说,
4/16/2024 3:24:00 PM
机器之心

Sora加入Adobe全家桶,视频改图加戏样样行:PR大更新预告

这就是生成式 AI 时代的视频编辑工具。Adobe 全家桶马上就要拥有最先进的生成式 AI 视频创作能力了。今天,Adobe 宣布了 Premiere Pro 全新版本的更新计划。其中包含为第三方 AI 视频生成模型添加插件,不论是 OpenAI 的 Sora 还是 Runway 的 Gen-2 和 Pika,很快都将出现在 Adobe 工具体系中可被人们所用。现在,基于 Adobe 自己的大模型 Firefly 的能力,你可以在视频素材上直接添加或减少内容。转场时感觉少点烘托背景的镜头?现在用 OpenAI 的
4/16/2024 3:19:00 PM
机器之心

OpenAI CEO、COO 首次“合体”对话:AI 成本可降至“接近零”

OpenAI CEO 阿尔特曼和 COO(首席运营官)布拉德・莱特凯普近日首次“合体”参与 YouTube 频道“20VC”的对话节目。IT之家附视频: 据钛媒体,阿尔特曼认为如今限制 AI 发展的关键是地缘政治、社会经济等方面的不稳定,这也有可能是“根本原因”。同时,他也表示,未来(人工智能)的计算成本将持续下降,AI 的价值将随着模型质量提升而不断上升。“OpenAI 可以将非常高质量的 AI 技术成本降至接近零,这将对世界上大多数事情非常有利。”我们正处于一场真正的、相当大的技术革命之中。AI 正在从非常有限
4/16/2024 3:17:16 PM
清源

DeepMind CEO 称谷歌计算能力优于微软,在 AI 领域的投入将超过千亿美元

DeepMind 首席执行官德米斯-哈萨比斯(Demis Hassabis)周一在温哥华举行的 TED 大会上被问及微软公司和 OpenAI 正在计划建造价值 1000 亿美元(当前约 7250 亿元人民币)的超级计算机 “星际之门”(Stargate),他表示谷歌在人工智能领域的投入未来将超过 1000 亿美元。哈萨比斯回答说:“我们不谈论具体数字,但我认为随着时间的推移,我们的投资会超过这个数字。”他没有透露具体的支出细节。他还表示 Alphabet 公司(IT之家备注:谷歌母公司)的计算能力优于包括微软在内的
4/16/2024 3:15:19 PM
沛霖(实习)

微软向阿联酋人工智能公司 G42 投资 15 亿美元,加速 AI 开发和全球扩张

感谢微软公司和阿联酋人工智能(AI)技术控股公司 G42 今天宣布,微软将向 G42 战略投资 15 亿美元(当前约 108.75 亿元人民币)。此次投资将加强两家公司的合作,将微软最新的人工智能技术和技能培训计划带到阿联酋和世界其他国家。作为扩大合作的一部分,微软公司副董事长兼总裁布拉德-史密斯(Brad Smith)将加入 G42 董事会。史密斯表示:“两家公司不仅将在阿联酋合作,还将把人工智能和数字基础设施及服务带到服务不足的国家。我们将与阿联酋和美国政府密切协调,将世界一流的技术与世界领先的安全、可信和负责
4/16/2024 2:44:25 PM
沛霖(实习)

OpenAI 推出 Batch 批处理 API:半价折扣,24 小时内输出结果

感谢OpenAI 今天凌晨面向开发者推出 Batch 批处理 API,可在 24 小时内给出结果,并提供 API 半价折扣。新的 Batch API 适用于异步任务处理,如当开发者需要处理大量文本、图片、摘要时,就可以使用该 API,OpenAI 会在 24 小时内给出处理结果。这样 OpenAI 可以在非高峰期处理,节约服务器资源,并为开发者提供半价优惠,解锁更高的速率限制。新的 Batch API 支持使用以下模型:gpt-3.5-turbogpt-3.5-turbo-16kgpt-4gpt-4-32kgpt-
4/16/2024 2:39:32 PM
泓澄(实习)

DeepMind升级Transformer,前向通过FLOPs最多可降一半

引入混合深度,DeepMind 新设计可大幅提升 Transformer 效率。Transformer 的重要性无需多言,目前也有很多研究团队致力于改进这种变革性技术,其中一个重要的改进方向是提升 Transformer 的效率,比如让其具备自适应计算能力,从而可以节省下不必要的计算。正如不久前 Transformer 架构的提出之一、NEAR Protocol 联合创始人 Illiya Polosukhin 在与黄仁勋的对话中说到的那样:「自适应计算是接下来必须出现的。我们要关注,在特定问题上具体要花费多少计算资
4/16/2024 2:31:00 PM
机器之心

被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。 从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最大的一个,被调侃为「庞然大物」。 然而,有研究人员测试却发现,参数规模量如此巨大的 Grok-1 ,效果竟然只与 Mistral AI 的 8x7B MoE 模型相当。
4/16/2024 2:28:00 PM
王悦

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]。从国际顶流 GPT-4 128K、Claude 200K 到国内「当红炸子鸡」支持 200 万字上下文的 Kimi Chat,大语言模型(LLM)在长上下文技术上不约而同地卷起来了。当全
4/16/2024 2:26:00 PM
机器之心

百度发布“全球首个 AI 原生操作系统”DuerOS X,用于小度音箱等

感谢在今日举行的 Create 2024 百度 AI 开发者大会上,小度科技宣布推出“全球首个 AI 原生操作系统”DuerOS X。据介绍,该系统基于百度文心大模型进行了全面升级,在多模态感知和拟人化呈现方面有了“重要突破”。通过 DuerOS X,小度的人机交互体验将实现“质的飞跃”,为用户提供更加自然、智能的交互方式。DuerOS 是百度在 2017 年推出的首个对话式人工智能操作系统,目前用于小度智能音箱等产品,已经迭代到 7.0 版本,DuerOS X 将迎来更多 AI 功能升级。DuerOS X 融合百
4/16/2024 12:47:56 PM
汪淼

刷爆多模态任务榜单!贾佳亚团队Mini-Gemini登热榜,代码、模型、数据全部开源

Mini-Gemini 堪比 GPT4 DALLE3 王炸组合。更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力,还能结合图像推理和生成,香港中文大学终身教授贾佳亚团队提出的这款多模态模型 Mini-Gemini 堪称绝绝子,相当于开源社区的 GPT4 DALLE3 的王炸组合!Github 地址: 地址: ::: 还提供了 2B 小杯到 34B 的超大杯,最强模型在多个指标上相比 Google Gemini Pro 甚至 GPT-4V 都不遑多让。目前,Mini-Gemini 从代码、模型、到数据
4/16/2024 11:41:00 AM
机器之心

多篇顶会一作却申博失败?斯坦福博士生亲述:AI领域太卷

「尽管我在顶级 ML 会议上发表了多篇一作论文,为开源项目做出了贡献,也在业界产生了影响,但我仍在为进入博士课程而苦苦挣扎。我被顶尖大学拒之门外,感到迷茫和疲惫。」「我开始怀疑自己,怀疑如果没有合适的人脉或家庭背景,光有强大的研究背景是否还不够。我正在考虑放弃攻读博士学位以及从事有价值研究的梦想。」在刚刚过去的周末,关于「AI 博士申请条件卷上天」的帖子成为了 Reddit 社区讨论的焦点。这个帖子的作者在 EMNLP、NeurIPS、ACM、ACL 等顶级会议和研讨会上以第一作者发表了多篇研究论文,也被公司评为过
4/16/2024 11:35:00 AM
机器之心

陶哲轩力荐、亲自把关:AI for Math照这个清单学就对了

在 AI for Math 领域,如果你一直找不到合适的资源,这份清单或许会有帮助。刚刚,著名数学家陶哲轩的个人博客又更新了,这次他们整理了一份有用的资源列表,该资源专注于 AI for Math,专为那些希望进入数学 AI 领域的人提供帮助。这份清单发起时间最早可追溯到去年,发起机构由美国国家科学院、工程院和医学院组织的研讨会「人工智能辅助数学推理」提出,陶哲轩担任研讨会主持人。目前,网址资源已经公开。网址:,这是一个初步的资源列表,最初由 UIUC 教授 Talia Ringer 整理,供那些希望进入 AI 数
4/16/2024 11:27:00 AM
机器之心

「音乐界Sora」Udio来了:前DeepMind员工创业,比Suno可定制性更强

我们已经看到,AI 已经能够理解和生成文本、图像、视频,尽管各个产品目前能达到的准确性和审美水准还不相同。自带曲谱的音乐生成似乎是 AI 要征服的下一座山峰,而这场竞争正在白热化。近日,音乐生成领域再次迎来新玩家「Udio」。与前段时间大火的 Suno V3 相似,Udio 仅通过一些人工输入的文本提示(包括用户提供的歌词),就可以创建高保真音乐音频。但它拥有比 Suno 更多的自定义能力,风格涵盖乡村音乐、理发店四重唱(Barbershop)、德国流行乐(German pop)、古典音乐、硬摇滚、嘻哈、演唱曲调等
4/16/2024 11:23:00 AM
机器之心

一阶优化算法启发,北大林宙辰团队提出具有万有逼近性质的神经网络架构的设计方法

以神经网络为基础的深度学习技术已经在诸多应用领域取得了有效成果。在实践中,网络架构可以显著影响学习效率,一个好的神经网络架构能够融入问题的先验知识,稳定网络训练,提高计算效率。目前,经典的网络架构设计方法包括人工设计、神经网络架构搜索(NAS)[1]、以及基于优化的网络设计方法 [2]。人工设计的网络架构如 ResNet 等;神经网络架构搜索则通过搜索或强化学习的方式在搜索空间中寻找最佳网络结构;基于优化的设计方法中的一种主流范式是算法展开(algorithm unrolling),该方法通常在有显式目标函数的情况
4/16/2024 11:17:00 AM
机器之心