AI在线 AI在线

机器学习

AI重塑医疗保健领域的消费者体验中的潜力、挑战与策略

AI驱动的解决方案能够从以往难以获取的数据中挖掘出有价值的见解,并以前所未有的规模实现消费者互动和个性化服务,从而提升医疗行业的业务成果。 在快速变化的医疗领域,AI有潜力重塑消费者与医疗服务的互动方式。 如今,美国的消费者在寻找合适的保险覆盖、了解何时应就医、就医费用以及如何管理自身健康等方面面临诸多困难。
11/19/2024 3:01:31 PM
Jenny Cordina

传说中Ilya Sutskever精选论文清单:AI领域40大论文完整版「破解」完成

今年 5 月,一份网传 OpenAI 联合创始人兼首席科学家 Ilya Sutskever 整理的一份机器学习研究文章清单火了。 网友称「Ilya 认为掌握了这些内容,你就了解了当前(人工智能领域) 90% 的重要内容。 」据说这份论文清单是 2020 年 OpenAI 的联合创始人、首席科学家 Ilya Sutskever 给另一位计算机领域大神,id Software 联合创始人,致力于转行 AGI 的 John Carmack 编写的。
11/16/2024 1:35:00 PM
机器之心

克服机器学习转换器的局限性——从位置嵌入到RoPE和ALiBi方法

译者 | 朱先忠审校 | 重楼引言近年来开发出的机器学习模型的指数级进步与转换器架构的出现密切相关。 以前,人工智能科学家必须先为手头的每项任务选择架构,然后再进行超参数优化以获得最佳性能。 限制科学家们潜力的另一个挑战是难以处理数据的长期依赖性,难以解决梯度消失、长序列上下文丢失以及因局部约束而无法捕获全局上下文的问题。
11/12/2024 8:20:25 AM
朱先忠

量子计算和人工智能融合如何开启新技术革命

译者 | 晶颜审校 | 重楼量子计算与经典人工智能的融合势不可挡! 量子计算和人工智能(AI)的融合代表了计算科学中最有前景的前沿之一。 作为量子计算研究科学家,我们正站在一个新时代的崖边,在这个新时代,量子系统的独特能力正被用于增强和加速传统的人工智能算法,而人工智能技术同时被用于优化量子电路并减轻嘈杂的中等规模量子(NISQ)设备中的误差。
11/6/2024 5:17:40 PM
晶颜

终于把机器学习中的损失函数搞懂了!!!

Mean Squared Error (MSE)MSE 是回归任务中最常用的损失函数之一。 它衡量模型预测值与实际值之间的平均平方误差。 公式:特点:对于大的误差,MSE 会给出更大的惩罚,因为误差被平方。
11/5/2024 12:56:06 PM
小寒

一种实现符号钢琴音乐声音和谱表分离的GNN新方法

译者 | 朱先忠审校 | 重楼本文涵盖了我最近在ISMIR 2024上发表的论文《聚类和分离:一种用于乐谱雕刻的声音和谱表预测的GNN方法》的主要内容。 简介以MIDI等格式编码的音乐,即使包含量化音符、拍号或小节信息,通常也缺少可视化的重要元素,例如语音和五线谱信息。 这种限制也适用于音乐生成、转录或编曲系统的输出。
11/5/2024 8:19:11 AM
朱先忠

深入理解多重共线性:基本原理、影响、检验与修正策略

在数据科学和机器学习领域,构建可靠且稳健的模型是进行准确预测和获得有价值见解的关键。 然而当模型中的变量开始呈现出高度相关性时,就会出现一个常见但容易被忽视的问题 —— 多重共线性。 多重共线性是指两个或多个预测变量之间存在强相关性,导致模型难以区分它们对目标变量的贡献。
11/4/2024 3:56:21 PM
佚名

使用 SHAP 使机器学习模型变的可解释!!

SHAP 是一种解释机器学习模型预测结果的方法,它基于博弈论中的 Shapley 值理论。 它通过计算每个特征对模型输出的贡献度,帮助我们理解模型的决策过程。 SHAP 适用于各种类型的机器学习模型,使得黑盒模型(如深度神经网络、随机森林等)的预测更加透明、可解释。
11/4/2024 2:33:04 PM
程序员小寒

十种数据预处理中的数据泄露模式解析:识别与避免策略

在机器学习教学实践中,我们常会遇到这样一个问题:"模型表现非常出色,准确率超过90%!但当将其提交到隐藏数据集进行测试时,效果却大打折扣。 问题出在哪里?"这种情况几乎总是与数据泄露有关。 当测试数据在数据准备阶段无意中泄露(渗透)到训练数据时,就会发生数据泄露。
11/4/2024 2:09:09 PM
Samy Baladram

Gartner认为企业必须探索的十大战略科技趋势

分析机构Gartner提出了2025年企业“需要探索”的十大战略技术趋势,其中一些趋势涉及人工智能,还有一些涉及数据管理和存储领域。 Gartner杰出的副总裁Gene Alvarez表示:“今年的十大战略技术趋势涉及人工智能的必要性和风险、计算的新前沿以及人机协同,”“跟踪这些趋势将有助于 IT 领导者以负责任并合乎道德的创新塑造组织的未来。 ”2025年最重要的战略技术趋势是:人工智能代理(Agentic AI)——人工智能代理系统可自主规划并采取行动,以实现用户定义的目标。
11/4/2024 1:44:39 PM
佚名

基于关系型深度学习的自助机器学习

译者 | 朱先忠审校 | 重楼本文将探讨直接在关系数据库上执行机器学习的新方法——关系型深度学习。 本文示例项目数据集的关系模式(作者提供图片)在本文中,我们将深入探讨一种有趣的深度学习(DL)新方法,称为关系型深度学习(RDL)。 我们还将通过在一家电子商务公司的真实数据库(不是数据集!
11/4/2024 8:14:48 AM
朱先忠

速度提高1000万倍,AI快速准确预测等离子体加热,助力核聚变研究

编辑 | 白菜叶用于等离子体加热的新型人工智能(AI)模型所能做的事情超出了人们之前的想象,不仅可以在保持准确性的情况下将预测速度提高 1000 万倍,而且还可以在原始数值代码失效的情况下正确预测等离子体加热。「凭借我们的智能,我们可以训练人工智能超越现有数值模型的限制。」美国能源部 (DOE) 普林斯顿等离子体物理实验室 (PPPL) 的副研究员、物理学家 Álvaro Sánchez-Villar 说道。
10/21/2024 3:01:00 PM
ScienceAI

Nature子刊,基于量子实验数据进行机器学习,用于解决量子多体问题

编辑 | 萝卜皮量子硬件实现方面的进步使得人们能够获取传统计算机无法模拟的数据。将传统机器学习 (ML) 算法与这些数据相结合,有望揭示隐藏的模式。与仅使用传统计算机相比,这种混合方法扩展了可有效解决的问题类别,但由于当前量子计算机中噪声的普遍存在,这种方法仅能用于解决受限问题。韩国首尔大学(Seoul National University)的研究人员扩展了混合方法的适用性,用于解决多体物理学中的挑战,例如预测给定哈密顿量的基态性质以及对量子相进行分类。通过在具有 127 个量子比特的超导量子硬件上进行各种减少误
10/10/2024 12:08:00 PM
ScienceAI

「可损伤编程设计」的超材料,上海交大团队用AI实现材料的自然抗裂机制

编辑 | 萝卜皮人造超材料的断裂行为往往会导致灾难性的破坏,并且对裂纹扩展的抵抗力有限。相比之下,骨头和陶瓷等天然材料具有微观结构,可产生空间可控的裂纹路径,并且增韧材料对裂纹的抵抗力会提高。上海交通大学的研究人员提出了一种受自然强化机制启发的方法,旨在开发一种系统的设计方法,使损伤可编程超材料能够在细胞中具有可工程化的微纤维,从而能够在空间上编程微尺度裂纹行为。机器学习可用于提供有效的设计引擎,加速生成可损伤可编程单元,该单元提供先进的增韧功能,如天然材料中的裂纹弯曲、裂纹偏转和屏蔽;并针对给定的裂纹路径编程进行
9/19/2024 4:16:00 PM
ScienceAI

ML如何推动结构生物学的发展?哈佛科学家用AI在最小尺度上研究人类发育

编辑 | 白菜叶对于结构生物学家 Lucas Farnung 来说,没有比单个受精卵如何发育成一个功能齐全的人类更令人着迷的问题了。他正努力在最小尺度上研究这一过程:数万亿个原子必须同步工作才能实现这一过程。「我看不出解决 5,000 块拼图和我们在实验室进行的研究有什么大区别。」哈佛医学院布拉瓦尼克研究所(Blavatnik Institute at Harvard Medical School)细胞生物学助理教授 Farnung 说,「我们试图从视觉上弄清楚这个过程是什么样子,然后我们就可以形成关于它如何运作的
7/19/2024 4:09:00 PM
ScienceAI

谷歌机器人专家:机器人在现实中碰过的壁,AI也会碰

「机器学习一直生活在一个令机器人专家、化学家、生物学家和神经科学家羡慕不已的泡沫中,随着它真正开始发挥作用,我们所有人都将遇到其他人多年来一直在应对的同样的现实壁垒。」有人说,机器人领域进展缓慢,甚至和机器学习的其他子领域相比显得毫无进展。谷歌 DeepMind 机器人科学家,SayCan、RT-1、RT-2 等具身智能项目参与者 Alex Irpan 同意这一说法。但他认为,这是因为机器人学是一个和现实紧密连接的领域,现实的复杂性决定了他们不免碰壁。他还指出,这些问题不是机器人技术所独有的。同样的问题也适用于大语
7/16/2024 3:04:00 PM
机器之心

登Science,药物亲和力增加37倍,AI对蛋白、抗体复合物进行无监督优化

编辑 | 萝卜皮蛋白质参与了细胞组成、肌肉收缩、消化食物、识别病毒等众多生物学功能。为了设计出更好的蛋白质(包括抗体),科学家经常在不同位置反复变异氨基酸(按一定顺序排列组成蛋白质的单位),直到使蛋白质获得所需要的功能。但氨基酸序列的数量比世界上的沙粒还要多,因此找到最佳蛋白质,进而找到最佳潜在药物,通常难度巨大。当面临这一挑战时,科学家通常会花费数百万美元,并在微型化、简化版的生物系统中进行测试。「这需要大量的猜测和验证。」斯坦福大学(Stanford University)化学工程助理教授兼 Arc 研究所创新
7/15/2024 5:36:00 PM
ScienceAI

Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI

编辑 | 萝卜皮OpenAI 的 GPT 和 Meta AI 的 Llama 等大型语言模型 (LLM),因其在化学信息学领域的潜力而日益受到认可,特别是在理解简化分子输入行输入系统(SMILES)方面。这些 LLM 还能够将 SMILES 字符串解码为矢量表示。加拿大温莎大学(University of Windsor)的研究人员比较了 GPT 和 Llama 与 SMILES 上的预训练模型在下游任务中嵌入 SMILES 字符串的性能,重点关注两个关键应用:分子特性预测和药物-药物相互作用预测。该研究以「Can
7/11/2024 11:51:00 AM
ScienceAI