AI在线 AI在线

语言模型

AI能夺走网文界的一切吗?

AI好好用原创作者:Pandora写网络小说,手拿把掐? 还差得远呢。 AI 学者拿下诺贝尔物理学奖、化学奖后,网友纷纷揶揄说:下一个被 AI 攻陷的诺奖会是 ......
11/8/2024 6:12:00 PM
AI好好用

AI搞科研?西湖大学发布「AI科学家」Nova,效果比SOTA竞品提升2.5倍

编辑 | ScienceAI伟大科学家的研究,往往开始于一个小的灵感、小的创意。 长久以来,科学创新与研究能力被视为人类在人工智能时代中坚守的一片独特领地。 然而,一篇来自西湖大学深度学习实验室的论文在科学界掀起了波澜。
10/24/2024 11:55:00 AM
ScienceAI

成功率提升15%,浙大、碳硅智慧用LLM进行多属性分子优化,登Nature子刊

编辑 | 萝卜皮优化候选分子的物理化学和功能特性一直是药物和材料设计中的一项关键任务。 虽然人工智能很适合处理平衡多个(可能相互冲突的)优化目标的任务,但是例如多属性标记训练数据的稀疏性等技术挑战,长期以来阻碍了解决方案的开发。 在最新的研究中,浙江大学侯廷军团队、中南大学曹东升团队以及碳硅智慧团队联合开发了一种分子优化工具 Prompt-MolOpt。
10/23/2024 2:06:00 PM
ScienceAI

如何用生成式 AI 定义我们的未来?看看微软怎么说

编辑 | 紫罗人工智能(AI)当下及未来的进步,意味着它在解决先前被视为棘手难题的能力上实现了阶段性的转变。鉴于这一巨大的技术飞跃,现在是我们必须定义未来轨迹的时候了。随着公司继续创新人工智能系统并将其集成到当前产品中,我们有责任问自己:我们想要构建的未来是什么?作为一个社会,我们必须采取立场并定义我们想要的人与人工智能系统之间的关系。我们仍处于人工智能革命的早期阶段,因此现在将我们的轨迹设定在一条认真负责的道路上比以后纠正我们的路线更容易。我们可以有意识地设计、构建和使用人工智能系统,使其成为社会中的一种平衡力量
10/6/2024 7:56:00 PM
ScienceAI

「两全其美」,从头设计分子,深度学习架构S4用于化学语言建模

编辑 | KX生成式深度学习正在重塑药物设计。化学语言模型 (CLM) 以分子串的形式生成分子,对这一过程尤为重要。近日,来自荷兰埃因霍芬理工大学(Eindhoven University of Technology)的研究人员将一种最新的深度学习架构(S4)引入到从头药物设计中。结构化状态空间序列(Structured State Space Sequence,S4)模型在学习序列的全局属性方面表现卓越,那么 S4 能否推进从头设计的化学语言建模?为了给出答案,研究人员系统地在一系列药物发现任务上对 S4 与最先
8/2/2024 3:20:00 PM
ScienceAI

为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架

编辑 | ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choice questions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答(openQA
7/24/2024 2:36:00 PM
ScienceAI

还在满网页扒资料?实测Kimi官方浏览器插件,颈椎这下有救了

机器之能报道编辑:杨文小编们的码字「神器」。Kimi,兵贵神速。前段时间,文风检测器在小红书上风靡一时,Kimi 立马推出该功能。这两天,Kimi 又在悄么声息地搞事情,偷偷上线官方浏览器插件。其实,早前就有个名叫「Kimi Copilot」的插件备受好评,只不过,这是由第三方开发者制作。而此次 Kimi 亲自下场,甩出官方浏览器插件,并为网页用户带来多项新功能。比如:对页面中部分内容划线提问;总结页面内容并生成摘要等。此外,插件还支持全局浮窗和侧边栏两种展示方式,用户可自行切换。我们实测后发现,这款插件简直是苦逼
7/10/2024 11:22:00 AM
机器之能

专为五大科学领域定制,NASA与IBM合作开大语言模型INDUS

INDUS 以南天星座命名,是一套全面的大型语言模型,支持五个科学领域。(来源:NASA)编辑 | KX在大量数据上训练的大型语言模型 (LLM) 在自然语言理解和生成任务上表现出色。大多数流行的 LLM 使用 Wikipedia 等通用语料库进行训练,但词汇的分布变化导致特定领域的性能不佳。受此启发,NASA 与 IBM 合作开发了 INDUS,这是一套全面的 LLM,专为地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学领域量身定制,并使用从不同数据源的精选科学语料库进行训练。INDUS 包含两类模型:
6/27/2024 5:23:00 PM
ScienceAI

多模态AI是医学的未来,谷歌推出三个新模型,Med-Gemini迎来大升级

编辑 | 白菜叶许多临床任务需要了解专业数据,例如医学图像、基因组学,这类专业知识信息在通用多模态大模型的训练中通常不存在。在上一篇论文的描述中,Med-Gemini 在各种医学成像任务上超越 GPT-4 系列模型实现了 SOTA!在这里,Google DeepMind 撰写了第二篇关于 Med-Gemini 的论文。在 Gemini 的多模态模型的基础上,该团队为 Med-Gemini 系列开发了多个模型。这些模型继承了 Gemini 的核心功能,并通过 2D 和 3D 放射学、组织病理学、眼科、皮肤病学和基因组
5/13/2024 3:58:00 PM
ScienceAI

【论文解读】System 2 Attention提高大语言模型客观性和事实性

一、简要介绍 本文简要介绍了论文“System 2 Attention (is something you might need too) ”的相关工作。基于transformer的大语言模型(LLM)中的软注意很容易将上下文中的不相关信息合并到其潜在的表征中,这将对下一token的生成产生不利影响。为了帮助纠正这些问题,论文引入了System 2 Attention(S2A),它利用LLM的能力,用自然语言进行推理,并遵循指示,以决定要处理什么。S2A重新生成输入上下文以使输入上下文只包含相关部分,然后再处理重新
5/11/2024 11:03:00 AM
合合信息

获ICLR 2024杰出论文奖,97.47%体外成功率,蛋白质设计新算法

编辑 | 紫罗在今年的 ICLR 会议上,共评选出 5 篇杰出论文奖以及 11 篇荣誉提名。纽约大学和基因泰克(Genentech)合作发表的一篇关于蛋白质设计的研究论文获得杰出论文奖。这篇论文解决了基于序列的抗体设计问题,这是蛋白质序列生成模型的一个及时而重要的应用。为此,研究人员引入了一种创新而有效的新建模方法——离散「步行-跳跃」采样(Discrete Walk-Jump Sampling,dWJS)算法,用来专门针对处理离散蛋白质序列数据的问题。除了在计算机上验证该方法之外,还进行了广泛的湿实验室实验,来测
5/10/2024 2:08:00 PM
ScienceAI

AI可以改写人类基因组吗?首次由AI从头设计的基因编辑器成功编辑人类细胞中DNA

编辑 | 凯霞生成式 AI 可以对话、写诗、画图、做视频、作曲、写代码......那么,AI 可以改写人类基因组吗?现在,新的 AI 技术正在为可编辑 DNA 的微观生物机制绘制蓝图,这预示着未来科学家将以更高的精度和速度对抗疾病。近日,美国 AI 蛋白质设计初创公司 Profluence 推出了 OpenCRISPRTM 计划,发布了世界上第一个开源的 AI 生成的基因编辑器。Profluence 展示了通过 AI 从头开始设计的可定制基因编辑器,对人类基因组的首次成功精确编辑。该技术基于驱动 ChatGPT 的
4/23/2024 2:04:00 PM
ScienceAI

AI在用| 万万没想到,科技论文还能这么读

机器之能报道编辑:Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。   我们也欢迎读者投稿亲自实践的创新型用例。Claude 3 具有非常大的内存( 200k 上下文窗口)和很强的调用准确性,它的上下文能力也因此成为最受欢迎、应用最广的技能。我们介绍过如何利用这种能力,没时间收听播客也能获取核心内容。今天,我们再介绍一个新技能,
4/9/2024 3:56:00 PM
机器之能

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

编辑 | XS2023 年 11 月,Nature 连续刊登了两篇重大成果:蛋白质生成方法 Chroma 和晶体材料设计方法 GNoME,均使用了图神经网络作为科学数据的表示工具。实际上,图神经网络,特别是几何图神经网络,一直是科学智能(AI for Science)研究的重要工具。这是因为,科学领域中的粒子、分子、蛋白质、晶体等物理系统均可被建模成一种特殊的数据结构——几何图。与一般的拓扑图不同,为了更好描述物理系统,几何图加入了不可或缺的空间信息,需要满足平移、旋转和翻转的物理对称性。鉴于几何图神经网络对于物理
3/7/2024 4:17:00 PM
ScienceAI

计算蛋白质工程最新SOTA方法,牛津团队用密码子训练大语言模型

编辑 | 萝卜皮来自深度语言模型的蛋白质表征,已经在计算蛋白质工程的许多任务中表现出最先进的性能。近年来,进展主要集中在参数计数上,最近模型的容量超过了它们所训练的数据集的大小。牛津大学(University of Oxford)的研究人员提出一个替代方向。他们证明,在密码子而不是氨基酸序列上训练的大型语言模型可以提供高质量的表征,并且在各种任务中都优于同类最先进的模型。在某些任务中,例如物种识别、蛋白质和转录本丰度预测等,该团队发现,基于密码子训练的语言模型优于所有其他已发布的蛋白质语言模型,包括一些包含超过 5
3/4/2024 4:20:00 PM
ScienceAI

解开化学语言模型中的「黑匣子」,Transformer可快速学习分子的部分结构,但手性学习困难

编辑 | X近年来,自然语言处理(NLP)模型,特别是 Transformer 模型,已应用于像 SMILES 这样的分子结构的文字表示。然而,关于这些模型如何理解化学结构的研究很少。为了解决这个黑匣子,东京大学的研究人员使用代表性的 NLP 模型 Transformer 研究了 SMILES 的学习进度与化学结构之间的关系。研究表明,虽然 Transformer 可以快速学习分子的部分结构,但它需要扩展训练才能理解整体结构。一致的是,从训练开始到结束,使用不同学习步骤的模型生成的描述符进行分子特性预测的准确性是相
2/26/2024 4:42:00 PM
ScienceAI

首次大规模多语言评估,支持7种语言,生物医学领域7B开源LLM

编辑 | X大语言模型 (LLM) 已应用于医疗保健和医学等专业领域。尽管有各种为健康环境量身定制的开源 LLM,但将通用 LLM 应用于医学领域仍存在重大挑战。近日,法国阿维尼翁大学(Avignon Université )、南特大学(Nantes Université)和 Zenidoc 的研究团队开发了 BioMistral,一个专为生物医学领域量身定制的开源 LLM,利用 Mistral 作为其基础模型,并在 PubMed Central 上进行了进一步的预训练。研究人员根据由 10 项既定的英语医学问答
2/21/2024 3:35:00 PM
ScienceAI

如果 LLM Agent 成为了科学家:耶鲁、NIH、Mila、上交等学者共同呼吁安全防范的重要性

最近的大型语言模型(LLMs)进步已经使我们处于革命性的时代,尤其是 LLMs 驱动的智能 Agents 在广泛任务中展现出了通用性和有效性。这些被称为「AI 科学家」的 Agent 已经开始探寻其在生物学和化学等各种领域内进行自主科学发现的潜力。此类 Agents 已经表现出了选择适合任务的工具,规划环境条件,以及实现实验自动化的能力。因此,Agent 可摇身一变成为真实的科学家,能够有效地设计和开展实验。在某些领域如化学设计中,Agent 所展现的能力已经超过了大部分非专业人士。然而,当我们享受着这种自动化 A
2/20/2024 11:54:00 AM
ScienceAI