AI在线 AI在线

自然语言处理

EMNLP 2025|vivo 等提出 DiMo-GUI:模态分治+动态聚焦,GUI 智能体推理时扩展的新范式

本文入选 EMNLP 2025 Main ConferenceEMNLP会议全称为Conference on Empirical Methods in Natural Language Processing,由国际计算语言学协会ACL举办,是自然语言处理和人工智能领域最重要的学术会议之一。 EMNLP 2025会议共有8174篇投稿,Main Conference接收率仅为22.16%。 项目主页:,针对多模态大语言模型(MLLMs)在复杂图形用户界面(GUI)定位任务中的挑战,通过动态视觉推理与模态感知优化显著提升性能。
9/4/2025 11:58:42 AM
互联网算法团队

腾讯开源翻译巨头 Hunyuan-MT-7B:斩获 WMT2025 三十项冠军,翻译界的新霸主!

近日,腾讯在 2025 年世界机器翻译大会(WMT2025)上表现惊艳,正式推出了他们的翻译大模型 ——Hunyuan-MT-7B。 这个模型在比赛中获得了 30 个语种的第一名,成为同类产品中的佼佼者,彰显了其强大的翻译能力。 Hunyuan-MT-7B 的成功不是偶然。
9/2/2025 9:07:02 AM
AI在线

记忆增强型Transformer:从神经科学原理到技术解决方案的三维解析

大家好,我是肆〇柒。 当下,Transformer架构已成为自然语言处理、计算机视觉和多模态学习的基石。 然而,随着应用场景的复杂化,标准Transformer暴露出三大关键局限:固定上下文窗口限制了长距离依赖建模静态知识表示阻碍了持续学习能力计算效率远低于生物神经系统这些限制催生了记忆增强型Transformer的研究热潮,而由新加坡国立大学等机构联合发表的系统性综述《Memory-Augmented Transformers: A Systematic Review from Neuroscience Principles to Technical Solutions》为我们提供了一个全面理解这一领域的三维分类框架。
8/25/2025 12:10:00 AM
肆零柒

终于把 LSTM 算法搞懂了!!

大家好,我是小寒今天给大家分享一个超强的算法模型,LSTM。 LSTM(长短期记忆网络,Long Short-Term Memory)是一种特殊的循环神经网络(RNN)算法,专门设计用来解决传统RNN在处理长序列数据时存在的梯度消失和梯度爆炸问题。 它通过引入细胞状态和门控机制,使得模型能够捕捉和保存长期依赖信息,从而有效地处理序列数据中的长期依赖关系。
7/15/2025 10:41:44 AM
程序员小寒

Shortcut横空出世!AI Excel助手10倍速碾压人类冠军,自动化任务效率飙升

近日,一款名为Shortcut的AI Excel助手在社交媒体上引发热议,其通过自然语言处理(NLP)技术,让用户无需编写复杂公式或VBA代码,即可轻松完成Excel任务。 AIbase编辑团队整理了社交媒体上的最新信息,为您深度解析Shortcut的强大功能及其对数据处理和财务建模领域的潜在影响。 Shortcut:自然语言驱动的Excel革命Shortcut被誉为“超人级Excel代理”(Superhuman Excel Agent),能够通过简单的自然语言指令完成复杂的Excel任务。
7/3/2025 6:00:47 PM
AI在线

​MIT 研究发现:使用 AI 写作工具或降低大脑活跃度

近日,麻省理工学院媒体实验室发布了一项新的研究,揭示了使用人工智能工具(如 ChatGPT)进行写作任务可能导致大脑活跃度降低。 该研究标题为《你在使用 ChatGPT 时的大脑:使用 AI 助手进行论文写作任务时的认知债务累积》。 图源备注:图片由AI生成,图片授权服务商Midjourney在这项研究中,研究人员分为三组进行实验:一组仅使用自己的大脑,另一组使用搜索引擎,最后一组使用大型语言模型(LLM),例如 ChatGPT。
7/3/2025 10:00:57 AM
AI在线

腾讯云推出全链路AI驱动应用开发平台“AI Builder”

近日,腾讯云正式推出了国内首个全链路AI驱动的应用开发平台——AI Builder,该平台通过自然语言处理技术,大幅降低了应用开发的门槛,让即便是没有技术背景的普通用户也能独立制作小程序或网页应用,为创意实现提供了强有力的支持。 在传统应用开发过程中,用户往往需要掌握编程语言、了解数据库设计、配置服务器等一系列复杂技能,这对于非专业开发者而言无疑是一道难以逾越的门槛。 而腾讯云AI Builder的推出,则彻底改变了这一现状。
6/20/2025 10:01:11 AM
AI在线

全栈智能体Lemon AI横空出世:一键解锁多领域复杂任务

近日,创新型全栈通用AI Agent——Lemon AI正式亮相,掀起智能自动化热潮。 Lemon AI以其强大的自主性和工具调用能力,从任务需求到成果交付实现全流程自动化,无需人工干预,为用户带来高效便捷的体验。 Lemon AI集成自然语言处理、代码生成、网页浏览、API调用、系统命令执行及应用操作等多种功能,能够智能识别任务目标,自动规划完成步骤并调用所需工具。
5/29/2025 12:01:03 PM
AI在线

UAV-Flow项目突破无人机控制,语言指令实现精准飞行

无人机技术的飞速发展正在改变我们的生活方式,而语言指令控制无人机的研究无疑是这一领域的先锋。 一项名为UAV-Flow的创新研究项目正崭露头角,通过自然语言处理技术,让用户仅凭语音指令即可实现对无人机的精确控制。 这一技术突破有望大幅降低无人机操作门槛,推动其在消费、工业和救援等场景的广泛应用。
5/27/2025 12:01:00 PM
AI在线

腾讯元宝功能上新 支持分析复杂Excel表格

腾讯元宝宣布推出一项新功能,能够帮助用户更轻松地理解和分析Excel表格。 这项功能的升级意味着用户只需简单地用自然语言提出问题,元宝就能直接从表格中读取数据、进行计算并给出答案,甚至还能突出显示重点信息,极大地简化了复杂的表格操作。 在过去,处理Excel表格往往需要用户记住大量的函数和公式,稍有不慎就可能导致错误。
3/21/2025 2:55:00 PM
AI在线

Transformers基本原理—Decoder如何进行解码?

一、Transformers整体架构概述Transformers 是一种基于自注意力机制的架构,最初在2017年由Vaswani等人在论文《Attention Is All You Need》中提出。 这种架构彻底改变了自然语言处理(NLP)领域,因为它能够有效地处理序列数据,并且能够捕捉长距离依赖关系。 Transformers整体架构如下:主要架构由左侧的编码器(Encoder)和右侧的解码器(Decoder)构成。
3/10/2025 10:20:00 AM

当AI更加理解人类语言可能预示提示工程终结

多年来,大型语言模型(LLM)的兴起要求用户学习一种新技能:提示工程。 为了得到人工智能有用的回应,人们不得不精心设计他们的查询问题,学习人工智能如何理解语言的细微差别。 但这种情况可能正在发生变化。
2/24/2025 2:03:43 PM
AI情报室

Meta 创新推出 “连续概念混合” 框架,推动 Transformer 预训练新革命

近年来,随着大型语言模型(LLMs)的快速发展,自然语言处理领域经历了前所未有的变革。 这些技术如今广泛应用于代码助手、搜索引擎和个人 AI 助手等场景,展现了强大的能力。 然而,传统的 “下一个 token 预测” 范式存在一定局限性,尤其是在处理复杂推理和长期任务时,模型需要经历大量训练才能掌握深层次的概念理解。
2/17/2025 10:05:00 AM
AI在线

南方电网全面引入 DeepSeek 大模型,助力电力行业智能化升级

南方电网公司近日宣布,成功完成人工智能创新平台 DeepSeek 的本地部署,并将 DeepSeek 系列模型引入其电力大模型体系。 这一创新标志着南方电网在人工智能领域的又一次突破,特别是在自然语言处理技术的应用上。 此次升级使得自然语言基础模型的参数规模提升至千亿级别,这将极大地增强电网在各项业务领域中的智能应用效果。
2/14/2025 9:31:00 AM
AI在线

面向语音控制前端应用程序的自然语言处理(NLP):架构、进展与未来方向

译者 | 李睿审校 | 重楼由于智能设备、虚拟助手和免提界面的日益普及,语音控制前端应用程序获得了更多的关注。 自然语言处理(NLP)是这些系统的核心,能够实现类似人类的理解和语音生成。 本白皮书介绍了语音控制前端应用程序的NLP方法的深入研究,阐述了语音识别、自然语言理解和生成技术的最新技术,以及它们在现代Web前端中的架构集成。
1/14/2025 9:47:44 AM
李睿

多模态RAG技术:从语义抽取到VLM应用与规模化挑战

一、基于语义抽取的多模态 RAG多模态 RAG 的发展方向旨在构建一个高度集成的系统,能够无缝融合文本、图像和其它多媒体元素,为用户提供更丰富的信息交互体验。 实现多模态 RAG 系统的三种主要技术路径如下:传统对象识别与解析(雕花路线)传统的多模态文档处理首先会运用图像识别技术,如 OCR(Optical Character Recognition,光学字符识别),从图像中抽取出文字、表格和图片等元素。 之后,这些独立的对象会被进一步解析,转换成文本格式,以便于后续的信息检索与分析。
1/2/2025 8:36:25 AM
金海

用有限的预算构建AI应用程序

译者 | 布加迪审校 | 重楼人工智能(AI)已经成为现代软件应用程序不可或缺的一部分,因为它可以为传统应用程序添加更强大的功能。 本教程将指导你使用一种简单的方法来构建AI应用程序。 人工智能(AI)已经成为现代软件应用程序不可或缺的一部分,因为它可以为传统应用程序添加前所未有的更强大功能,比如语音识别、图像检测/分类以及自然语言处理(NLP)等等。
12/10/2024 8:01:38 AM
布加迪

提高深度学习模型效率的三种模型压缩方法

译者 | 李睿审校 | 重楼近年来,深度学习模型在自然语言处理(NLP)和计算机视觉基准测试中的性能稳步提高。 虽然这些收益的一部分来自架构和学习算法的改进,但数据集大小和模型参数的增长是重要的驱动因素。 下图显示了top-1 ImageNet分类精度作为GFLOPS的函数,GFLOPS可以用作模型复杂性的指标。
11/18/2024 8:08:21 AM
李睿