自然语言处理
终于把 LSTM 算法搞懂了!!
大家好,我是小寒今天给大家分享一个超强的算法模型,LSTM。 LSTM(长短期记忆网络,Long Short-Term Memory)是一种特殊的循环神经网络(RNN)算法,专门设计用来解决传统RNN在处理长序列数据时存在的梯度消失和梯度爆炸问题。 它通过引入细胞状态和门控机制,使得模型能够捕捉和保存长期依赖信息,从而有效地处理序列数据中的长期依赖关系。
7/15/2025 10:41:44 AM
程序员小寒
Shortcut横空出世!AI Excel助手10倍速碾压人类冠军,自动化任务效率飙升
近日,一款名为Shortcut的AI Excel助手在社交媒体上引发热议,其通过自然语言处理(NLP)技术,让用户无需编写复杂公式或VBA代码,即可轻松完成Excel任务。 AIbase编辑团队整理了社交媒体上的最新信息,为您深度解析Shortcut的强大功能及其对数据处理和财务建模领域的潜在影响。 Shortcut:自然语言驱动的Excel革命Shortcut被誉为“超人级Excel代理”(Superhuman Excel Agent),能够通过简单的自然语言指令完成复杂的Excel任务。
7/3/2025 6:00:47 PM
AI在线
MIT 研究发现:使用 AI 写作工具或降低大脑活跃度
近日,麻省理工学院媒体实验室发布了一项新的研究,揭示了使用人工智能工具(如 ChatGPT)进行写作任务可能导致大脑活跃度降低。 该研究标题为《你在使用 ChatGPT 时的大脑:使用 AI 助手进行论文写作任务时的认知债务累积》。 图源备注:图片由AI生成,图片授权服务商Midjourney在这项研究中,研究人员分为三组进行实验:一组仅使用自己的大脑,另一组使用搜索引擎,最后一组使用大型语言模型(LLM),例如 ChatGPT。
7/3/2025 10:00:57 AM
AI在线
腾讯云推出全链路AI驱动应用开发平台“AI Builder”
近日,腾讯云正式推出了国内首个全链路AI驱动的应用开发平台——AI Builder,该平台通过自然语言处理技术,大幅降低了应用开发的门槛,让即便是没有技术背景的普通用户也能独立制作小程序或网页应用,为创意实现提供了强有力的支持。 在传统应用开发过程中,用户往往需要掌握编程语言、了解数据库设计、配置服务器等一系列复杂技能,这对于非专业开发者而言无疑是一道难以逾越的门槛。 而腾讯云AI Builder的推出,则彻底改变了这一现状。
6/20/2025 10:01:11 AM
AI在线
全栈智能体Lemon AI横空出世:一键解锁多领域复杂任务
近日,创新型全栈通用AI Agent——Lemon AI正式亮相,掀起智能自动化热潮。 Lemon AI以其强大的自主性和工具调用能力,从任务需求到成果交付实现全流程自动化,无需人工干预,为用户带来高效便捷的体验。 Lemon AI集成自然语言处理、代码生成、网页浏览、API调用、系统命令执行及应用操作等多种功能,能够智能识别任务目标,自动规划完成步骤并调用所需工具。
5/29/2025 12:01:03 PM
AI在线
UAV-Flow项目突破无人机控制,语言指令实现精准飞行
无人机技术的飞速发展正在改变我们的生活方式,而语言指令控制无人机的研究无疑是这一领域的先锋。 一项名为UAV-Flow的创新研究项目正崭露头角,通过自然语言处理技术,让用户仅凭语音指令即可实现对无人机的精确控制。 这一技术突破有望大幅降低无人机操作门槛,推动其在消费、工业和救援等场景的广泛应用。
5/27/2025 12:01:00 PM
AI在线
腾讯元宝功能上新 支持分析复杂Excel表格
腾讯元宝宣布推出一项新功能,能够帮助用户更轻松地理解和分析Excel表格。 这项功能的升级意味着用户只需简单地用自然语言提出问题,元宝就能直接从表格中读取数据、进行计算并给出答案,甚至还能突出显示重点信息,极大地简化了复杂的表格操作。 在过去,处理Excel表格往往需要用户记住大量的函数和公式,稍有不慎就可能导致错误。
3/21/2025 2:55:00 PM
AI在线
Transformers基本原理—Decoder如何进行解码?
一、Transformers整体架构概述Transformers 是一种基于自注意力机制的架构,最初在2017年由Vaswani等人在论文《Attention Is All You Need》中提出。 这种架构彻底改变了自然语言处理(NLP)领域,因为它能够有效地处理序列数据,并且能够捕捉长距离依赖关系。 Transformers整体架构如下:主要架构由左侧的编码器(Encoder)和右侧的解码器(Decoder)构成。
3/10/2025 10:20:00 AM
当AI更加理解人类语言可能预示提示工程终结
多年来,大型语言模型(LLM)的兴起要求用户学习一种新技能:提示工程。 为了得到人工智能有用的回应,人们不得不精心设计他们的查询问题,学习人工智能如何理解语言的细微差别。 但这种情况可能正在发生变化。
2/24/2025 2:03:43 PM
AI情报室
Meta 创新推出 “连续概念混合” 框架,推动 Transformer 预训练新革命
近年来,随着大型语言模型(LLMs)的快速发展,自然语言处理领域经历了前所未有的变革。 这些技术如今广泛应用于代码助手、搜索引擎和个人 AI 助手等场景,展现了强大的能力。 然而,传统的 “下一个 token 预测” 范式存在一定局限性,尤其是在处理复杂推理和长期任务时,模型需要经历大量训练才能掌握深层次的概念理解。
2/17/2025 10:05:00 AM
AI在线
南方电网全面引入 DeepSeek 大模型,助力电力行业智能化升级
南方电网公司近日宣布,成功完成人工智能创新平台 DeepSeek 的本地部署,并将 DeepSeek 系列模型引入其电力大模型体系。 这一创新标志着南方电网在人工智能领域的又一次突破,特别是在自然语言处理技术的应用上。 此次升级使得自然语言基础模型的参数规模提升至千亿级别,这将极大地增强电网在各项业务领域中的智能应用效果。
2/14/2025 9:31:00 AM
AI在线
面向语音控制前端应用程序的自然语言处理(NLP):架构、进展与未来方向
译者 | 李睿审校 | 重楼由于智能设备、虚拟助手和免提界面的日益普及,语音控制前端应用程序获得了更多的关注。 自然语言处理(NLP)是这些系统的核心,能够实现类似人类的理解和语音生成。 本白皮书介绍了语音控制前端应用程序的NLP方法的深入研究,阐述了语音识别、自然语言理解和生成技术的最新技术,以及它们在现代Web前端中的架构集成。
1/14/2025 9:47:44 AM
李睿
多模态RAG技术:从语义抽取到VLM应用与规模化挑战
一、基于语义抽取的多模态 RAG多模态 RAG 的发展方向旨在构建一个高度集成的系统,能够无缝融合文本、图像和其它多媒体元素,为用户提供更丰富的信息交互体验。 实现多模态 RAG 系统的三种主要技术路径如下:传统对象识别与解析(雕花路线)传统的多模态文档处理首先会运用图像识别技术,如 OCR(Optical Character Recognition,光学字符识别),从图像中抽取出文字、表格和图片等元素。 之后,这些独立的对象会被进一步解析,转换成文本格式,以便于后续的信息检索与分析。
1/2/2025 8:36:25 AM
金海
用有限的预算构建AI应用程序
译者 | 布加迪审校 | 重楼人工智能(AI)已经成为现代软件应用程序不可或缺的一部分,因为它可以为传统应用程序添加更强大的功能。 本教程将指导你使用一种简单的方法来构建AI应用程序。 人工智能(AI)已经成为现代软件应用程序不可或缺的一部分,因为它可以为传统应用程序添加前所未有的更强大功能,比如语音识别、图像检测/分类以及自然语言处理(NLP)等等。
12/10/2024 8:01:38 AM
布加迪
提高深度学习模型效率的三种模型压缩方法
译者 | 李睿审校 | 重楼近年来,深度学习模型在自然语言处理(NLP)和计算机视觉基准测试中的性能稳步提高。 虽然这些收益的一部分来自架构和学习算法的改进,但数据集大小和模型参数的增长是重要的驱动因素。 下图显示了top-1 ImageNet分类精度作为GFLOPS的函数,GFLOPS可以用作模型复杂性的指标。
11/18/2024 8:08:21 AM
李睿
基于PyTorch的大语言模型微调指南:Torchtune完整教程与代码示例
近年来,大型语言模型(Large Language Models, LLMs)在自然语言处理(Natural Language Processing, NLP)领域取得了显著进展。 这些模型通过在大规模文本数据上进行预训练,能够习得语言的基本特征和语义,从而在各种NLP任务上取得了突破性的表现。 为了将预训练的LLM应用于特定领域或任务,通常需要在领域特定的数据集上对模型进行微调(Fine-tuning)。
11/4/2024 2:42:12 PM
佚名
百川智能发布超千亿大模型Baichuan 3,中文评测水平超GPT-4
1 月 29 日,百川智能正式发布千亿参数的大语言模型 Baichuan 3。在多个权威通用能力评测如 CMMLU、GAOKAO 和 AGI-Eval 中,Baichuan 3 都展现了出色的能力,尤其在中文任务上更是超越了 GPT-4。而在数学和代码专项评测如 MATH、HumanEval 和 MBPP 中同样表现出色,证明了 Baichuan 3 在自然语言处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的 MCMLE、MedExam、CMExam 等权威医疗评测上的中文效果同样超过了
1/29/2024 2:33:00 PM
新闻助手
- 1
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用