AI
Transformer 模型结构详解及代码实现!
一、Transformer简要发展史以下是Transformer模型发展历史中的关键节点:Transformer架构于2017年6月推出。 原本研究的重点是翻译任务。 随后推出了几个有影响力的模型,包括:时间模型简要说明2017 年 6 月「Transformer」Google 首次提出基于 Attention 的模型,用于机器翻译任务2018 年 6 月「GPT」第一个使用 Transformer 解码器模块进行预训练的语言模型,适用于多种 NLP 任务2018 年 10 月「BERT」使用 Transformer 编码器模块,通过掩码语言建模生成更强大的句子表示2019 年 2 月「GPT-2」更大更强的 GPT 版本,由于潜在风险未立即发布,具备出色的文本生成能力2019 年 10 月「DistilBERT」BERT 的轻量化版本,在保留 97% 性能的同时,速度更快、内存占用更低2019 年 10 月「BART、T5」使用完整的 Encoder-Decoder 架构,在各种 NLP 任务中表现优异2020 年 5 月「GPT-3」超大规模语言模型,支持“零样本学习”,无需微调即可完成新任务这个列表并不全面,只是为了突出一些不同类型的 Transformer 模型。
5/20/2025 8:15:00 AM
郭小喵玩AI
理解 RAG 第九部分:针对 RAG 微调 LLM
在“理解 RAG”系列的前几篇文章中,我们重点探讨了检索增强生成的各个方面。 文章中,我们重点介绍了与大型语言模型 (LLM) 集成的检索器组件,该组件用于检索有意义且真实的上下文知识,从而提升 LLM 输入的质量,并最终提升其生成的输出响应。 具体来说,我们学习了如何管理传递给 LLM 的上下文长度、如何优化检索,以及如何利用向量数据库和索引策略来有效地检索知识。
5/20/2025 6:00:00 AM
晓晓
微软推出 Microsoft 365 Copilot Tuning,企业可用自己的数据训练 AI 模型
微软在Build大会上宣布推出Microsoft 365 Copilot Tuning,企业可利用自身数据微调AI模型,提升特定任务表现。同时,Copilot Studio的多智能体协作功能进入公开预览,支持跨部门协同工作。#微软Build大会#
5/20/2025 1:07:37 AM
远洋
微软应用商店迎大变革:取消个人开发者注册费、显示应用上次更新时间、支持 Win32 应用直接更新
微软宣布取消个人开发者注册费,并新增应用更新时间显示、Win32应用直接更新等功能。微软应用商店目前拥有2.5亿月活跃用户,热门应用如Notion即将上线。#微软应用商店#
5/20/2025 12:35:27 AM
远洋
微软 GitHub 推出 AI 编程智能体,可自动修复漏洞和优化代码
GitHub在微软Build大会上宣布推出AI编程智能体,集成在GitHub Copilot中,可自动修复漏洞、添加功能和优化文档。该工具已向Copilot企业版和Plus用户开放。#AI编程# #GitHubCopilot#
5/20/2025 12:23:51 AM
远洋
微软 Edge 浏览器将开放设备端 AI 功能,助力 Web 开发者提升应用体验
微软在Build 2025大会上宣布,Edge浏览器将支持设备端AI模型Phi-4-mini,开发者可通过新API将其集成到Web应用中,提供文本生成、总结等功能。目前已在Edge Canary和Dev频道开放试用。#微软Build2025# #Edge浏览器#
5/20/2025 12:17:08 AM
远洋
微软推出 Windows AI Foundry:用于本地人工智能开发的统一平台
在 Build 2025 开发者大会上,微软宣布了一系列针对 Windows 平台的 AI 开发新工具与功能,其中包括 Windows AI Foundry 的推出,这一全新的统一平台旨在为本地 AI 开发提供强大的支持,整合了 Windows Copilot Runtime 以及多项新能力,进一步推动 Windows 生态内的 AI 应用发展。
5/20/2025 12:09:46 AM
远洋
从代码助手到工程伙伴:Windsurf 的 SWE-1 开启 AI 辅助开发新范式
译者 | 刘汪洋审校 | 重楼如今,在许多 Vibe Coding 平台通常会借助现有的大型语言模型 (LLMs) 来辅助编写代码。 不过,写代码仅仅是开发人员日常工作的一小部分。 要想构建一个完善的企业级生产平台,还得用上各种工具来审查代码、提交代码,并进行长期的维护。
5/20/2025 12:08:00 AM
刘汪洋
高通重返数据中心市场,瞄准 AI 时代低功耗高效能产品
在 Computex 大会上,高通 CEO 克里斯蒂亚诺・阿蒙(Cristiano Amon)宣布,该公司正积极准备进军数据中心市场,并将在不久的将来推出相关产品。 阿蒙在演讲的最后一刻透露,高通将在数据中心领域发布一些独特且具颠覆性的技术,这是高通重返该市场的原因之一。 值得注意的是,高通在2018年因未能成功推出基于 Arm 架构的服务器而退出了数据中心市场。
5/19/2025 6:00:55 PM
AI在线
抖音启动 “AI 起号” 专项整治行动,清理低俗内容
抖音官方发布公告,宣布启动 “AI 起号” 专项治理行动,旨在整治平台内利用人工智能生成低俗猎奇视频等行为。 随着人工智能技术的快速发展,抖音发现一些用户利用 AI 进行造假、售卖虚拟账号等行为,这严重影响了平台的生态环境。 此次专项治理行动的重点包括:利用 AI 生成低质视频、虚拟幼儿教育专家的育儿内容、AI 视频账号的售卖教程以及 AI 账号的传授秘籍。
5/19/2025 6:00:55 PM
AI在线
NVIDIA全新GeForce GPU震撼亮相!黄仁勋:AI与模拟交织,极致美感颠覆游戏与创作!
NVIDIA在台北COMPUTEX2025大会上正式发布全新GeForce GPU系列,引发全球科技圈热议。 NVIDIA首席执行官黄仁勋在主题演讲中表示:“你在这里看到的都不是艺术,只是恰好很美而已”,强调新GPU通过人工智能与实时模拟的融合,为游戏玩家、内容创作者和AI开发者带来前所未有的视觉与性能体验。 AIbase综合最新动态,深入解析这一突破性发布的技术亮点及其对AI与游戏生态的深远影响。
5/19/2025 6:00:55 PM
AI在线
微软推动AI代理跨公司协作,引入新标准协议
在即将举行的微软年度开发者大会前夕,微软的首席技术官凯文・斯科特(Kevin Scott)透露了一个激动人心的愿景:未来不同公司的人工智能(AI)代理能够实现无缝协作,并更好地记住彼此之间的互动。 斯科特在华盛顿州雷德蒙德的微软总部表示,微软致力于推动行业标准的建立,以使各个制造商的 AI 代理能够相互配合。 微软将支持一种名为模型上下文协议(Model Context Protocol,MCP)的标准化通信协议。
5/19/2025 6:00:55 PM
AI在线
Poe2025春季AI模型使用趋势报告:OpenAI与Anthropic双雄争霸 可灵异军突起
全球知名AI模型集成平台Poe发布《2025春季AI模型使用趋势报告》,基于平台上数百万次用户交互,深入分析了文本、图像、视频、音频和推理模型的需求与使用份额变化。 报告揭示了今年以来OpenAI GPT-4.1、Google Gemini2.5Pro、Kuaishou Kling等突破性模型的快速崛起,以及AI使用模式的深刻转变。 AIbase综合最新动态,独家解读这一报告的核心亮点及其对AI生态的深远影响。
5/19/2025 5:00:45 PM
AI在线
Google搜索推出AI Mode实验,探索全新智能问答体验
近日,Google 在其搜索引擎中推出了一项名为 “AI Mode” 的实验。 这项新功能旨在为用户提供更智能的问答体验,用户可以通过文本、语音或图像提问,AI 将根据海量的网络信息为用户提供有用的回答。 AI Mode不仅能够帮助用户获取信息,还能根据提问者的后续问题进行深入探索,甚至提供相关的网页链接,帮助用户更全面地理解所查询的内容。
5/19/2025 4:00:45 PM
AI在线
AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!
本文由匹兹堡大学智能系统实验室(Intelligent Systems Laboratory)的研究团队完成。 第一作者为匹兹堡大学的一年级博士生薛琪耀。 当前文本生成视频(T2V)技术正在从注重视觉质量与模型规模的扩展阶段,迈向更关注物理一致性与现实合理性的推理驱动阶段。
5/19/2025 3:00:38 PM
谷歌NotebookLM即将推出Sparks视频概览 Gemini与Deep Research加持,可生成1-3分钟AI视频
2025年5月,谷歌旗下研究工具NotebookLM迎来重大更新,计划推出名为“Sparks”(火花)的1-3分钟视频概览功能,其中10%内容由AI生成。 这一创新将进一步整合Gemini2.5 chatbot和Deep Research报告功能,为用户提供从文档到短视频的智能化内容创作体验。 AIbase综合最新社交媒体动态,深入解析“火花”视频概览的技术亮点及其对AI内容生成领域的深远影响。
5/19/2025 3:00:29 PM
AI在线
全新GPU高速互联设计,为大模型训练降本增效!北大/阶跃/曦智提出新一代高带宽域架构
随着大模型的参数规模不断扩大,分布式训练已成为人工智能发展的中心技术路径。 如此一来,高带宽域的设计对提升大模型训练效率至关重要。 然而,现有的HBD架构在可扩展性、成本和容错能力等方面存在根本性限制:以交换机为中心的HBD(如NVIDIA NVL-72)成本高昂、不易扩展规模;以GPU为中心的HBD(如 Google TPUv3和Tesla Dojo)存在严重的故障传播问题;TPUv4等交换机-GPU混合HBD采用折中方案,但在成本和容错方面仍然不甚理想。
5/19/2025 2:57:44 PM
三金,又是中国队!全球机器人视触融合挑战赛揭榜
今天,机器人和自动化领域的全球顶级会议ICRA 2025在亚特兰大正式拉开帷幕。 不久前,机器人领域的顶级赛事——ManiSkill-ViTac 2025也公布了获奖团队名单。 5月23日,ManiSkill-ViTac 2025的成果将在ICRA 2025第六届ViTac国际研讨会中集中汇报。
5/19/2025 2:55:41 PM
资讯热榜
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
微软发布 700 个真实 AI 案例,探索智能化工作新模式
Li Hang, head of ByteDance AI Lab, resigns; Seed team enters adjustment period
Former DeepSeek executive secretly starts new AI Agent project, already backed by top VC
OpenAI Upgrades ChatGPT Search Functionality to Provide More Precise and Smarter Responses
消息称 OpenAI 已同谷歌敲定一份云 AI 算力交易,减少对微软依赖
Microsoft AI Unveils Code Researcher: 58% Crash Resolution Rate Stuns the Industry!
腾讯LeVo来袭!媲美Suno 4.5的AI唱歌模型,支持零样本音色克隆
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
Meta
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
训练
神经网络
智能体
研究
3D
生成
苹果
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
LLM
预测
伟达
深度学习
字节跳动
Transformer
Agent
工具
模态
视觉
神器推荐
具身智能
文本
RAG
LLaMA
算力
Copilot
大型语言模型
驾驶
API
应用
架构