AI
谢赛宁团队提出BLIP3-o:融合自回归与扩散模型的统一多模态架构,开创CLIP特征驱动的图像理解与生成新范式!
BLIP3-o 是一个统一的多模态模型,它将自回归模型的推理和指令遵循优势与扩散模型的生成能力相结合。 与之前扩散 VAE 特征或原始像素的研究不同,BLIP3-o 扩散了语义丰富的CLIP 图像特征,从而为图像理解和生成构建了强大而高效的架构。 此外还发布了包含 2000 万张带详细标题的图片(BLIP3o Pretrain Long Caption)和 400 万张带短标题的图片(BLIP3o Pretrain Short Caption)的数据集。
英伟达新“桌面超算”800GB大内存,满血DeepSeek R1能装1个半
英伟达官宣新办公室落户中国台湾省台北市,但居然是从太空飞下来的吗? 当然,这只是黄仁勋在Computex大会上展示的CG特效,但背后还有这样一层意思:如此逼真的画面中,只有1/10的像素是显卡渲染的,剩下全部内容为AI预测。 当初是GeForce显卡让AI成为现实,现在AI反过来给GeForce显卡带来颠覆性变革。
火山引擎发布大模型生态广场 MCP Servers
火山引擎正式发布了其大模型生态广场——MCP Servers,这一创新平台的推出标志着AI开发进入了一个全新的模块化组装时代。 通过“MCP Market(工具广场) 火山方舟(大模型服务) Trae(应用开发环境)”的深度协同,MCP Servers实现了从工具调用、模型推理到应用部署的全链路开发闭环,极大地简化了开发流程,让开发者能够以更高效的方式构建AI应用。 MCP Servers被形象地称为“大模型工具超市”,它集成了众多高质量的MCP协议适配工具,覆盖了搜索、数据库、业务系统API等高频应用场景。
英伟达等巨头联手打造欧洲最大AI园区,计划 2028 年投入运营
近日,阿布扎比的 AI 投资基金 MGX、法国国家投资银行、AI 初创公司 Mistral AI 与科技巨头英伟达宣布了一项重磅合作计划,目标是在巴黎地区建立欧洲最大的人工智能园区。 该项目的初步规划显示,园区的最终装机容量预计将达到1.4吉瓦,规模之大让人期待。 这个新 AI 园区的建设预计将于2024年下半年正式启动,并计划于2028年投入运营。
苹果高管称其自研AI聊天机器人不输OpenAI的ChatGPT
在人工智能领域的竞争日益激烈的背景下,苹果公司正在内部测试其自主开发的 AI 聊天机器人,并取得了显著的技术突破。 根据彭博社记者马克・古尔曼的最新报道,苹果在新任 AI 负责人约翰・贾南德里亚(John Giannandrea)的领导下,过去六个月里对这款聊天机器人进行了深入的研发。 知情人士透露,苹果的高管们对目前的聊天机器人版本表示乐观,认为其性能已经不逊于 OpenAI 的 ChatGPT。
微软推出 AI 平台,200小时发现新化合物,科学研究迎来突破
在最新发布的 Build 开发者大会上,微软宣布推出名为 “Microsoft Discovery” 的企业级平台,利用人工智能技术大幅度加速科学研究和开发进程。 这一平台有潜力将传统上需要多年的实验室工作压缩为数周甚至数天完成,改变医药、材料科学和半导体行业的研发模式。 图源备注:图片由AI生成,图片授权服务商Midjourney“Microsoft Discovery” 依赖于专业化的 AI 代理和高性能计算,帮助科学家和工程师解决复杂的研究难题,且用户无需具备编程能力。
GitHub 推出全新 AI 编程智能体,助力开发者自动修复代码漏洞
在最新举行的微软 Build 大会上,GitHub 正式发布了一款名为 AI 编程智能体的全新工具。 这款工具被集成在 GitHub Co pilot 中,旨在为开发者提供更高效的编程支持,能够自动执行诸如修复代码漏洞、添加新功能和优化文档等任务。 据悉,这款 AI 编程智能体通过自动启动虚拟机,克隆相关代码仓库并对其进行全面分析来完成工作。
微软放大招!VS Code转型开源AI编辑器,狙击Cursor与Windsurf
微软在Build2025大会上宣布了一项震撼举措:旗下广受欢迎的代码编辑器Visual Studio Code(VS Code)将转型为全球首款开源AI编辑器,并将GitHub Copilot Chat扩展完全开源,遵循MIT许可证。 这一战略不仅深化了微软对开源社区的承诺,还通过整合AI功能重塑开发者工具生态,对Cursor、Windsurf等竞品形成强力挑战。 AIbase综合最新动态,深入解析这一里程碑式发布的技术亮点与行业影响。
苹果高管认为内部 AI 聊天机器人已接近 ChatGPT
近日,彭博社的知名记者马克・古尔曼(Mark Gurman)报道,苹果公司正在积极测试其自主开发的 AI 聊天机器人产品。 这一消息引发了外界的广泛关注,尤其是在新任 AI 负责人约翰・贾南德里亚(John Giannandrea)的带领下,苹果的自研 AI 项目在过去六个月内取得了显著的技术突破。 知情人士透露,苹果高管们对该聊天机器人当前的技术水平感到满意,并认为其已达到与 OpenAI 的 ChatGPT 最新版本相当的水平。
透明、可控:微软发布 Magentic-UI 人机协作新工具,你的 AI 网络任务智能伙伴
微软研究院昨日(5 月 19 日)发布博文,介绍了 Magentic-UI 开源研究原型。这是一款以人为中心的 AI 智能体,旨在通过网页浏览器,实时协助用户完成复杂的网络任务。
Transformer 模型结构详解及代码实现!
一、Transformer简要发展史以下是Transformer模型发展历史中的关键节点:Transformer架构于2017年6月推出。 原本研究的重点是翻译任务。 随后推出了几个有影响力的模型,包括:时间模型简要说明2017 年 6 月「Transformer」Google 首次提出基于 Attention 的模型,用于机器翻译任务2018 年 6 月「GPT」第一个使用 Transformer 解码器模块进行预训练的语言模型,适用于多种 NLP 任务2018 年 10 月「BERT」使用 Transformer 编码器模块,通过掩码语言建模生成更强大的句子表示2019 年 2 月「GPT-2」更大更强的 GPT 版本,由于潜在风险未立即发布,具备出色的文本生成能力2019 年 10 月「DistilBERT」BERT 的轻量化版本,在保留 97% 性能的同时,速度更快、内存占用更低2019 年 10 月「BART、T5」使用完整的 Encoder-Decoder 架构,在各种 NLP 任务中表现优异2020 年 5 月「GPT-3」超大规模语言模型,支持“零样本学习”,无需微调即可完成新任务这个列表并不全面,只是为了突出一些不同类型的 Transformer 模型。
理解 RAG 第九部分:针对 RAG 微调 LLM
在“理解 RAG”系列的前几篇文章中,我们重点探讨了检索增强生成的各个方面。 文章中,我们重点介绍了与大型语言模型 (LLM) 集成的检索器组件,该组件用于检索有意义且真实的上下文知识,从而提升 LLM 输入的质量,并最终提升其生成的输出响应。 具体来说,我们学习了如何管理传递给 LLM 的上下文长度、如何优化检索,以及如何利用向量数据库和索引策略来有效地检索知识。
微软推出 Microsoft 365 Copilot Tuning,企业可用自己的数据训练 AI 模型
微软在Build大会上宣布推出Microsoft 365 Copilot Tuning,企业可利用自身数据微调AI模型,提升特定任务表现。同时,Copilot Studio的多智能体协作功能进入公开预览,支持跨部门协同工作。#微软Build大会#
微软应用商店迎大变革:取消个人开发者注册费、显示应用上次更新时间、支持 Win32 应用直接更新
微软宣布取消个人开发者注册费,并新增应用更新时间显示、Win32应用直接更新等功能。微软应用商店目前拥有2.5亿月活跃用户,热门应用如Notion即将上线。#微软应用商店#
微软 GitHub 推出 AI 编程智能体,可自动修复漏洞和优化代码
GitHub在微软Build大会上宣布推出AI编程智能体,集成在GitHub Copilot中,可自动修复漏洞、添加功能和优化文档。该工具已向Copilot企业版和Plus用户开放。#AI编程# #GitHubCopilot#
微软 Edge 浏览器将开放设备端 AI 功能,助力 Web 开发者提升应用体验
微软在Build 2025大会上宣布,Edge浏览器将支持设备端AI模型Phi-4-mini,开发者可通过新API将其集成到Web应用中,提供文本生成、总结等功能。目前已在Edge Canary和Dev频道开放试用。#微软Build2025# #Edge浏览器#
微软推出 Windows AI Foundry:用于本地人工智能开发的统一平台
在 Build 2025 开发者大会上,微软宣布了一系列针对 Windows 平台的 AI 开发新工具与功能,其中包括 Windows AI Foundry 的推出,这一全新的统一平台旨在为本地 AI 开发提供强大的支持,整合了 Windows Copilot Runtime 以及多项新能力,进一步推动 Windows 生态内的 AI 应用发展。
从代码助手到工程伙伴:Windsurf 的 SWE-1 开启 AI 辅助开发新范式
译者 | 刘汪洋审校 | 重楼如今,在许多 Vibe Coding 平台通常会借助现有的大型语言模型 (LLMs) 来辅助编写代码。 不过,写代码仅仅是开发人员日常工作的一小部分。 要想构建一个完善的企业级生产平台,还得用上各种工具来审查代码、提交代码,并进行长期的维护。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
大型语言模型
生成式AI
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Transformer
Copilot
架构
MCP
编程
视觉