开源
突发!微软刚开源GitHub Copilot Chat,超强AI Agent自动化编程
今天凌晨4点30,微软首席执行官Satya Nadella分享了,VS Code的最新AI开源编辑器GitHub Copilot Chat。 GitHub Copilot Chat最大技术亮点支持AI Agent自动化编程模式,可以执行多步骤的编码任务,自动处理编译和语法检查错误,监控终端和测试输出,并持续迭代直至编程任务完成。 此外,用户也可以直接用自然语言与GitHub Copilot Chat交互,例如,这段代码的作用是什么?
7/1/2025 9:07:52 AM
百度重磅开源文心大模型 4.5 系列,国内大模型市场再掀波澜!
近日,百度正式宣布开源其文心大模型4.5系列,共推出了十款模型,包括47B、3B 激活参数的混合专家(MoE)模型,以及0.3B 参数的稠密型模型。 此次开源不仅实现了预训练权重的完整公开,还提供了推理代码,标志着百度在大模型领域的重大进展。 这些新发布的模型可以在飞桨星河社区、Hugging Face 等平台上下载和部署,同时,百度智能云千帆大模型平台也提供了相应的 API 服务。
6/30/2025 3:00:50 PM
AI在线
RAG终极框架!港大开源RAG-Anything:统一多模态知识图谱
RAG-Anything的核心技术创新在于构建了统一的多模态知识图谱架构,能够同时处理并关联文档中的文字内容、图表信息、表格数据、数学公式等多种类型的异构内容,解决了传统RAG系统仅支持文本处理的技术限制,为多模态文档的智能理解提供了新的技术方案。 项目地址:: (RAG)系统,专注解决复杂场景下的智能问答与信息检索难题。 该系统提供完整的端到端多模态文档处理解决方案,能够统一处理文本、图像、表格、数学公式等多种异构内容,实现从文档解析、知识图谱构建到智能问答的全流程自动化,为下一代AI应用提供了可靠的技术基础。
6/30/2025 1:57:59 PM
百度文心大模型4.5系列正式开源,同步开放API服务
百度文心大模型开源,如期而至。 就在今天,百度官宣文心大模型4.5系列正式开源,还同步提供API服务。 此番,百度一次性推出10款开源模型,涵盖从47B参数的混合专家(MoE)模型到轻量级0.3B稠密型模型,覆盖文本、多模态等多种任务需求。
6/30/2025 1:54:34 PM
百度文心系列大模型在飞桨平台开源,涵盖多款最新模型
据新浪科技消息,百度旗下文心系列大模型近日已在其飞桨(PaddlePaddle)平台开源,其中包括 ERNIE-4.5-VL-424B-A47B-Paddle 和 ERNIE-4.5-300B-A47B-Paddle 等数十款最新模型。 尽管百度方面尚未主动披露此次开源行动,但飞桨平台的更新信息显示,这一系列动作集中在6月29日至6月30日,是其最新的举措。 有内部人士证实:“官网上新并公布了开源代码,足见公司确实已在推进开源举措。
6/30/2025 11:00:50 AM
AI在线
华为开源盘古7B稠密和72B混合专家模型
6月30日,华为于正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE720亿参数的混合专家模型,以及基于升腾的模型推理技术。 此次开源举措,是华为践行升腾生态战略的关键一步,旨在推动大模型技术的研究与创新发展,加速人工智能在各行业的应用并创造价值。 目前,盘古Pro MoE72B模型权重、基础推理代码,以及基于升腾的超大规模MoE模型推理代码,均已正式上线开源平台。
6/30/2025 10:01:04 AM
AI在线
媲美DeepSeek!腾讯开源新版混元模型:AI Agent强化,超30种智能体指令
腾讯开源了混元大模型的最新版本Hunyuan-A13B。 Hunyuan-A13B是一个专家混合模型,拥有800亿参数,其中130亿参数处于激活状态。 支持快、慢两种思考模式:快速思维模式,提供简洁高效的输出,适用于高效、简单的日常任务;慢速思维模式,支持更深层次的推理步骤包含反思和回溯,生成更长的思维链,提升复杂任务的准确性。
6/30/2025 9:04:00 AM
腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署
腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型。 该模型采用基于专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,在保持顶尖开源模型效果的同时,大幅降低了推理延迟与计算开销,为个人开发者和中小企业提供了更具性价比的AI解决方案。 据腾讯方面介绍,混元-A13B模型在极端条件下仅需1张中低端GPU卡即可部署,用户可通过Github、HuggingFace等技术社区下载使用,模型API也已在腾讯云官网上线。
6/27/2025 4:00:52 PM
AI在线
谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型
端侧设备迎来了新架构的 AI 模型。 本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。 模型、权重:::,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。
6/27/2025 10:08:19 AM
超过GPT-image-1!大黑马Black Forest刚开源新模型,只用文本实现一键PS
今天凌晨,知名开源平台Black Forest开源了,文生图模型FLUX.1-Kontext的开发者版本。 该版本主要专注于图像编辑任务,支持迭代编辑,在各种场景和环境中都能出色地保留角色特征,还允许进行精确的局部和全局编辑,例如,用户想给一个人脸加上胡子或者更改衣服穿着、场景,FLUX.1-Kontext都能轻松实现。 简单来说,FLUX.1-Kontext开发版的主要功能可以像PS一样,让用户通过自然语言就能实现一键P图。
6/27/2025 9:26:50 AM
谷歌AI Agent刚开源!多任务智能体+MCP+谷歌搜索,狂揽9000颗星
今天凌晨,谷歌在官网开源了AI Agent框架Gemini CLI,直接将Gemini大模型融入到终端中。 Gemini CLI最大亮点之一就是可以直接调用,谷歌最新发布的视频模型 Veo和图像模型Imagen,同时集成了MCP、谷歌搜索、自定义自动化等众多实用功能。 开源地址:,用Gemini CLI自动制作一个短视频,展示一只姜猫在澳大利亚的冒险故事。
6/26/2025 10:07:11 AM
谷歌放大招!Gemini CLI开源发布,免费提供AI编程助手挑战Cursor
谷歌今日重磅发布Gemini CLI,一款开源的终端AI代理工具,直接向商业化AI编程工具发起挑战。 该项目一经发布即在GitHub收获9000 星标,展现了开发者社区的强烈关注。 免费策略颠覆市场谷歌此次采用了极具冲击力的免费策略:零成本使用:仅需个人Google账号即可获得Gemini Code Assist许可顶级模型:免费提供Gemini2.5Pro模型,配备100万token超大上下文窗口业界最高免费额度:每分钟60次请求,每日1000次请求完全免费这一配置对个人开发者和学习者而言几乎等同于无限制使用,涵盖编程、调试、学习和自动化等全场景需求。
6/26/2025 10:01:32 AM
AI在线
重磅!淘天联合爱橙开源强化学习训练框架ROLL,高效支持十亿到千亿参数大模型训练
过去几年,随着基于人类偏好的强化学习(Reinforcement Learning from Human Feedback,RLHF)的兴起,强化学习(Reinforcement Learning,RL)已成为大语言模型(Large Language Model,LLM)后训练阶段的关键技术。 RL 不仅显著提升了模型的对齐能力,也拓展了其在推理增强、智能体交互等场景下的应用边界。 围绕这一核心范式,研究社区不断演化出多种优化策略和算法变体,如 Agentic RL、RLAIF、GRPO、REINFORCE 等。
6/25/2025 1:44:09 PM
华科开源MonkeyOCR:3B小模型,居然把GPT-4o给比下去了
看到这个标题,你可能会想"又一个号称吊打GPT的模型"。 但这次不一样,华中科技大学真的搞出了点名堂。 前几天,华科和金山办公联合开源了一个叫MonkeyOCR的文档解析模型。
6/25/2025 9:14:00 AM
阿丸笔记
如何做到在手机上实时跑3D真人数字人?MNN-TaoAvatar开源了!
TaoAvatar 是由阿里巴巴淘宝 Meta 技术团队研发的 3D 真人数字人技术,这一技术能在手机或 XR 设备上实现 3D 数字人的实时渲染以及 AI 对话的强大功能,为用户带来逼真的虚拟交互体验。 它是如何实现的呢? 本文将为您揭秘 TaoAvatar 背后的黑科技!
6/25/2025 9:11:16 AM
3D VLA新范式!中科院&字节Seed提出BridgeVLA,斩获CVPR 2025 workshop冠军!
只需要三条轨迹,就能取得 96.8% 的成功率? 视觉干扰、任务组合等泛化场景都能轻松拿捏? 或许,3D VLA 操作新范式已经到来。
6/24/2025 11:50:37 AM
AI日报:月之暗面首款自主智能体Kimi-Researcher;MiniMax推音色设计功能;Jaaz发布Lovart AI本地化替代品
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解: Kimi-Researcher月之暗面推出Kimi-Researcher,多轮搜索与推理能力强,在HLE测试中超越谷歌和OpenAI同类产品。 【AiBase提要:】🌐 Kimi-Researcher基于k-系列模型,通过端到端强化学习训练。
6/23/2025 5:00:38 PM
AI在线
AI时代的开源进化论:安全、成本与选择的破局之道
自ChatGPT横空出世引爆AI大模型热潮以来,科技界一场关于"开源"与"闭源"的辩论被推向新的高潮。 这场争论的源头可追溯至计算机文明的启蒙时代——1998年2月3日,自由软件运动活动家克里斯汀·彼得森(Christine Peterson)首次提出"Open Source"这一革命性术语,次日Linux创始人林纳斯·托瓦兹(Linus Torvalds)发布具有里程碑意义的GPL版权许可说明,正式为开源运动奠定法律基石。 在开源运动早期,埃里克·雷蒙德(Eric S.
6/23/2025 3:55:46 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
智能体
AI创作
Anthropic
英伟达
AI新词
论文
代码
训练
算法
LLM
Stable Diffusion
芯片
蛋白质
开发者
腾讯
Claude
苹果
Agent
生成式
AI for Science
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
华为
工具
RAG
AI设计
大语言模型
搜索
字节跳动
具身智能
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
AGI
Transformer
架构
神器推荐
亚马逊
Copilot
特斯拉
DeepMind
应用