开源

微软推出 Magentic-One：多 AI 智能体协同完成复杂任务

微软本月发布 Magentic-One 系统，通过协调多个专用 AI 智能体，高效处理复杂工作流程。

11/7/2024 12:11:24 PM 故渊

腾讯混元宣布大语言模型和3D模型正式开源

腾讯混元大模型正在加快开源步伐。 11月5日，腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源，支持企业及开发者精调、部署等不同场景的使用需求，可在HuggingFace、Github等技术社区直接下载，免费可商用。本次开源是腾讯混元继文生图模型后持续开放的一大举措。

11/6/2024 9:47:00 AM

全球首个开源 AI 标准发布，微软、谷歌、亚马逊、Meta、英特尔、三星等巨头制定

在本月底的 2024 年 ALL THINGS OPEN 大会上，开源组织 Open Source Initiative（OSI）正式发布开源人工智能定义（OSAID）1.0 版本，标志着全球首个开源 AI 标准的诞生。 OSI 成立于 1998 年，是一个全球性的非营利组织，旨在定义和“管理”所有开源事物。 OSAID 标准由超过 25 个组织共同设计，包括微软、谷歌、亚马逊、Meta、英特尔、三星、Mozilla 基金会、Linux 基金会、Apache 软件基金会等，该标准可以帮助验证一个 AI 系统是否可以被视为开源 AI。

10/30/2024 5:12:34 PM 汪淼

阿里达摩院开源 CoI-Agent：一键生成科研 idea 的 AI 研究助手

阿里巴巴达摩院本月开源了一款名为 CoI-Agent 的 AI 工具，旨在帮助科研人员自动生成科研想法。这款工具通过输入特定的论文主题，能够迅速生成相关的科研 idea，从而节省科研人员的时间，提高工作效率。只需输入一个主题，CoI-Agent 就能生成一系列相关的关键词、研究问题和研究方法。

10/25/2024 11:00:56 AM 汪淼

“稚晖君”创业项目，智元机器人宣布灵犀 X1 面向全球开源

智元机器人今日宣布“灵犀 X1”面向全球正式开源，软硬件全套图纸和代码水灵灵地上线到 GitHub 啦，开发指南上线至智元机器人官网。智元机器人官方称，作为业内首家全栈开源人形机器人图纸和代码的公司，此次开源将毫无保留地提供“一站式”软硬件技术资源，总资料大小超过 1.2GB。在整机结构硬件方面，开源内容包含详尽的整机结构图纸、硬件框图和物料清单（BOM）、装机说明。

10/24/2024 6:07:26 PM 浩渺

智谱开源文生图模型 CogView3-Plus，相关功能上线智谱清言 App

感谢智谱技术团队今天宣布开源文生图模型 CogView3 及 CogView3-Plus-3B ，该系列模型的能力已经上线“智谱清言”App。据介绍，CogView3 是一个基于级联扩散的 text2img 模型，其包含如下三个阶段：第一阶段：利用标准扩散过程生成 512x512 低分辨率的图像。第二阶段：利用中继扩散过程，执行 2 倍的超分辨率生成，从 512x512 输入生成 1024x1024 的图像。

10/14/2024 11:13:47 AM 清源

首个开源 AI 候选版定义稿发布：四大要求，训练数据上有妥协

如何定义开源人工智能（AI）？开源倡议组织（OSI）经过 2 年的努力，于昨日（10 月 9 日）发布了首个开源 AI 定义候选版本。首个候选版本主要澄清开源 AI 领域的各种争议，规定一个 AI 系统 / 模型需要具备以下 4 种基础自由要求，才能视为开源，AI在线附上相关要求如下：在未获许可的情况下，他人可出于任何目的使用该系统。可以深入研究系统的运行原理出于任何目的修改系统。与他人共享，无论是否修改。OSI 在训练数据方面选择妥协，要求提供“关于用于训练系统的数据的足够详细信息”，而非完整数据集。此举旨在平衡

10/10/2024 10:07:46 AM 故渊

Lumigator 评估框架登场：Mozilla 赋能开发者 AI 旅程，助其选择最佳模型

Mozilla 昨日（10 月 3 日）发布博文，推出了 Lumigator 新框架，主要帮助开发者为其项目挑选合适的 AI 大语言模型（LLM）。Mozilla 想要解决的问题Mozilla 公司在博文中表示，相比较 AI 大语言模型的繁荣，相关的评估工具尚未跟上发展的步伐，由于没有清晰的统一方法来比较模型，让开发者和企业难以做出明智的选择。Mozilla Lumigator 框架Mozilla 在博文中表示 Lumigator 主要有以下特点：透明和高效的模型选择：Lumigator 的目标是使模型选择过程变得

10/4/2024 1:16:16 PM 故渊

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

近日，中国电信人工智能研究院（TeleAI）成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型（万卡万参），并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首席科学家、中国电信人工智能研究院（TeleAI）院长李学龙教授带领团队完成的又一项里程碑式的重要科研成果，标志着国产大模型训练真正实现全国产化替代，正式进入全国产自主创新、安全可控的新阶段。TeleChat2-115B 基于中国电信自研的天翼云“息壤

9/29/2024 4:42:00 PM 机器之心

最受欢迎开源大模型，为什么是通义？

开源与闭源之争早已非新奇的话题，但毋庸置疑的是，开源极大地促进了大模型技术发展和生态繁荣。大模型被认为是最烧钱的技术，训练一个大模型往往需要大量的数据、计算资源，导致训练成本巨大，众所周知GPT-3的训练费用据说超过 4600万美元，在大模型开源之前，大模型一直是那些有大量资金加持的大厂和明星创业公司才有资格碰的事情。随着如 llama、Mistral、Falcon 这些开源先锋搅动了整个大模型竞争浪潮，那些没有AI积累的企业、大量中小公司团队，今天个人开发者，都能基于开源底座模型，用很低的成本训练、部署自己的专属模型，llama 这样的开源先锋也因此拥有一众拥趸。

9/29/2024 11:15:00 AM 张进

陈睿：B站已上线自研大模型 index 并应用于 AI 字幕，具备近 10 种语言实时翻译能力

感谢据澎湃新闻报道，在今天的 2024 年中国国际智能传播论坛上，哔哩哔哩董事长兼 CEO 陈睿表示，B站上线了自研大语言模型 index，并将其应用于 AI 字幕。目前，B站具备中、英、韩、日、泰语等近 10 种语言的实时翻译能力，准确度接近 90%。陈睿表示，B站更看重拥抱开源的生态，自研大模型就是建立在开源的基础上，相信开源将会成为 AI 中的主流。同时，AI 是年轻人在B站上最关注的内容，也是增长最快的科技内容。作为一种普惠技术，AI 最终会让所有人都从中受益。B站第二季度的日均活跃用户（日活用户）达 1.

9/26/2024 9:59:45 PM 清源

“稚晖君”创业项目，智元自主研发的机器人中间件 AimRT 开源

智元自主研发的机器人中间件 AimRT 开源上线。▲ AimRT 架构图官方表示，AimRT 是一个更现代、轻量易用，且高效稳定的通信开发框架，具备机器人开发流程所必备的许多实用特性，并解决了主流开源中间件的一些痛点：在软件开发效率方面，AimRT 基于现代 C 新标准开发，轻量易部署，将现代化设计模式应用在资源管控、异步编程、部署配置等方面，使得机器人应用的开发更加快捷和高效。在工具链与调测效率方面，AimRT 提供了完善的调试、性能分析工具，以及良好的可观测性支持，有助于快速发现并解决系统中的问题，相比较传

9/25/2024 4:55:32 PM 沛霖（实习）

摩尔线程开源 OpenCV-MUSA：支持绝大部分 cv::cuda 命名空间下数据结构及 API

感谢摩尔线程宣布其自研统一系统架构 MUSA 已完成与开源计算机视觉库 OpenCV 的适配，并正式发布 OpenCV-MUSA 开源项目。OpenCV 作为计算机视觉领域最重要的开源库之一，为图像和视频处理的开发者和研究人员提供了强大且灵活的工具。OpenCV 在自动驾驶、医疗影像、安防监控、机器人视觉、增强现实和图像识别等多个领域得到广泛应用。在现有 OpenCV 代码的基础上，摩尔线程新增了 MUSA 设备后端，并为多个算法模块提供了 MUSA 加速支持，同时对编译脚本也进行了适配。目前 OpenCV-MUS

9/20/2024 5:28:01 PM 沛霖（实习）

零一万物开源 Yi-Coder 系列编程助手模型，支持 52 种编程语言

零一万物今日宣布开源 Yi-Coder 系列模型，该模型是 Yi 系列模型家族中的编程助手。Yi-Coder 系列模型专为编码任务而生，提供 1.5B 和 9B 两种参数。其中，Yi-Coder-9B 的表现号称“优于其他 10B 参数以下的模型”，如 CodeQwen1.5 7B 和 CodeGeex4 9B，甚至能够“与 DeepSeek-Coder 33B 相媲美”。据介绍，Yi-Coder 能够处理最长 128K tokens 的上下文内容，适用于复杂项目级代码的理解和生成。Yi-Coder 还支持 52

9/5/2024 9:21:50 AM 汪淼

摩尔线程开源音频理解大模型 MooER：基于国产全功能 GPU 训练和推理

摩尔线程开源了音频理解大模型 —MooER（摩耳），是业界首个基于国产全功能 GPU 进行训练和推理的大型开源语音模型。基于摩尔线程夸娥（KUAE）智算平台，MooER 大模型用 38 小时完成了 5000 小时音频数据和伪标签的训练。MooER 不仅支持中文和英文的语音识别，还具备中译英的语音翻译能力。在 Covost2 中译英测试集中，MooER-5K 取得了 25.2 的 BLEU 分数，接近工业级效果。摩尔线程 AI 团队在该工作中开源了推理代码和 5000 小时数据训练的模型，并计划进一步开源训练代码和基

8/23/2024 6:21:35 PM 沛霖（实习）

北京将建设具身智能机器人创新中心，全力打造全球机器人产业高地

2024 年世界机器人大会今天在北京亦庄开幕。据财联社，北京市副市长靳伟在大会上表示，北京将坚持产品创新和场景示范的双轮驱动，产业协同和生态优化的共同联动，全力打造全球的机器人产业高地。据介绍，北京将建设具身智能机器人创新中心，用好“天工”和“开悟”两个开源平台和具身智能数据体，组建机器人共享加工中心，推动精密零部件加工中心、概念验证和中试测试平台，尽快投入运营，支撑初创企业技术和产品的快速迭代。此外，北京将不断加大应用场景的开放力度，全面实施百项机器人新品工程和百种应用场景示范工程，率先探索医疗、养老、园林、农业

8/21/2024 1:39:43 PM 清源

智谱 AI 开源 CogVideoX 视频生成模型：“清影”同源，单张 4090 显卡可推理

感谢智谱 AI 今日宣布，将与“清影”同源的视频生成模型 ——CogVideoX 开源。据介绍，CogVideoX 开源模型包含多个不同尺寸大小的模型，目前将开源 CogVideoX-2B，它在 FP-16 精度下的推理需 18GB 显存，微调则需要 40GB 显存，这意味着单张 4090 显卡即可进行推理，而单张 A6000 显卡即可完成微调。CogVideoX-2B 的提示词上限为 226 个 token，视频长度为 6 秒，帧率为 8 帧 / 秒，视频分辨率为 720*480。官方表示，性能更强参数量更大的模

8/6/2024 11:13:40 AM 沛霖（实习）

Llama 对决 GPT：AI 开源拐点已至?｜智者访谈

人工智能的卓越发展源于对技术与产业本质的洞察机器之心全新视频栏目「智者访谈」邀请领域专家，洞悉 AI 核心技术与行业趋势为从业者量身打造深化行业认知，激发创新思考与智者同行，共创 AI 未来

7/28/2024 11:07:00 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型 AI新词机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果算法腾讯 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算大型语言模型 AI设计生成式AI 搜索视频生成亚马逊 AI模型 DeepMind 特斯拉场景深度学习 Transformer 架构 Copilot MCP 编程视觉

开源

微软推出 Magentic-One：多 AI 智能体协同完成复杂任务

腾讯混元宣布大语言模型和3D模型正式开源 ​

全球首个开源 AI 标准发布，微软、谷歌、亚马逊、Meta、英特尔、三星等巨头制定

阿里达摩院开源 CoI-Agent：一键生成科研 idea 的 AI 研究助手

“稚晖君”创业项目，智元机器人宣布灵犀 X1 面向全球开源

智谱开源文生图模型 CogView3-Plus，相关功能上线智谱清言 App

首个开源 AI 候选版定义稿发布：四大要求，训练数据上有妥协

Lumigator 评估框架登场：Mozilla 赋能开发者 AI 旅程，助其选择最佳模型

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

最受欢迎开源大模型，为什么是通义？

陈睿：B站已上线自研大模型 index 并应用于 AI 字幕，具备近 10 种语言实时翻译能力

“稚晖君”创业项目，智元自主研发的机器人中间件 AimRT 开源

摩尔线程开源 OpenCV-MUSA：支持绝大部分 cv::cuda 命名空间下数据结构及 API

零一万物开源 Yi-Coder 系列编程助手模型，支持 52 种编程语言

摩尔线程开源音频理解大模型 MooER：基于国产全功能 GPU 训练和推理

北京将建设具身智能机器人创新中心，全力打造全球机器人产业高地

智谱 AI 开源 CogVideoX 视频生成模型：“清影”同源，单张 4090 显卡可推理

Llama 对决 GPT：AI 开源拐点已至?｜智者访谈

腾讯混元宣布大语言模型和3D模型正式开源