大模型

上线仅7天，阿里通义千问3问鼎全球开源模型

近日，阿里巴巴推出的开源大模型 “通义千问3”（Qwen3）在上线仅七天后，便成功夺得了全球开源模型的冠军地位。这一成果是在国际权威大模型评测榜 LiveBench 最新发布的排名中取得的，标志着阿里在人工智能领域又一次取得了重要突破。据悉，通义千问3在指令遵循能力方面，表现超越了诸多顶级闭源模型，如 o3High、o4-Mini High 和 Gemini2.5pro，成功跻身全球第一的位置。

5/7/2025 10:01:04 AM AI在线

理想汽车李想宣布 AI Talk 第二季：探讨人工智能的未来与发展

理想汽车创始人兼 CEO 李想在社交平台上宣布，《AI Talk 第二季》将于5月7日晚上8点正式上线。在这一季中，他将与观众分享自己对人工智能最新的思考，尤其是理想 VLA 司机大模型的创新理念。李想表示，VLA 司机大模型不仅是技术的结晶，更是生物进化的延续，从动物智能到人类智慧的跃迁。

5/7/2025 9:00:53 AM AI在线

从看见到理解，多模态大模型如何重塑行为检测

在人工智能技术快速迭代的今天，行为检测作为计算机视觉领域的重要分支，正迎来一场由多模态大模型引领的技术革命。作为曾在CV算法公司工作的从业者，我深刻体会到传统计算机视觉方法在实际落地中的诸多痛点。过去几年，许多行为检测、烟火检测等应用，往往因为高昂的训练成本和难以接受的误报率而被甲方叫停。

5/7/2025 1:00:00 AM 贝塔街的万事屋

三分钟快速入门大模型数据工程

向自然语言处理的大模型应用，数据工程的核心任务是构建一套高效、可扩展、可控的数据流程，从源头到可用于模型训练、推理的高质量文本语料，全链路打通。数据工程的整体目标构建稳定的数据流转链路，从原始文本数据 → 清洗/标注/审核后的语料 → 符合模型输入格式的数据集保证数据可用性、完整性、质量、结构统一性支持多阶段使用场景：训练/微调、推理RAG、评估测试等数据来源最常见的形式是甲方提供，如客户工单、业务知识库、客服聊天记录、FAQ 等。需尽早明确数据格式、内容范围、隐私边界。

5/7/2025 12:10:00 AM 贝塔街的万事屋

南天信息与新华三合作推出行业领先的大模型一体机

近日，南天信息的子公司海捷科技与紫光集团旗下的新华三集团达成深度合作，联合推出了一款基于新华三 LinSeer Cube 的大模型一体机。这一新产品的发布，标志着在人工智能领域内又一次重要的技术进步，特别是在行业应用方面。随着人工智能的迅猛发展，企业在数字转型和智能化进程中亟需高效、便捷的解决方案。

5/6/2025 12:00:51 PM AI在线

iOS18.6或为中国用户启用AI功能国行苹果AI或由阿里百度技术支持

近日，知名科技记者马克·古尔曼透露消息，苹果AI有望在iOS18.6系统中首次在中国大陆启用部分功能，届时其背后将有阿里巴巴和百度提供技术支持。由于政策和合规方面的限制，海外的大模型如GPT、Gemini等无法在中国境内直接提供服务。基于此情况，百度的文心一言大模型将成为国行版苹果AI的核心云端智能引擎，承担起为苹果AI提供智能处理能力的重任。

5/6/2025 10:01:27 AM AI在线

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

大语言模型（LLMs）的成功激发了人们对各种智能体的兴趣。将 LLM 用于智能体的一个关键假设是，LLMs 利用常识和思维链（Chain-of-Thought, CoT）进行推理，从而智能体可以有效地探索并高效地解决复杂领域的问题。然而，LLM 智能体存在次优探索和知 - 行差距（knowing-doing gap）的问题，即无法有效地将模型中的知识转化为行动。

5/6/2025 9:08:00 AM 机器之心

68页论文再锤大模型竞技场！Llama4发布前私下测试27个版本，只取最佳成绩

大模型竞技场的可信度，再次被锤。最近一篇名为《排行榜幻觉》（The Leaderboard Illusion）的论文在学术圈引发关注。图片它指出，如今被视为LLM领域首选排行榜的Chatbot Arena，存在诸多系统问题。

5/6/2025 1:45:00 AM

快手All in AI视觉！成立可灵AI事业部，加速大模型商业化

4 月 30 日，快手发布组织架构调整公告，宣布正式成立可灵AI事业部，进一步强化其在人工智能领域的战略布局。公告显示，新成立的可灵AI事业部下设可灵AI产品部、运营部和技术部，全面负责包括可灵、可图在内的系列大模型业务。快手高级副总裁盖坤将出任可灵AI事业部负责人，并继续兼任社区科学线负责人。

4/30/2025 6:00:51 PM AI在线

中国开源大模型新成员：小米推理大模型首秀！

编辑 | 云昭进入2025以来，中国大模型的开源力量一骑绝尘，甚至盖过了Llama的势头。今天，中国开源大模型，迎来新成员！ 4月30日，赶在五一前，一条“为Reasoning而生”的Xiaomi Mimo开源模型的发布消息不胫而走，发布渠道是小米6天前新注册的公众号Xiaomi Mimo。

4/30/2025 4:48:07 PM 云昭

真假难辨!腾讯混元Turbo S助《太空杀》AI玩家智商飙升

社交推理游戏《太空杀》正迎来一场人和AI推理水平的大PK。巨人网络旗下这款风靡全球的手游，通过接入腾讯混元新一代旗舰快思考模型Turbo S，使其AI玩家的智能水平实现了高度拟人化。腾讯混元Turbo S能够同时驱动八名AI玩家参与游戏，凭借其强大的推理能力和仿真的文字对话能力，与真人玩家展开智力较量。

4/30/2025 2:00:41 PM AI在线

蚂蚁数科发布金融智能体开发平台 Agentar，推动 AI 技术在金融领域应用

在数字中国建设峰会期间，蚂蚁数科正式推出了智能体开发平台 Agentar。该平台旨在为金融机构提供一站式、全栈的智能体开发工具，帮助它们高效地打造具备自主决策能力、可信赖的金融智能体应用。此次发布标志着 AI 技术从 “辅助工具” 转变为推动金融服务变革和效率提升的 “生产力引擎”。

4/30/2025 12:00:40 PM AI在线

加速追赶！腾讯拆分AI团队，豪掷研发资源

据央广网消息，4月29日，公司对其混元大模型研发体系进行全面重构，聚焦算力、算法和数据三大核心，调整团队部署并加大研发投入。此次调整的核心是成立两个新的部门:大语言模型部和多模态模型部，分别负责探索前沿技术、迭代基础模型。同时，腾讯加强了底层支撑，设立数据平台部和机器学习平台部，专注于数据管理和AI平台建设，为混元大模型的研发提供全面支持。

4/30/2025 11:00:50 AM AI在线

Qwen3来了！新一代高性能与混合推理能力兼备的大语言模型！

阿里云正式发布通义千问Qwen3系列大模型，这一里程碑式更新在性能、训练规模和推理能力等多个维度实现重大突破。作为国产大模型的领军者，Qwen3不仅以2350亿参数的MoE架构刷新性能记录，更通过创新的"混合思考模式"和360万亿token的超大规模训练，成为当前性能领先的开源大语言模型。 1、Qwen3的性能表现Qwen3系列包含多个版本，涵盖MoE混合专家模型和Dense稠密模型。

4/30/2025 10:59:04 AM

万兴科技与华为云携手推进 AI 大模型技术创新

近日，万兴科技集团股份有限公司（以下简称 “万兴科技”）与华为云计算技术有限公司(以下简称 “华为云”)在深圳签署了战略合作协议。此次合作旨在结合双方的优势，共同推动 AI 大模型的技术和应用创新，进一步开拓数字创意领域的潜力。根据协议，万兴科技将充分发挥其在音视频大模型和 AI 应用方面的专业能力，而华为云则将利用其强大的云基础设施和市场拓展优势，建立深度合作关系。

4/30/2025 10:00:50 AM AI在线

AI知识库的真相，你知道吗？

很多人对AI知识库的想象是这样的，他们以为只需将所有资料一股脑地拖进AI客户端，比如 Cherry Studio 内。图片这样，AI就会认真阅读所有内容，并自动生成完美结论。然而，实际体验后，许多人发现AI知识库的效果远没有想象中理想，经常遇到各种奇怪的问题。

4/30/2025 9:06:23 AM 程序员NEO

2024 年中国 MaaS 与 AI 大模型解决方案市场迎来爆发式增长

4/29/2025 6:00:40 PM AI在线

蚂蚁数科发布金融智能体开发平台Agentar 内测上线超百个金融MCP服务

4月29日，在数字中国建设峰会期间，蚂蚁数科正式对外发布智能体开发平台Agentar，为金融机构提供一站式、全栈的智能体开发工具，助力金融机构高效打造能够自主决策、可信可靠的金融智能体应用，加速AI技术从“辅助工具”真正成为驱动体验变革、效率跃升的“生产力引擎”。随着生成式AI的快速发展，行业大模型及智能体应用正在重塑金融服务。然而，大模型训练成本高昂难以在普惠场景中规模化复制;金融行业数据的高敏感性与安全合规要求;以及金融核心场景数据样本量较小、通用模型在金融专业场景中泛化能力不足等问题都在制约大模型技术在金融行业应用的深度与广度。

4/29/2025 4:00:40 PM AI在线

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

大模型

上线仅7天，阿里通义千问3问鼎全球开源模型

理想汽车李想宣布 AI Talk 第二季：探讨人工智能的未来与发展

从看见到理解，多模态大模型如何重塑行为检测

三分钟快速入门大模型数据工程

南天信息与新华三合作推出行业领先的大模型一体机

iOS18.6或为中国用户启用AI功能 国行苹果AI或由阿里百度技术支持

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

68页论文再锤大模型竞技场！Llama4发布前私下测试27个版本，只取最佳成绩

快手All in AI视觉！成立可灵AI事业部，加速大模型商业化

中国开源大模型新成员：小米推理大模型首秀！

真假难辨!腾讯混元Turbo S助《太空杀》AI玩家智商飙升

​蚂蚁数科发布金融智能体开发平台 Agentar，推动 AI 技术在金融领域应用

加速追赶！腾讯拆分AI团队，豪掷研发资源

Qwen3来了！新一代高性能与混合推理能力兼备的大语言模型！

万兴科技与华为云携手推进 AI 大模型技术创新

AI知识库的真相，你知道吗？

​2024 年中国 MaaS 与 AI 大模型解决方案市场迎来爆发式增长

蚂蚁数科发布金融智能体开发平台Agentar 内测上线超百个金融MCP服务

iOS18.6或为中国用户启用AI功能国行苹果AI或由阿里百度技术支持

蚂蚁数科发布金融智能体开发平台 Agentar，推动 AI 技术在金融领域应用

2024 年中国 MaaS 与 AI 大模型解决方案市场迎来爆发式增长