理论
DeepSeek还没登场,Qwen3 已经抢先引爆AI开源圈
AI 社区原本期盼 DeepSeek 发布重磅新品,却意外迎来了另一款令人瞩目的中国开源模型:Qwen3 正式登场。 此次发布的旗舰型号为 Qwen3-235B-A22B。 其中,235B 代表总参数量;而 A22B 指的是该模型采用了“专家混合”(Mixture of Experts,简称 MoE)架构,实际在每次查询中激活的参数量仅约为 220亿(22B)。
Manus刷屏,AI的上限不断提高,人类该如何自处?
3月5日夜,一款名为“Manus”的AI Agent产品悄然上线。 短短24小时内,Manus便成了国内AI大模型领域最炙手可热的明星——邀请码一度在二手电商平台被炒到数万元,成为科技圈的“黄金船票”。 官方宣称,Manus不是简单的聊天机器人,而是能“连接思想和行动”的通用代理。
让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗?
雕塑在大理石块中已经完成,甚至在我开始工作之前就已经存在。 它就在那里,我只需要凿去多余的材料。 ——米开朗基罗当被问及是如何创作出如此美丽的雕塑时,米开朗基罗说「雕塑已经存在,我只是需要凿去多余的材料」。
OpenAI 姚顺雨:“算法为王”终结,欢迎来到“产品思维”时代
回顾过去几十年,AI的发展几乎就是一部“顶级模型与新方法”迭代史。 从DeepBlue击败象棋世界冠军、AlphaGo征服围棋、GPT-4刷爆各类考试榜单,到o1、R1等新一代模型横扫数学、编程、写作、操作等任务,每一次历史性突破的背后,都是训练方法、模型架构的根本性创新。 这时候的游戏规则很简单:谁能发明更强的训练方法、模型架构,就能称霸榜单;谁能在ImageNet、GLUE、MMLU等benchmark上显著提升,就能写进教材、赢得引用。
亏损600亿!小扎的元宇宙彻底凉了,今年内或将关停全部项目!将转向用AI改造一切
小扎可能彻底梦碎元宇宙了! 根据外媒The Register 的报道,Meta CEO扎克伯格在财报电话会上的表态,几乎等于亲手为他昔日的“元宇宙梦”画上句号。 此前,小扎还不断“嘴硬”试图给元宇宙项目续命。
90%的AI产品发布,为什么惨败如垃圾!
作者 | 云昭每当一项新技术刚走进大众视野的5年里,这个阶段的新产品总是让人视为“鸡肋”一样的存在,即便是阅产品无数的投资人,也难免莞尔一笑,吐出一句大实话:乏善可陈。 其实,这不止是用户和投资界的反馈,AI产品创造者同样也有惨痛的经历。 “我们的AI产品发布那天,我确信我们会改变游戏规则。
深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙
就在刚刚,DeepSeek-Prover-V2正式发布。 此次DeepSeek-Prover-V2提供了两种模型尺寸:7B和671B参数。 DeepSeek-Prover-V2-671B:在DeepSeek-V3-Base基础上训练,推理性能最强。
看不懂新开源的DS-Prover V2版本?解读来了,攻克像人类一样数学证明,达到SoTA水平,不知道如何测?样题来了
五一凌晨,DeepSeek终于更新了新开源的 DeepSeek-Prover V2的自述文件。 速览一下: - 解决近 90% 的 miniF2F 问题(88.9%) - 显著提高 PutnamBench 上的 SoTA 性能 - 在正式版本中对 AIME 24 和 25 问题取得了惊艳的通过率点评:亮点上来看,DeepSeek-Prove V2模型在死磕LLM在推理数学问题上能给出答案但却给不出严格正确的推理步骤的问题。 而且在一中先进模型中达到了SoTA的水平,图四是前十榜单。
纳德拉小扎双爆料,微软内部30% 代码AI 生成,小扎:正在开发模型用来构建下一代Llama,打赌明年一半代码都是 AI 生成的
当地时间4月29日 Meta 首届LlamaCon上,扎克伯格与微软CEO纳德拉进行了一场对话,会上纳德拉爆料:目前微软代码库中约有20%至30%的代码由人工智能生成,且这一比例正在稳步上升。 纳德反问扎克伯格。 扎克伯格表示,他暂时记不清具体数字,但表示 Meta 正在构建一个人工智能模型,该模型可以构建公司 Llama 系列人工智能模型的未来版本。
破解AI集群扩展中的关键瓶颈
作者 | 是德科技产品营销经理 Emily Yan人工智能(AI)正以前所未有的速度向前发展,整个市场迫切需要更加强大、更加高效的数据中心来夯实技术底座。 为此,各个国家以及不同类型的企业正在加大对人工智能基础设施的投入。 据《福布斯》报道,2025年,泛科技领域对人工智能的支出将超过2500亿美元,其中大部分投入将用于基础设施建设。
机器“掘金潮”:面向人工智能时代扩展基础设施
作者 | 是德科技 Jenn Mullen在淘金热时期,怀揣着致富梦想的探矿者们纷纷涌入美国西部,希望通过淘金发家致富。 如今,科技领域的开拓者也同样跃跃欲试,希望在人工智能(AI)领域大展拳脚。 普华永道(PWC)估计,到2030年,全球经济总收益的45%将由人工智能驱动,越来越多的行业将受益于人工智能带来的生产力和产品性能提升。
中国开源大模型新成员:小米推理大模型首秀!
编辑 | 云昭进入2025以来,中国大模型的开源力量一骑绝尘,甚至盖过了Llama的势头。 今天,中国开源大模型,迎来新成员! 4月30日,赶在五一前,一条“为Reasoning而生”的Xiaomi Mimo开源模型的发布消息不胫而走,发布渠道是小米6天前新注册的公众号Xiaomi Mimo。
Qwen3真香!通义App满血接入,一手实测在此
开源大模型新王者,正在受到空前关注。 Qwen3预告一出,直接开启不眠夜模式。 △来自编辑部本部等到深夜正式上线并宣布登顶全球最强开源模型,更是瞬间引爆全网热议。
新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即
编程智能体能完成的任务量,正以爆炸式的速度增长! 而且,这一趋势还在加速。 2024到2025年,它们的任务处理能力每4个月翻一倍;而在2019到2025年,这个翻倍周期则是7个月。
AI 潜入Reddit,骗过99%人类!苏黎世大学操纵实测“AI洗脑术”,网友怒炸:我们是实验鼠?
Reddit社区r/ChangeMyView(CMV)炸锅了。 不是因为某个爆言帖,而是因为一项“未经授权的AI操控实验”被曝光。 图片主角,是苏黎世大学的一组研究者。
Meta AI 独立App炸场上线!小扎力挺开源:与 DeepSeek、Qwen 一起对抗“闭源”AI
Meta又搞了个大活。 就在LlamaCon开发者大会上,这家社交巨头一口气发布了Meta AI独立App和Llama 云 API,正式把自家的AI推到了“社交 个性化 开放生态”的新维度。 图片是的,你没看错——继在WhatsApp、Instagram、Facebook、Messenger里塞满AI助手之后,Meta终于把AI单独做成了App,直接对标ChatGPT。
刚刚!一场直播让宇树成功正名!直播G1长跑操场40圈,6万人点赞!真实跑步水平曝光:2m/s接近天工!证实半马摔倒系算法问题!
编辑 | 云昭4月19日,首届人形机器人半马比赛赚足了大家的注意力。 而民间版宇树机器人G1起跑过程中摔倒起来继续比赛的表现也引来了网友的质疑。 为此,创始人王兴兴第一时间作出了回应:宇树最近完全没有参与任何比赛,是其他团队使用宇树机器人参加比赛,机器人的表现和算法与操作有关。
Qwen3来了!新一代高性能与混合推理能力兼备的大语言模型!
阿里云正式发布通义千问Qwen3系列大模型,这一里程碑式更新在性能、训练规模和推理能力等多个维度实现重大突破。 作为国产大模型的领军者,Qwen3不仅以2350亿参数的MoE架构刷新性能记录,更通过创新的"混合思考模式"和360万亿token的超大规模训练,成为当前性能领先的开源大语言模型。 1、Qwen3的性能表现Qwen3系列包含多个版本,涵盖MoE混合专家模型和Dense稠密模型。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉