理论
深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙
就在刚刚,DeepSeek-Prover-V2正式发布。 此次DeepSeek-Prover-V2提供了两种模型尺寸:7B和671B参数。 DeepSeek-Prover-V2-671B:在DeepSeek-V3-Base基础上训练,推理性能最强。
5/1/2025 10:33:59 AM
新智元
看不懂新开源的DS-Prover V2版本?解读来了,攻克像人类一样数学证明,达到SoTA水平,不知道如何测?样题来了
五一凌晨,DeepSeek终于更新了新开源的 DeepSeek-Prover V2的自述文件。 速览一下: - 解决近 90% 的 miniF2F 问题(88.9%) - 显著提高 PutnamBench 上的 SoTA 性能 - 在正式版本中对 AIME 24 和 25 问题取得了惊艳的通过率点评:亮点上来看,DeepSeek-Prove V2模型在死磕LLM在推理数学问题上能给出答案但却给不出严格正确的推理步骤的问题。 而且在一中先进模型中达到了SoTA的水平,图四是前十榜单。
5/1/2025 8:33:20 AM
纳德拉小扎双爆料,微软内部30% 代码AI 生成,小扎:正在开发模型用来构建下一代Llama,打赌明年一半代码都是 AI 生成的
当地时间4月29日 Meta 首届LlamaCon上,扎克伯格与微软CEO纳德拉进行了一场对话,会上纳德拉爆料:目前微软代码库中约有20%至30%的代码由人工智能生成,且这一比例正在稳步上升。 纳德反问扎克伯格。 扎克伯格表示,他暂时记不清具体数字,但表示 Meta 正在构建一个人工智能模型,该模型可以构建公司 Llama 系列人工智能模型的未来版本。
4/30/2025 7:08:07 PM
破解AI集群扩展中的关键瓶颈
作者 | 是德科技产品营销经理 Emily Yan人工智能(AI)正以前所未有的速度向前发展,整个市场迫切需要更加强大、更加高效的数据中心来夯实技术底座。 为此,各个国家以及不同类型的企业正在加大对人工智能基础设施的投入。 据《福布斯》报道,2025年,泛科技领域对人工智能的支出将超过2500亿美元,其中大部分投入将用于基础设施建设。
4/30/2025 5:07:53 PM
机器“掘金潮”:面向人工智能时代扩展基础设施
作者 | 是德科技 Jenn Mullen在淘金热时期,怀揣着致富梦想的探矿者们纷纷涌入美国西部,希望通过淘金发家致富。 如今,科技领域的开拓者也同样跃跃欲试,希望在人工智能(AI)领域大展拳脚。 普华永道(PWC)估计,到2030年,全球经济总收益的45%将由人工智能驱动,越来越多的行业将受益于人工智能带来的生产力和产品性能提升。
4/30/2025 5:05:25 PM
中国开源大模型新成员:小米推理大模型首秀!
编辑 | 云昭进入2025以来,中国大模型的开源力量一骑绝尘,甚至盖过了Llama的势头。 今天,中国开源大模型,迎来新成员! 4月30日,赶在五一前,一条“为Reasoning而生”的Xiaomi Mimo开源模型的发布消息不胫而走,发布渠道是小米6天前新注册的公众号Xiaomi Mimo。
4/30/2025 4:48:07 PM
云昭
Qwen3真香!通义App满血接入,一手实测在此
开源大模型新王者,正在受到空前关注。 Qwen3预告一出,直接开启不眠夜模式。 △来自编辑部本部等到深夜正式上线并宣布登顶全球最强开源模型,更是瞬间引爆全网热议。
4/30/2025 2:12:36 PM
量子位
Meta AI 独立App炸场上线!小扎力挺开源:与 DeepSeek、Qwen 一起对抗“闭源”AI
Meta又搞了个大活。 就在LlamaCon开发者大会上,这家社交巨头一口气发布了Meta AI独立App和Llama 云 API,正式把自家的AI推到了“社交 个性化 开放生态”的新维度。 图片是的,你没看错——继在WhatsApp、Instagram、Facebook、Messenger里塞满AI助手之后,Meta终于把AI单独做成了App,直接对标ChatGPT。
4/30/2025 2:12:36 PM
文摘菌
新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即
编程智能体能完成的任务量,正以爆炸式的速度增长! 而且,这一趋势还在加速。 2024到2025年,它们的任务处理能力每4个月翻一倍;而在2019到2025年,这个翻倍周期则是7个月。
4/30/2025 2:12:36 PM
新智元
AI 潜入Reddit,骗过99%人类!苏黎世大学操纵实测“AI洗脑术”,网友怒炸:我们是实验鼠?
Reddit社区r/ChangeMyView(CMV)炸锅了。 不是因为某个爆言帖,而是因为一项“未经授权的AI操控实验”被曝光。 图片主角,是苏黎世大学的一组研究者。
4/30/2025 2:12:36 PM
文摘菌
刚刚!一场直播让宇树成功正名!直播G1长跑操场40圈,6万人点赞!真实跑步水平曝光:2m/s接近天工!证实半马摔倒系算法问题!
编辑 | 云昭4月19日,首届人形机器人半马比赛赚足了大家的注意力。 而民间版宇树机器人G1起跑过程中摔倒起来继续比赛的表现也引来了网友的质疑。 为此,创始人王兴兴第一时间作出了回应:宇树最近完全没有参与任何比赛,是其他团队使用宇树机器人参加比赛,机器人的表现和算法与操作有关。
4/30/2025 12:19:52 PM
云昭
Qwen3来了!新一代高性能与混合推理能力兼备的大语言模型!
阿里云正式发布通义千问Qwen3系列大模型,这一里程碑式更新在性能、训练规模和推理能力等多个维度实现重大突破。 作为国产大模型的领军者,Qwen3不仅以2350亿参数的MoE架构刷新性能记录,更通过创新的"混合思考模式"和360万亿token的超大规模训练,成为当前性能领先的开源大语言模型。 1、Qwen3的性能表现Qwen3系列包含多个版本,涵盖MoE混合专家模型和Dense稠密模型。
4/30/2025 10:59:04 AM
AI包办79%代码,程序员饭碗不保!前端开发要凉,人类只配改Bug?
就在昨天,Anthropic再次更新了他们的人类经济指数报告。 这次他们把研究重点放到了编码上。 在分析了50万份有关编码的用户对话后,他们总结出了一些趋势。
4/30/2025 9:52:42 AM
新智元
零基础十分钟学会 MCP,AI 从此听你指挥!
是否好奇过,为什么有些人能让 AI 助手读取电脑文件、查询实时天气,甚至控制其他软件? 今天,这扇通往 AI 无限可能的大门将为你敞开! 我将用最通俗易懂的语言,手把手教你如何通过 MCP 这个"魔法接口",让你的 AI 助手——无论是 Claude、ChatWise 还是 Cherry Studio——从一个"只会聊天"的助手,变身为能够操作你电脑文件的"全能管家"。
4/30/2025 9:37:07 AM
林月半子聊AI
细思极恐,AI操控舆论达人类6倍!卧底4月无人识破,Reddit集体沦陷
一项惊人的实验揭秘:AI超强说服力,已达人类的6倍! 当你在论坛上激烈争辩,对方逻辑缜密、情感真挚,句句击中内心——但你不知道的是,这根本不是人类,而是一个AI机器人。 最近,苏黎世大学在Reddit热门辩论子版块r/changemyview(CMV)秘密进行的实验,震惊了全球。
4/30/2025 9:20:00 AM
新智元
DeepSeek定制训练:微调与推理技术应用
一. 前言介绍本文内容:模型加载与预处理:详细讲解如何加载预训练模型、分词器,并处理输入数据集。 LoRA配置:介绍如何使用LoRA技术配置模型,并高效进行微调,节省计算资源。
4/30/2025 9:19:32 AM
微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持
微软又有“1 bit LLM”新成果了——发布BitNet v2框架,为1 bit LLM实现了原生4 bit激活值量化,由此可充分利用新一代GPU(如GB200)对4 bit计算的原生支持能力。 同时减少内存带宽&提升计算效率。 之前,微软持续研究BitNet b1.58,把LLM的权重量化到1.58-bit,显著降低延迟、内存占用等推理成本。
4/30/2025 9:16:00 AM
量子位
炸裂登场!Qwen3:等了这一个月,开源AI新王带着“思考引擎”杀来了!
全世界的AI圈子,似乎都在屏息等待。 从各种小道消息到官方偶尔泄露的只言片语,过去这一个月,大家都在猜测阿里通义千问的下一代大模型——Qwen3,到底会带来怎样的惊喜。 今天,靴子终于落地!
4/30/2025 9:11:15 AM
墨风如雪
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind