代码
清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者
整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计,给人一种视频版DeepSeek的感觉。 图片Magi-1将视频生成卷到了新高度,大片级品质直接锁住大家的眼球,请看VCR:其主打能力,一是无限长度扩展,实现跨时间的无缝连贯叙事:图片二是能将生成时长控制精确到每一“秒”:图片另外,Magi-1对物理规律也有更深度的理解,Physics-IQ基准测试56.02%,大幅领先一众顶流。 现在看这张图,Sora的时代是真的过去了。
4/22/2025 3:29:05 PM
实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实!
号称“OpenAI迄今为止最强模型”,o3/o4-mini真实能力究竟如何? 就在发布后的几小时内,网友们的第一波实测已新鲜出炉。 最强推理模型o3,即使遇上首位全职提示词工程师Riley Goodside的“刻意刁难”,也顺利过关:图片可以看到,面对藏在一堆玩具里的手绘图表,它也能通过图像识别和推理能力正确解答。
4/18/2025 11:18:51 AM
量子位
从思考到行动:大模型自主工具调用能力的深度实现
本项目由复旦大学知识工场实验室肖仰华教授、梁家卿青年副研究员领导,博士生韩槿一,硕士生李廷云、熊程元、姜子上、王昕奕等同学共同参与完成。 GPT - 4o、Deepseek - R1 等高级模型已展现出令人惊叹的「深度思考」能力:理解上下文关联、拆解多步骤问题、甚至通过思维链(Chain - of - Thought)进行自我验证、自我反思等推理过程。 但是,多数主流模型仍在基础问题上犯错,复杂四则运算计算失误,简单「两个小数比大小」出错、甚至连数清楚 strawberry 里有几个「r」都能翻车……即使提示像 R1 这样具备深度思考能力的大模型也要消耗大量的 token 才能勉强答对。
4/17/2025 10:43:00 AM
机器之心
OpenAI开源超火Agent,五小时破5000颗星,霸榜Github
在今天凌晨1点的产品发布中,OpenAI还开源了一个终端轻量级代码Agent智能体——Codex CLI。 从凌晨到现在只用了5小时左右,Codex CLI直接破5000星霸榜Github,估计今天能破1万颗星,将成为一款明星级Agent。 OpenAI联合创始人兼总裁Greg Brockman表示,Codex CLI只是第一款代码工具,未来还将继续开源Agent产品。
4/17/2025 9:58:32 AM
AIGC开放社区
官方回应!微软旗下GitHub“崩了”系配置变更导致的意外,并非屏蔽中国IP!现已恢复
上周末,一些网友发现微软旗下的代码托管平台 GitHub无法访问,疑似屏蔽了中国IP! 这一消息立即在多个平台被热议,有人联想到最近微软旗下的微创公司刚刚停止了中国区运营,表示“微软最近动作不断”。 还好,官方已经进行回应,表示暂时的封锁访问是由一项配置更改带来的意外。
4/14/2025 12:06:48 PM
AI席卷校园:百万条对话揭秘,Claude是代码救星还是作弊工具?
如今,AI不再只是专业的研究工具,它已成为大学生日常学习的好帮手。 随着AI越来越深入地融入教育环境,需要思考一系列关于学习、评估和技能培养的重要问题。 目前,大多数相关讨论都基于调查和对照实验,却缺乏学生在真实学习场景中自然融入AI的直接证据。
4/14/2025 9:22:00 AM
新智元
首个AI科学家发论文进ICLR!得分6/7/6,从选题到实验全程零人工,连GitHub代码库都是AI写的
嚯! 完全由AI生成的论文,通过顶会ICLR评审? !
4/9/2025 9:12:28 AM
量子位
Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告
Meta最新基础模型Llama 4发布36小时后,评论区居然是这个画风:失望,非常失望不知道他们后训练怎么搞的,总之不太行在[各种测试]2中失败……还被做成表情包调侃,总结起来就是一个“差评如潮”。 具体来看,大家的抱怨主要集中在代码能力。 最直观的要数经典“氛围编程”小球反弹测试,小球直接穿过墙壁掉下去了。
4/8/2025 3:44:00 AM
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯
AI不过周末,硅谷也是如此。 大周日的,Llama家族上新,一群LIama 4就这么突然发布了。 这是Meta首个基于MoE架构模型系列,目前共有三个款:Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。
4/7/2025 9:05:00 AM
量子位
DeepSeek再度升级,厉害了!
当代的程序员,避免不了各种AI工具打交道,可以说,这些AI工具早已成为我们生活和工作的一部分。 从之前的ChatGpt,到今年年初开源的DeepSeek爆火,国产新锐 DeepSeek 犹如一匹黑马,将中国的 AI 技术从“追赶者”转变为“引领者”。 现在各个大厂也都纷纷部署了DeepSeek,我也把重心从国外的产品转向了国内 AI。
4/3/2025 1:25:00 AM
刘欣
DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet
昨夜,DeepSeek V3 毫无征兆地来了一波更新,升级到了「DeepSeek-V3-0324」版本。 目前,新版本在 Hugging Face 上可以下载并部署。 Hugging Face 地址:,DeepSeek-V3-0324 没有公布详细的模型卡。
3/25/2025 9:48:22 AM
机器之心
13年后,AlexNet源代码终于公开:带注释的原版
想知道 AlexNet 2012 年的原始代码长什么样吗? 现在,机会来了! 刚刚,谷歌首席科学家 Jeff Dean 宣布,他们与计算机历史博物馆(CHM)合作,共同发布了 AlexNet 的源代码,并将长期保存这些代码。
3/21/2025 1:17:38 PM
机器之心
Gemini大升级!谷歌引爆程序员革命:编程只需一句话,不到1分钟
谷歌Gemini惊喜不断,再次迎来重磅更新! 之前,Gemini陆续推出了原生图像处理,已被全网玩疯了。 此外,上周推出可免费体验的最新Deep Research,个性化AI助手等功能。
3/19/2025 1:12:14 PM
新智元
陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目
大模型持续震惊科学家! 以往一小时才能完成的代码,现在十分钟就能实现「生成、测试到得出结果」。 “大模型推广大神”陶哲轩又来分享他的亲测体验了。
3/18/2025 9:19:26 AM
量子位
0行代码打造3D游戏,氛围编码席卷全网!开发30分爆赚28万
用「vide coding」制作3D游戏正在成为一股新风潮。 从大V到普通网友,越来越多人加入到了这场狂欢之中。 资深软件工程师Grégory D'Angelo上传了一段他vide coding出来的游戏视频。
3/17/2025 9:27:45 AM
新智元
大模型指标:RPM、TPM…这些“神秘代码”到底是什么?
一、RPM:每分钟能“说多少话”? 定义:RPM全称是Requests Per Minute(每分钟请求数),表示大模型每分钟能处理的请求次数。 比如,某模型设置RPM=300,就意味着每分钟最多响应300次用户提问。
3/13/2025 8:33:37 AM
若有无
OpenAI最强模型惨遭剖脑,CoT写下作弊自白书!不写代码耍心机被当场抓包
就在刚刚,OpenAI博客放出了一项新的研究。 他们发现,前沿推理模型一旦有机会,就会试图钻漏洞! 这种行为,被称为奖励欺骗。
3/11/2025 1:39:08 PM
新智元
已节省数百万GPU小时!字节再砍MoE训练成本,核心代码全开源
字节对MoE模型训练成本再砍一刀,成本可节省40%! 刚刚,豆包大模型团队在GitHub上开源了叫做COMET的MoE优化技术。 COMET已应用于字节的万卡训练集群,在真实的生产环境中,累计帮助节省了数百万GPU小时。
3/11/2025 9:20:00 AM
量子位
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
Anthropic
英伟达
论文
AI新词
代码
训练
算法
Stable Diffusion
LLM
芯片
蛋白质
腾讯
开发者
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
华为
AI设计
工具
RAG
大语言模型
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
特斯拉
应用
DeepMind