AI
OpenAI百万美元豪测:顶级大模型取代不了程序员
当Sam Altman宣称大模型将取代"低阶程序员"时,OpenAI自家的最新研究却给出了相反的答案。 该研究联合百名工程师开展SWE-Lancer基准测试,结果显示:面对价值百万美元的真实软件开发任务,三大顶尖大模型的总收入竟不足21%,最强者Claude 3.5也仅解决26%技术问题。 这场AI与人类程序员的"抢饭碗"对决,暂时以机器的惨败告终。
2/21/2025 11:08:46 AM
佚名
前OpenAI CTO 成立思维机器实验室
前OpenAI首席技术官Mira Murati宣布成立新的思维机器实验室(Thinking Machines Lab)。 主要有三个方向:帮助人们调整AI系统以满足他们的具体需求;开发坚实的基础以构建更强大的AI系统;培养开放科学的文化,帮助整个领域理解和改进这些系统。 以下是Thinking Machines Lab的官网介绍:思维机器实验室(Thinking Machines Lab)是一家人工智能研究与产品公司。
2/21/2025 11:00:00 AM
AIGC开放社区
GitLab 再遭投资者诉讼,因 AI 虚假宣传与涨价引发争议
近期,GitLab 及其高管再次面临投资者诉讼,原因是涉嫌对公司的人工智能(AI)能力和市场需求进行虚假宣传。 这是五个月内第三起针对 GitLab 的诉讼,起初的证券投资者诉讼于2024年9月9日提出,随后在2025年2月5日进行了修正,详细说明了更多内容。 紧接着,分别于2025年2月14日和2月19日,提起了两起衍生诉讼。
2/21/2025 10:44:00 AM
AI在线
两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?
刚刚过去的春节,DeepSeek-R1 推理大模型引爆了国内外 AI 社区,并火出了圈。 最近,各个行业又掀起了接入 DeepSeek 的狂潮,大家唯恐落后于人。 北大 AI 对齐团队对包括 DeepSeek-R1、Kimi-K1.5在内的一些强推理模型进行了 2 万字的技术解读,也是此前 o1 解读(北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式)的续作。
2/21/2025 10:34:49 AM
机器之心
深推理模型崛起!Together AI融资3.05亿美元助推GPU需求
在 AI 行业,Together AI 最近宣布完成了一轮3.05亿美元的 B 轮融资,这一消息引起了广泛关注。 该公司的崛起与其新推出的深度理模型 DeepSeek-R1密切相关。 与最初的担忧相反,许行业专家认为,深度推理的进步并没有降低对基础设施的需求,反而在不断提升这一需求。
2/21/2025 10:28:00 AM
AI在线
剧本自动生成3D动画!北航中大等提出新方法,破解多人交互难题 | ICLR 2025
设定一个3D场景,你便可以用文字编织你的剧情。 一句话,就能让两个人激烈争吵。 吵完之后,又温馨共舞起来~想怎么排就怎么排,就像影视拍摄或舞台剧的编排一样,只需在剧本中设定角色的行动、互动和环境要素,就能自动生成符合逻辑的3D角色动画,让你的剧情真正“动”起来。
2/21/2025 9:35:00 AM
量子位
想要提升 DeepSeek 回复质量,会这一招就够了(90%的人不知道)
今天继续介绍deepseek核心技术:反事实推理。 上一篇简要回顾:反事实推理,是一种通过构建与事实相反的假设性情景,探索因果关系和潜在结果的逻辑推理方法;反事实推理,有着严密的数学模型,属于因果推断第三层次:关联,干预,反事实;反事实推理,能帮deepseek突破数据量上限,加强结果解释性,提升回复丰富度;画外音:详见《deepseek凭啥能给出这么丰富的答案 - 反事实推理(上)》。 反事实推理,对我们写提示词,获取更佳的回答质量有什么启示呢?
2/21/2025 9:30:00 AM
58沈剑
谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现,CEO皮猜也来站台了
CEO皮猜亲自站台,谷歌的最新研究狠狠火了——为科学家群体推出“科研搭子”AI co-scientist,一个能够利用高级推理综合大量文献、生成新颖假设,并提出详细研究计划的多智能体AI系统。 划重点,该系统将与OpenAI o1/DeepSeek-R1相似的测试时间计算用来加速科学发现。 据皮猜介绍,这个系统已经在肝脏纤维化治疗、抗菌耐药性和药物再利用等重要研究领域取得了初步成果。
2/21/2025 9:20:00 AM
量子位
比尔盖茨自述:中学时期就开始偷偷996写代码
57年前的西雅图冬夜,一个瘦削少年翻出卧室窗户,奔向名为“C的立方”的计算机实验室。 比尔·盖茨不会想到,这段在寒夜中追逐代码的岁月,正悄然叩响数字时代的大门。 当湖滨中学的编程少年们以无偿劳动换取珍贵的上机时间时,一场改变人类文明进程的变革已在晶体管与二进制中孕育——在这个数字时代的黎明,一群年轻的先驱者站在了浪潮之巅,他们以智慧和勇气,开辟了一个全新的领域:个人计算机软件。
2/21/2025 9:10:00 AM
量子位
世界首个「AI CUDA工程师」诞生!AI自己写代码优化CUDA内核,性能狂飙100倍
就在刚刚,由Transformer八大金刚之一Llion Jones创办的Sakana AI,推出了世界上首个「AI CUDA工程师」——The AI CUDA Engineer。 同时,还发布了一个由「AI CUDA工程师」生成的,包含17,000多个已验证CUDA内核的数据集。 论文地址::「AI科学家」之后,一个疑问一直萦绕在团队心头:如果可以使用AI来进行AI研究,是不是也能用AI来研究如何让AI运行得更快?
2/21/2025 9:00:00 AM
新智元
复旦视频扩散模型综述:覆盖300+文献,探讨近期研究趋势与突破,Github揽星2k+
视频扩散模型新综述来了,覆盖300 文献的那种。 最近,复旦大学、上海市智能视觉计算协同创新中心联合微软等学术机构,在国际顶级期刊《ACM Computing Surveys》(CSUR)上发表了题为《A Survey on Video Diffusion Models》的综述论文。 不仅系统地梳理了扩散模型在视频生成、编辑及理解等前沿领域的进展,还深入探讨了近期的研究趋势与突破,涵盖了该领域近年来的重要成果。
2/21/2025 8:56:49 AM
量子位
微软Muse秒生游戏登Nature,10亿级画面练出最强AI!千亿游戏市场重洗牌
同一天,微软放出两个核弹,首个拓扑量子芯片,还有首个世界与人类行动模型。 AI离数秒生成游戏视频的未来,又近了一步。 今天,微软团队首次引入了「世界与人类行动模型」(WHAM),并冠以希腊艺术女神「缪斯」(Muse)之名。
2/21/2025 8:44:06 AM
新智元
企业为何纷纷转向小AI模型?
当科技巨头们还在比拼千亿参数时,一场静悄悄的AI效率革命正在改写商业规则,从医疗诊断到零售库存管理,企业开始用“小模型”解决“大问题”。 大型语言模型因其多功能性、广泛的领域知识和解决复杂多步骤问题的能力而广受欢迎。 相比之下,小型模型为企业提供了一种资源消耗更少的方式,能够利用定制化的专业知识完成特定任务。
2/21/2025 8:00:00 AM
Lindsey Wilkinson
全球首家!联想将率先在AIPC端侧本地部署DeepSeek大模型
2025年2月20日,联想集团公布截至2024年12月31日的第三财季业绩,其中营收1351亿人民币,同比增长20%;净利润49.8亿人民币,同比增长达106%。 在公布业绩的同时,联想集团宣布,将在AI PC端侧本地部署DeepSeek大模型,这将成为全球首家端侧部署该大模型的AI PC品牌。 小天个人智能体已全面接入DeepSeek-R1联网满血版大模型此前,联想旗下联想天禧个人智能体系统(天禧AS)中的小天个人智能体已全面接入DeepSeek-R1联网满血版大模型。
2/20/2025 6:01:00 PM
新闻助手
钉钉AI企业搜索面向所有用户免费开放
2 月 20 日,钉钉宣布其 AI 企业搜索向所有用户免费开放,同时新增支持慢思考模式和全网搜索,支持移动端、桌面端 7.6.45 及以上钉钉版本。 自钉钉 365 会员权益上线以来,钉钉 AI 企业搜索已经帮助了大量个人用户构建动态的知识网络。 它借助通义大模型的理解、推理和生成能力,可实现自然语言查询信息,并对钉钉内的用户自有信息、企业知识进行整理与提炼,搜索效率较传统搜索方式提升 300%。
2/20/2025 5:22:00 PM
新闻助手
小红书等给AI图像检测上难度!数据集均通过人类感知“图灵测试” | ICLR 2025
量:图像分辨率从720P到4K不等,提供了更高质量的图像数据,增加了检测模型的挑战性。 AIDE模型:多专家融合的检测框架在AI生成图像检测领域,现有的检测方法往往只能从单一角度进行分析,难以全面捕捉AI生成图像与真实图像之间的细微差异。 为了解决这一问题,研究者们提出了简单且有效的AIDE(AI-generated Image DEtector with Hybrid Features)模型,该模型通过融合多种专家模块,从低级像素统计和高级语义两个层面全面捕捉图像特征,实现了对AI生成图像的精准检测。
2/20/2025 1:50:00 PM
量子位
法国核聚变重大突破,等离子体运行1337秒刷新世界纪录!全球核电时代一步之遥
创纪录的1,337秒! 2月12日,法国WEST托卡马克装置,成功实现了创纪录的等离子体持续时间——超过22分钟。 这比几周前中国EAST装置的1066秒提升了25%。
2/20/2025 1:46:19 PM
新智元
突发,Grok-3免费上线!答对9.11和9.9谁大,1分攻克MIT积分难题
世界首个20万块GPU(另有说法是10万)训出的Grok-3,官宣人人可用了! DeepSearch、Think两大模式,同时上线。 唯独遗憾的是,Big Brain还在雪藏。
2/20/2025 1:44:01 PM
新智元
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind