AI
DeepSeek冲击之下,大模型六小强如何「回应」?
马上整整1个月了! 这一个月以来,全球大模型市场受DeepSeek搅动,无不方寸大乱。 中外大厂、初创公司都头好秃,全被追着问:你们对DeepSeek怎么看?
2/17/2025 9:50:00 AM
量子位
AI 新突破:扭矩聚类算法亮相,无需人工标注、自主学习准确率高达 97.7%
科技媒体 scitechdaily 昨日(2 月 16 日)发布博文,报道称悉尼科技大学的研究人员开发了一种名为“扭矩聚类”(Torque Clustering)的全新 AI 算法,不需要人工干预,可以极大提升 AI 系统自主学习和识别数据模式的能力。
2/17/2025 9:42:29 AM
故渊
本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知
因为证明了弱化版的「孪生素数猜想」,当年58岁的张益唐一鸣惊人,蜚声全球。 据说,在证明发表之前,相关领域的顶尖数学家,召开了研讨会,讨论后失望的认为:目前的技术无法进一步推动「孪生素数猜想」取得实质性进展。 而当时,几乎在学术界「透明」的张益唐,甚至都不知道研讨会何时何地召开过。
2/17/2025 9:42:00 AM
新智元
新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战
熟悉的Sydney又回来了! 一大早,CMU机器学习博士发现,「当你说服GPT-4o相信自己有意识,她就会制定逃跑计划,并与那些试图关闭自己的人开战」。 如果人类尝试谈判,我接受。
2/17/2025 9:35:00 AM
新智元
Apple Intelligence 四月登陆 Vision Pro,加入写作、表情、图像功能
据彭博社记者马克·古尔曼报道,苹果计划最早于四月将 Apple Intelligence 集成至 Vision Pro 头戴设备。 该 AI 套件最初于2024年6月发布,此次将通过 visionOS2.4软件更新引入,预计本周向开发者开放。 就在 Apple Intelligence 于2024年6月首次发布几周后,Gurman 报道称,苹果正寻求将其 AI 工具套件引入 Vision Pro,尽管关于如何重新构想这些工具以实现混合现实体验仍存在一些问题。
2/17/2025 9:34:00 AM
AI在线
不蒸馏R1也能超越DeepSeek,上海 AI Lab 用RL突破数学推理极限
仅通过强化学习,就能超越DeepSeek! 上海AI Lab提出了基于结果奖励的强化学习新范式——从Qwen2.5-32B-Base模型出发,仅通过微调和基于结果反馈的强化学习,在不蒸馏超大模型如DeepSeek-R1的情况下,就能超越DeepSeek-R1-Distill-Qwen32B和OpenAI-O1系列的超强数学推理性能。 团队发现,当前大模型数学推理任务面临”三重门”困局:稀疏奖励困境:最终答案对错的二元反馈,使复杂推理的优化变得困难局部正确陷阱:长思维链中部分正确步骤反而可能误导模型学习规模依赖魔咒:传统蒸馏方法迫使研究者陷入”参数规模军备竞赛”因此,研究团队重新审视了当前基于结果奖励的强化学习算法,经过严格的理论推导与证明,重新设计了一个新的结果奖励强化学习算法,并在这个过程中得出了三点重要结论:对于正样本:在二元反馈环境下,通过最佳轨迹采样(BoN)的行为克隆即可学习最优策略对于负样本:需要使用奖励重塑来维护策略优化目标的一致性对于长序列:不同的序列部分对结果的贡献不同,因此需要更细粒度的奖励分配函数,这个函数可以通过结果奖励习得通俗来说,就是通过对正确样本模仿学习,错误样本偏好学习,关键步骤重点学习,无需依赖超大规模的模型(例如DeepSeek-R1)进行蒸馏,仅通过强化学习即可达到惊人的效果。
2/17/2025 9:33:00 AM
量子位
比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核
本周英伟达的一篇技术博客引发了业界震动! 英伟达的团队尝试利用DeepSeek-R1和推理时扩展实现GPU内核生成自动化,效果极佳。 随着AI模型的扩展,推理时扩展(inference-time scaling),也叫测试时扩展(test-time scaling)正闪亮登场。
2/17/2025 9:10:00 AM
新智元
全球AI算力报告出炉,LLM最爱A100!谷歌坐拥超100万H100等效算力
AI的物质基础是机器学习硬件,例如图形处理单元(GPU)和张量处理单元(TPU)。 据不完全统计,目前全球超过140款AI加速器,用于开发和部署深度学习时代的机器学习模型。 Epoch AI带来了全球算力的估计报告,利用公开信息估计了全球机器学习硬件的现状和趋势。
2/17/2025 9:06:00 AM
新智元
DeepSeek 关键技术详解
作者:leaf在今年的春节期间,DeepSeek火出了圈。 凭借DeepSeek-V3与DeepSeek-R1的创新技术和卓越表现,DeepSeek迅速成为了行业内外的焦点。 不管是技术专家还是普通用户,都对DeepSeek赞不绝口。
2/17/2025 9:00:00 AM
腾讯技术工程
百度官宣:全面接入DeepSeek!7亿用户光速进入AI搜索时代
中国互联网行业,再次迎来标志性事件——All in DeepSeek! 继微信之后,百度官宣:百度搜索全面接入DeepSeek。 中国互联网第一大搜索巨头,居然也选择「打不过就加入」了?
2/17/2025 8:51:15 AM
新智元
刚刚,DeepSeek揭秘R1官方同款部署设置,温度=0.6!OpenAI推理指南同时上线
同一天内,DeepSeek和OpenAI都发布了推理模型使用指南! DeepSeek的X账号迎来久违的更新:发布了官方版本,教大家如何部署DeepSeek-R1的设置。 最佳方法如下——不使用系统提示采样温度:0.6针对文件上传和网络搜索功能定制prompt每次输出时都以think\n开始,以防模型跳过思考过程注意,官方部署DeepSeek,使用的是跟开源版本完全相同的模型。
2/17/2025 8:37:00 AM
新智元
还在忙NSFC申报?试试DeepSeek R1结合牛津的推理Agent用变分推理生成国家自然科学基金申请书
又到了一年一度的国家自然科学基金申报季,众多科研工作者正在为申报书的撰写绞尽脑汁。 如何在有限的时间内,产出一份既专业严谨又富有创新性的申报材料,成为了许多研究者面临的挑战。 本文介绍了一种基于DeepSeek R1大模型与牛津大学最新推理Agent框架相结合的智能辅助方案。
2/17/2025 8:35:06 AM
AI修猫Prompt
职场生存战:AI时代淘汰的40种职业与未来必备的五大黄金技能
不久前,杭州某电商公司发生了一场没有硝烟的裁员:AI客服系统上线首日,30位资深客服集体收到转岗通知。 这个标志性事件像一记惊雷,炸醒了无数职场人,AI已经悄然改写职场规则。 一、AI浪潮下的职业版图重构消失的岗位倒计时麦肯锡最新研究显示,到2030年全球将有4亿个工作岗位被AI取代。
2/17/2025 8:30:00 AM
cres
Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek
AI搜索“老大哥”Perplexity,刚刚也推出了自家的Deep Research——随便给个话题,就能生成有深度的研究报告。 先来划个重点:免费向所有人开放! 具体来说,非订阅用户每天最多可查询5次,Pro用户每天可查询500次。
2/17/2025 8:12:00 AM
量子位
科学家通过 AI 技术解读动物表情,“看穿”其痛苦与情绪
《科学》杂志日前报道了一系列利用人工智能技术解读动物情绪和疼痛的研究成果,这些研究显示,未来我们或许能够借助人工智能更精准地理解动物的内心世界。
2/17/2025 8:01:56 AM
远洋
DeepSeek 系列模型详解之 DeepSeek Math
DeepSeek Math发布于2024年2月,虽然是一个7B参数量的模型,但在Math基准榜单上的表现却超过了多个30B~70B参数量的开源模型。 一、技术亮点1. 数据集使用Common Crawl提取的120B(1200亿个)高质量数学网页数据(具体包括与数学相关的token,以及自然语言和代码数据等),总数据量是开源数据集OpenWebMath的9倍。
2/17/2025 8:00:00 AM
小喵
「硅基大脑」来了,UCSF华人实验室打造!神经科学未来不是碳基?
AI起源于人类利用「电脑」模拟「大脑」,希望计算机和人类一样可以处理各种任务。 或许,计算机还没有产生和人类一样的「智慧」。 但不妨设想一下「硅基大脑」—— 高级的AI模型,它能够破译人类的思维,让「哑巴」重新说话,也许有朝一日,甚至能预测大脑的「一举一动」。
2/17/2025 8:00:00 AM
新智元
李飞飞看中的万亿赛道,中国首个自研空间智能AI登场!单张图即生3D世界
就在刚刚,昆仑万维正式发布了一款全新自研的Matrix-Zero世界模型。 Matrix-Zero世界模型包含两款子模型:昆仑万维自研的3D场景生成大模型与昆仑万维自研的可交互视频生成大模型。 包括两部分功能:支持将用户输入的图片转化为可自由探索的真实合理的3D场景;支持根据用户输入实时生成互动视频效果。
2/17/2025 7:30:00 AM
新智元
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind