资讯列表
腾讯元宝:混元 T1 深度思考模型面向所有用户不限量开放使用
腾讯元宝本月(2 月 13 日)宣布 DeepSeek R1 模型联网、满血上线。其支持对用户的提问进行深度思考、逻辑推理和详细回答,同时也支持联网搜索信息,以提高推理和回答的时新性和权威性。
2/19/2025 7:12:15 PM
问舟
OpenAI:强化学习确实可显著提高LLM性能,DeepSeek R1、Kimi k1.5发现o1的秘密
最近,OpenAI 发了一篇论文,宣称 o3 模型在 2024 IOI 上达到了金牌水平,并且在 CodeForces 上获得了与精英级人类相当的得分。 他们是怎么做到的呢? OpenAI 在论文开篇就用一句话进行了总结:「将强化学习应用于大型语言模型(LLM)可显著提高在复杂编程和推理任务上的性能。
2/19/2025 7:05:00 PM
机器之心
大模型强化学习新发现:删减84%数据反提升效果
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/19/2025 6:59:00 PM
机器之心
理想同学 App 接入 DeepSeek R1 满血版
理想汽车官方今日发文宣布,理想汽车旗下人工智能助手理想同学 App 全面接入 DeepSeek R1&V3 671B 满血版,支持与理想自研 MindGPT 大模型的双向切换。
2/19/2025 6:28:25 PM
归泷(实习)
从一个简单的神经网络模型开始
关于神经网络的文章写的也不少了,但一直没弄明白神经网络到底是怎么运作的;而现有的神经网络模型又太复杂,如Transformer,CNN,RNN,以及各种应用场景(NLP,CV,分类任务,回归任务等等);导致我们无法看到神经网络最本质的东西。 所以,今天我们就来从最简单的神经网络开始学起。 简单神经网络神经网络的基本原理很简单,那就是模仿由人类大脑神经元构成的神经网络;神经元结构如下图所示:上图是生物学中神经元的基本结构,神经元由树突和轴突以及细胞核组成;而不同神经元之间通过轴突进行连接;当然这些都是中学生物学的基础,就不多说了。
2/19/2025 6:00:00 PM
AI探索时代
中国信通院正式启动AI眼镜专项测试
据证券时报报道,中国信息通信研究院(信通院)正式启动了针对 AI 眼镜的专项测试。 这一测试旨在推动 AI 眼镜技术的创新与行业标准化,助力行业的健康发展。 图源备注:图片由AI生成,图片授权服务商Midjourney此次专项测试由信通院的泰尔终端实验室与 Sream Lab 联合进行,主要针对 RayBan-Meta Wayfarer 智能眼镜进行评估。
2/19/2025 5:59:00 PM
AI在线
数据:闲鱼全线AI产品已覆盖 1020 万用户
近日,闲鱼平台发布了最新数据显示,其全线 AI 产品 —— 闲鱼 AI 智能体已经覆盖了1020万用户。 作为这一产品的核心,AI 智能发布功能每天吸引超过20万人使用,并且经过多轮模型优化后,用户的采纳率高达85%。 这一成绩展示了闲鱼在人工智能技术应用方面的巨大潜力。
2/19/2025 5:56:00 PM
AI在线
Springer知识蒸馏专著解读 | 面向图像识别的知识蒸馏综述
本次文章介绍我们发表于由Springer出版的专著《Advancements in Knowledge Distillation: Towards New Horizons of Intelligent Systems 》中的第一章“Categories of Response-Based, Feature-Based, and Relation-Based Knowledge Distillation”。 该篇文章的主要内容是整理了面向图像识别的知识蒸馏的相关工作,首先在response-based、feature-based和relation-based三种知识形式来介绍离线知识蒸馏的相关工作,然后整理了在线知识蒸馏和自知识蒸馏的相关工作,在其中也对自监督学习蒸馏和视觉Transformer(ViT)蒸馏也进行了介绍。 最后讲解了扩展的蒸馏技术领域,包括多教师知识蒸馏、跨模态知识蒸馏、注意力机制知识蒸馏、无数据知识蒸馏和对抗知识蒸馏。
2/19/2025 5:20:00 PM
机器之心
AI助力iOS开发:CursorAI与即将推出的Swift Assist
随着人工智能技术的不断进步,iOS 开发的生态系统正经历一场前所未有的变革。 从最初的 Interface Builder 到如今的 AI 增强开发流程,程序员们在生产力上获得了显著提升,但这种变化也带来了新的挑战和机遇。 近年来,AI 辅助开发工具的崛起为 iOS 开发带来了巨大的影响。
2/19/2025 4:10:00 PM
AI在线
「诺奖风向标」2025斯隆奖公布,清华姚班大神霸榜!8位华人计算机科学家入选
2025斯隆研究奖,最新名单刚刚出炉! 今年,126位杰出的职业生涯早期科学家,荣获「诺奖风向标」斯隆研究奖。 这些学者凭借卓越的成就和巨大的发展潜力,成功跻身美国和加拿大新一代科学领军人物的行列。
2/19/2025 4:01:46 PM
新智元
Kimi新论文再次“撞车”DeepSeek,都谈到了长文注意力机制
Kimi背后的长上下文处理机制曝光了! 这项名为MoBA的新型注意力机制,能将处理1M长文本的速度一下子提升6.5倍,而且还是经过Kimi平台实际验证的那种。 概括而言,这项耗时一年半的工作主要看点在:把完整上下文划分成块,让每个查询token自动去关注最相关的KV块,这样就能高效处理长序列数据;提出一种新的参数无关的top-k门控机制,它能给每个查询token挑选出最相关的块,保证模型只聚焦在最有用信息的块上;支持在全注意力和稀疏注意力模式之间轻松切换;一言以蔽之,MoBA将MoE(专家混合)应用于注意力机制,通过遵循一种“less structure” 原则,允许模型自主决定关注哪些区域或位置。
2/19/2025 4:01:37 PM
量子位
DeepSeek新注意力机制引热议!梁文锋亲自提交预印本,目标明确降低计算成本
DeepSeek新注意力机制论文一出,再次引爆讨论热度。 依然是熟悉的画风,熟悉的味道——那边马斯克疯狂烧了20万张卡训出Grok 3,这厢DeepSeek重点关注的依然是压缩计算和推理成本。 具体来说,新论文提出了一种可原生训练的稀疏注意力机制,名为NSA(Native Sparse Attention)。
2/19/2025 4:01:37 PM
量子位
OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一
昨天马斯克刚刚发布了号称「地表最聪明」的Grok 3模型,抢走了所有关注。 这边OpenAI就开始坐不住了,立刻扔出了SWE-Lancer(AI编码测试基准),看一下AI到底能在现实任务中挣到多少钱。 SWE-Lance是一个全新的、更贴近现实的基准测试,用于评估AI模型的编码性能。
2/19/2025 4:01:37 PM
新智元
李彦宏最新财报会议内容流出:百度从DeepSeek身上学到了一件事;调用量涨30倍百度AI搜索的打法;50亿股票回购回馈股东
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)开年,各大科技巨头都被DeepSeek狠狠冲击已经近三周。 本周将会迎来各大公司的2024的Q4财报会议。 百度率先公开了过去三个月取得的成绩。
2/19/2025 4:01:29 PM
言征
Spring Boot 接入 DeepSeek API:实现智能应用的全新路径
在数字化时代,人工智能技术的飞速发展为各行业带来了前所未有的变革机遇。 自然语言处理作为 AI 领域的重要分支,正逐渐渗透到我们日常生活的方方面面,从智能客服、文本生成到知识问答等应用场景,其价值不断凸显。 DeepSeek 作为一种先进且功能强大的自然语言处理 API,为开发者提供了高效、精准的语言理解和生成能力。
2/19/2025 4:00:00 PM
Java技术营地
中国高温超导新突破登Nature,薛其坤院士领衔,南方科大成果
中国高温超导,再迎新突破! 南方科技大学校长薛其坤院士领衔的团队,最新研究成果加急发表在了Nature。 不同于经典的铜或铁基超导,这项成果首次让镍基化合物突破了麦克米兰极限(40K)。
2/19/2025 3:43:16 PM
量子位
撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开
昨天下午,DeepSeek 发布了一篇新论文,提出了一种改进版的注意力机制 NSA;加上还有创始人兼 CEO 梁文锋亲自参与,一时之间吸引眼球无数,参阅报道《刚刚! DeepSeek 梁文锋亲自挂名,公开新注意力架构 NSA》。 但其实就在同一天,月之暗面也发布了一篇主题类似的论文,并且同样巧合的是,月之暗面创始人兼 CEO 杨植麟也是该论文的署名作者之一。
2/19/2025 3:02:25 PM
机器之心
深势科技张林峰:平台化科研入口雏形初现,玻尔赋能未来教育科研
近日,AI在线旗下ScienceAI以了解深势科技旗下AI加持的先进工具玻尔空间站(Bohrium)为契机,对深势科技创始人兼首席科学家、北京科学智能研究院院长张林峰进行了专访。 作为AI for Science领域的先行探索者,张林峰在采访中与我们深入探讨了AI for Science的内涵与发展趋势,玻尔空间站在教育、科研与产业融合中的角色,以及如何通过技术创新解决传统科研中的痛点。 他还分享了玻尔空间站在未来科研生态中的愿景,以及如何通过平台化的方式推动科研范式的变革。
2/19/2025 3:02:19 PM
ScienceAI