资讯列表
DeepSeek-R1秘籍轻松迁移,最低只需原始数据0.3%
DeepSeek-R1背后关键——多头潜在注意力机制(MLA),现在也能轻松移植到其他模型了! 而且只需原始数据的0.3%~0.6%。 这项研究由复旦大学、华东师范大学、上海AI Lab等联合提出,复旦教授邱锡鹏(Moss大模型项目负责人)也在作者名单之列。
2/25/2025 10:03:20 AM
量子位
苹果宣布超5000亿美元投资计划 以生产苹果智能服务器
苹果公司近日正式揭晓了一项前所未有的大规模投资蓝图,预计未来四年内将在美国市场投入超过5000亿美元资金。 据悉,苹果已着手准备在休斯敦地区建立一座全新的工厂,占地面积高达25万平方英尺。 该工厂将专注于组装用于数据中心的服务,特别是生产支持苹果智能设备的服务器。
2/25/2025 10:00:49 AM
AI在线
网传“四川成都 30 所中小学将开启机器人授课”,官方回应称“消息不实”
据“抖音辟谣”官方号,近日,有自媒体账号发布虚假信息,称“成都 30 所中小学即将开启机器人授课”,引发网友热议。据悉,相应消息称“成都未来的课堂不再需要真人老师上课了”。对此,成都市教育局有关负责人称该消息并不属实。
2/25/2025 9:55:12 AM
漾仔
剑指“蹭热点”国家知识产权局驳回63件“DeepSeek”商标申请
2月24日,国家知识产权局发布最新通告,宣布依法驳回一批恶意抢注“DeepSeek”等商标的注册申请,以维护公平竞争的市场秩序,并保护创新主体的合法权益。 通告指出,近期,由杭州深度求索人工智能基础技术研究有限公司研发的DeepSeek人工智能大模型,在全球范围内引发广泛关注,其技术实力和市场潜力备受瞩目。 图源备注:图片由AI生成,图片授权服务商Midjourney然而,部分企业和自然人出于不正当目的,恶意抢注与该知名人工智能大模型名称相同的“DEEPSEEK”及相关图形商标,并向国家知识产权局商标局提交了商标注册申请。
2/25/2025 9:54:00 AM
AI在线
AI 模型 Claude 3.7 Sonnet 刚发布,消息称 Anthropic 新一轮融资增至 35 亿美元
据《华尔街日报》报道,人工智能公司 Anthropic 正在敲定一轮 35 亿美元(IT之家备注:当前约 253.83 亿元人民币)的融资,公司估值达到 615 亿美元。最初,Anthropic 计划筹集 20 亿美元,但投资者现已同意投入更大一笔资金。
2/25/2025 9:50:44 AM
远洋
大语言模型:表面的推理能力背后是出色的规划技巧
译者 | 刘汪洋审校 | 重楼大语言模型(LLMs)在技术发展上取得了显著突破。 OpenAI 的 o3、Google 的 Gemini 2.0和 DeepSeek 的R1展现出了卓越的能力:它们能处理复杂问题、生成自然的对话内容,甚至精确编写代码。 业界常把这些先进的LLMs 称为"推理模型",因为它们在分析和解决复杂问题时表现非凡。
2/25/2025 9:49:12 AM
刘汪洋
AI 要“白嫖”音乐?英国千名音乐家发“无声专辑”抗议
英国政府计划修改版权法,允许AI公司未经许可使用艺术家作品进行训练,引发音乐界强烈反对。1000名音乐家联合发布无声专辑《Is This What We Want?》,通过空荡荡的工作室和演出场所的声音,抗议版权法改革对创作生态的冲击。专辑收益将捐给慈善机构。#版权法改革 #AI训练 #音乐界抗议
2/25/2025 9:42:05 AM
远洋
新型语言模型 Huginn:突破推理界限 无需语言即可“思考”
近日,来自图宾根埃利斯研究所、马里兰大学和劳伦斯利弗莫尔国家实验室的研究团队,开发出名为 Huginn 的新型语言模型,该模型采用递归架构,显著提升了推理能力。 与传统模型不同,Huginn 无需专门的“推理链”训练,便可在神经网络的“潜在空间”内自主推理,再输出结果。 研究团队开发出名为 Huginn 的新型语言模型,该模型采用递归架构,显著提升了推理能力。
2/25/2025 9:39:00 AM
AI在线
OpenAI 出新招:ChatGPT 变身苹果 Safari 浏览器默认搜索引擎
此次更新,OpenAI 将 ChatGPT 的功能延伸至 Safari 浏览器,为用户提供了一种全新的搜索体验。通过简单的设置,用户即可将 ChatGPT 作为默认搜索引擎,享受更智能、更便捷的搜索服务。
2/25/2025 9:35:48 AM
故渊
波士顿动力创始人自曝已购买宇树机器人,并称 DeepSeek 创新“只是开始”
“我们的实验室买了宇树的人形机器人,还买了几个小型的机器人,它们相对便宜。即便我们是竞争对手,我们也可以买来看看它究竟能做些什么。”
2/25/2025 9:23:29 AM
清源
OpenAI 工程师拒绝马斯克 AI 公司挖角,直言其威胁民主
近日,Elon Musk 所创办的 AI 公司 xAI 试图挖角 OpenAI 的一名工程师,却遭到了对方的强烈拒绝。 OpenAI 的工程师哈维尔・索托(Javier Soto)在社交媒体平台 X 上分享了他对 xAI 的回复截图,令许多网友惊讶不已。 在这条信息中,索托明确表示:“我无法在良心上为 Elon Musk 工作。
2/25/2025 9:23:00 AM
AI在线
LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%
在LLM的开发中,推动模型进步的主要驱动力是精心挑选高质量的训练示例。 虽然Scaling Law的确能实现「力大砖飞」,但仅仅增加数据量并不能保证模型性能的提升,数据的质量才是关键。 低质量的数据可能会引入噪声,影响模型的训练效果。
2/25/2025 9:17:47 AM
新智元
官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug
近日,获英伟达支持、已获数亿美元风投资金的Sakana AI爆出戏剧性反转。 此前,该公司宣称开发出「AI CUDA工程师」,能将特定模型训练速度提升最高达100倍,引发行业关注。 然而,网友却发现,这个系统根本不管用。
2/25/2025 9:15:35 AM
新智元
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
憋了大半年,Anthropic终于放出大招——首款混合推理模型Claude 3.7 Sonnet重磅登场! 这是Claude系列中,迄今为止最智能的模型,几乎能够及时响应,并进行可扩展的、逐步的思考。 简言之,一个模型,两种思考方式。
2/25/2025 9:13:16 AM
新智元
1000 名艺术家发布“无声”专辑,抗议英国向人工智能出售版权
千名音乐家近日发布“无声专辑”,抗议英国拟议的版权法修改。 音乐界担忧新规将允许科技公司未经许可、无偿使用受版权保护作品进行技术训练。 名为《这是我们想要的吗?》的专辑汇集了凯特·布什等众多知名音乐人的“无声”作品,象征性地表达不满。
2/25/2025 9:13:00 AM
AI在线
Chegg 起诉谷歌:AI 搜索摘要影响其流量与收入
近日,在线教育公司Chegg向美国哥伦比亚特区地方法院提起诉讼,指控科技巨头谷歌(Google)利用其搜索结果的 AI 摘要功能,损害了Chegg的流量和收入。 Chegg在诉状中表示,谷歌的行为构成了不正当竞争,具体包括互惠交易、垄断维持以及不当得利。 Chegg声称,谷歌强迫公司提供内容,以便在谷歌搜索中获得展示机会。
2/25/2025 9:13:00 AM
AI在线
DeepSeek FlashMLA:大模型推理的“涡轮增压器”
FlashMLA(Flash Multi-head Latent Attention)是DeepSeek针对英伟达Hopper架构GPU(如H800/H100)设计的高效解码内核,其核心技术围绕多头潜在注意力(MLA)机制展开,通过软硬件协同优化实现性能突破
2/25/2025 9:08:12 AM
AI在线
美国律师因使用 AI 生成虚假案例被罚款 1.5 万美元
近日,美国印第安纳州南区的联邦地方法官马克・D・丁斯莫尔建议对一名律师处以1.5万美元的罚款,原因是该律师在法庭文件中引用了不存在的法院案例。 这一事件引发了对人工智能在法律领域应用的广泛关注。 图源备注:图片由AI生成,图片授权服务商Midjourney事件的主角是来自德克萨斯州里奥洪多的律师拉斐尔・拉米雷斯(Rafael Ramirez)。
2/25/2025 9:08:00 AM
AI在线