资讯列表
基于闪电注意力机制,创新高效开源大模型
从数学竞赛、编程到自然语言处理,通过大规模的强化学习的模型正不断提升其推理能力。 但传统的Transformer架构由于其注意力机制的二次计算复杂度,在处理长文本和复杂推理任务时面临着效率瓶颈。 尽管有研究提出了多种改进方法,如稀疏注意力、线性注意力等,但这些方法在大规模推理模型中的应用效果尚未得到充分验证,大多数领先的模型仍然依赖于传统的注意力设计。
7/16/2025 10:15:51 AM
完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话
GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力,但它们的技术体系完全闭源。 现在,紫东太初团队联合长城汽车AI Lab直接把整个技术栈都开源了,推出完全透明开源的端到端共情语音语言大模型OpenS2S。 OpenS2S的核心在于提供一个高效、低成本构建共情语音系统的新范式。
7/16/2025 10:12:35 AM
首篇潜空间推理综述!模型思考不必依赖Token,带宽暴增2700+倍
大模型在潜空间中推理,带宽能达到普通(显式)思维链(CoT)的2700多倍? 史上首篇潜空间推理综述,对这种新兴的推理范式进行了全面总结。 这篇综述当中,作者分析了循环、递归、连续思维等潜空间推理的形式,并将这些方法总结成了一个框架。
7/16/2025 10:08:57 AM
七个月翻一番!AI Agent能力飙升,METR报告揭示指数级进化规律
Agent能力每7个月翻一番! 根据非营利研究机构METR最新发布的报告,这一规律已在9项基准测试中得到了验证。 这些任务涉及编程、数学、计算机使用、自动驾驶等领域,表明大模型正在不断向着高度自动化迈进。
7/16/2025 10:06:00 AM
老黄投了个120亿美元最贵种子轮!但小钱:H20中国开卖,市值一夜暴涨1600亿美元
种子轮,估值120亿美元! 硅谷乃至全球创纪录的创业种子轮诞生了。 OpenAI前CTO Mira创业公司,Thinking Machines Lab——思考机器实验室,刚刚公告了首款融资情况:顺利筹集约20亿美元(约合人民币143亿元),公司估值一夜飙升至120亿美元(约合人民币861亿元),成为硅谷史上最大种子轮之一。
7/16/2025 10:03:14 AM
加拿大丛林迷路五小时,ChatGPT救命神技,比地图还靠谱!
最近,X平台上一个帖子火了,一群人在加拿大偏远的小镇Mabou骑全地形车(ATV)玩,结果迷路了整整五小时,最后靠ChatGPT导航才安全回来。 Mabou是个小地方,周围全是没开发过的森林和小路。 他们本来打算从Upper Southwest Mabou Rd出发,骑18公里到Whycocomagh玩一圈。
7/16/2025 9:58:47 AM
倒反天罡:ChatGPT教人说话?36万视频+77万播客已证实!
AI驯服人类第一步:教人重新说英语? 最近,越来越多的媒体发现:说话的方式,越来越像ChatGPT了! 这不是模仿,而是「入侵」。
7/16/2025 9:52:07 AM
错题本 × LLM:人机协作如何炼成“最严代码考官”
大家好,我是肆〇柒。 在 vibe coding 活跃的当下,有时,我们不得不思考一个问题:在软件开发流程中,我们能否完全依赖、使用 LLM 生成的代码? 大型语言模型(LLM)在代码生成基准测试中的卓越表现备受瞩目,从 HumanEval 到 LiveCodeBench,众多基准测试平台见证了 LLM 在代码生成任务上的飞速进步。
7/16/2025 9:51:43 AM
肆零柒
秘塔AI整大活,国内首个免费「深度研究」来了!搞研究证据链惊人
就在刚刚,国内第一家免费公开可用的「深度研究」产品来了! 这个产品,可以直接对标海外的Deep Research能力,性能十分强大。 在BrowseComp等评测集上,它们超越了上周刚开源且达到最好结果的WebSailor模型,准确率有明显提升。
7/16/2025 9:48:23 AM
五个月估值120亿!OpenAI前CTO自曝首个多模态AI,竟要免费开源
OpenAI前CTO初创,又拿到新融资了! 一早,Mira Murati官宣由a16z领投20亿美元融资,至此,Thinking Machines Lab估值120亿美元。 同时,英伟达、AMD、Accel、ServiceNow等多家明星风投也参与了本次融资。
7/16/2025 9:44:29 AM
月之暗面卷土重来?Kimi K2杀回来了
为什么一个中国公司的开源模型,能让硅谷的闭源巨头们感到紧张? 昨天看到月之暗面发布Kimi K2的消息,我特意去测试了一下。 说实话,刚开始我还是有点怀疑,毕竟之前见过太多"对标GPT-4"的宣传最后都不了了之。
7/16/2025 9:29:39 AM
阿丸笔记
一篇被证明“理论有误”的论文,拿下了ICML2025时间检验奖
深度学习界的传奇论文,终于等来了它的“封神”时刻! 刚刚,ICML 2025会议上,2015年发表的Batch Normalization(批次归一化,简称BatchNorm)论文荣获时间检验奖。 这篇如今引用量超过6万次的开创性工作,是深度学习发展史上一个里程碑式的突破,极大地推动了深层神经网络的训练和应用。
7/16/2025 9:15:17 AM
Meta修复安全漏洞,用户AI提示及生成内容不再泄露
近日,Meta 公司宣布修复了一项影响其 AI 聊天机器人的严重安全漏洞,该漏洞曾允许用户访问其他用户的私人提示和 AI 生成的内容。 此漏洞的发现者,安全测试公司 AppSecure 的创始人 Sandeep Hodkasia,因其在2024年12月26日私下披露该漏洞,获得了 Meta 支付的1万美元奖励。 Hodkasia 在接受 TechCrunch 采访时表示,他是在对 Meta AI 的功能进行深入研究时发现了这个漏洞。
7/16/2025 9:11:33 AM
AI在线
前OpenAI工程师离职揭秘:高速增长下的混乱与“创业精神”
三周前,曾参与开发OpenAI关键产品之一的工程师Calvin French-Owen选择离开这家备受瞩目的AI巨头。 日前,他发表了一篇引人入胜的博客文章,详细分享了在OpenAI工作一年的感受,其中包括为开发与Cursor和Anthropic的Claude Code竞争的新编码代理Codex而夜以继日冲刺的经历。 French-Owen的离职并非源于“戏剧性事件”,而是出于回归初创企业创始人身份的愿望。
7/16/2025 9:11:28 AM
AI在线
Perplexity携手SheerID:AI搜索引擎免费向全球2.64亿学生开放,剑指教育市场
人工智能搜索引擎Perplexity周一宣布与身份验证公司SheerID达成合作,将向全球超过2.64亿学生提供长达两年的免费Perplexity Pro高级服务。 此举旨在解决人工智能公司在向教育领域提供昂贵工具时面临的折扣欺诈挑战,并凸显了Perplexity在日益激烈的用户竞争中,大力押注教育市场的战略。 高级服务免费开放,精准锁定学生用户根据协议,经过SheerID验证的学生将能免费使用原价每月20美元的Perplexity Pro。
7/16/2025 9:11:20 AM
AI在线
苹果 AI 框架 MLX 正新增英伟达 CUDA 支持,助开发者降低硬件成本
AI在线 7 月 16 日消息,Appleinsider 发现,苹果专为 Apple Silicon 设计的机器学习框架 MLX 正新增 CUDA 支持。 这意味着开发者可直接在 Apple Silicon Mac 上利用 MLX 开发应用,随后导出至 CUDA 环境运行。 在此之前,由于 MLX 深度集成于苹果平台的 Metal 框架,其无法在 macOS 之外运行,故导致开发者需购买额外硬件以完成部署和测试。
7/16/2025 8:47:00 AM
问舟
AI分析的崛起及其在各行业中的重大影响
译者 | 刘涛审校 | 重楼如今,企业正面临着数据的海量冲击。 从在线购物行为到医院病历记录,每一项业务活动都会源源不断地产生大量信息。 然而,单纯的数据本身并无实际价值。
7/16/2025 8:45:06 AM
刘涛
帮助职场人士提高办公效率的十款免费人工智能工具
译者 | 李睿审校 | 重楼提高办公效率并不能只依赖埋头苦干。 在通常情况下,“巧干胜于蛮干”。 因此,为了持续领先,关键在于融合个人才智、专注投入,以及高效应对日常挑战的方案。
7/16/2025 8:37:02 AM
李睿