资讯列表
错题本 × LLM:人机协作如何炼成“最严代码考官”
大家好,我是肆〇柒。 在 vibe coding 活跃的当下,有时,我们不得不思考一个问题:在软件开发流程中,我们能否完全依赖、使用 LLM 生成的代码? 大型语言模型(LLM)在代码生成基准测试中的卓越表现备受瞩目,从 HumanEval 到 LiveCodeBench,众多基准测试平台见证了 LLM 在代码生成任务上的飞速进步。
7/16/2025 9:51:43 AM
肆零柒
秘塔AI整大活,国内首个免费「深度研究」来了!搞研究证据链惊人
就在刚刚,国内第一家免费公开可用的「深度研究」产品来了! 这个产品,可以直接对标海外的Deep Research能力,性能十分强大。 在BrowseComp等评测集上,它们超越了上周刚开源且达到最好结果的WebSailor模型,准确率有明显提升。
7/16/2025 9:48:23 AM
五个月估值120亿!OpenAI前CTO自曝首个多模态AI,竟要免费开源
OpenAI前CTO初创,又拿到新融资了! 一早,Mira Murati官宣由a16z领投20亿美元融资,至此,Thinking Machines Lab估值120亿美元。 同时,英伟达、AMD、Accel、ServiceNow等多家明星风投也参与了本次融资。
7/16/2025 9:44:29 AM
月之暗面卷土重来?Kimi K2杀回来了
为什么一个中国公司的开源模型,能让硅谷的闭源巨头们感到紧张? 昨天看到月之暗面发布Kimi K2的消息,我特意去测试了一下。 说实话,刚开始我还是有点怀疑,毕竟之前见过太多"对标GPT-4"的宣传最后都不了了之。
7/16/2025 9:29:39 AM
阿丸笔记
一篇被证明“理论有误”的论文,拿下了ICML2025时间检验奖
深度学习界的传奇论文,终于等来了它的“封神”时刻! 刚刚,ICML 2025会议上,2015年发表的Batch Normalization(批次归一化,简称BatchNorm)论文荣获时间检验奖。 这篇如今引用量超过6万次的开创性工作,是深度学习发展史上一个里程碑式的突破,极大地推动了深层神经网络的训练和应用。
7/16/2025 9:15:17 AM
Meta修复安全漏洞,用户AI提示及生成内容不再泄露
近日,Meta 公司宣布修复了一项影响其 AI 聊天机器人的严重安全漏洞,该漏洞曾允许用户访问其他用户的私人提示和 AI 生成的内容。 此漏洞的发现者,安全测试公司 AppSecure 的创始人 Sandeep Hodkasia,因其在2024年12月26日私下披露该漏洞,获得了 Meta 支付的1万美元奖励。 Hodkasia 在接受 TechCrunch 采访时表示,他是在对 Meta AI 的功能进行深入研究时发现了这个漏洞。
7/16/2025 9:11:33 AM
AI在线
前OpenAI工程师离职揭秘:高速增长下的混乱与“创业精神”
三周前,曾参与开发OpenAI关键产品之一的工程师Calvin French-Owen选择离开这家备受瞩目的AI巨头。 日前,他发表了一篇引人入胜的博客文章,详细分享了在OpenAI工作一年的感受,其中包括为开发与Cursor和Anthropic的Claude Code竞争的新编码代理Codex而夜以继日冲刺的经历。 French-Owen的离职并非源于“戏剧性事件”,而是出于回归初创企业创始人身份的愿望。
7/16/2025 9:11:28 AM
AI在线
Perplexity携手SheerID:AI搜索引擎免费向全球2.64亿学生开放,剑指教育市场
人工智能搜索引擎Perplexity周一宣布与身份验证公司SheerID达成合作,将向全球超过2.64亿学生提供长达两年的免费Perplexity Pro高级服务。 此举旨在解决人工智能公司在向教育领域提供昂贵工具时面临的折扣欺诈挑战,并凸显了Perplexity在日益激烈的用户竞争中,大力押注教育市场的战略。 高级服务免费开放,精准锁定学生用户根据协议,经过SheerID验证的学生将能免费使用原价每月20美元的Perplexity Pro。
7/16/2025 9:11:20 AM
AI在线
苹果 AI 框架 MLX 正新增英伟达 CUDA 支持,助开发者降低硬件成本
AI在线 7 月 16 日消息,Appleinsider 发现,苹果专为 Apple Silicon 设计的机器学习框架 MLX 正新增 CUDA 支持。 这意味着开发者可直接在 Apple Silicon Mac 上利用 MLX 开发应用,随后导出至 CUDA 环境运行。 在此之前,由于 MLX 深度集成于苹果平台的 Metal 框架,其无法在 macOS 之外运行,故导致开发者需购买额外硬件以完成部署和测试。
7/16/2025 8:47:00 AM
问舟
AI分析的崛起及其在各行业中的重大影响
译者 | 刘涛审校 | 重楼如今,企业正面临着数据的海量冲击。 从在线购物行为到医院病历记录,每一项业务活动都会源源不断地产生大量信息。 然而,单纯的数据本身并无实际价值。
7/16/2025 8:45:06 AM
刘涛
帮助职场人士提高办公效率的十款免费人工智能工具
译者 | 李睿审校 | 重楼提高办公效率并不能只依赖埋头苦干。 在通常情况下,“巧干胜于蛮干”。 因此,为了持续领先,关键在于融合个人才智、专注投入,以及高效应对日常挑战的方案。
7/16/2025 8:37:02 AM
李睿
消息称亚马逊低估工作量,网页版 Alexa AI 延至 7 月 31 日后上线
AI在线 7 月 16 日消息,科技媒体 Windows Central 今天(7 月 16 日)发布博文,报道称亚马逊低估了上线网页版 Alexa 的工作量,因此决定推迟至 7 月 31 日以后上线该服务。 AI在线此前报道,亚马逊在今年 2 月的活动中,计划今年 6 月中旬推出网页版 Alexa 虚拟助手,即 Alexa.com。 最新披露的文件显示,亚马逊公司内部正积极推动该服务落地,但从目前曝光的细节来看,该公司低估了成功推出所需的工作量,因此公司高层宣布,“不早于 7 月 31 日”上线该服务。
7/16/2025 8:27:52 AM
故渊
一文带你彻底理解 AIGC、Agent、MCP 的概念和关系
作者 | willzhen近两年 AI 技术发展迅猛,日新月异。 大语言模型 (LLM)、AIGC、多模态、RAG、Agent、MCP 等各种相关概念层出不穷,若不深入了解,极易混淆。 本文旨在简要介绍这些 AI 技术的核心概念、基本原理及其相互关系,主要帮助非 AI 行业的开发者建立基础认知。
7/16/2025 8:00:00 AM
腾讯技术工程
多智能体时代正式到来!7个章节深度解读马斯克Grok 4 发布会
一、Grok 4 发布会:不仅仅是“又一款大模型”. 北京时间 2025 年 7 月 10 日上午 11 点(当地时间 9 日晚),Elon Musk(下文以马斯克&Musk 指代)亲自在 xAI 举办的直播发布会上正式发布了 Grok 4。 与过去市面上的大型语言模型(LLM)不同,Grok 4 并非只是参数升级版的 GPT 克隆,而是一款强调多智能体协作、多模态交互和实时联网能力的全新形态 AI 系统。
7/16/2025 7:47:26 AM
要爆炸的张老三
华为 × 云南交投发布“绿美通道・交通大模型”,实现通用与智能算力融合升级
AI在线 7 月 16 日消息,云南省交通投资建设集团有限公司(以下简称“云南交投”)与华为、长安大学合作研发的“绿美通道・交通大模型”已于昨日正式发布。 华为公司副总裁、交通智慧化军团 CEO 马悦受邀出席发布仪式并致辞。 来自中国公路学会、云南省以及全国 20 多家省级交通企业的 100 多位领导嘉宾出席发布仪式。
7/16/2025 7:19:37 AM
归泷
Meta Strikes Out! Cracking Down on Copycat Accounts to Rebuild the Social Media Content Ecosystem
In the digital content era, originality is becoming increasingly important. Recently, Meta (the parent company of Facebook) announced that it will strengthen its efforts to crack down on accounts that share "non-original" content on its platform. These accounts often repeatedly use others' text, images, or videos without their own creative input.
7/16/2025 4:31:48 AM
AI在线
Amazon Prime Day Hits Big! U.S. E-commerce Sales Exceed $24 Billion, AI Traffic Surges 3300%!
Amazon's Prime Day event is in full swing, bringing substantial sales for the platform itself and injecting a strong boost into the overall U.S. e-commerce market. According to Adobe Analytics, U.S.
7/16/2025 4:31:36 AM
AI在线