资讯列表
“数据产品”究竟是什么以及它为何对AI代理至关重要
深陷数据泥潭,渴望洞察如今,许多组织都深陷数据洪流。 信息从销售系统、营销工具、运营数据库、网站以及无数其他来源涌入。 然而,尽管信息浩如烟海,要获得清晰可靠的业务答案却异常困难。
7/11/2025 10:00:03 AM
晓晓
一文搞懂 | 大模型为什么出现幻觉?从成因到缓解方案
1、前言随着大模型(Large Language Models, 以下简称LLM)迅猛发展的浪潮中,幻觉(Hallucination)问题逐渐成为业界和学术界关注的焦点。 所谓模型幻觉,指的是模型在生成内容时产生与事实不符、虚构或误导性的信息。 比如,当你询问“世界上最长的河流是哪条?
7/11/2025 9:50:52 AM
火山引擎云安全
Llama惨遭抛弃!Meta内部改用Claude写代码
闻乐 发自 凹非寺. 量子位 | 公众号 QbitAILlama惨遭抛弃! 据Meta工程师透露,现在Meta内部开发都已经换掉了自家的Llama,改用Claude Sonnet写代码。
7/11/2025 9:26:42 AM
闻乐
AI 15分钟"逆向工程"桌面软件:79美元/月的"专有技术"竟然是这样...
用了Claude Code几天之后,我决定测试一下它的逆向工程能力。 结果让我彻底震惊了。 一个收费79美元/月的"专有"桌面软件,Claude Code用15分钟就完全拆解了。
7/11/2025 9:16:49 AM
阿丸笔记
AB实验新突破:携程提出图贪心分流算法,解决两大核心难题
作者简介小白,携程算法工程师,关注营销定价领域。 携程火车票部门为解决智行酒店商户侧AB实验中,预实验分流中遇到的分流不均、分流组流量交叉问题,提出了一种用于非用户端AB实验的分流算法,该算法通过优化的随机抽样模块与贪心交换模块,保证实验组之间多指标的相似性;通过图算法模块,降低实验组之间的流量交叉。 通过实证分析,该算法一方面有效的提升了商户端实验在多指标下的分流效率;另一方面,相比于使用先验知识进行分流,显著降低了实验组之间的流量交叉。
7/11/2025 9:16:00 AM
告别数据「噪音」,UCSD大模型推理新方法DreamPRM充当「信号放大器」,登顶MathVista测评榜
DreamPRM 由加州大学圣地亚哥分校的研究团队开发,在数学推理权威测评榜MathVista上获得了第一名。 第一作者为博士生 Qi Cao,通讯作者为该校副教授 Pengtao Xie,团队其他成员还包括王睿一,Ruiyi Zhang 和 Sai Ashish Somayajula。 使用过程奖励模型(PRM)强化大语言模型的推理能力已在纯文本任务中取得显著成果,但将过程奖励模型扩展至多模态大语言模型(MLLMs)时,面临两大难题:由于多模态输入(图像 文本)构成高维连续与离散信号的混合空间,训练数据与测试数据的分布偏移(Distribution Shift)远超纯文本场景,导致一般过程奖励模型泛化能力显著下降。
7/11/2025 9:15:00 AM
单向VLM变双向!人大斯坦福等提出MoCa框架:双向多模态编码器
预训练的视觉语言模型(VLM)因其强大的图文联合建模能力,在多种任务上展现出巨大潜力,也成为了许多目前广泛使用的多模态嵌入模型的基础。 然而,这些使用因果注意力机制的多模态嵌入模型在多模态嵌入任务中存在三个关键限制:表示能力弱:因果注意力机制单向预测的特性,限制了模型充分捕获双向跨模态的深层语义。 泛化性差:传统模型多依赖于简单的图文对训练数据,缺乏更广泛、更丰富的数据源,难以在新任务或新领域快速泛化。
7/11/2025 9:10:00 AM
编码器-解码器架构的复兴?谷歌一口气发布32个T5Gemma模型
今天是 xAI 的大日子,伊隆・马斯克早早就宣布了会在今天发布 Grok 4 大模型,AI 社区的眼球也已经向其聚拢,就等着看他的直播(等了挺久)。 当然,考虑到 Grok 这些天的「失控」表现,自然也有不少人是在等着看笑话。 尽管如此,谷歌似乎也并不在意被夺走的目光,接连对 Gemma 系列模型进行了更新。
7/11/2025 9:02:00 AM
搭积木一样做视频!Vidu Q1「参考生视频」功能实测
嗨大家好! 今天是你们的 Vidu 创意小助手阿真!. 我们使用 AI 生成视频都遇到过一些普遍痛点,比如角色难以保持统一,多个元素同框画风就不稳定,还有就是每个场景都要从零开始去构思分镜,费时又费力,最后视频画面出来效果还糊了吧唧的。
7/11/2025 7:19:47 AM
阿真Irene
资讯/神器/素材全都有!2025年6月设计素材周刊第四波
往期周刊:一、设计资讯. Figma 已申请在纽约证券交易所进行 IPO,股票代码为 "FIG". 预计 IPO 日期为 7 月下旬或 8 月初。
7/11/2025 7:08:23 AM
四喜茶茶
AI 系统架构的演进:LLM → RAG → AI Workflow → AI Agent
AI Agent 是当前的一个热门话题,但并非所有 AI 系统都需要采用这种架构。 虽然 Agent 具有自主决策能力,但更简单、更具成本效益的解决方案往往更适合实际业务场景。 关键在于根据具体需求选择恰当的架构方案。
7/11/2025 3:10:00 AM
Baihai IDP
多模态大模型的“安全锁”:SAPT 软提示调优技术
引言:多模态大模型的安全困境在人工智能技术飞速发展的当下,多模态大模型(VLM)正以前所未有的速度融入我们的生活,从智能助手到图像识别,从文本生成到跨模态任务处理,它们展现出了令人惊叹的能力。 然而,随着 VLM 在实际应用中的广泛部署,一个不容忽视的问题逐渐浮出水面——其安全性漏洞正成为潜在的“ ticking bomb”。 近期,一篇题为《The Safety Reminder: A Soft Prompt to Reactivate Delayed Safety Awareness in Vision-Language Models》的论文,为我们揭开了 VLM 安全性研究的新篇章。
7/11/2025 1:23:00 AM
果冻布丁兔
裁员 9000 人后微软高管表态:想留下,就得学会 AI
7 月 10 日消息,据 The Information 报道,在微软上周宣布将裁员 9000 人,启动今年第二次大规模裁员后,该公司便要求剩余的销售人员借助人工智能提高工作效率。 据与会者透露,微软美洲地区中小企业销售业务主管特拉维斯・沃尔特(Travis Walter)在周一的员工会议上表示:“我们都需要使用 AI 工具。 ”沃尔特向员工推荐了微软内部的人工智能工具,旨在帮助销售人员更快地掌握客户账户信息,并自动生成销售方案。
7/10/2025 11:15:05 PM
小小
华为启动全球教育医疗伙伴联盟,倡议推动 AI 诊疗商业模式落地
AI在线 7 月 10 日消息,在 2025 全球教育医疗合作伙伴中国周期间,华为今日成功举办教育医疗行业合作伙伴峰会。 来自 40 个国家的 300 余位伙伴嘉宾参会,共话教育和医疗行业数智化转型新未来。 会上,华为启动全球教育医疗伙伴联盟(GEHPA)计划,旨在增强行业伙伴的交流,互补优势,实现合作共赢。
7/10/2025 10:56:49 PM
汪淼
非营利 AI 研究机构 METR:资深程序员使用 AI 编程反而会拖慢开发速度
AI在线 7 月 10 日消息,据路透社今日报道,非营利机构 METR 的最新研究发现,和大家普遍认为的相反,经验丰富的软件开发者在使用最先进的 AI 工具辅助熟悉的代码库时,反而变得更慢,而不是更快。 该机构对一批资深开发者进行了深入调查,他们用流行的 AI 编程助手 Cursor 来完成自己熟悉的开源项目任务。 研究开始前,这些开发者预计 AI 能让自己的工作速度提升,估计任务时间会缩短 24%。
7/10/2025 10:54:31 PM
清源
全新C11焕新登场,以六维进阶重塑中型SUV价值标杆
四年前,零跑C11于杭州运河发布中心上市,以“越级满配”之姿开启中型智能SUV的价值革命。 四年后,这款累计销量突破25万台的“现象级产品”重回起点,在同样的地点迎来全面进化。 2025年7月10日,零跑汽车旗下智能越享中型SUV——全新C11正式上市。
7/10/2025 10:44:00 PM
新闻助手