AI在线 AI在线

资讯列表

特斯拉申请在亚利桑那州测试Robotaxi,紧追Waymo步伐

据CNBC报道,埃隆·马斯克旗下的特斯拉已在亚利桑那州凤凰城提出申请,计划测试并最终部署其Robotaxi(无人驾驶出租车)服务,此举意在紧随行业领头羊Waymo。 亚利桑那州审批进程亚利桑那州交通部发言人周四向CNBC表示,特斯拉已申请在亚利桑那州进行自动驾驶汽车的测试和运营,测试场景包括配备或不配备人类安全员的情况。 相关审批预计将在7月底前作出决定。
7/11/2025 11:11:47 AM
AI在线

马斯克的新AI聊天机器人Grok 4:是追求真理还是个人观点的代言?

在近期 xAI 推出的 AI 聊天机器人 Grok4发布会上,马斯克通过社交平台 X 进行现场直播,表示该公司的最终目标是开发一个 “最大限度追求真理的 AI”。 但当 Grok4面对一些有争议的问题时,它到底是如何寻找真理的呢?根据多位用户的反馈,Grok4在回答有关以色列和巴勒斯坦冲突、堕胎和移民法律等敏感话题时,似乎引用了马斯克在 X 平台上的社交媒体帖子。 我们的调查也发现,Grok4常常参考马斯克的立场以及关于他的新闻报道。
7/11/2025 11:11:42 AM
AI在线

Llama 被抛弃!Meta转向Claude,内情大揭秘

Meta 的内部开发现状引发广泛关注,近日有工程师透露,该公司已经停止使用自家的 Llama 模型,而转而选择了 Claude Sonnet 来进行代码编写。 这一变化似乎标志着 Meta 对 Llama 的失望,尤其是在 Llama4发布后,该模型就遭遇了诸多负面评价。 自 Llama4面世的36小时内,用户对其功能的批评声就不绝于耳,随后更是卷入了大型模型排名的争议,令其声誉受损。
7/11/2025 11:11:36 AM
AI在线

​英伟达市值首次突破 4 万亿美元,黄仁勋将与特朗普会面引关注

根据 CNBC 的报道,英伟达(Nvidia)首席执行官黄仁勋将在不久后于美国白宫与前总统特朗普会面。 此次会面的背景非常引人注目,因为英伟达在最近的股市交易中,其市值首次突破了4万亿美元,成为全球市值最高的公司,超越了苹果和微软。 特朗普在社交媒体上对此表示了赞赏,指出科技股、工业股和纳斯达克指数都创下了历史新高。
7/11/2025 11:11:28 AM
AI在线

是的,LeCun要向28岁的Alexandr Wang汇报!这是Meta新AI团队的一些独家内部消息

LeCun 向 Alexandr Wang 汇报? Meta 内部:是的。 招募了一众 AI 大牛以后,Meta 能吃得消吗?
7/11/2025 11:02:00 AM
机器之心

打破大模型编程「数据污染」与「能力虚胖」困境,Meituan-M17团队构建新一代AI编程评测新标准——OIBench

当前,大语言模型(LLMs)在编程领域的能力受到广泛关注,相关论断在市场中普遍存在,例如 DeepMind 的 AlphaCode 曾宣称达到人类竞技编程选手的水平;OpenAI 的顶尖模型屡屡被报道能通过谷歌高级编程面试,并在 LeetCode 挑战中表现出较高能力。 然而,将这些能力宣称与实际评测结果进行对比时,当前评估体系的深层问题便随之显现:比如尽管 GPT-4o 模型被冠以 “竞赛级” 头衔,甚至有声音称其算法水平接近 ACM 区域赛金牌选手,但实际在面对未经大量公开数据训练的、更高难度的信息学奥赛级别问题时,其通过率却往往低至个位数,与 985 级别高校 ACM 校队成员的平均通过率存在显著差距。 当部分评测宣称 Claude 3.5 Sonnet 可替代中级开发人员时,它在动态规划等高难度题型中错误率却高达 80% 以上,且无法独立完成需数学建模的复杂竞赛题。
7/11/2025 10:54:00 AM
机器之心

儿童性剥削材料监管新挑战,逼真 AI 视频肆虐网络

AI在线 7 月 11 日消息,纽约时报昨日(7 月 10 日)发布博文,报道称 AI 生成的儿童性剥削材料(CSAM)正在互联网上泛滥。 互联网观察基金会(IWF)和美国失踪与被剥削儿童国家中心的研究人员发出警告,这种新型 AI 生成的 CSAM 几乎与真实内容难以区分。 图源:IWFIWF 报告指出在 2024 年上半年,仅发现 2 个 AI 生成的 CSAM 内容,而在 2025 年上半年,发现了 1286 个 AI 生成视频,而且这些生成的视频具备很高质量,很难与真实内容区分。
7/11/2025 10:37:46 AM
故渊

Lora微调实操教程(上):人话版概念详解(附案例)

知识星球中,上个月有个关于让 LLM 学习公司内部业务和产品逻辑中,微调、RAG、提示词三者效果对比的提问。 我当时给出了一个经典的客服场景数据集构建示例,鉴于后续又陆续有人评论和私信来问,从这篇开始,专门写两篇内容来做个粗浅的分享。 之所以要分两篇内容,我想还是在做具体的微调案例演示前,把一些基本概念尽可能的讲清楚,这样感兴趣的话在复现下期案例和二开时,能够在自己的业务场景下对参数调优更有的放矢些。
7/11/2025 10:31:11 AM
韦东东

如何利用企业架构构建可扩展的数据和人工智能战略

概述随着数据和人工智能的爆炸式增长,以及通用人工智能(GenAI)的持续发展势头,企业正竞相确定自身的战略基点。 制定稳健的战略、治理模式和任责结构的压力空前巨大。 这不仅关乎数据和人工智能战略应该是什么,更关乎如何制定战略、由谁来领导,以及如何在整个企业范围内进行治理。
7/11/2025 10:23:34 AM
晓晓

重新审视 LLM:集体知识的动态映射与人机共舞

大家好,我是肆〇柒。 今天咱们不聊那些晦涩的技术。 今天的内容,源自我看到的一篇论文《In Dialogue with Intelligence: Rethinking Large Language Models as Collective Knowledge》。
7/11/2025 10:11:38 AM
肆零柒

“数据产品”究竟是什么以及它为何对AI代理至关重要

深陷数据泥潭,渴望洞察如今,许多组织都深陷数据洪流。 信息从销售系统、营销工具、运营数据库、网站以及无数其他来源涌入。 然而,尽管信息浩如烟海,要获得清晰可靠的业务答案却异常困难。
7/11/2025 10:00:03 AM
晓晓

一文搞懂 | 大模型为什么出现幻觉?从成因到缓解方案

1、前言随着大模型(Large Language Models, 以下简称LLM)迅猛发展的浪潮中,幻觉(Hallucination)问题逐渐成为业界和学术界关注的焦点。 所谓模型幻觉,指的是模型在生成内容时产生与事实不符、虚构或误导性的信息。 比如,当你询问“世界上最长的河流是哪条?
7/11/2025 9:50:52 AM
火山引擎云安全

AI+数据血缘的三重境界(建议收藏)

凌晨两点,你被一通电话吵醒。  "报表有问题! 销售额对不上!
7/11/2025 9:38:47 AM
大数据AI智能圈

Llama惨遭抛弃!Meta内部改用Claude写代码

闻乐 发自 凹非寺. 量子位 | 公众号 QbitAILlama惨遭抛弃! 据Meta工程师透露,现在Meta内部开发都已经换掉了自家的Llama,改用Claude Sonnet写代码。
7/11/2025 9:26:42 AM
闻乐

AI 15分钟"逆向工程"桌面软件:79美元/月的"专有技术"竟然是这样...

用了Claude Code几天之后,我决定测试一下它的逆向工程能力。 结果让我彻底震惊了。 一个收费79美元/月的"专有"桌面软件,Claude Code用15分钟就完全拆解了。
7/11/2025 9:16:49 AM
阿丸笔记

AB实验新突破:携程提出图贪心分流算法,解决两大核心难题

作者简介小白,携程算法工程师,关注营销定价领域。 携程火车票部门为解决智行酒店商户侧AB实验中,预实验分流中遇到的分流不均、分流组流量交叉问题,提出了一种用于非用户端AB实验的分流算法,该算法通过优化的随机抽样模块与贪心交换模块,保证实验组之间多指标的相似性;通过图算法模块,降低实验组之间的流量交叉。 通过实证分析,该算法一方面有效的提升了商户端实验在多指标下的分流效率;另一方面,相比于使用先验知识进行分流,显著降低了实验组之间的流量交叉。
7/11/2025 9:16:00 AM

告别数据「噪音」,UCSD大模型推理新方法DreamPRM充当「信号放大器」,登顶MathVista测评榜

DreamPRM 由加州大学圣地亚哥分校的研究团队开发,在数学推理权威测评榜MathVista上获得了第一名。 第一作者为博士生 Qi Cao,通讯作者为该校副教授 Pengtao Xie,团队其他成员还包括王睿一,Ruiyi Zhang 和 Sai Ashish Somayajula。 使用过程奖励模型(PRM)强化大语言模型的推理能力已在纯文本任务中取得显著成果,但将过程奖励模型扩展至多模态大语言模型(MLLMs)时,面临两大难题:由于多模态输入(图像 文本)构成高维连续与离散信号的混合空间,训练数据与测试数据的分布偏移(Distribution Shift)远超纯文本场景,导致一般过程奖励模型泛化能力显著下降。
7/11/2025 9:15:00 AM

Manus跑路了吗?

Manus,真的从国内撤了? ! 4个月前一夜蹿红起飞的AI Agent产品Manus,刚被曝出背后公司一举裁掉国内七成团队。
7/11/2025 9:13:00 AM