AI在线 AI在线

资讯列表

TOMG-Bench:大语言模型开放域分子生成新基准

编辑 | ScienceAI科学家提出了一个新的基准测试——TOMG-Bench,用于评估 LLM 在分子领域的开放域生成能力。 项目主页::: Datasets::、材料科学等领域进步的关键环节。 然而,传统的分子发现方法往往依赖于反复实验和数据分析,效率低下且成本高昂。
2/18/2025 4:25:00 PM
ScienceAI

马斯克首次披露 Grok 3 的训练成本:高达 20 万块英伟达 GPU

近日,马斯克在直播中正式推出了全新的聊天机器人 Grok3,并透露了该模型训练的惊人成本。 Grok3目前已面向 Premium 订阅用户开放,并在多个评测领域表现出色,甚至超过了市场上其他竞争对手,如 Gemini、DeepSeek 和 ChatGPT。 马斯克在直播中介绍,Grok3的训练过程中共计消耗了20万块英伟达 GPU,这一数字让人震惊。
2/18/2025 4:21:00 PM
AI在线

马斯克首次披露 Grok 3 训练成本:20 万块英伟达 GPU

马斯克介绍称,Grok 3 即日起面向 Premium+ 订阅者推出。目前 Grok 已经推出了专属的 Grok.com 网页,供用户体验 Grok 系列模型。
2/18/2025 4:01:37 PM
问舟

腾讯公关总监张军回应“DeepSeek 元宝回答植入广告”:理论上不应该,估计开了联网搜索

腾讯公关总监张军给出原因:“回答参考了‘58 到家家政保洁保姆月嫂搬家’公众号的避坑内容‘空调移机套路多?过来人总结了 4 个坑,提前了解不花冤枉钱!’估计是开了联网搜索。”
2/18/2025 3:59:09 PM
归泷(实习)

月之暗面宣布推出新模型 Kimi Latest:始终使用最新模型,名称保持不变

kimi-latest 将对标 Kimi 智能助手当前使用的模型,随智能助手产品更新而同步升级(模型名称始终为 kimi-latest)。
2/18/2025 3:30:16 PM
汪淼

AI看照片,几秒就能地理定位!因太危险被公司主动关闭,正向警方推销

在看刑侦片的时候,每当破案遇阻,你是否想象过,一种能够仅基于一张嫌疑人出现的场景照片,就即刻定位到场景所在地的具体经纬度的技术呢? 现在,这种想象,已然成为现实! 初创AI公司graylark发布了一项名为「GeoSpy」的系列产品,因其是一个革命性的照片地理定位系统,近来引发热议。
2/18/2025 3:30:00 PM
新智元

“地表最强”Grok 3震撼登场,马斯克演示却“小翻车”,网友调侃:加上擎天柱才是AGI!几个月后还将开源!

出品 | 51CTO技术栈(微信号:blog51cto)编辑 | 伊风、言征跳票多次! Grok 3终于来了! 此前,DeepSeek创造的破圈奇迹,把硅谷的大模型公司全部笼罩在阴影之下。
2/18/2025 3:16:25 PM
伊风

影子AI:CISO常忽视的安全隐患

在企业数字化转型的浪潮中,一股新的力量正悄然兴起,却也让安全领导者和CISO们头疼不已——那就是影子AI。 这些并非来自外部攻击者的威胁,而是由本应值得信赖的员工,在没有IT和安全部门监督或批准的情况下,自行创建的AI应用。 它们如同数字世界的“兴奋剂”,让使用者能在短时间内完成更细致的工作,却也让企业的安全边界变得岌岌可危。
2/18/2025 3:13:29 PM
Louis Columbus

终于找到答案了!DeepSeek凭啥能给出这么丰富的答案 - 反事实推理(上)

为什么deepseek的回答如此丰富,如此多维度? 今天和大家聊聊,deepseek核心技术(之一):反事实推理。 什么是反事实推理?
2/18/2025 3:13:13 PM
58沈剑

月之暗面推出kimi-latest:可第一时间体验kimi最新模型

2月18日,北京月之暗面科技有限公司宣布在Kimi开放平台推出最新模型——kimi-latest,旨在为开发者和企业用户提供更强大、更稳定的AI生成能力。 自2024年1月31日Kimi开放平台公测以来,moonshot-v1系列模型一直是Kimi智能助手的核心支持。 然而,随着Kimi智能助手的快速迭代,开发平台用户对模型稳定性和功能的需求逐渐分化,促使月之暗面科技推出这一新模型。
2/18/2025 3:12:00 PM
AI在线

企业AI采用规则变革:IT领导者面临的新机遇与挑战

一场AI领域的“地震”正悄然发生,而这场“地震”的震源,正是初创企业DeepSeek推出的R1 AI模型。 这一模型的横空出世,不仅让美国科技股市值蒸发万亿,更让OpenAI、Alphabet、Meta等AI巨头措手不及。 DeepSeek声称,其推理模型性能媲美OpenAI的顶尖产品,速度翻倍,成本却仅为十分之一。
2/18/2025 3:11:16 PM
Martin De Saulles

马斯克“地表最强”Grok 3炸场,竞技场首超1400分

刚刚,马斯克xAI的Grok 3终于亮相(超300万人次围观)! 一出道即巅峰,竞技场(lmarena.ai)官方给出了这样的评价:Grok 3是首个突破1400分的模型,并且在所有类别中排名第一。 而且,Grok 3还是首个在10万张(后扩展到20万)H100集群上训练出的模型。
2/18/2025 3:09:07 PM
量子位

微软开放3.1T token高质量数据!通用/代码/数学/问答,全领域超越开源

过去几年,大型语言模型(LLMs)已经成为人工智能研究的一个关键领域,从大规模的自然语言数据中学习,使其能够以极高的准确率执行各种与语言相关的任务。 得益于模型扩展性方面的进展,研究人员能够创建具有前所未有复杂度的模型。 当前的研究趋势是致力于构建更大、更复杂的模型,具有数百/数千亿个参数,但大型语言模型的训练需要海量的训练数据,尤其随着模型参数量的上升,对于优质数据数量的要求也将进一步加大,优质数据量的缺乏极大限制了模型能力的进一步增长。
2/18/2025 3:03:58 PM
新智元

强化学习Scaling Law错了?无需蒸馏,数据量只要1/6,效果还更好

DeepSeek-R1带火了使用强化学习训练LLM。 在训练中,AI灵机一动,让作者耳目一新,甚至因此惊叹到:这就是强化学习的力与美! DeepSeek-R1-Zero惊艳了研究人员然而,对RL训练的理解存在空白:这些工作的训练数据的透明度有限,谁知道是方法好还是数据集质量好?
2/18/2025 3:02:13 PM
新智元

AI 看照片几秒就能地理定位:GeoSpy 技术因太危险被公司主动关闭,正向警方推销

任何一张照片,直接就能定位照片中的具体所在地,并呈现出对应的 3D 场景。GeoSpy 使得这一切都成为了现实,但大家也都为此而感到隐私泄露的巨大风险和潜在危害。
2/18/2025 3:02:01 PM
汪淼

首批苏州 AI 青年创业园名单揭晓,20家创业园入选

据苏州日报报道,首批苏州 AI 青年创业园名单正式公布,涵盖20家入选的创业园。 报道称,苏州AI青年创业园将加强青年AI人才引育,进一步发挥辐射和带动作用,推动AI产业与应用融合创新,为加快建设具有苏州特色的“人工智能 ”创新发展试验区作出更大贡献。
2/18/2025 3:00:26 PM
AI在线

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

人类史上首个在20万块GPU上训出的模型终于问世! 刚刚,马斯克带队三位xAI成员在线开启直播,官宣Grok-3全家桶——Grok-3(Beta)、Grok-3 mini首个推理模型Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning:击败o3-mini/DeepSeek-R1,解锁推理时计算首个AI智能体「DeepSearch」:联网深入搜索一股OpenAI发布会的味道扑面而来据介绍,三代Grok的训练计算量竟是Grok-2的10倍,那么实际表现又如何? 世界最大超算集群Colossus已有20万块GPU:10万块GPU同步训练(第一阶段用时122天搭建);20万GPU(第二阶段用时92天)在多项基准测试中,Grok-3在数学(AIME 2024)、科学问答(GPQA)、编码(LCB)上刷新SOTA,大幅超越DeepSeek-V3、Gemini-2 Pro、GPT-4o。
2/18/2025 2:59:16 PM
新智元

“每 20 个 80 后就有 1 人去世”系谣言,罪魁祸首可能是 AI

报道提到,大多数相关文章都号称其数据来自第七次人口普查的“权威数据”,然而其中的信息漏洞百出,对此,中国人民大学教授李婷在一篇文章中也作出了反驳。
2/18/2025 2:52:17 PM
汪淼