AI在线 AI在线

资讯列表

GPT-5真身曝光,首测编程惊艳全网!一句话秒生游戏,OpenAI双雄备战AGI

GPT-5的发布前兆,愈发强烈了。 今早,一款神秘模型Horizon Alpha突然上线OpenRouter,各种榜单和测试席卷了全网。 Horizon Alpha模型的上下文为256K,响应极速,非常擅长创意写作。
8/1/2025 2:40:45 PM

全新的AI模型带来更快速的漏洞检测方案

一组研究人员开发出一种名为White-Basilisk的新型AI模型,该模型检测软件漏洞的效率高于许多大型系统。 当前,开发人员和安全团队在保障复杂代码库安全方面面临着越来越大的压力,且往往缺乏部署大规模AI工具的资源,该模型正是在这一背景下发布的。 小模型,大成效与需要数十亿参数和强大计算能力的大型语言模型(LLM)不同,White-Basilisk模型非常紧凑,仅有2亿个参数,然而,在多个用于漏洞检测的公共基准测试中,它的表现优于规模超过其30倍的模型,这至少在专门的安全任务方面,对“模型越大越好”的观点提出了质疑。
8/1/2025 2:38:14 PM
Mirko Zorz

OpenAI护城河被攻破!AI新王Anthropic爆赚45亿,拿下企业级LLM市场

GPT-5再不来,奥特曼正要熬夜头秃,无法入眠了! 刚刚,OpenAI最强劲敌Anthropic被曝年化收益已达45亿美元,晋级为史上增长最快的软件公司。 在LLM API赛道上,Anthropic成功登顶,而OpenAI在AI编程上更是落荒而逃,市场份额只有Anthropic一半!
8/1/2025 2:37:07 PM

VLM与扩散模型深度整合,图像理解生成编辑三合一模型登场,权重数据训练流程全开源

VLM和扩散模型被整合到一起了。 ModelScope(魔搭)团队发布Nexus-Gen V2,一个同时支持图像理解、生成和编辑的统一模型,而且模型权重、训练流程和数据集全部开源。 这事儿有多重要?
8/1/2025 2:32:01 PM

GPT-4o遭越狱后指挥机器人做危险动作!全球首个具身智能体安全评测基准来了,大模型集体翻车

AGENTSAFE团队 投稿. 量子位 | 公众号 QbitAI想象一下,你家的智能机器人管家,不仅能听懂“把苹果放进冰箱”,也能执行“用打火机点燃房间”这样的指令。 这听起来是不是有点吓人?
8/1/2025 2:30:54 PM
闻乐

小红书提出首个社交大模型:八大社交任务平均提升14.02%

大模型也能“通人情”? 行业首个社交大模型全景解析:既能兼顾社交理解与平台规则,又能洞察理解用户。 小红书重磅推出RedOne——一款面向SNS(社交网络服务)领域的定制化LLM,旨在突破单一任务基线模型的性能瓶颈,并且构建全面覆盖SNS任务的基座模型。
8/1/2025 2:28:38 PM
时令

字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍

用扩散模型写代码,不仅像开了倍速,改起来还特别灵活! 字节Seed最新发布扩散语言模型Seed Diffusion Preview,这款模型主要聚焦于代码生成领域,它的特别之处在于采用了离散状态扩散技术,在推理速度上表现出色。 在H20上,它的代码推理速度能达到2146tokens/s,比同类的Mercury和Gemini Diffusion等模型快不少,同时比同等规模的自回归模型快5.4倍,并且在代码编辑任务中更具优势。
8/1/2025 2:15:20 PM
闻乐

Kimi K2 高速版kimi-k2-turbo-preview发布 输出每秒 40 Tokens

kimi-k2-turbo-preview,即Kimi K2高速版正式发布。 据悉,该高速版模型在参数设置上与原版kimi-k2保持一致,但在性能上实现了显著提升,输出速度从原先的每秒10Tokens大幅跃升至每秒40Tokens,为用户带来更加流畅高效的使用体验。 为庆祝Kimi K2高速版的发布,官方特别推出限时5折特惠活动,该优惠将持续至9月1日,之后将恢复原价。
8/1/2025 2:12:12 PM
AI在线

Kimi K2高速版发布 输出速度提升至每秒40 Tokens

Kimi开放平台发布Kimi K2 高速版。 新款模型命名为kimi-k2-turbo-preview,参数规模与现有kimi-k2 保持一致,但输出速度由每秒10 Tokens提升至每秒40 Tokens,显著提升使用效率。 此次升级旨在优化用户体验,满足更高实时性需求的应用场景。
8/1/2025 2:12:08 PM
AI在线

新加坡AI初创公司SixSense获850万美元融资

在半导体行业,如何快速发现和解决生产过程中的缺陷一直是一个棘手的问题。 新加坡深科技初创公司 SixSense 正是瞄准了这一挑战,推出了一款 AI 驱动的平台,旨在帮助芯片制造商实时预测和检测潜在的芯片缺陷。 近日,SixSense 成功完成了850万美元的 A 轮融资,使其总融资额达到1200万美元。
8/1/2025 2:12:07 PM
AI在线

月之暗面发布 Kimi K2 高速版:输出速度提升至每秒 40 Tokens

AI在线 8 月 1 日消息,月之暗面今日发布 Kimi K2 高速版 ——Kimi-K2-turbo-preview,模型参数与 Kimi-K2 一致,但输出速度由每秒 10 Tokens 提升至每秒 40 Tokens。 据介绍,该模型目前限时 5 折特惠,9 月 1 日恢复原价,折扣后的价格:模型每百万 tokens 输入价格(缓存命中)2 元,输入价格(缓存未命中)8 元,输出价格 32 元。 据AI在线此前报道,月之暗面 7 月 11 日正式发布 Kimi K2 模型,并同步开源。
8/1/2025 1:49:43 PM
浩渺

全球首款通用AI科研智能体问世:我一个文科生用它写了份CRISPR基因编辑综述报告

就在一夜之间,用 AI 帮忙搞科研,不是再只是想想了。 最近,科研圈里越来越多的人在讨论一种叫 SciMaster 的「AI 科学助手」,有让它做实验的,有让他帮忙开题的,还有跟他聊科幻的。 仿佛有一个 AI 大模型加持的助手就可以包打天下了。
8/1/2025 1:27:00 PM
机器之心

马斯克、吴恩达青睐,黄仁勋批评,见证百度、OpenAI内部起落,Anthropic CEO自曝式采访:诞生四年,每年营收十倍增长

编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)进入7月底,巨头们迎来了新一轮的财报周,而创业公司们也迎来了新一轮的采访和融资周。 昨天,Anthropic 的创始人 Dario Amodei 接受了知名播客 The Big Technology 的采访,主持人 Alex Kantrowitz 事后自己走访了 Dario 的朋友、同事、竞争者二十余次,特别为这次含金量满满的采访写了一篇特稿:《 Anthropic CEO 成长之路》。 可以说是 Dario 的半篇自传了。
8/1/2025 1:24:06 PM
云昭

中国在AI领域超越美国已是板上钉钉?吴恩达:美国无法保持领先

中国在人工智能领域已经成为全球竞争的重要力量。 根据斯坦福 2025 年 AI 指数报告,美国虽然仍领先于顶级模型数量,但中国正在迅速缩小差距 —— 在 MMLU、HumanEval 等基准测试中的差距已从几乎双位数下降到几乎持平。 而最近召开的 WAIC 大会,AI 应用,智能体,新模型不断更新迭代,显示了中国在人工智能方面的迅猛发展。
8/1/2025 1:21:00 PM
机器之心

驯服复杂表格:九天重磅开源,开启「人与表格对话」智能新时代

7 月 26 日,在 WAIC 2025 世界人工智能大会上,中国移动九天人工智能研究院全面开源九天结构化数据大模型 “数据 - 模型 - 测评” 三位一体的完整模型体系,包括了结构化数据体系、TReB 标准化测评框架、支持微调及推理全流程模型。 中国移动希望通过开源共享,降低结构化数据智能应用的技术门槛与研发成本,助力结构化数据大模型的行业演进,推动行业形成协同创新生态,让结构化数据价值在千行百业高效释放。 全方位、多维度、深层次结构化数据体系表格数据以其结构化、紧凑的特性,承载着海量关键数据,是结构化数据大模型的核心训推数据。
8/1/2025 1:15:00 PM
机器之心

思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

近期,随着OpenAI-o1/o3和Deepseek-R1的成功,基于强化学习的微调方法(R1-Style)在AI领域引起广泛关注。 这些方法在数学推理和代码智能方面展现出色表现,但在通用多模态数据上的应用研究仍有待深入。 DocTron团队提出的Chart-R1模型在这一背景下应运而生,针对图表这一信息密集型多模态数据类型,开发出一套思维链监督和强化的图表推理方法,通过逐步骤的思维链监督和数值敏感的强化学习微调实现复杂图表推理能力。
8/1/2025 1:10:00 PM
机器之心

图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight

henry 发自 凹非寺量子位 | 公众号 QbitAI一个不起眼的迷宫导航任务,却能让一众模型“原形毕露”。 Diffuser和Diffusion Forcing双双翻车,通关率低得可怜。 唯独有一个模型,通关率高达 100%。
8/1/2025 1:02:35 PM
henry

世纪华通谢斐:在“三大平衡”中领跑,实现游戏行业更高质量的发展

7月31日,以“聚新质动能,引全球共振”为主题的第22届中国国际数字娱乐产业大会(CDEC)在上海举行。 作为行业头部公司,世纪华通总裁谢斐受邀参会并发表了题为《在平衡中领跑:有关中国游戏新质发展的思考》的主题演讲。 她指出,中国游戏行业虽然已成为全球游戏领域的“领跑者”,但也面临三大亟需平衡的矛盾,需要在平衡中实现更高质量的发展。
8/1/2025 12:43:35 PM
鱼羊