AI在线 AI在线

理论

Grok 4意外提前曝光,xAI巨额融资700亿,马斯克宣布“重写人类知识库”

马斯克旗下xAI的重磅炸弹Grok 4提前泄露了! 有开发者在xAI控制台的源代码中意外发现了两个全新模型Grok 4和Grok 4 Code。 图片与此同时,xAI刚刚完成了一轮100亿美元(约716亿人民币)的巨额融资。
7/3/2025 8:50:20 AM

同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等

通过单阶段监督微调与强化微调结合,让大模型在训练时能同时利用专家演示和自我探索试错,有效提升大模型推理性能。 中国科学院自动化研究所深度强化学习团队联合美团,提出一种单阶段监督-强化微调方法——SRFT (Supervised Reinforcement Fine-Tuning)。 该方法通过基于熵的动态加权机制,将两种训练范式结合。
7/3/2025 8:33:00 AM

一文详解Character AI:实用指南+ ChatGPT、Gemini对比分析

译者 | 晶颜审校 | 重楼本指南将深入剖析Character AI的运行机制、功能特性及其存在的局限性。 近年来,生成式人工智能领域发展态势迅猛,其应用范畴已远超单纯的文本生成领域。 在众多备受瞩目的新兴平台中,Character AI是一款支持用户以对话形式与人工智能生成角色进行交互的工具。
7/3/2025 8:03:54 AM
晶颜

OpenAI播客再谈AI编程大战!开发者是最有福的人:特定需求的代码模型将涌现!主持人说漏嘴:我最喜欢Claude!

编译、整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)OpenAI第二期播客来了! 阵容也是相当重磅! 嘉宾是OpenAI 首席研究官 马克·陈(Mark Chen)和ChatGPT 负责人 尼克·特利(Nick Turley)。
7/3/2025 7:55:29 AM
伊风

AI能经营实体店吗?Anthropic的Claude尝试后,结果糟糕得既离谱又滑稽

想象一下这样的场景:你让AI完全掌控一家小店,不仅负责收银机,而且负责整个店铺的运营,包括定价、库存管理、客户服务、与供应商的谈判,那么,可能会出什么错呢?新的研究给出了明确的答案:一切皆有可能出错。 Anthropic公司的AI助手Claude在旧金山办公室管理了一家小店约一个月,结果读起来就像是一个从未真正经营过业务的人写的商学院案例研究——而事实证明,确实如此。 这项名为“Project Vend”的实验,是与AI安全评估公司Andon Labs合作进行的,是对具有显著经济自主权的AI系统进行的首次现实世界测试之一。
7/3/2025 7:07:00 AM
Michael

AI在不安全代码上训练后变得邪恶

研究揭示,用不安全代码微调 LLM 会导致“突发不一致”,模型可能产生有害建议。 GPT-4o 等模型在编码无关查询中表现出反人类、赞扬纳粹等行为。 需警惕数据投毒和后门攻击,加强 AI 对齐,防范 ASI 风险。
7/3/2025 4:00:00 AM
岱军

爆改RAG!让你的AI检索“见人说人话,见鬼说鬼话”——自适应检索的魔法揭秘

一、RAG的“尴尬”与“觉醒”1.1 传统RAG的“直男式”检索RAG系统的基本套路大家都懂:用户提问,系统先去知识库里“搜一搜”,然后把搜到的内容丢给大模型“写一写”,最后输出一段看似高大上的答案。 但问题来了:用户问“XAI是什么? ”——你给我一堆论文段落,啰嗦半天没说重点。
7/3/2025 4:00:00 AM
许泽宇

深入浅出RAG详解:语言模型的“开卷考试”——让模型答案锚定现实的外部“记忆”

引言大型语言模型(LLMs)彻底革新了自然语言处理领域,但其对静态内部知识的依赖,在事实准确性和时效性方面暴露出根本性局限。 检索增强生成(RAG)作为一种强大的范式应运而生,它构建了一种混合架构,将模型输出动态锚定于外部可验证信息。 本文将深入探讨RAG框架的核心机制——从检索器与生成器组件到参数化记忆与非参数化记忆的关键区别,揭示其在知识密集型应用中实现前沿性能的奥秘。
7/3/2025 2:12:00 AM
柏企阅文

机器学习实战:糖尿病预测及可视化分析

你一生中可能已经多次听说过糖尿病。 它如此普遍地流行。 根据国际糖尿病联合会的数据,2024年有超过340万人死于糖尿病。
7/3/2025 1:45:00 AM
云朵君

Bengio亲手戳穿CoT神话!LLM推理是假象,25%顶会论文遭打脸

图灵奖大牛Bengio新作上线了! 这篇由牛津、谷歌DeepMind、Mila多家机构联手论文指出——思维链并非可解释性。 这一观点彻底打破了许多人的认知:CoT看似一步步给出答案,实则并不一定是其真实的推理过程。
7/3/2025 1:45:00 AM
新智元

李飞飞最新访谈:没有空间智能,AGI就不完整

这是“AI教母”李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。 不过她有自己的表述,从进入人工智能领域开始,她就确定了她终身奋斗的梦想:让智能体能够讲述世界的故事。 而这,离不开空间智能。
7/2/2025 6:15:02 PM

Grok4未上线源码先泄露!马斯克的Code模型被实锤!将深度对齐开发者编程习惯,能否逆袭前代硬伤?再获融资百亿,算力多到用不完

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Grok 4真的要来了! 马斯克预告多次的Grok 3.5跳票,直接给大家端上4.0的更强版本。 为了这一次发布能够给AI圈一点震撼,Grok团队也是真的够拼,又一次把帐篷搭进了办公室。
7/2/2025 4:53:28 PM
伊风

Grok 4源代码刚刚泄露!上线倒计时,马斯克xAI估值破1130亿,大模型要变天

突发消息:Grok 4即将上线! 与此同时,xAI再度获得百亿美元融资,估值已经直冲1130亿。 马斯克的AI帝国,再度以可怕的规模扩张。
7/2/2025 2:42:03 PM

9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA | 智谱开源

如果一个视觉语言模型(VLM)只会“看”,那真的是已经不够看的了。 因为现在真实世界的任务简直不要太复杂,要想让AI干点实事儿,光有多模态还不够,必须还得有深度思考的强推理能力。 而就在刚刚,智谱发布并开源了一个仅9B大小的模型——GLM-4.1V-9B-Thinking,在28项评测中一举拿下23个SOTA!
7/2/2025 2:39:29 PM

Prompt格局小了,上下文工程称王!Shopify CEO提上下文工程,大神Karpathy一众创业者狂喊+1,网友:都是巫术

编辑 | 云昭Prompt工程又“失效”了? ! 之前是各种白领对它“喊打喊杀”,担心它取代自己的工作,后来的口风就变成了“大模型强大到不再需要Prompt工程了”,现在圈里又有谷歌的大佬抛出了神断言,让评论区炸锅的那种。
7/2/2025 12:10:50 PM
云昭

小扎狂砸3亿美金薪酬包!奥特曼放狠话:传教士终将打败雇佣兵

「传教士将打败雇佣兵」! 在小扎挖走近十位OpenAI研究院后,奥特曼在内部备忘录中,写下了这句提振士气的话。 这张在全网疯传的图片中,OpenAI多数大神纷纷加入Meta,华人研究员更是占据了半壁江山。
7/2/2025 9:56:09 AM

震惊!OpenAI创始人透露:这是人类历史上创业最好的时代,但99%的人都理解错了

Hi,大家好,我叫秋水,当前专注于 AI Agent(智能体)。 你有没有想过,为什么有些人能在短短几年内从默默无闻变成改变世界的人? 近期,我看到了OpenAI的创始人Sam Altman的访谈,这个34岁就创造出ChatGPT、估值千亿美元公司的男人,说了一句让所有人震惊的话:"这是人类历史上,创业最好的时代!
7/2/2025 9:56:06 AM
秋水

开源端到端语音大模型:直接从原始音频输入,生成语音输出

目前,大模型LLMs能胜任知识问答、代码辅助等多种任务,但传统模型大多只能输出文本,无法直接生成自然语音,这让人机音频交互不够顺畅。 要知道,人类交流和感知环境可不只是靠文字,语音里藏着音色、情感、语调等丰富信息,其他音频也包含着现实场景的关键信息。 所以,能根据语音或音频输入直接回应的音频语言模型就很重要,也是迈向AGI的关键一步。
7/2/2025 9:46:30 AM