AI在线 AI在线

模型

Meta两员大将回流OpenAI,30天爆赚800万?刚入职闪回巢,小扎钞能力失效

成立仅两个月,小扎「梦之队」MSL已痛失三位核心大脑。 最新爆料称, 两位前OpenAI员工Avi Verma和Ethan Knight,加入Meta一个月再次回流到OpenAI。 1亿美金诱人薪酬包,也没能留住顶尖人才,难道小扎的「钞能力」真的失效了吗?
8/27/2025 3:39:11 PM

马斯克狂烧14万亿,5000万H100算力五年上线!终极爆冲数十亿

世界首富马斯克,这次宣布决定All in AI了。 5年内实现5000万张H100的算力。 要知道,他已经有了全世界最强的Colossus超算集群,AI算力等价于约20万张H100。
8/27/2025 3:16:34 PM

谷歌nano banana正式上线:单图成本不到3毛钱,比OpenAI便宜95%

昨晚,神秘且强大的图像生成与编辑模型 nano banana 终于正式显露真身。 没有意外,它果然来自谷歌,并且也获得了一个正式但无趣的名字:gemini-2.5-flash-image-preview。 据介绍,该模型具有「SOTA 的图像生成与编辑能力、惊人的角色一致性以及闪电般的速度」。
8/27/2025 9:25:00 AM

设计界的"华为时刻"!国产AI包揽全球前15,Adobe们要慌了

前15名100%是中国模型,总榜6个国产模型上榜——当我看到DesignArena最新UI设计能力排行榜时,说实话有点被震撼到了。 这不是营销噱头,而是来自权威AI模型评测平台的硬数据。 在这个专门测试大模型UI设计能力的排行榜上,中国模型上演了一场前所未有的"集体霸榜"。
8/27/2025 9:09:45 AM
阿丸笔记

视觉Token注入CLIP语义,走向多模态理解与生成新范式

让视觉token说话,既能看懂图像,又可以画出图像! 腾讯ARC Lab联合中科院自动化所、香港城市大学、浙江大学等机构提出了一种全新的视觉分词器——TokLIP,即Token CLIP。 可以将低级的离散视觉Token与高级的CLIP语义相结合,实现多模态理解与生成的高效统一。
8/27/2025 9:08:00 AM

教AI「择偶生娃」,复刻自然演化!上交校友提名最佳论文

如果让AI模型像生物一样演化,它们会不会彼此竞争、协作、结合,并繁衍出越来越强的后代? 「物竞天择,适者生存」的进化论思想,是否也适用于AI模型? 就在最近,Sakana AI从自然演化的过程中汲取灵感,提出了一种利用「竞争与吸引力」的自然选择机制,来提升AI模型融合效果的方法。
8/27/2025 9:07:00 AM

Meta万引强化学习大佬跑路!用小扎原话作为离别寄语,扎心了

小扎在这头疯狂挖人,结果家里的老员工纷纷跑路了? ? 最新消息,Meta万引强化学习大佬Rishabh Agarwal即将离职,还留下了一篇让人浮想联翩的小作文:这是我在Meta的最后一周。
8/27/2025 9:05:00 AM

问小白o4:AI的“头脑风暴”时代来了!

各位AI圈的朋友们,最近有没有被一个新名字刷屏? “问小白o4”,这个名字背后,可藏着一个颠覆性的概念——并行思考。 这不,国内首个打出这个旗号的模型,着实让大家眼前一亮。
8/27/2025 2:25:00 AM
墨风如雪

刚刚,英伟达新模型上线!4B推理狂飙53倍,全新注意力架构超越Mamba 2

英伟达最近真的痴迷上「小模型」了。 刚刚,英伟达发布了一个全新的混合架构语言模型系列,Jet-Nemotron。 论文地址::。
8/26/2025 3:31:35 PM

当AI成为预言家:大数据时代,我们正在失去理解世界的能力吗?

最近,我在斯坦福大学的一篇文章中读到了神经科学家Grace Huckins的观点,她提出了一个令人深思的问题:"虽然强大的AI工具和海量数据集正在推动实际进步,但它们可能没有深化我们对宇宙的理解。 "这句话像一记重锤,敲在了我的思考深处。 在这个AI大爆炸的时代,我们每天都在惊叹于技术的进步:AlphaFold预测蛋白质结构的准确性超越了实验方法,大型语言模型能够写出看似有深度的文章,AI系统可以识别出人类肉眼无法察觉的模式...但是,这些进步真的让我们更理解这个世界了吗?
8/26/2025 9:16:55 AM

ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

本文第一作者是清华大学博士生张清杰,研究方向是大语言模型异常行为和可解释性;本文通讯作者是清华大学邱寒副教授;其他作者来自清华大学、南洋理工大学和蚂蚁集团。 如果我们的教科书里包含大量的污言秽语,那么我们能学好语言吗? 这种荒唐的问题却出现在最先进 ChatGPT 系列模型的学习过程中。
8/26/2025 9:15:00 AM

真实场景也能批量造「险」!VLM+扩散模型打造真实域自动驾驶极限测试

近期,懂车帝的《懂车智炼场》栏目对量产自动驾驶系统的NOA辅助驾驶功能进行了安全关键场景测试。 结果显示,在黑夜施工工地、高速公路前方车辆发生事故以及障碍物后突然驶出车辆等高风险场景中,目前尚无任何系统能够在测试中做到完全避免事故。 这类安全关键场景在真实道路上虽不常见,但一旦发生,可能导致人员伤亡或严重交通事故。
8/26/2025 9:10:00 AM

最新智能体自动操作手机电脑,10个榜单开源SOTA全拿下|通义实验室

能自动操作手机、电脑的智能体新SOTA来了。 通义实验室推出Mobile-Agent-v3智能体框架,在手机端和电脑端的多个核心榜单上均取得开源最佳。 它不仅能做交互界面的问答、描述、定位,也能一条指令独立完成复杂任务,甚至可以在多智能体框架中无缝扮演不同角色。
8/26/2025 9:08:00 AM

为防AI刷题,Nature等顶刊最新封面被做成数据集,考验模型科学推理能力|上海交通大学

近年来,以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型,在各大基准测试(如MMMU)中捷报频传,纷纷刷榜成功。 然而,这些令人瞩目的进展也带来了一个愈发严峻的问题:当现有的“题库”逐渐被提前预训练进模型,我们如何才能持续、准确地评估这些顶尖AI的真实能力? 为了应对这一挑战,上海交通大学王德泉教授课题组巧妙地将“动态基准”这一理念与不断更新的科学前沿相结合,提出了MAC(多模态学术封面)基准:既然科学知识本身在不断演进,为什么不用最新的科学内容来测试AI呢?
8/26/2025 9:07:00 AM

2025临界点:AI智商超越人类,经济规则即将改写

在人类经济活动数字化的浪潮中,互联网和移动互联网走完了前两步,正在浮现中的AI经济,可能带来更大的变化。 人类经济活动正在数字化:1946年,人类发明了计算机,这标志着人类的计算经过几千年的演化,从手动到机械,终于到了电子形式。 计算机的出现,把计算能力提高到了远超过人脑计算能力的程度。
8/26/2025 9:06:00 AM

Karpathy氛围编程最新指南!三层AI编程结构:顺境Cursor,逆境Claude,绝境GPT-5 Pro

刚刚,大神Karpathy发布全新Vibe Coding指南! 在这份指南中,Karpathy不死磕单一模型,而是集众模之所长,总结出了一套AI编程的三层结构:Cursor——主要负责自动补全与小范围代码修改,高效传达任务意图。 Claude Code/Codex——用于实现较大功能块,快速原型开发和跨领域代码尝试。
8/26/2025 9:00:00 AM

揭秘大语言模型的“开挂神器”:ReAct 框架与推理应用

大语言模型看似神通广大,但其实也有犯迷糊的时候。 今天就带大家揭开一个能让大语言模型瞬间“开挂”的秘密武器——ReAct 引导式学习框架,还有超厉害的 ReACT 推理应用。 想知道它们到底有多神?
8/26/2025 4:11:00 AM
demo123567

Java融合AI,手把手教你整合大语模型

人工智能(AI)正加速重构各行业发展模式,大型语言模型(LLM)无疑是这场技术革命的核心驱动力。 对于Java开发者而言,如何将LLM的强大能力融入现有应用,是拓展技术边界、提升产品价值的重要方向。 本文聚焦LLM与Java集成的核心流程,从实际操作步骤、工具选型到行业最佳实践展开讲解,为Java开发者提供清晰的入门路径,助力快速落地AI集成需求。
8/26/2025 1:32:00 AM
学研妹