AI在线 AI在线

技术

「香蕉革命」首揭秘!谷歌疯狂工程师死磕文字渲染,竟意外炼出最强模型

纳尼(°ロ°),怎么AI圈子突然就开始「纳米香蕉革命」了。 谷歌没想到自己发布了一个新的图像模型,直接就引爆了社区! 最近这个香蕉实在太火了,仿佛又回到几个月前的OpenAI的「吉卜力热」盛况。
8/29/2025 2:45:21 PM

AAAI-26投稿量爆炸:近3万篇论文,2万来自中国,评审系统都快崩了

你可能不信,你投的 AAAI-2026 会议,应该是有史以来投稿量最多的一次。 此前,取号人数就突破了 3 万,其中有不少 NeurIPS 转投的。 如今官方数据也公开了:主技术轨道共接收将近 29000 篇投稿,来自中国的投稿接近 20000 篇,占据了惊人的三分之二。
8/28/2025 3:32:51 PM

告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的面部、肢体表达严重脱节,削弱了观众的沉浸感。 现有新兴的音频驱动视频生成模型,在应对长视频序列时也暴露出身份漂移和片段过渡生硬等问题。 为解决这些痛点,Infinitetalk 引入 “稀疏帧 video dubbing”。
8/28/2025 9:11:56 AM

设计界的"华为时刻"!国产AI包揽全球前15,Adobe们要慌了

前15名100%是中国模型,总榜6个国产模型上榜——当我看到DesignArena最新UI设计能力排行榜时,说实话有点被震撼到了。 这不是营销噱头,而是来自权威AI模型评测平台的硬数据。 在这个专门测试大模型UI设计能力的排行榜上,中国模型上演了一场前所未有的"集体霸榜"。
8/27/2025 9:09:45 AM
阿丸笔记

问小白o4:AI的“头脑风暴”时代来了!

各位AI圈的朋友们,最近有没有被一个新名字刷屏? “问小白o4”,这个名字背后,可藏着一个颠覆性的概念——并行思考。 这不,国内首个打出这个旗号的模型,着实让大家眼前一亮。
8/27/2025 2:25:00 AM
墨风如雪

FastAPI开发AI应用教程:新增用户历史消息

本文将深入介绍如何在 FastAPI AI 聊天应用中实现用户历史消息功能,当用户切换助手,刷新页面时,都可以保留当前会话历史消息。 图片本项目已经开源至 Github,项目地址::本文全文约一万字,看完约需 15 分钟。 文章概述重点讲解每个助手区分 sessionid、获取历史消息接口以及发送消息时携带上下文信息的核心技术实现。
8/26/2025 1:11:00 AM
wayn

谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒

大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。
8/22/2025 3:08:38 PM

三人团队击败科技巨头:RF-DETR如何成为目标检测新王者

说实话,当我看到一个仅3人团队打造的目标检测模型RF-DETR,居然能在性能上碾压Google、Meta等科技巨头的数百人研发团队时,第一反应是——这怎么可能? 但事实就是这么魔幻。 在刚刚发布的最新评测中,RF-DETR不仅成为首个在COCO数据集上突破60mAP的实时模型,更是在新发布的RF100-VL真实世界数据集上大幅领先YOLO、D-FINE等知名模型。
8/21/2025 9:29:18 AM
阿丸笔记

AI图像水印失守!开源工具5分钟内抹除所有水印

AI图像的水印技术要变天了! 一款全新的去水印技术——UnMarker,能在5分钟内去除市面上几乎所有的AI图像水印。 其中,谷歌水印工具HiDDeN已被完全破解,SynthID也已被攻破79%!
8/14/2025 12:37:03 PM

美国宣战,AI行动计划打响第一枪!「AI+材料」成最新核武器

近日,美国白宫发布《美国AI行动计划》,该计划勾勒了美国国家层面的人工智能发展蓝图,其中也明确提出多项AI与产业深度融合的战略部署。 从材料科学的角度出发,可以看到美国正在以空前的战略高度,将材料科学与人工智能的深度融合置于国家核心竞争力的位置。 这其中传递出清晰的信号:谁掌握了「AI 材料」的核心能力,谁就扼住了下一代产业革命和科技创新的咽喉。
8/14/2025 9:12:00 AM

智谱终于发布GLM-4.5技术报告,从预训练到后训练,细节大公开

就在上个月底,智谱放出重磅炸弹 —— 开源新一代旗舰模型 GLM-4.5 以及轻量版 GLM-4.5-Air。 其不仅首次突破性地在单个模型中实现了推理、编码和智能体能力的原生融合,还在 12 项全球公认的硬核测试中取得了全球第三的综合成绩。 这个成绩在所有国产模型和开源模型中均排名第一!
8/11/2025 5:58:44 PM

硅谷AI大佬都在造末日地堡:小扎夏威夷修了465平米,奥特曼承认有加固地下室

科技巨头、亿万富翁、AI押注者&话事人……但你可能没注意到,除了这些身份之外,奥特曼和扎克伯格还有个鲜为人知的共同点:末日堡垒建造者。 所谓末日堡垒,指的是在危机时刻可以长期生存的地下避难所,具备防灾、储粮、自给自足等功能,是科技富豪们眼中的最后保险。 据Wired报道,这个夏天,小扎斥6500万美元巨资,又悄悄在夏威夷考艾岛北部海岸买了962英亩的牧场土地。
8/8/2025 9:17:46 AM

AI Agent原生企业有哪些发展趋势与机遇

随着技术成熟与应用场景拓展,以智能Agent为核心构建业务流程、组织架构与产品服务的原生企业将会迎来一个高速增长期——这些企业将崛起于各行各业,并展现出高度的敏捷性、自适应性与创新能力,成为引领产业变革的新兴主体。 未来,Agent原生企业将会有哪些发展趋势与机遇呢? AI Agent原生企业的趋势和机遇发展趋势展望未来,AI Agent原生企业将会有以下几个发展趋势:(一)“Agent-first”业务逻辑成为主流设计范式。
8/7/2025 12:00:01 AM

谢赛宁「踩雷」背后,竟藏着科研圈更黑真相:Science实锤论文造假+AI滥用!

谢赛宁是真倒霉! 为了避免被LLM审稿「误上」,他领导的实验室投稿的一些论文中暗藏了系统提示词,被𝕏网友当中「处刑」! 跟刚刚《Science》爆出的科研圈两大丑闻,就是小巫见大巫,不值一提。
8/6/2025 9:29:30 AM

Discrete Tokenization:多模态大模型的关键基石,首个系统化综述发布

近年来,大语言模型(LLM)在语言理解、生成和泛化方面取得了突破性进展,并广泛应用于各种文本任务。 随着研究的深入,人们开始关注将 LLM 的能力扩展至非文本模态,例如图像、音频、视频、图结构、推荐系统等。 这为多模态统一建模带来了机遇,也提出了一个核心挑战:如何将各种模态信号转化为 LLM 可处理的离散表示。
8/6/2025 9:10:10 AM

13岁小孩哥当上CEO,22岁造独角兽!少年帮扎堆辍学,集结硅谷创业

一群20岁出头的年轻人,在硅谷掀起了一波AI创业风暴。 他们抛下名校光环,甚至直接辍学,带着梦想和激情杀入了如今的爆火AI赛道。 NYT一篇深度长文中以独特视角,将那些与AI一起成长的年轻CEO们推到聚光灯下。
8/5/2025 3:08:24 PM

破局酒店搜索零结果!携程AI搜索实战,复杂查询召回率提升90%

在AI快速发展的浪潮中,传统的关键词搜索早已难以满足用户日益复杂的需求。 尤其在酒店预订领域,如何精准理解“2大1小”“江浙周边遛娃”这类模糊却真实的意图,成了提升用户体验的关键。 本文将带您深入探索语义搜索如何颠覆传统检索方式,从实体识别、向量召回到大模型加持的语义理解,全面解析携程在智能搜索上的技术路径与实践经验。
8/5/2025 9:28:08 AM

万亿参数狂欢!一文刷爆2025年七大顶流大模型架构

从最初的GPT架构问世以来,已经过去七年了。 回顾2019年GPT-2,再看2024-2025年的DeepSeek-V3和Llama 4,你会发现,这些模型的结构依然惊人地相似。 当然,位置嵌入已从绝对位置编码演变为旋转位置编码(RoPE),多头注意力(Multi-Head Attention)大多被分组查询注意力(Grouped-Query Attention)取代,更高效的SwiGLU激活函数也逐渐取代了GELU。
8/4/2025 9:20:00 AM