技术
「香蕉革命」首揭秘!谷歌疯狂工程师死磕文字渲染,竟意外炼出最强模型
纳尼(°ロ°),怎么AI圈子突然就开始「纳米香蕉革命」了。 谷歌没想到自己发布了一个新的图像模型,直接就引爆了社区! 最近这个香蕉实在太火了,仿佛又回到几个月前的OpenAI的「吉卜力热」盛况。
8/29/2025 2:45:21 PM
AAAI-26投稿量爆炸:近3万篇论文,2万来自中国,评审系统都快崩了
你可能不信,你投的 AAAI-2026 会议,应该是有史以来投稿量最多的一次。 此前,取号人数就突破了 3 万,其中有不少 NeurIPS 转投的。 如今官方数据也公开了:主技术轨道共接收将近 29000 篇投稿,来自中国的投稿接近 20000 篇,占据了惊人的三分之二。
8/28/2025 3:32:51 PM
告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式
传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的面部、肢体表达严重脱节,削弱了观众的沉浸感。 现有新兴的音频驱动视频生成模型,在应对长视频序列时也暴露出身份漂移和片段过渡生硬等问题。 为解决这些痛点,Infinitetalk 引入 “稀疏帧 video dubbing”。
8/28/2025 9:11:56 AM
设计界的"华为时刻"!国产AI包揽全球前15,Adobe们要慌了
前15名100%是中国模型,总榜6个国产模型上榜——当我看到DesignArena最新UI设计能力排行榜时,说实话有点被震撼到了。 这不是营销噱头,而是来自权威AI模型评测平台的硬数据。 在这个专门测试大模型UI设计能力的排行榜上,中国模型上演了一场前所未有的"集体霸榜"。
8/27/2025 9:09:45 AM
阿丸笔记
问小白o4:AI的“头脑风暴”时代来了!
各位AI圈的朋友们,最近有没有被一个新名字刷屏? “问小白o4”,这个名字背后,可藏着一个颠覆性的概念——并行思考。 这不,国内首个打出这个旗号的模型,着实让大家眼前一亮。
8/27/2025 2:25:00 AM
墨风如雪
FastAPI开发AI应用教程:新增用户历史消息
本文将深入介绍如何在 FastAPI AI 聊天应用中实现用户历史消息功能,当用户切换助手,刷新页面时,都可以保留当前会话历史消息。 图片本项目已经开源至 Github,项目地址::本文全文约一万字,看完约需 15 分钟。 文章概述重点讲解每个助手区分 sessionid、获取历史消息接口以及发送消息时携带上下文信息的核心技术实现。
8/26/2025 1:11:00 AM
wayn
谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒
大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。
8/22/2025 3:08:38 PM
三人团队击败科技巨头:RF-DETR如何成为目标检测新王者
说实话,当我看到一个仅3人团队打造的目标检测模型RF-DETR,居然能在性能上碾压Google、Meta等科技巨头的数百人研发团队时,第一反应是——这怎么可能? 但事实就是这么魔幻。 在刚刚发布的最新评测中,RF-DETR不仅成为首个在COCO数据集上突破60mAP的实时模型,更是在新发布的RF100-VL真实世界数据集上大幅领先YOLO、D-FINE等知名模型。
8/21/2025 9:29:18 AM
阿丸笔记
AI图像水印失守!开源工具5分钟内抹除所有水印
AI图像的水印技术要变天了! 一款全新的去水印技术——UnMarker,能在5分钟内去除市面上几乎所有的AI图像水印。 其中,谷歌水印工具HiDDeN已被完全破解,SynthID也已被攻破79%!
8/14/2025 12:37:03 PM
美国宣战,AI行动计划打响第一枪!「AI+材料」成最新核武器
近日,美国白宫发布《美国AI行动计划》,该计划勾勒了美国国家层面的人工智能发展蓝图,其中也明确提出多项AI与产业深度融合的战略部署。 从材料科学的角度出发,可以看到美国正在以空前的战略高度,将材料科学与人工智能的深度融合置于国家核心竞争力的位置。 这其中传递出清晰的信号:谁掌握了「AI 材料」的核心能力,谁就扼住了下一代产业革命和科技创新的咽喉。
8/14/2025 9:12:00 AM
智谱终于发布GLM-4.5技术报告,从预训练到后训练,细节大公开
就在上个月底,智谱放出重磅炸弹 —— 开源新一代旗舰模型 GLM-4.5 以及轻量版 GLM-4.5-Air。 其不仅首次突破性地在单个模型中实现了推理、编码和智能体能力的原生融合,还在 12 项全球公认的硬核测试中取得了全球第三的综合成绩。 这个成绩在所有国产模型和开源模型中均排名第一!
8/11/2025 5:58:44 PM
硅谷AI大佬都在造末日地堡:小扎夏威夷修了465平米,奥特曼承认有加固地下室
科技巨头、亿万富翁、AI押注者&话事人……但你可能没注意到,除了这些身份之外,奥特曼和扎克伯格还有个鲜为人知的共同点:末日堡垒建造者。 所谓末日堡垒,指的是在危机时刻可以长期生存的地下避难所,具备防灾、储粮、自给自足等功能,是科技富豪们眼中的最后保险。 据Wired报道,这个夏天,小扎斥6500万美元巨资,又悄悄在夏威夷考艾岛北部海岸买了962英亩的牧场土地。
8/8/2025 9:17:46 AM
AI Agent原生企业有哪些发展趋势与机遇
随着技术成熟与应用场景拓展,以智能Agent为核心构建业务流程、组织架构与产品服务的原生企业将会迎来一个高速增长期——这些企业将崛起于各行各业,并展现出高度的敏捷性、自适应性与创新能力,成为引领产业变革的新兴主体。 未来,Agent原生企业将会有哪些发展趋势与机遇呢? AI Agent原生企业的趋势和机遇发展趋势展望未来,AI Agent原生企业将会有以下几个发展趋势:(一)“Agent-first”业务逻辑成为主流设计范式。
8/7/2025 12:00:01 AM
谢赛宁「踩雷」背后,竟藏着科研圈更黑真相:Science实锤论文造假+AI滥用!
谢赛宁是真倒霉! 为了避免被LLM审稿「误上」,他领导的实验室投稿的一些论文中暗藏了系统提示词,被𝕏网友当中「处刑」! 跟刚刚《Science》爆出的科研圈两大丑闻,就是小巫见大巫,不值一提。
8/6/2025 9:29:30 AM
Discrete Tokenization:多模态大模型的关键基石,首个系统化综述发布
近年来,大语言模型(LLM)在语言理解、生成和泛化方面取得了突破性进展,并广泛应用于各种文本任务。 随着研究的深入,人们开始关注将 LLM 的能力扩展至非文本模态,例如图像、音频、视频、图结构、推荐系统等。 这为多模态统一建模带来了机遇,也提出了一个核心挑战:如何将各种模态信号转化为 LLM 可处理的离散表示。
8/6/2025 9:10:10 AM
13岁小孩哥当上CEO,22岁造独角兽!少年帮扎堆辍学,集结硅谷创业
一群20岁出头的年轻人,在硅谷掀起了一波AI创业风暴。 他们抛下名校光环,甚至直接辍学,带着梦想和激情杀入了如今的爆火AI赛道。 NYT一篇深度长文中以独特视角,将那些与AI一起成长的年轻CEO们推到聚光灯下。
8/5/2025 3:08:24 PM
破局酒店搜索零结果!携程AI搜索实战,复杂查询召回率提升90%
在AI快速发展的浪潮中,传统的关键词搜索早已难以满足用户日益复杂的需求。 尤其在酒店预订领域,如何精准理解“2大1小”“江浙周边遛娃”这类模糊却真实的意图,成了提升用户体验的关键。 本文将带您深入探索语义搜索如何颠覆传统检索方式,从实体识别、向量召回到大模型加持的语义理解,全面解析携程在智能搜索上的技术路径与实践经验。
8/5/2025 9:28:08 AM
万亿参数狂欢!一文刷爆2025年七大顶流大模型架构
从最初的GPT架构问世以来,已经过去七年了。 回顾2019年GPT-2,再看2024-2025年的DeepSeek-V3和Llama 4,你会发现,这些模型的结构依然惊人地相似。 当然,位置嵌入已从绝对位置编码演变为旋转位置编码(RoPE),多头注意力(Multi-Head Attention)大多被分组查询注意力(Grouped-Query Attention)取代,更高效的SwiGLU激活函数也逐渐取代了GELU。
8/4/2025 9:20:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用