AI在线 AI在线

技术

被H-1B签证折磨10年,前微软科学家用AI「掀桌」

一位前微软科学家正在用AI改造美国签证体系,让一个10万美元的「昂贵流程」变得透明而又简单。 专注移民科技的初创公司Casium,在H‑1B新政落地后迎来窗口期,获Maverick Ventures领投的500万美元种子轮。 Casium创始人Priyanka KulkarniCasium由前微软科学家Priyanka Kulkarni创办,多年在美国移民体系下生存的她和许多其他科技移民一样,经常体会到工作签证背后那份无形困扰与束缚。
10/22/2025 8:58:35 AM

美国拟减40%国际生,留学风向要变?Nature曝全球高校大洗牌

全球高校正在经历一场大洗牌! 如果把全球2.64亿大学生组成一个国家,它将是世界上人口第五大国。 而且,也是「人口增长最快的国家」之一。
10/21/2025 9:06:52 AM

刚得诺奖的成果被做成芯片了

谁说获得诺贝尔化学奖的MOF(金属有机框架)“无用”? 这种几十年前被嫌弃“只有理论但缺乏实际应用”的新材料,前脚刚获得诺奖认可,后脚就被做成芯片! 这就是莫纳什大学的科学家们刚刚发布的最新成果——用MOF制造超迷你的流体芯片。
10/13/2025 3:53:23 PM

告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星

核心突破:首次将LLM推理中的P/D分离思想扩展至多模态场景,提出EPD(Encoder-Prefill-Decode)三阶段解耦,并通过「空分复用」彻底解决编码器引发的行头阻塞问题。 随着多模态大语言模型(MLLM)广泛应用于高分辨率图像理解、长视频分析等场景,其推理流程中的多模态编码(Encoding)阶段正成为性能瓶颈。 当前主流系统(如vLLM)在服务MLLM时,仍沿用「时间复用」(time-multiplexing)策略:GPU先执行视觉/音频编码器,完成后才切换上下文运行文本解码器。
10/13/2025 9:10:00 AM

老黄9亿美元再投AI Infra,这次直接打包带走CEO和核心技术

刚入股了“老对手”英特尔,老黄又豪掷9亿美刀,拿下一家AI Infra公司……的CEO和技术授权。 最新消息,AI Infra初创公司Enfabrica的核心团队和技术授权,已经被英伟达打包带走。 没错,又是一个不收购公司本身、但掏空公司根本的“雇佣式收购”。
9/22/2025 9:14:00 AM

小扎AI眼镜当场死机,CTO自曝灾难级演示内幕:一个指令干趴自家服务器

就在上周,小扎当着数万观众的面,搞砸了! 他在Meta总部现场演示智能眼镜Ray-Ban Display时,眼镜内置AI助手,无法正确回应对话。 而且,Ray-Ban Display眼镜在与神经腕带的来电/交互演示时,也没能成功,引发现场哄笑与尴尬。
9/22/2025 8:56:00 AM

Anthropic 再次解释 Claude 近期三起故障,并称 Claude Code 已全面恢复

Claude 再次解释:八月到九月初,它确实出问题了。 刚刚,Anthropic 今天发布了一份详细的技术报告,解释了三个基础设施 bug 如何让 Claude 的回答质量断崖式下降。 虽然他们像是说了些实话,但这份报告来得有点太晚了。
9/18/2025 4:18:23 PM
J0hn

从复刻魔术开始,RoboMirage打开了机器人仿真的新世界

在具身智能的发展路径中,如何获得海量且高质量的数据是行业绕不开的核心问题。 如果说大语言模型依赖于互联网规模的语料库,那么具身智能的成长同样需要规模化的交互经验。 现实中,收集这些数据的代价极高:机械臂等硬件部署成本高,单台投入就需数万元,且难以规模化;数据采集环节依赖经验丰富的数采员且耗时漫长。
9/3/2025 1:59:02 PM

「香蕉革命」首揭秘!谷歌疯狂工程师死磕文字渲染,竟意外炼出最强模型

纳尼(°ロ°),怎么AI圈子突然就开始「纳米香蕉革命」了。 谷歌没想到自己发布了一个新的图像模型,直接就引爆了社区! 最近这个香蕉实在太火了,仿佛又回到几个月前的OpenAI的「吉卜力热」盛况。
8/29/2025 2:45:21 PM

AAAI-26投稿量爆炸:近3万篇论文,2万来自中国,评审系统都快崩了

你可能不信,你投的 AAAI-2026 会议,应该是有史以来投稿量最多的一次。 此前,取号人数就突破了 3 万,其中有不少 NeurIPS 转投的。 如今官方数据也公开了:主技术轨道共接收将近 29000 篇投稿,来自中国的投稿接近 20000 篇,占据了惊人的三分之二。
8/28/2025 3:32:51 PM

告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的面部、肢体表达严重脱节,削弱了观众的沉浸感。 现有新兴的音频驱动视频生成模型,在应对长视频序列时也暴露出身份漂移和片段过渡生硬等问题。 为解决这些痛点,Infinitetalk 引入 “稀疏帧 video dubbing”。
8/28/2025 9:11:56 AM

设计界的"华为时刻"!国产AI包揽全球前15,Adobe们要慌了

前15名100%是中国模型,总榜6个国产模型上榜——当我看到DesignArena最新UI设计能力排行榜时,说实话有点被震撼到了。 这不是营销噱头,而是来自权威AI模型评测平台的硬数据。 在这个专门测试大模型UI设计能力的排行榜上,中国模型上演了一场前所未有的"集体霸榜"。
8/27/2025 9:09:45 AM
阿丸笔记

问小白o4:AI的“头脑风暴”时代来了!

各位AI圈的朋友们,最近有没有被一个新名字刷屏? “问小白o4”,这个名字背后,可藏着一个颠覆性的概念——并行思考。 这不,国内首个打出这个旗号的模型,着实让大家眼前一亮。
8/27/2025 2:25:00 AM
墨风如雪

FastAPI开发AI应用教程:新增用户历史消息

本文将深入介绍如何在 FastAPI AI 聊天应用中实现用户历史消息功能,当用户切换助手,刷新页面时,都可以保留当前会话历史消息。 图片本项目已经开源至 Github,项目地址::本文全文约一万字,看完约需 15 分钟。 文章概述重点讲解每个助手区分 sessionid、获取历史消息接口以及发送消息时携带上下文信息的核心技术实现。
8/26/2025 1:11:00 AM
wayn

谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒

大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。
8/22/2025 3:08:38 PM

三人团队击败科技巨头:RF-DETR如何成为目标检测新王者

说实话,当我看到一个仅3人团队打造的目标检测模型RF-DETR,居然能在性能上碾压Google、Meta等科技巨头的数百人研发团队时,第一反应是——这怎么可能? 但事实就是这么魔幻。 在刚刚发布的最新评测中,RF-DETR不仅成为首个在COCO数据集上突破60mAP的实时模型,更是在新发布的RF100-VL真实世界数据集上大幅领先YOLO、D-FINE等知名模型。
8/21/2025 9:29:18 AM
阿丸笔记

AI图像水印失守!开源工具5分钟内抹除所有水印

AI图像的水印技术要变天了! 一款全新的去水印技术——UnMarker,能在5分钟内去除市面上几乎所有的AI图像水印。 其中,谷歌水印工具HiDDeN已被完全破解,SynthID也已被攻破79%!
8/14/2025 12:37:03 PM

美国宣战,AI行动计划打响第一枪!「AI+材料」成最新核武器

近日,美国白宫发布《美国AI行动计划》,该计划勾勒了美国国家层面的人工智能发展蓝图,其中也明确提出多项AI与产业深度融合的战略部署。 从材料科学的角度出发,可以看到美国正在以空前的战略高度,将材料科学与人工智能的深度融合置于国家核心竞争力的位置。 这其中传递出清晰的信号:谁掌握了「AI 材料」的核心能力,谁就扼住了下一代产业革命和科技创新的咽喉。
8/14/2025 9:12:00 AM