技术
被H-1B签证折磨10年,前微软科学家用AI「掀桌」
一位前微软科学家正在用AI改造美国签证体系,让一个10万美元的「昂贵流程」变得透明而又简单。 专注移民科技的初创公司Casium,在H‑1B新政落地后迎来窗口期,获Maverick Ventures领投的500万美元种子轮。 Casium创始人Priyanka KulkarniCasium由前微软科学家Priyanka Kulkarni创办,多年在美国移民体系下生存的她和许多其他科技移民一样,经常体会到工作签证背后那份无形困扰与束缚。
10/22/2025 8:58:35 AM
美国拟减40%国际生,留学风向要变?Nature曝全球高校大洗牌
全球高校正在经历一场大洗牌! 如果把全球2.64亿大学生组成一个国家,它将是世界上人口第五大国。 而且,也是「人口增长最快的国家」之一。
10/21/2025 9:06:52 AM
刚得诺奖的成果被做成芯片了
谁说获得诺贝尔化学奖的MOF(金属有机框架)“无用”? 这种几十年前被嫌弃“只有理论但缺乏实际应用”的新材料,前脚刚获得诺奖认可,后脚就被做成芯片! 这就是莫纳什大学的科学家们刚刚发布的最新成果——用MOF制造超迷你的流体芯片。
10/13/2025 3:53:23 PM
告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星
核心突破:首次将LLM推理中的P/D分离思想扩展至多模态场景,提出EPD(Encoder-Prefill-Decode)三阶段解耦,并通过「空分复用」彻底解决编码器引发的行头阻塞问题。 随着多模态大语言模型(MLLM)广泛应用于高分辨率图像理解、长视频分析等场景,其推理流程中的多模态编码(Encoding)阶段正成为性能瓶颈。 当前主流系统(如vLLM)在服务MLLM时,仍沿用「时间复用」(time-multiplexing)策略:GPU先执行视觉/音频编码器,完成后才切换上下文运行文本解码器。
10/13/2025 9:10:00 AM
老黄9亿美元再投AI Infra,这次直接打包带走CEO和核心技术
刚入股了“老对手”英特尔,老黄又豪掷9亿美刀,拿下一家AI Infra公司……的CEO和技术授权。 最新消息,AI Infra初创公司Enfabrica的核心团队和技术授权,已经被英伟达打包带走。 没错,又是一个不收购公司本身、但掏空公司根本的“雇佣式收购”。
9/22/2025 9:14:00 AM
小扎AI眼镜当场死机,CTO自曝灾难级演示内幕:一个指令干趴自家服务器
就在上周,小扎当着数万观众的面,搞砸了! 他在Meta总部现场演示智能眼镜Ray-Ban Display时,眼镜内置AI助手,无法正确回应对话。 而且,Ray-Ban Display眼镜在与神经腕带的来电/交互演示时,也没能成功,引发现场哄笑与尴尬。
9/22/2025 8:56:00 AM
Anthropic 再次解释 Claude 近期三起故障,并称 Claude Code 已全面恢复
Claude 再次解释:八月到九月初,它确实出问题了。 刚刚,Anthropic 今天发布了一份详细的技术报告,解释了三个基础设施 bug 如何让 Claude 的回答质量断崖式下降。 虽然他们像是说了些实话,但这份报告来得有点太晚了。
9/18/2025 4:18:23 PM
J0hn
从复刻魔术开始,RoboMirage打开了机器人仿真的新世界
在具身智能的发展路径中,如何获得海量且高质量的数据是行业绕不开的核心问题。 如果说大语言模型依赖于互联网规模的语料库,那么具身智能的成长同样需要规模化的交互经验。 现实中,收集这些数据的代价极高:机械臂等硬件部署成本高,单台投入就需数万元,且难以规模化;数据采集环节依赖经验丰富的数采员且耗时漫长。
9/3/2025 1:59:02 PM
「香蕉革命」首揭秘!谷歌疯狂工程师死磕文字渲染,竟意外炼出最强模型
纳尼(°ロ°),怎么AI圈子突然就开始「纳米香蕉革命」了。 谷歌没想到自己发布了一个新的图像模型,直接就引爆了社区! 最近这个香蕉实在太火了,仿佛又回到几个月前的OpenAI的「吉卜力热」盛况。
8/29/2025 2:45:21 PM
AAAI-26投稿量爆炸:近3万篇论文,2万来自中国,评审系统都快崩了
你可能不信,你投的 AAAI-2026 会议,应该是有史以来投稿量最多的一次。 此前,取号人数就突破了 3 万,其中有不少 NeurIPS 转投的。 如今官方数据也公开了:主技术轨道共接收将近 29000 篇投稿,来自中国的投稿接近 20000 篇,占据了惊人的三分之二。
8/28/2025 3:32:51 PM
告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式
传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的面部、肢体表达严重脱节,削弱了观众的沉浸感。 现有新兴的音频驱动视频生成模型,在应对长视频序列时也暴露出身份漂移和片段过渡生硬等问题。 为解决这些痛点,Infinitetalk 引入 “稀疏帧 video dubbing”。
8/28/2025 9:11:56 AM
设计界的"华为时刻"!国产AI包揽全球前15,Adobe们要慌了
前15名100%是中国模型,总榜6个国产模型上榜——当我看到DesignArena最新UI设计能力排行榜时,说实话有点被震撼到了。 这不是营销噱头,而是来自权威AI模型评测平台的硬数据。 在这个专门测试大模型UI设计能力的排行榜上,中国模型上演了一场前所未有的"集体霸榜"。
8/27/2025 9:09:45 AM
阿丸笔记
问小白o4:AI的“头脑风暴”时代来了!
各位AI圈的朋友们,最近有没有被一个新名字刷屏? “问小白o4”,这个名字背后,可藏着一个颠覆性的概念——并行思考。 这不,国内首个打出这个旗号的模型,着实让大家眼前一亮。
8/27/2025 2:25:00 AM
墨风如雪
FastAPI开发AI应用教程:新增用户历史消息
本文将深入介绍如何在 FastAPI AI 聊天应用中实现用户历史消息功能,当用户切换助手,刷新页面时,都可以保留当前会话历史消息。 图片本项目已经开源至 Github,项目地址::本文全文约一万字,看完约需 15 分钟。 文章概述重点讲解每个助手区分 sessionid、获取历史消息接口以及发送消息时携带上下文信息的核心技术实现。
8/26/2025 1:11:00 AM
wayn
谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒
大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。
8/22/2025 3:08:38 PM
三人团队击败科技巨头:RF-DETR如何成为目标检测新王者
说实话,当我看到一个仅3人团队打造的目标检测模型RF-DETR,居然能在性能上碾压Google、Meta等科技巨头的数百人研发团队时,第一反应是——这怎么可能? 但事实就是这么魔幻。 在刚刚发布的最新评测中,RF-DETR不仅成为首个在COCO数据集上突破60mAP的实时模型,更是在新发布的RF100-VL真实世界数据集上大幅领先YOLO、D-FINE等知名模型。
8/21/2025 9:29:18 AM
阿丸笔记
AI图像水印失守!开源工具5分钟内抹除所有水印
AI图像的水印技术要变天了! 一款全新的去水印技术——UnMarker,能在5分钟内去除市面上几乎所有的AI图像水印。 其中,谷歌水印工具HiDDeN已被完全破解,SynthID也已被攻破79%!
8/14/2025 12:37:03 PM
美国宣战,AI行动计划打响第一枪!「AI+材料」成最新核武器
近日,美国白宫发布《美国AI行动计划》,该计划勾勒了美国国家层面的人工智能发展蓝图,其中也明确提出多项AI与产业深度融合的战略部署。 从材料科学的角度出发,可以看到美国正在以空前的战略高度,将材料科学与人工智能的深度融合置于国家核心竞争力的位置。 这其中传递出清晰的信号:谁掌握了「AI 材料」的核心能力,谁就扼住了下一代产业革命和科技创新的咽喉。
8/14/2025 9:12:00 AM
资讯热榜
6秒视频10秒生成!全新AI视频神器 Grok Imagine 深度体验+元提示词分享
AI玩拼图游戏暴涨视觉理解力,告别文本中心训练,无需标注的多模态大模型后训练范式
OpenAI 为 ChatGPT 推出智能记忆清理功能,Plus 用户率先体验
「性价比王者」Claude Haiku 4.5来了,速度更快,成本仅为Sonnet 4的1/3
大模型降本增效,稀疏注意力机制的魔力在哪?
AI音乐创作成程序员新副业:单曲播放破200万,版权收入数万元
实测,Claude Code 配合国内大模型,一样很牛x(完整配置教程)
Claude 与 Microsoft 365 深度整合,企业效率再提升!
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
论文
LLM
代码
算法
芯片
Stable Diffusion
AI for Science
苹果
腾讯
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
生成
AI视频
百度
大语言模型
具身智能
Sora
工具
GPU
华为
RAG
计算
字节跳动
AI设计
搜索
AGI
大型语言模型
场景
视频生成
深度学习
架构
DeepMind
视觉
预测
Transformer
伟达
编程
AI模型
生成式AI
亚马逊
特斯拉