AI在线 AI在线

资讯列表

一张照片,一个3D「你」:计算所等提出HumanLift,实现高保真数字人重建

创建具有高度真实感的三维数字人,在三维影视制作、游戏开发以及虚拟/增强现实(VR/AR)等多个领域均有着广泛且重要的应用。 尽管现有技术在从多视角图片重建高质量、可动画化的三维人体模型任务中展现出诸多优势,但从单张参考图像重建真实感三维数字人,依旧面临技术复杂、资源消耗大的挑战。 如何兼顾三维一致性与参考图像一致性,重建出高质量、高真实感的人物外观与姿势,以及如何生成高真实度且细节一致的服饰、人脸等,都是亟待解决的难题。
10/22/2025 9:03:00 AM

文本已死,视觉当立!Karpathy狂赞DeepSeek新模型,终结分词器时代

DeepSeek再次让全世界大吃一惊! 他们最新成果DeepSeek-OCR,从根本上改变了游戏规则——文本并非通用的输入。 反而,视觉将取而代之!
10/22/2025 9:01:31 AM

AI牛马实现“干中学”!上海AI Lab联合推出智能体自我进化新框架

在人工智能的广阔世界里,我们早已习惯了LLM智能体在各种任务中大放异彩。 但有没有那么一瞬间,你觉得这些AI“牛马”还是缺了点什么? 没错,它们缺少的是我们人类最宝贵的职场技能:经验的积累和持续的自我进化。
10/22/2025 9:00:00 AM

被H-1B签证折磨10年,前微软科学家用AI「掀桌」

一位前微软科学家正在用AI改造美国签证体系,让一个10万美元的「昂贵流程」变得透明而又简单。 专注移民科技的初创公司Casium,在H‑1B新政落地后迎来窗口期,获Maverick Ventures领投的500万美元种子轮。 Casium创始人Priyanka KulkarniCasium由前微软科学家Priyanka Kulkarni创办,多年在美国移民体系下生存的她和许多其他科技移民一样,经常体会到工作签证背后那份无形困扰与束缚。
10/22/2025 8:58:35 AM

AGI前夜重磅:RL突破模型「认知上限」,真·学习发生了!

在AI研究圈,一个核心争论是:强化学习(RL)是否能够赋予模型超越其基础模型(base model)的推理能力。 怀疑派观点:早在四月份,清华的黄高团队[arXiv:2504.13837]指出,尽管经过 RLVR 训练的模型在较小的采样值 (k)(例如 (k=1))时能优于其基础模型,但当采样数较大时,基础模型往往能取得相同或更好的 pass@k 表现。 他们通过覆盖率(coverage)和困惑度(perplexity)分析推断,模型的推理能力最终受限于基础模型的支持范围。
10/22/2025 8:56:05 AM

Embedding黑箱成为历史!这个新框架让模型“先解释,再学Embedding”

让模型先解释,再学Embedding! 来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员,最新推出可解释的生成式Embedding框架——GRACE。 过去几年,文本表征(Text Embedding)模型经历了从BERT到E5、GTE、LLM2Vec,Qwen-Embedding等不断演进的浪潮。
10/22/2025 8:39:31 AM

OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用

西风 雷刚 发自 凹非寺. 量子位 | 公众号 QbitAI今天开始,使用ChatGPT有了OpenAI官方浏览器。 ChatGPT Atlas——阿特拉斯(古希腊扛住地球的神)——作为OpenAI首款AI原生浏览器,正式对外发布。
10/22/2025 8:16:33 AM
西风

聊聊多模态训练数据创建的八个挑战

译者 | 核子可乐审校 | 重楼多模态AI能够处理图像、音频和文字等多种数据形式,亦可捕捉面部表情和周遭环境细节,让用户与AI的日常交互变得更加轻松自然、如同与好友聊天。 2023年,多模态AI市场规模就已达到12亿美元,预计自2024年至2032年期间复合年增长率将超过30%。 而显著增长的前提,离不开训练数据。
10/22/2025 8:00:00 AM
核子可乐

自主式AI安全漏洞来袭:确保企业无忧的七道防线

智能体是专为执行特定任务而设计的模型,可在指令下自主或半自主地运行,目前已在各企业中广泛应用(普华永道今年早些时候的一份报告显示,在所有接受调查的企业中,这一比例高达79%)。 但这些智能体也带来了新的安全风险。 当发生智能体安全漏洞事件时,企业可能会迅速解雇员工并归咎于他们,但却迟迟无法识别和修复导致漏洞出现的系统性故障。
10/22/2025 7:05:00 AM
Louis

全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!

AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。
10/22/2025 7:01:42 AM
数字生命卡兹克

秒变Midjourney高手!精选9条优质独特的 sref 风格代码

嗨大家好! 我是阿真! 今天是轻松好玩的一期,我整理了一些Midjourney V7 的sref code分享给大家,现在LiblibAI、夸克造点AI、Lovart都可以用Midjourney V7了,我尝试过这些工具,确认它们都支持sref code也就是风格代码,后续只需要在提示词最后加上风格代码,生成图片就可以看见图片的风格变化了。
10/22/2025 6:01:48 AM
阿真Irene

AI导致全球大裁员?牛津大学研究员:别把AI当成替罪羊

人工智能正在影响现实世界,从科技企业到航空企业都出现了不同程度的裁员,许多员工陷入恐慌。 一些企业为了裁员,甚至将AI当成借口。 上个月,科技咨询公司埃森哲(Accenture)宣布裁员,无法率先掌握AI技术的员工被迫离开。
10/22/2025 2:00:00 AM
小刀

长生不老成真?哈佛AI数周破解「衰老密码」,人类寿命或迎重写

几千年来,人类都在追问:如何才能长生不老? 从炼丹术到现代实验室,答案始终模糊。 即便有了基因测序和大数据,研究者往往也要花上数年,才能在庞杂信号里筛出一丝线索。
10/22/2025 2:00:00 AM
新智元

从互联网泡沫到AI泡沫论:为何高盛说当前AI投资“未过热”?

2025下半年以来,AI 领域的热度持续攀升,美国企业在该领域的投资力度更是不断加大。 以 OpenAI 为例,即便尚未实现盈利,其已预定的算力投资规模就至少达到 1.5 万亿美元。 这股强劲的投资热潮,不禁让人联想到 2000 年代的互联网泡沫,引发了外界对 AI 投资是否过热的担忧。
10/22/2025 1:00:00 AM

新款坦克400开启预售,新增激光雷达:30.98万起

10 月 21 日晚,长城旗下硬派越野品牌的新车全新坦克 400 正式开启了预售,本次发布活动公布了 Hi4-Z 智享版以及 Hi4-T 智享版两个配置,预售价分别为 32.98 万元以及 30.98 万元。 作为车型的中期改款,新款坦克 400 针对外观、内饰进行了调整,新增了 “敦煌紫” 车身颜色,在配置上则增加了激光雷达,搭载第三代 Coffee Pilot Ultra 辅助驾驶系统,并引入 Hi4-Z 新能源动力系统。 外观方面,新款坦克 400 继续沿用硬派机甲风格,并对前后包围进行了重新设计,增加了黑色网格装饰件,显得更加厚实。
10/22/2025 12:10:00 AM
李泽南

蚂蚁万亿模型震撼开源!数学推理碾压GPT,国产AI首次问鼎奥数银牌

92.6分 vs 94.6分——当我看到蚂蚁集团刚发布的Ring-1T模型在AIME25测试中的成绩时,第一反应是有点不敢相信。 一个国产开源模型,居然能在数学推理上逼近GPT-5的水平? 更震撼的是,这个叫Ring-1T的模型在模拟IMO(国际数学奥林匹克)近十年真题的测试中,正确率达到了银牌选手平均水平的93%。
10/22/2025 12:00:00 AM
阿丸笔记

讯飞刚发的财报:净利润暴涨了202%

西风 发自 凹非寺. 量子位 | 公众号 QbitAI营收大涨10.02%,净利润暴涨202.40%……. 这就是A股AI龙头科大讯飞,最新交出的第三季度财报业绩——.
10/21/2025 6:08:34 PM
西风

惊爆!Vercel CEO 称 Kimi K2 在 AI 应用中超越 GPT-5,准确率高出 50%!

近日,美国初创公司 Vercel 的首席执行官吉列尔莫在社交媒体上发布了一项引人注目的声明,称中国开源模型 Kimi K2在智能体应用场景中的表现远超其对手,包括前沿的闭源模型 GPT-5和 Claude Sonnet4.5。 根据吉列尔莫的分享,Kimi K2不仅在准确率上领先了50%,而且运行速度更是快了整整5倍,这一发现引发了科技界的广泛关注。 在一项真实场景基准测试中,吉列尔莫提供的数据表明,Kimi K2的运行时间仅为2分钟,而其竞争对手 GPT-5和 Sonnet4.5则需要8到10分钟才能完成相同任务。
10/21/2025 5:56:11 PM
AI在线