AI

双人动作生成新SOTA！浙大提出TIMotion框架 | CVPR 2025

双人动作生成新SOTA！针对Human-human motion generation问题，浙江大学提出了一种对双人运动序列进行时序和因果建模的架构TIMotion，论文已发表于CVPR 2025。具体来说，通过分别利用运动序列时间上的因果关系和两人交互过程中的主动被动关系，TIMotion设计了两种有效的序列建模方式。

4/3/2025 9:27:44 AM 量子位

CVPR 2025：单图秒变专业影棚，几何/材质/光影全搞定，数据训练代码全开源

如何从一张普通的单幅图像准确估计物体的三维法线和材质属性，是计算机视觉与图形学领域长期关注的难题。这种单图逆渲染任务存在严重的不确定性，传统方法通常需要多角度或多光源的拍摄条件，难以在日常场景中普遍应用。近日，由香港中文大学、上海人工智能实验室及南洋理工大学的研究团队联合研发的论文《Neural LightRig: Unlocking Accurate Object Normal and Material Estimation with Multi-Light Diffusion》。

4/3/2025 9:25:53 AM 量子位

AI 时代如何更高效开发前端组件？21st.dev 给了一种答案

4/3/2025 9:04:19 AM 范文杰

美国CS专业卷上天，满分学霸惨遭藤校全拒！父亲大受震撼引爆热议

美国大学CS专业，卷到何种程度了？最近，一位父亲痛心发帖：他的儿子成绩全校第一近乎完美——SAT接近满分、18门AP课程全部5分，却在申请季被所有常春藤名校拒绝。唯一伸来橄榄枝的，只有本州的马萨诸塞大学阿默斯特分校（UMass Amherst）。

4/3/2025 8:50:00 AM 新智元

多模态AI核心技术：CLIP与SigLIP技术原理与应用进展

近年来，人工智能领域在多模态表示学习方面取得了显著进展，这类模型通过统一框架理解并整合不同数据类型间的语义信息，特别是图像与文本之间的关联性。在此领域具有里程碑意义的模型包括OpenAI提出的CLIP（Contrastive Language-Image Pre-training，对比语言-图像预训练）和Google研发的SigLIP（Sigmoid Loss for Language-Image Pre-training，用于语言-图像预训练的Sigmoid损失）。这些模型重新定义了计算机视觉与自然语言处理的交互范式，实现了从图像分类到零样本学习等多种高级应用能力。

4/3/2025 7:00:00 AM

美国奥数题撕碎AI数学神话，顶级模型现场翻车！最高得分5%，DeepSeek唯一逆袭

3月26号，ETH等团队的一项研究一经发布，就引起了圈内热议。这项研究彻底撕开遮羞布，直接击碎了「LLM会做数学题」这个神话！论文地址：，MathArena团队使用最近的2025年美国数学奥林匹克竞赛进行了详细评估，结果令人大吃一惊——所有大模型的得分，都低于5%！

4/3/2025 2:25:00 AM 新智元

基于DeepSeek + VSCode 实现AI辅助编程

随着人工智能技术的飞速发展，AI 辅助编程逐渐成为提升开发效率、优化代码质量的重要工具。本文通过结合 DeepSeek 的强大语言模型和 VSCode 的高效开发环境，展示了如何利用 AI 辅助编程完成一个经典的 MapReduce 词频统计任务。这一实践不仅展示了 AI 在编程中的应用潜力，还为开发者提供了一个高效、便捷的开发流程示例，帮助读者快速上手 AI 辅助编程，并探索其在实际项目中的应用价值。

4/3/2025 12:00:01 AM

加州大学研究：AI 模型 GPT - 4.5 和 Llama 3.1 - 405B 可通过标准图灵测试

美国加州大学圣地亚哥分校研究显示，GPT-4.5和Llama 3.1-405B在PERSONA模式下通过三方图灵测试，提问者难以区分AI与人类。AI有望在社交场景中替代人类。#人工智能##图灵测试#

4/2/2025 3:20:23 PM 远洋

两位华人76页论文解决量子领域核心问题：首次证明伪随机性真实存在

量子领域的一个核心开放问题，就这样被两位华人研究员解决了？事情是这样的。一直以来，量子的随机性在计算和密码学中极为有用。

4/2/2025 9:40:00 AM 量子位

DeepSeek-V3击败R1开源登顶！杭州黑马撼动硅谷AI霸主，抹去1万亿市值神话

DeepSeek依然很能打，春节余波还在扩散！据AI产品分析平台aitools.xyz统计，DeepSeek每月新增网站访问量超过了ChatGPT。作为异军突起的现象级产品，DeepSeek的增长速度除了创造AI产品的增长奇迹，更是重新定义了全球的AI竞赛格局。

4/2/2025 9:21:00 AM 新智元

Vibe Agent: Token成本直降90%，会对话就能创造专属本地Agent

刚刚，Local AI 领域的 Libra 团队发布了一段最新技术演示视频，展示了用户通过自然语言交互直接生成 Agent，并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理，最终完成复杂任务。 Libra 构建的本地化、即时响应、自我规划方案为行业开辟了一条全新的长程推理 Agent 技术路径，实现了从手工 Agent 设计向端到端 In-Context Vibe Agent 生成范式演进。从官网信息来看，Libra 的技术方案直接回应了制约 Agent 技术普及的两大关键瓶颈：一方面，当前热门 Agent 产品如 Cursor、Devin、Manus 等虽功能强大，但运行成本高昂 —— 专业评测显示单次使用 Manus 可消耗约 1000k Token（起步 2 美元）。

4/2/2025 9:19:00 AM 机器之心

孙正义豪掷1万亿，机器人帝国崛起！总额远超星际之门，劳动力末日翻盘

报道称，在「星际之门」放血5000亿后，软银又拿着1万亿砸向机器人！孙正义将在美国各地创建配备AI工厂的工业园区，用人形机器人助力制造业解决劳动力短缺难题。机器人军团领衔，AI工厂重定义制造业在软银的宏伟蓝图中，AI工厂成为核心。

4/2/2025 9:15:00 AM 新智元

吉卜力太火，奥特曼求饶！GPT-4o免费生图登王座，设计师直呼天塌了

OpenAI再次火爆全网，而且接近一周了，GPT-4o带来的热潮还未停歇。现在免费用户也可以使用生图功能了，更多人涌进了GPT-4o。显然，靠吉卜力图像形成的病毒式传播，让奥特曼和整个OpenAI团队都没想到。

4/2/2025 9:10:00 AM 新智元

超低成本复现QwQ！数学推理模型训练迎来RL暴击，数据代码模型全开源 | 蚂蚁&清华出品

用上这个开源框架，2天时间就能刷新7B数学推理纪录！蚂蚁清华联手开源的强化学习框架AReaL-boba，直接把推理模型训练带到了Next Level——训练成本下降的同时，训练速率、推理能力还大幅提升的那种。除了前面提到的7B模型，在32B模型上，只需两百美元、200条数据，就可以轻松复现QwQ-32B，就是数学推理能力媲美DeepSeek-R1，一战封神的那个。

4/2/2025 9:00:00 AM 量子位

DeepSeek R1本地训练全流程实操指南，手把手教你打通其“任督二脉”

作者 | asher许多关于 DeepSeek R1 的复现文章，主要聚焦在“rewards的设计、训练指标的变化、benchmark测评”这些内容，但是对于“本地训练”这个开启深度探索的关键前置步骤，却很少有人深挖。可能有人觉得，照着readme操作就能轻松训练了吧？太天真啦！

4/2/2025 9:00:00 AM 腾讯技术工程

人工智能应用就是大模型能力+场景，基于大模型构建应用，首先要了解大模型的能力圈

在关于大模型应用方面，虽然也了解和应用过其中的一些技术；但经过这段时间的实践和思考发现，对大模型应用的认识还很浅显，因此在此记录一下自己的思考。大模型应用的思考大模型作为人工智能应用的底座技术，所有应用场景和技术都是构建在大模型之上；但很多时候我们都搞错了一件事，那就是我们没有搞清楚大模型能力和其它技术的关联和区别。因此，在这里我们要搞清楚一个概念，那就是大模型能力；所谓大模型的能力，就是模型开发人员怎么把模型做的更好更强，其中设计到模型的设计，训练等；具体有神经网络架构，模型蒸馏等等。

4/2/2025 8:40:00 AM DFires

AI在主数据中的十大应用|用例和优势

一概述在当今数字化环境中，企业面临的挑战不仅包括管理海量数据，还包括处理各种复杂数据，尤其是来自物联网 (IoT) 设备和联网技术等新兴来源的数据。云技术的重大转变使这一情况更加复杂，促使企业不再仅仅采购基础设施，而是更加战略性地利用技术和服务，以最大限度地提高数据资产价值。 “数据敏捷性”概念应运而生，成为应对这种情况的关键。

4/2/2025 8:00:00 AM 晓晓

如何识别和预防深度伪造诈骗

这些被篡改的内容在社交媒体、即时通讯应用和视频分享平台上广泛传播，模糊了现实与虚构之间的界限。 “Deepfake”一词是在2017年由一位Reddit用户创造的，当时该用户创建了一个以此命名的子论坛(subreddit)。这个子论坛被用来分享AI生成的视频，其中经常包含名人换脸的色情内容。

4/2/2025 7:30:00 AM Sinisa

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉