理论

企业级AI“脱虚向实”，落地还有几道槛？

从ChatGPT横空出世，到越来越智能化的人形机器人，再到让世人惊艳的Sora文生视频……种种迹象表明，人工智能逐渐迎来产业化的临界点。当全球科技巨头们将AI的边界推向星辰大海时，绝大多数企业仍在经历着AI落地的“高原反应”。某制造业CIO的办公桌上，堆积着三份不同供应商的AI解决方案，却始终无法解答他“如何让AI看懂三十年陈旧的ERP数据”的灵魂拷问。

4/3/2025 10:00:00 AM 科技云报到

稚晖君刚挖来的90后机器人大牛：逆袭履历堪比爽文男主

刚刚，稚晖君旗下创企智元机器人官宣了两个新动向——一则是关于人事变动。具身智能领域的国际领军学者罗剑岚博士，已于近日加盟并出任首席科学家。罗剑岚在该领域已深耕10年，曾担任Google X、Google DeepMind研究科学家，是UC伯克利17万引大佬Sergey Levine团队的核心成员。

4/3/2025 9:37:23 AM 量子位

AI理解27分钟长视频超越GPT-4o，港理工新国立开源新框架：角色化推理+链式LoRA

AI能像人类一样理解长视频。港理工、新加坡国立团队推出VideoMind框架，核心创新在于角色化推理（Role-based Reasoning）和链式LoRA（Chain-of-LoRA）策略。相关论文已上传arXiv，代码和数据全部开源。

4/3/2025 9:34:36 AM 量子位

震惊！用 Redis+AI 模型实现秒级实时风控，这波操作太秀了

兄弟们，有没有遇到过这种情况：凌晨三点在某东抢购显卡，刚提交订单就提示"系统繁忙"，转头发现黄牛已经在海鲜市场挂出同款；扫码支付时突然弹出风险提示，非要验证人脸识别；更绝的是某银行APP，刚输完密码就收到短信提醒："检测到您的账户存在异常操作"——但此时您根本没动过手机。这些让人又爱又恨的操作背后，都藏着一个叫"实时风控"的技术妖怪。今天咱们就来扒一扒，这个妖怪是如何用 Redis 和 AI 模型在 0.1 秒内完成逆天操作的。

4/3/2025 9:30:56 AM 儒猿团队

AI Agent打了个响指，商业齿轮加速转动

3月16日，百度旗下文心大模型4.5和文心大模型X1正式发布。目前，两款模型已在文心一言官网上线，免费向用户开放。同时，文心大模型4.5已上线百度智能云千帆大模型平台，企业用户和开发者登录即可调用API；文心大模型X1也即将在千帆上线。

4/3/2025 9:30:00 AM 科技云报到

双人动作生成新SOTA！浙大提出TIMotion框架 | CVPR 2025

双人动作生成新SOTA！针对Human-human motion generation问题，浙江大学提出了一种对双人运动序列进行时序和因果建模的架构TIMotion，论文已发表于CVPR 2025。具体来说，通过分别利用运动序列时间上的因果关系和两人交互过程中的主动被动关系，TIMotion设计了两种有效的序列建模方式。

4/3/2025 9:27:44 AM 量子位

CVPR 2025：单图秒变专业影棚，几何/材质/光影全搞定，数据训练代码全开源

如何从一张普通的单幅图像准确估计物体的三维法线和材质属性，是计算机视觉与图形学领域长期关注的难题。这种单图逆渲染任务存在严重的不确定性，传统方法通常需要多角度或多光源的拍摄条件，难以在日常场景中普遍应用。近日，由香港中文大学、上海人工智能实验室及南洋理工大学的研究团队联合研发的论文《Neural LightRig: Unlocking Accurate Object Normal and Material Estimation with Multi-Light Diffusion》。

4/3/2025 9:25:53 AM 量子位

大模型RL不止数学代码！7B奖励模型搞定医学法律经济全学科，不用思维链也能做题

一个7B奖励模型搞定全学科，大模型强化学习不止数学和代码。 o1/r1的强化学习很强，但主要探索了数学和代码领域，因为这两个领域的数据结构化程度高，奖励函数/奖励模型比较好设计。那么，想提升大模型在其他学科领域的能力该怎么办？

4/3/2025 9:23:08 AM 量子位

AI 时代如何更高效开发前端组件？21st.dev 给了一种答案

4/3/2025 9:04:19 AM 范文杰

美国CS专业卷上天，满分学霸惨遭藤校全拒！父亲大受震撼引爆热议

美国大学CS专业，卷到何种程度了？最近，一位父亲痛心发帖：他的儿子成绩全校第一近乎完美——SAT接近满分、18门AP课程全部5分，却在申请季被所有常春藤名校拒绝。唯一伸来橄榄枝的，只有本州的马萨诸塞大学阿默斯特分校（UMass Amherst）。

4/3/2025 8:50:00 AM 新智元

那些用ChatGPT实现10倍开发效率的顶级程序员，到底做对了什么？

大部分人都错了。你刚刚发给ChatGPT那条“帮我写个函数实现xxx”的泛泛提示？删了吧。

4/3/2025 8:36:31 AM dev

我们如何构建了一个LangGraph代理以确定GitOps漏洞的优先级？

译者 | 布加迪审校 | 重楼一款基于LangGraph的开源工具可帮助你确定在特定的Kubernetes环境中最需要优先解决的漏洞。在当今复杂的Kubernetes环境中，管理漏洞并确定优先级很快会变得令人不堪重负。由于数十甚至数百个容器跨多个服务运行，你如何决定先处理哪些漏洞？

4/3/2025 8:33:59 AM 布加迪

DAPO：面向开源大语言模型的解耦裁剪与动态采样策略优化系统

在人工智能技术快速迭代发展的背景下，大语言模型（LLMs）已成为自然语言处理与生成领域的核心技术。然而，将这些模型与人类偏好精确对齐并增强其复杂推理能力的挑战，促使研究者开发了一系列复杂的强化学习（RL）技术。 DAPO（解耦裁剪和动态采样策略优化，Decoupled Clip and Dynamic Sampling Policy Optimization）作为一个突破性的开源大语言模型强化学习系统应运而生，为该领域带来了技术变革。

4/3/2025 8:00:00 AM Jenray

多模态AI核心技术：CLIP与SigLIP技术原理与应用进展

近年来，人工智能领域在多模态表示学习方面取得了显著进展，这类模型通过统一框架理解并整合不同数据类型间的语义信息，特别是图像与文本之间的关联性。在此领域具有里程碑意义的模型包括OpenAI提出的CLIP（Contrastive Language-Image Pre-training，对比语言-图像预训练）和Google研发的SigLIP（Sigmoid Loss for Language-Image Pre-training，用于语言-图像预训练的Sigmoid损失）。这些模型重新定义了计算机视觉与自然语言处理的交互范式，实现了从图像分类到零样本学习等多种高级应用能力。

4/3/2025 7:00:00 AM

AI算法 | 训练数据的数量、质量及语言分布等因素对中文大模型性能的影响

已有LLM研究探索了训练数据对模型性能的影响，但这些研究大多集中在英文模型上，对于中文模型的研究相对较少。今天来看一篇来自贝壳的研究团队在2023年的一篇工作——《Towards Better Instruction Following Language Models for Chinese: Investigating the Impact of Training Data and Evaluation》。这篇工作的核心目标是提升中文指令跟随语言模型的性能。

4/3/2025 7:00:00 AM Goldma

深度解析：通过 AIBrix 多节点部署 DeepSeek-R1 671B 模型

原文链接： AIBrix 分布式推理平台实现 DeepSeek-R1 671B 的多节点部署。 DeepSeek-R1 通过渐进式训练框架展现出优秀的逻辑推理能力 —— 在 6710 亿总参数量中，其动态激活的 370 亿参数与 128k 上下文窗口，使其在复杂任务处理中表现卓越。然而，如此庞大的模型规模对部署环境提出了严苛挑战，尤其是分布式推理的资源调度与性能优化。

4/3/2025 6:30:00 AM 字节跳动开源

GenAI遇上SLM：边缘计算的新纪元

小型语言模型（SLM）在效率、隐私和适应性之间实现了卓越的平衡，使其成为各种应用的理想选择。译自GenAI Meets SLMs: A New Era for Edge Computing，作者 Pankaj Mendki。让我们想象一个场景：一家医院的患者拥有自己的医疗记录。

4/3/2025 4:21:00 AM 岱军

美国奥数题撕碎AI数学神话，顶级模型现场翻车！最高得分5%，DeepSeek唯一逆袭

3月26号，ETH等团队的一项研究一经发布，就引起了圈内热议。这项研究彻底撕开遮羞布，直接击碎了「LLM会做数学题」这个神话！论文地址：，MathArena团队使用最近的2025年美国数学奥林匹克竞赛进行了详细评估，结果令人大吃一惊——所有大模型的得分，都低于5%！

4/3/2025 2:25:00 AM 新智元

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

企业级AI“脱虚向实”，落地还有几道槛？

稚晖君刚挖来的90后机器人大牛：逆袭履历堪比爽文男主

AI理解27分钟长视频超越GPT-4o，港理工新国立开源新框架：角色化推理+链式LoRA

震惊！用 Redis+AI 模型实现秒级实时风控，这波操作太秀了

AI Agent打了个响指，商业齿轮加速转动

双人动作生成新SOTA！浙大提出TIMotion框架 | CVPR 2025

CVPR 2025：单图秒变专业影棚，几何/材质/光影全搞定，数据训练代码全开源

大模型RL不止数学代码！7B奖励模型搞定医学法律经济全学科， 不用思维链也能做题

AI 时代如何更高效开发前端组件？21st.dev 给了一种答案

美国CS专业卷上天，满分学霸惨遭藤校全拒！父亲大受震撼引爆热议

那些用ChatGPT实现10倍开发效率的顶级程序员，到底做对了什么？

我们如何构建了一个LangGraph代理以确定GitOps漏洞的优先级？

DAPO：面向开源大语言模型的解耦裁剪与动态采样策略优化系统

多模态AI核心技术：CLIP与SigLIP技术原理与应用进展

AI算法 | 训练数据的数量、质量及语言分布等因素对中文大模型性能的影响

深度解析：通过 AIBrix 多节点部署 DeepSeek-R1 671B 模型

GenAI遇上SLM：边缘计算的新纪元

美国奥数题撕碎AI数学神话，顶级模型现场翻车！最高得分5%，DeepSeek唯一逆袭

大模型RL不止数学代码！7B奖励模型搞定医学法律经济全学科，不用思维链也能做题