AI
双人动作生成新SOTA!浙大提出TIMotion框架 | CVPR 2025
双人动作生成新SOTA! 针对Human-human motion generation问题,浙江大学提出了一种对双人运动序列进行时序和因果建模的架构TIMotion,论文已发表于CVPR 2025。 具体来说,通过分别利用运动序列时间上的因果关系和两人交互过程中的主动被动关系,TIMotion设计了两种有效的序列建模方式。
CVPR 2025:单图秒变专业影棚,几何/材质/光影全搞定,数据训练代码全开源
如何从一张普通的单幅图像准确估计物体的三维法线和材质属性,是计算机视觉与图形学领域长期关注的难题。 这种单图逆渲染任务存在严重的不确定性,传统方法通常需要多角度或多光源的拍摄条件,难以在日常场景中普遍应用。 近日,由香港中文大学、上海人工智能实验室及南洋理工大学的研究团队联合研发的论文《Neural LightRig: Unlocking Accurate Object Normal and Material Estimation with Multi-Light Diffusion》。
AI 时代如何更高效开发前端组件?21st.dev 给了一种答案
给大家推荐一个好东西:21st.dev ,大致上你可以将它理解为一个非常前卫的组件托管市场,特别之处在于:它参考 shadcn/ui 的设计理念提供了一种原子化的,Code Out 形式的依赖安装、管理模式;并且更具有启发性的,它为每一个组件都提供了一套用于生成组件代码的 Prompt,用户可以借此在特定项目上下文中生成适配度更高的组件效果。 借助 21st.dev 与 cursor,我做了这样一个 demo: 这一切都是在 5min 内,不写一行代码的情况下实现的! 更值得称谓的是,21st.dev 的功能设计真正做到了 AI 友好,能够很好地应用在各类 AI 工具中(cursor、v0.dev、bolt.new、cline 等等),并且这套设计逻辑还非常适合复用到各种 TO-D 场景中,21st.dev 是什么21st.dev 是一个开源的 React UI 组件市场,专门为设计工程师和前端开发者提供高质量的 UI 组件。
美国CS专业卷上天,满分学霸惨遭藤校全拒!父亲大受震撼引爆热议
美国大学CS专业,卷到何种程度了? 最近,一位父亲痛心发帖:他的儿子成绩全校第一近乎完美——SAT接近满分、18门AP课程全部5分,却在申请季被所有常春藤名校拒绝。 唯一伸来橄榄枝的,只有本州的马萨诸塞大学阿默斯特分校(UMass Amherst)。
多模态AI核心技术:CLIP与SigLIP技术原理与应用进展
近年来,人工智能领域在多模态表示学习方面取得了显著进展,这类模型通过统一框架理解并整合不同数据类型间的语义信息,特别是图像与文本之间的关联性。 在此领域具有里程碑意义的模型包括OpenAI提出的CLIP(Contrastive Language-Image Pre-training,对比语言-图像预训练)和Google研发的SigLIP(Sigmoid Loss for Language-Image Pre-training,用于语言-图像预训练的Sigmoid损失)。 这些模型重新定义了计算机视觉与自然语言处理的交互范式,实现了从图像分类到零样本学习等多种高级应用能力。
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭
3月26号,ETH等团队的一项研究一经发布,就引起了圈内热议。 这项研究彻底撕开遮羞布,直接击碎了「LLM会做数学题」这个神话! 论文地址:,MathArena团队使用最近的2025年美国数学奥林匹克竞赛进行了详细评估,结果令人大吃一惊——所有大模型的得分,都低于5%!
基于DeepSeek + VSCode 实现AI辅助编程
随着人工智能技术的飞速发展,AI 辅助编程逐渐成为提升开发效率、优化代码质量的重要工具。 本文通过结合 DeepSeek 的强大语言模型和 VSCode 的高效开发环境,展示了如何利用 AI 辅助编程完成一个经典的 MapReduce 词频统计任务。 这一实践不仅展示了 AI 在编程中的应用潜力,还为开发者提供了一个高效、便捷的开发流程示例,帮助读者快速上手 AI 辅助编程,并探索其在实际项目中的应用价值。
加州大学研究:AI 模型 GPT - 4.5 和 Llama 3.1 - 405B 可通过标准图灵测试
美国加州大学圣地亚哥分校研究显示,GPT-4.5和Llama 3.1-405B在PERSONA模式下通过三方图灵测试,提问者难以区分AI与人类。AI有望在社交场景中替代人类。#人工智能##图灵测试#
两位华人76页论文解决量子领域核心问题:首次证明伪随机性真实存在
量子领域的一个核心开放问题,就这样被两位华人研究员解决了? 事情是这样的。 一直以来,量子的随机性在计算和密码学中极为有用。
DeepSeek-V3击败R1开源登顶!杭州黑马撼动硅谷AI霸主,抹去1万亿市值神话
DeepSeek依然很能打,春节余波还在扩散! 据AI产品分析平台aitools.xyz统计,DeepSeek每月新增网站访问量超过了ChatGPT。 作为异军突起的现象级产品,DeepSeek的增长速度除了创造AI产品的增长奇迹,更是重新定义了全球的AI竞赛格局。
Vibe Agent: Token成本直降90%,会对话就能创造专属本地Agent
刚刚,Local AI 领域的 Libra 团队发布了一段最新技术演示视频,展示了用户通过自然语言交互直接生成 Agent,并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理,最终完成复杂任务。 Libra 构建的本地化、即时响应、自我规划方案为行业开辟了一条全新的长程推理 Agent 技术路径,实现了从手工 Agent 设计向端到端 In-Context Vibe Agent 生成范式演进。 从官网信息来看,Libra 的技术方案直接回应了制约 Agent 技术普及的两大关键瓶颈:一方面,当前热门 Agent 产品如 Cursor、Devin、Manus 等虽功能强大,但运行成本高昂 —— 专业评测显示单次使用 Manus 可消耗约 1000k Token(起步 2 美元)。
孙正义豪掷1万亿,机器人帝国崛起!总额远超星际之门,劳动力末日翻盘
报道称,在「星际之门」放血5000亿后,软银又拿着1万亿砸向机器人! 孙正义将在美国各地创建配备AI工厂的工业园区,用人形机器人助力制造业解决劳动力短缺难题。 机器人军团领衔,AI工厂重定义制造业在软银的宏伟蓝图中,AI工厂成为核心。
吉卜力太火,奥特曼求饶!GPT-4o免费生图登王座,设计师直呼天塌了
OpenAI再次火爆全网,而且接近一周了,GPT-4o带来的热潮还未停歇。 现在免费用户也可以使用生图功能了,更多人涌进了GPT-4o。 显然,靠吉卜力图像形成的病毒式传播,让奥特曼和整个OpenAI团队都没想到。
超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码模型全开源 | 蚂蚁&清华出品
用上这个开源框架,2天时间就能刷新7B数学推理纪录! 蚂蚁清华联手开源的强化学习框架AReaL-boba,直接把推理模型训练带到了Next Level——训练成本下降的同时,训练速率、推理能力还大幅提升的那种。 除了前面提到的7B模型,在32B模型上,只需两百美元、200条数据,就可以轻松复现QwQ-32B,就是数学推理能力媲美DeepSeek-R1,一战封神的那个。
DeepSeek R1本地训练全流程实操指南,手把手教你打通其“任督二脉”
作者 | asher许多关于 DeepSeek R1 的复现文章,主要聚焦在“rewards的设计、训练指标的变化、benchmark测评”这些内容,但是对于“本地训练”这个开启深度探索的关键前置步骤,却很少有人深挖。 可能有人觉得,照着readme操作就能轻松训练了吧? 太天真啦!
人工智能应用就是大模型能力+场景,基于大模型构建应用,首先要了解大模型的能力圈
在关于大模型应用方面,虽然也了解和应用过其中的一些技术;但经过这段时间的实践和思考发现,对大模型应用的认识还很浅显,因此在此记录一下自己的思考。 大模型应用的思考大模型作为人工智能应用的底座技术,所有应用场景和技术都是构建在大模型之上;但很多时候我们都搞错了一件事,那就是我们没有搞清楚大模型能力和其它技术的关联和区别。 因此,在这里我们要搞清楚一个概念,那就是大模型能力;所谓大模型的能力,就是模型开发人员怎么把模型做的更好更强,其中设计到模型的设计,训练等;具体有神经网络架构,模型蒸馏等等。
AI在主数据中的十大应用|用例和优势
一 概述在当今数字化环境中,企业面临的挑战不仅包括管理海量数据,还包括处理各种复杂数据,尤其是来自物联网 (IoT) 设备和联网技术等新兴来源的数据。 云技术的重大转变使这一情况更加复杂,促使企业不再仅仅采购基础设施,而是更加战略性地利用技术和服务,以最大限度地提高数据资产价值。 “数据敏捷性”概念应运而生,成为应对这种情况的关键。
如何识别和预防深度伪造诈骗
这些被篡改的内容在社交媒体、即时通讯应用和视频分享平台上广泛传播,模糊了现实与虚构之间的界限。 “Deepfake”一词是在2017年由一位Reddit用户创造的,当时该用户创建了一个以此命名的子论坛(subreddit)。 这个子论坛被用来分享AI生成的视频,其中经常包含名人换脸的色情内容。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉