资讯列表
AI理解27分钟长视频超越GPT-4o,港理工新国立开源新框架:角色化推理+链式LoRA
AI能像人类一样理解长视频。 港理工、新加坡国立团队推出VideoMind框架,核心创新在于角色化推理(Role-based Reasoning)和链式LoRA(Chain-of-LoRA)策略。 相关论文已上传arXiv,代码和数据全部开源。
4/3/2025 9:34:36 AM
量子位
震惊!用 Redis+AI 模型实现秒级实时风控,这波操作太秀了
兄弟们,有没有遇到过这种情况:凌晨三点在某东抢购显卡,刚提交订单就提示"系统繁忙",转头发现黄牛已经在海鲜市场挂出同款;扫码支付时突然弹出风险提示,非要验证人脸识别;更绝的是某银行APP,刚输完密码就收到短信提醒:"检测到您的账户存在异常操作"——但此时您根本没动过手机。 这些让人又爱又恨的操作背后,都藏着一个叫"实时风控"的技术妖怪。 今天咱们就来扒一扒,这个妖怪是如何用 Redis 和 AI 模型在 0.1 秒内完成逆天操作的。
4/3/2025 9:30:56 AM
儒猿团队
AI Agent打了个响指,商业齿轮加速转动
3月16日,百度旗下文心大模型4.5和文心大模型X1正式发布。 目前,两款模型已在文心一言官网上线,免费向用户开放。 同时,文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用API;文心大模型X1也即将在千帆上线。
4/3/2025 9:30:00 AM
科技云报到
双人动作生成新SOTA!浙大提出TIMotion框架 | CVPR 2025
双人动作生成新SOTA! 针对Human-human motion generation问题,浙江大学提出了一种对双人运动序列进行时序和因果建模的架构TIMotion,论文已发表于CVPR 2025。 具体来说,通过分别利用运动序列时间上的因果关系和两人交互过程中的主动被动关系,TIMotion设计了两种有效的序列建模方式。
4/3/2025 9:27:44 AM
量子位
CVPR 2025:单图秒变专业影棚,几何/材质/光影全搞定,数据训练代码全开源
如何从一张普通的单幅图像准确估计物体的三维法线和材质属性,是计算机视觉与图形学领域长期关注的难题。 这种单图逆渲染任务存在严重的不确定性,传统方法通常需要多角度或多光源的拍摄条件,难以在日常场景中普遍应用。 近日,由香港中文大学、上海人工智能实验室及南洋理工大学的研究团队联合研发的论文《Neural LightRig: Unlocking Accurate Object Normal and Material Estimation with Multi-Light Diffusion》。
4/3/2025 9:25:53 AM
量子位
大模型RL不止数学代码!7B奖励模型搞定医学法律经济全学科, 不用思维链也能做题
一个7B奖励模型搞定全学科,大模型强化学习不止数学和代码。 o1/r1的强化学习很强,但主要探索了数学和代码领域,因为这两个领域的数据结构化程度高,奖励函数/奖励模型比较好设计。 那么,想提升大模型在其他学科领域的能力该怎么办?
4/3/2025 9:23:08 AM
量子位
AI 时代如何更高效开发前端组件?21st.dev 给了一种答案
给大家推荐一个好东西:21st.dev ,大致上你可以将它理解为一个非常前卫的组件托管市场,特别之处在于:它参考 shadcn/ui 的设计理念提供了一种原子化的,Code Out 形式的依赖安装、管理模式;并且更具有启发性的,它为每一个组件都提供了一套用于生成组件代码的 Prompt,用户可以借此在特定项目上下文中生成适配度更高的组件效果。 借助 21st.dev 与 cursor,我做了这样一个 demo: 这一切都是在 5min 内,不写一行代码的情况下实现的! 更值得称谓的是,21st.dev 的功能设计真正做到了 AI 友好,能够很好地应用在各类 AI 工具中(cursor、v0.dev、bolt.new、cline 等等),并且这套设计逻辑还非常适合复用到各种 TO-D 场景中,21st.dev 是什么21st.dev 是一个开源的 React UI 组件市场,专门为设计工程师和前端开发者提供高质量的 UI 组件。
4/3/2025 9:04:19 AM
范文杰
百度飞桨框架 3.0 正式版发布,五大特性专为大模型设计
飞桨框架 3.0 号称从设计理念上实现了从底层硬件适配到顶层开发体验的全面进化,已面向开发者开放,并且兼容 2.0 版本的开发接口。
4/3/2025 8:50:36 AM
汪淼
美国CS专业卷上天,满分学霸惨遭藤校全拒!父亲大受震撼引爆热议
美国大学CS专业,卷到何种程度了? 最近,一位父亲痛心发帖:他的儿子成绩全校第一近乎完美——SAT接近满分、18门AP课程全部5分,却在申请季被所有常春藤名校拒绝。 唯一伸来橄榄枝的,只有本州的马萨诸塞大学阿默斯特分校(UMass Amherst)。
4/3/2025 8:50:00 AM
新智元
那些用ChatGPT实现10倍开发效率的顶级程序员,到底做对了什么?
大部分人都错了。 你刚刚发给ChatGPT那条“帮我写个函数实现xxx”的泛泛提示? 删了吧。
4/3/2025 8:36:31 AM
dev
我们如何构建了一个LangGraph代理以确定GitOps漏洞的优先级?
译者 | 布加迪审校 | 重楼一款基于LangGraph的开源工具可帮助你确定在特定的Kubernetes环境中最需要优先解决的漏洞。 在当今复杂的Kubernetes环境中,管理漏洞并确定优先级很快会变得令人不堪重负。 由于数十甚至数百个容器跨多个服务运行,你如何决定先处理哪些漏洞?
4/3/2025 8:33:59 AM
布加迪
DAPO:面向开源大语言模型的解耦裁剪与动态采样策略优化系统
在人工智能技术快速迭代发展的背景下,大语言模型(LLMs)已成为自然语言处理与生成领域的核心技术。 然而,将这些模型与人类偏好精确对齐并增强其复杂推理能力的挑战,促使研究者开发了一系列复杂的强化学习(RL)技术。 DAPO(解耦裁剪和动态采样策略优化,Decoupled Clip and Dynamic Sampling Policy Optimization)作为一个突破性的开源大语言模型强化学习系统应运而生,为该领域带来了技术变革。
4/3/2025 8:00:00 AM
Jenray
OpenAI o3 模型运行成本估算大幅上调:单次任务从 3000 美元涨至 3 万美元
Arc Prize Foundation 大幅上调 OpenAI o3 模型运行成本估算,从 3000 美元涨至 3 万美元。高昂成本凸显 AI 模型特定任务的高成本难题,控制成本成行业挑战。##AI模型成本##
4/3/2025 7:59:45 AM
远洋
多模态AI核心技术:CLIP与SigLIP技术原理与应用进展
近年来,人工智能领域在多模态表示学习方面取得了显著进展,这类模型通过统一框架理解并整合不同数据类型间的语义信息,特别是图像与文本之间的关联性。 在此领域具有里程碑意义的模型包括OpenAI提出的CLIP(Contrastive Language-Image Pre-training,对比语言-图像预训练)和Google研发的SigLIP(Sigmoid Loss for Language-Image Pre-training,用于语言-图像预训练的Sigmoid损失)。 这些模型重新定义了计算机视觉与自然语言处理的交互范式,实现了从图像分类到零样本学习等多种高级应用能力。
4/3/2025 7:00:00 AM
AI算法 | 训练数据的数量、质量及语言分布等因素对中文大模型性能的影响
已有LLM研究探索了训练数据对模型性能的影响,但这些研究大多集中在英文模型上,对于中文模型的研究相对较少。 今天来看一篇来自贝壳的研究团队在2023年的一篇工作——《Towards Better Instruction Following Language Models for Chinese: Investigating the Impact of Training Data and Evaluation》。 这篇工作的核心目标是提升中文指令跟随语言模型的性能。
4/3/2025 7:00:00 AM
Goldma
谷歌 AI 笔记应用 NotebookLM 新增“发现资料”功能,可自动检索相关网络资源
谷歌NotebookLM推出“发现资料”新功能,基于Gemini技术自动搜索网络资源,提升学习研究效率。用户只需输入兴趣点,AI即可推荐相关资源并生成摘要。#AI学习工具##NotebookLM#
4/3/2025 6:50:40 AM
远洋
深度解析:通过 AIBrix 多节点部署 DeepSeek-R1 671B 模型
原文链接: AIBrix 分布式推理平台实现 DeepSeek-R1 671B 的多节点部署。 DeepSeek-R1 通过渐进式训练框架展现出优秀的逻辑推理能力 —— 在 6710 亿总参数量中,其动态激活的 370 亿参数与 128k 上下文窗口,使其在复杂任务处理中表现卓越。 然而,如此庞大的模型规模对部署环境提出了严苛挑战,尤其是分布式推理的资源调度与性能优化。
4/3/2025 6:30:00 AM
字节跳动开源
GPT-4o深度体验10大场景!可能ComfyUI工作流真不用学了
上周我介绍了 gemini 生图模型,我觉得已经算是实用性很强了,但紧接着 Open AI 就卷起来了,也更新了一波图像生成模型,然后迅速在全网刷屏。 那它的效果到底好不好用呢? 是不是被吹的很厉害?
4/3/2025 5:39:24 AM
彩云Sky