资讯列表
Light-A-Video :无需训练实现视频重新打光
近年来,图像重光照技术的进步得益于大规模数据集和预训练的扩散模型,使得一致性光照的应用变得更加普遍。 然而,在视频重光照领域,由于训练成本高昂以及缺乏多样化和高质量的视频重光照数据集,进展相对缓慢。 仅仅将图像重光照模型逐帧应用于视频,会导致多种问题,如光源不一致和重光照外观不一致,最终导致生成的视频出现闪烁现象。
2/17/2025 11:00:58 AM
AI在线
香港大学研发 AI 成像工具CytoMAD 提升癌症检测速度与精准度
香港大学(HKU)的研究团队近日宣布,他们成功开发出一款基于人工智能的成像工具,旨在提升癌症诊断的速度和准确性。 这项名为 “细胞形态对抗蒸馏”(CytoMAD)的新技术,由工程学院的齐凯文教授领导,利用生成式人工智能的方法进行精确的单细胞分析,且无需传统的标记技术。 CytoMAD 的技术经过香港大学李嘉诚医学院及玛丽医院的合作测试,已在肺癌患者的评估中表现出良好的效果,并且能支持药物筛选过程。
2/17/2025 10:57:00 AM
AI在线
FDA 大裁员:AI 部门受重创,特朗普却在加码投资!
在最近的一次裁员中,美国食品药品监督管理局(FDA)的人工智能(AI)和数字健康团队遭遇了重创。 这一决定引发了广泛的担忧,因为在当前医疗行业对 AI 技术日益依赖的背景下,监管机构亟需密切关注医院和保险公司如何应用这些新兴技术。 图源备注:图片由AI生成,图片授权服务商Midjourney近年来,AI 在医疗保健领域的使用不断增加,医生们开始运用这一技术来更有效地检测疾病,制定治疗方案。
2/17/2025 10:54:00 AM
AI在线
AI大地震!微信百度同日接入DeepSeek,“技术洗牌”后是“流量大迁徙”?
2025年2月16日,中国互联网圈迎来了一场“AI大地震”——微信和百度先后宣布接入DeepSeek。 这可不是普通的“技术升级”,而是AI技术普惠化的一次“超级加速跑”,行业影响重大而深远。 AI从“奢侈品”到“日用品”DeepSeek的低成本 开源特性,简直就是AI界的“共享经济”。
2/17/2025 10:53:19 AM
舒云
大模型前缀缓存技术,有望将服务成本降低90%
译者 | 核子可乐审校 | 重楼是不是总感觉ChatGPT响应缓慢? 大家可能没有留意,大模型应用程序的提示词重复率高达70%,问天气、问翻译和问节日安排的内容大量出现,且每次都要消耗算力进行处理。 这样的情况在分布式集群的各节点上被无数次放大,白白烧掉宝贵的能源和金钱。
2/17/2025 10:49:49 AM
核子可乐
用DeepSeek+Xmind, 3分钟实现万字报告秒变思维导图!
前言你是不是也经常遇到这样的崩溃瞬间? 👉 收到客户发来的万字行业报告,密密麻麻的文字看得眼冒金星。 👉 领导突然甩来一篇调研文档,要求两小时内提炼核心观点。
2/17/2025 10:41:16 AM
码易有道
DeepSeek 背后的技术:GRPO,基于群组采样的高效大语言模型强化学习训练方法详解
强化学习(Reinforcement Learning, RL)已成为提升大型语言模型(Large Language Models, LLMs)推理能力的重要技术手段,特别是在需要复杂推理的任务中。 DeepSeek 团队在 DeepSeek-Math [2] 和 DeepSeek-R1 [3] 模型中的突破性成果,充分展示了强化学习在增强语言模型数学推理和问题解决能力方面的巨大潜力。 这些成果的取得源于一种创新性的强化学习方法——群组相对策略优化(Group Relative Policy Optimization, GRPO)。
2/17/2025 10:40:20 AM
佚名
DeepSeek-R1下载量超1000万次,成最受欢迎开源大模型!
全球最大开源平台Hugging Face联合创始人Clément Delangue宣布——DeepSeek R1 在发布仅仅几周后,就成为了Hugging Face 平台上有史以来最受欢迎的模型。 现在已有数千个魔改变体模型,下载量超过了1000万次! 开源地址: Face上的数据显示,上个月的下载量是370万次。
2/17/2025 10:40:00 AM
AIGC开放社区
华为推出 DeepSeek 训 / 推超融合一体机,适配 V3&R1 及蒸馏模型
华为 DCS AI 解决方案针对 DeepSeek 推出 FusionCube A3000 训 / 推超融合一体机,适配 DeepSeek V3&R1 及蒸馏模型,支持私有化部署。
2/17/2025 10:37:21 AM
远洋
微软开源创新框架:可将DeepSeek,变成AI Agent
微软在官网发布了视觉Agent解析框架OmniParser最新版本V2.0,可将DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型,变成可在计算机使用的AI Agent。 与V1版本相比,V2在检测较小的可交互UI元素时准确率更高、推理速度更快,延迟降低了60%。 在高分辨率Agent基准测试ScreenSpot Pro中,V2 GPT-4o的准确率达到了惊人的39.6%,而GPT-4o原始准确率只有0.8%,整体提升非常大。
2/17/2025 10:36:00 AM
AIGC开放社区
服务器总是繁忙?DeepSeek-R1本地部署图文版教程来啦
最近一段时间,国产大模型DeepSeek-R1在市场上迅速崛起,成为了众多用户的新宠。 然而,伴随其热度与用户量的急剧攀升,由此导致服务器繁忙的状况频繁出现。 为了摆脱服务器繁忙的困扰,本地部署DeepSeek-R1成为了一个绝佳的解决方案,这不仅减少了对网络连接的依赖,还能增强数据安全性。
2/17/2025 10:33:19 AM
Yu
Meta 出品!Pippo:输入单张人物图片生高分辨率多视角图片
近日,Meta Reality Labs 的研究团队联合高效发布了一项名为 “Pippo” 的创新性生成模型,能够从一张随意拍摄的照片中,生成一段高达1K 分辨率的密集周转视频。 这一突破性技术,标志着计算机视觉和图像生成领域的又一重要进展。 Pippo 模型的核心在于其多视图扩散转换器的设计。
2/17/2025 10:32:00 AM
AI在线
Nature:全球博士生数量锐减,钱少、事多、前途迷茫
过去几年,一些国家的博士项目申请人数出现下滑,有专家警告称,这是一个令人担忧的趋势。 从澳大利亚、日本到巴西和英国,高昂的生活成本、微薄的助学金以及毕业后有限的就业前景,正在阻碍人们攻读博士学位。 据经合组织(OECD)巴黎总部项目负责人斯拉里科表示,这些下降的数据应该「敲响警钟」。
2/17/2025 10:30:00 AM
新智元
微软发布 OmniParser V2.0:把屏幕截图转化成LLM可处理的结构化格式
微软近日发布了 OmniParser V2.0,这是一个旨在将用户界面(UI)截图转换为结构化格式的全新解析工具。 OmniParser 能够提高基于大型语言模型(LLM)的 UI 代理的性能,帮助用户更好地理解和操作屏幕上的信息。 该工具的训练数据集包括一个可交互图标检测数据集,该数据集从热门网页中精心挑选并自动注释,以突出可点击和可操作的区域。
2/17/2025 10:28:00 AM
AI在线
OpenAI调整策略,力求在内容审查与自由言论之间找到平衡
OpenAI 近期宣布了一项重要的政策更新,旨在改变其人工智能模型的训练方式,强调 “知识自由” 的重要性,无论话题多么具有挑战性或争议性。 这一变化意味着,ChatGPT 将能更全面地回答问题,提供更多视角,减少拒绝讨论某些话题的情况。 在新的187页模型规范中,OpenAI 提出了一个新的指导原则:不要撒谎,既不要发表不真实的陈述,也不要省略重要的上下文。
2/17/2025 10:26:00 AM
AI在线
微信与百度相继接入DeepSeek,AI技术普惠开启超级加速度
2月16日,腾讯微信和百度相继宣布接入DeepSeek,这一事件标志着中国互联网行业在AI领域的又一次重大突破。 微信作为拥有近14亿月活用户的超级应用,百度作为国内领先的搜索引擎,两者的接入不仅为用户带来了更智能的交互体验,更对整个行业产生了深远影响。 推动AI技术普惠化与应用落地DeepSeek的开源特性使其成为AI技术普惠化的关键力量。
2/17/2025 10:25:46 AM
苹果与Meta争相开发AI驱动的人形机器人
在科技界的舞台上,苹果与 Meta 这两大巨头正在悄然展开一场关于 AI 驱动的人形机器人的竞赛。 尽管这两家公司在某些领域存在竞争,但此次合作与对抗的交织,或许将开启科技的新篇章。 苹果作为消费者电子产品的先锋,其在智能硬件领域的创新能力毋庸置疑。
2/17/2025 10:20:00 AM
AI在线
首个基于统计学的线性注意力机制ToST,高分拿下ICLR Spotlight
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/17/2025 10:19:00 AM
机器之心