资讯列表
英伟达华人AI版《猫和老鼠》爆火全网,60秒经典泪目!仅靠Transformer新增一层
「猫和老鼠」,这部创作于1940年的动画,现在已经85岁了。 如今,只需一个提示,不用任何剪辑,AI便可「无限续杯」童年经典,继续延续它的魅力。 你没有看过的《猫和老鼠》情节画面,由AI制作来自英伟达、斯坦福、UCSD、UC伯克利以及UT Austin研究团队,通过Test-Time Training构建了一个「一分钟视频」生成器。
4/10/2025 9:26:56 AM
芯片设计效率提升2.5倍,中科大华为诺亚联合,用GNN+蒙特卡洛树搜索优化电路设计 | ICLR2025
芯片设计是现代科技的核心,逻辑优化(Logic Optimization, LO)作为芯片设计流程中的关键环节,其效率直接影响着芯片设计的整体性能。 然而,传统逻辑优化算子由于存在大量无效和冗余的变换,导致优化过程耗时较长,成为制约芯片设计效率的主要瓶颈。 为解决这一挑战,中科大王杰教授团队(MIRALab)和华为诺亚方舟实验室(HuaweiNoah’sArkLab)联合提出了基于神经符号函数挖掘的高效逻辑优化方法,显著提升传统关键逻辑优化算子运行效率最高达2.5倍。
4/10/2025 9:19:52 AM
量子位
用梯度下降求解整数规划,中科大等提出无监督训练整数规划求解器新范式 | ICLR 2025 Spotlight
无监督学习训练整数规划求解器的新范式来了。 中国科学技术大学王杰教授团队(MIRA Lab)提出了一种全新的整数规划求解方法——DiffILO(Differentiable Integer Linear Programming Optimization),相关论文已被人工智能顶级国际会议ICLR 2025接收为Spotlight。 结果显示:与现有主流的监督学习方法对比,DiffILO不仅显著加快训练速度,还能生成更高质量的可行解。
4/10/2025 9:15:03 AM
量子位
首个统一多模态模型评测标准,DeepSeek Janus理解能力领跑开源,但和闭源还有差距
统一多模态大模型(U-MLLMs)逐渐成为研究热点,近期GPT-4o,Gemini-2.0-flash都展现出了非凡的理解和生成能力,而且还能实现跨模态输入输出,比如图像 文本输入,生成图像或文本。 相比传统的多模态模型(比如 GPT-4V 或 DALL·E 3),这类模型在任务适应性和灵活性上更具优势。 然而,当前研究领域还存在几个突出的问题:1.
4/10/2025 9:15:00 AM
量子位
李飞飞团队提出世界模型基准:“世界生成”能力迎来统一评测,3D/4D/视频模型同台PK
世界模型领域最新进展,要比拼“世界生成”了。 李飞飞吴佳俊团队提出了全面评测基准WorldScore,涵盖了三大类评估指标,动态静态都有涉及,其数据集中包含了3000个测试样例。 并且,WorldScore将3D场景生成、4D场景生成和视频生成三类模型的评估,统一到了一起。
4/10/2025 9:10:00 AM
量子位
AI 助 86 岁经典老片重获新生:谷歌拟将《绿野仙踪》搬上拉斯维加斯巨型球幕
谷歌和 Magnopus 等公司正借助 AI 技术对这部问世 86 年的经典老片进行全面升级,让它能在 Sphere 高达 16 万平方英尺(约 14864.49 平方米)的巨型半球屏幕上焕发新生。
4/10/2025 9:02:54 AM
清源
继 OpenAI 后,谷歌 Gemini 模型将支持 Anthropic 的 MCP 协议
谷歌宣布Gemini模型和SDK将支持Anthropic的MCP协议,该协议旨在实现大语言模型与外部数据源的安全双向连接。多家公司已跟进支持。#AI技术# #谷歌Gemini#
4/10/2025 9:00:07 AM
远洋
GPT开山一作,本科学历入职前CTO初创!OpenAI痛失「爱因斯坦级天才」
被Ilya感谢过,被奥特曼誉为「爱因斯坦级的天才」,在OpenAI更是「想要什么就给什么」——即便如此,去年12月,Alec Radford还是选择了离开。 直到昨天,他的去向才确定。 据Thinking Machine Lab官网更新,OpenAI前核心成员Alec Radford和Bob McGrew将担任公司顾问(Advisors)。
4/10/2025 9:00:00 AM
新智元
谷歌 AI 编程助手 Gemini Code Assist 新增“代理”功能,可多步骤完成复杂任务
谷歌在Cloud Next大会上宣布AI编程助手Gemini Code Assist新增代理功能,可多步骤完成复杂编程任务,如根据文档创建应用或转换代码语言。同时支持Android Studio等环境,但用户仍需亲自审查代码确保安全。#AI编程助手##谷歌云#
4/10/2025 8:50:15 AM
远洋
三大AI超能力:分类式AI、预测式AI和生成式AI
译者 | 晶颜审校 | 重楼了解分类、预测和生成式AI之间的区别——它们的主要功能,以及如何使用它们对数据进行分类、趋势预测和内容创建。 人工智能(AI)是一个潜能巨大且不断发展的领域,是无数现代技术的核心。 为了驾驭它的复杂性,将AI划分为三个核心“家族”是大有裨益的,它们每个“家族”都有自己独特的目的和“个性”:分类式AI:作为数据整理的关键工具,它善于将输入信息标记为既定类别。
4/10/2025 8:33:05 AM
晶颜
谷歌发布 Gemini 2.5 Flash AI 模型:专为省钱高效而生
谷歌推出Gemini 2.5 Flash AI模型,主打高效能和低成本,适合高容量应用如客户服务和文档解析。该模型提供动态计算能力,开发者可灵活调整速度、准确性和成本。不过谷歌尚未发布其安全报告。#AI# #谷歌Gemini#
4/10/2025 8:26:17 AM
远洋
小型推理模型的崛起:紧凑型人工智能能否匹敌GPT级推理能力?
译者 | 涂承烨审校 | 重楼近年来,人工智能领域一直沉迷于大型语言模型(LLMs)的成功。 这些模型最初设计用于自然语言处理,如今已演变为强大的推理工具,能够通过类人类的逐步思考过程解决复杂问题。 然而,尽管LLMs具备卓越的推理能力,它们仍存在显著缺陷,包括高昂的计算成本和缓慢的部署速度,这使得它们在移动设备或边缘计算等资源受限的实际场景中难以应用。
4/10/2025 8:23:11 AM
涂承烨
OpenCV 应用中九个惊艳的图像处理实例
大家好! 今天我们将一起探索OpenCV中的9个实用且惊艳的图像处理技术。 无论你是初学者还是有一定基础的朋友,这篇文章都会让你收获满满。
4/10/2025 8:20:00 AM
手把手PythonAI编程
谷歌重申今年 750 亿美元资本支出计划:斥巨资购买芯片、服务器,持续押注生成式 AI
Alphabet首席执行官桑达尔·皮查伊在谷歌云计算部门的年度会议上表示,这项投资将用于采购所需的芯片和服务器,强化公司核心业务(如搜索),同时推动AI服务的发展,例如其 Gemini 模型。
4/10/2025 8:15:17 AM
清源
十款能几乎取代整个开发团队的 AI 工具
几年前,如果你告诉我一些工具能够取代整个开发团队 70% 的工作量,我一定会笑出声。 但如今,我们已经进入了 2025 年,AI 已经成为独立开发者、个人创客和技术创作者们的无形但强大的合伙人。 今天,带你了解这 10 款 AI 工具,它们正在替代开发者、设计师和测试人员完成大部分繁重的工作。
4/10/2025 8:11:06 AM
dev
MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期
MIT最新研究表明,当前AI系统并无稳定价值观,其行为高度依赖提示语且难以预测,挑战了此前AI会发展自主价值观的观点。研究团队测试了Meta、谷歌等主流模型,发现其偏好呈现“不一致且不稳定”特性。#AI伦理##MIT研究#
4/10/2025 8:05:59 AM
远洋
使用Argo Workflows微调大语言模型
本文整理自:KCD 2025 Beijing: Fine-tuning LLM with Argo Workflows: A Kubernetes-native Approach1.在大语言模型上微调的挑战图片微调就是将特定的领域数据赋予到基础的大模型中进行特定的调优。 为什么要这样做呢,这是因为基础的大语言模型的设计较为通用,像一颗未经雕琢的宝石/百科全书,能够给我们比较通用全面的回答,当面对一些特定领域的问题,比如金融,健康等领域,回答不够精细化。 通过微调,可以让模型在特定领域达到出类拔萃的效果。
4/10/2025 7:59:51 AM
田双坤
OpenAI 启动先锋计划,旨在重塑 AI 模型评分体系
OpenAI宣布启动先锋计划,旨在改善AI模型评分方式,创建更符合实际应用场景的评估体系。该计划将专注于法律、金融、医疗等特定领域,并与初创公司合作设计定制化基准测试。#AI技术# #OpenAI#
4/10/2025 7:52:21 AM
远洋