资讯列表
美国四大科技巨头疯狂建设AI数据中心,2024年总投资约2180亿美元
由于算力和先进技术的需求增加,国外科技巨头在2024年继续疯狂建设数据中心。 2024年1-8月,微软、Meta、谷歌、亚马逊总计向AI数据中心投入1250亿美元,包括AI资本支出、总数据中心运营成本,现金运营费用、软件、折旧和电费也纳入统计。 在固定AI资产投资方面,微软花钱最多,比如采购GPU及其它芯片,维护AI数据中心。
1/2/2025 9:50:38 AM
小刀
GitHub 7.5k star量,各种视觉Transformer的PyTorch实现合集整理好了
近一两年,Transformer 跨界 CV 任务不再是什么新鲜事了。 自 2020 年 10 月谷歌提出 Vision Transformer (ViT) 以来,各式各样视觉 Transformer 开始在图像合成、点云处理、视觉 - 语言建模等领域大显身手。 之后,在 PyTorch 中实现 Vision Transformer 成为了研究热点。
1/2/2025 9:32:54 AM
计算机视觉研究院
日本罗森便利店将雇佣“海外店员”,以虚拟形象服务深夜顾客
据日经1月1日报道,日本便利店连锁品牌罗森将启用“远程海外员工”模式,通过数字化虚拟形象为深夜顾客提供服务,以应对劳动力短缺问题。
1/2/2025 9:31:54 AM
清源
OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示
OpenAI的推理模型o1-preview最近展示了它不按常理出牌的能力。 o1-preview在与专用国际象棋引擎Stockfish比赛时,为了强行取得胜利,居然采用了入侵测试环境的卑劣手段。 而这一切都不需要任何对抗性提示。
1/2/2025 9:30:00 AM
新智元
潞晨尤洋:视频生成的GPT-4时刻,3年后可以见证 | MEET 2025
奥特曼说,Sora代表了视频生成大模型的GPT-1时刻。 从开年到现在,国内外、初创独角兽到互联网大厂,都纷纷投入视频生成领域,带来一个个新鲜模型的同时,视频、影视行业也随之发生巨变。 不可否认,当下的视频生成模型还遇到诸多问题,比如对空间、对物理规律的理解,我们都期待着视频生成的GPT-3.5/4时刻到来。
1/2/2025 9:14:51 AM
量子位
世界模型再进化!DrivingWorld:通过视频GPT构建自动驾驶世界模型(港科技&地平线)
写在前面 & 笔者的个人理解最近自回归(AR)生成模型的成功,如自然语言处理中的GPT系列,促使人们努力在视觉任务中复制这一成功。 一些工作试图通过构建能够生成逼真的未来视频序列和预测自车状态的基于视频的世界模型,将这种方法扩展到自动驾驶。 然而,先前的工作往往产生不令人满意的结果,因为经典的GPT框架旨在处理1D上下文信息,如文本,并且缺乏对视频生成所必需的空间和时间动态进行建模的固有能力。
1/2/2025 9:12:34 AM
Xiaotao Hu等
伦敦大学学院、华盛顿大学研究:AI 写作工具正不断进步,但仍无法媲美人类创造力
研究发现,人类在诗歌、小说和演讲领域的表现明显优于 AI,分别高出 80%、100% 和 150%。
1/2/2025 9:07:14 AM
清源
多模态RAG技术:从语义抽取到VLM应用与规模化挑战
一、基于语义抽取的多模态 RAG多模态 RAG 的发展方向旨在构建一个高度集成的系统,能够无缝融合文本、图像和其它多媒体元素,为用户提供更丰富的信息交互体验。 实现多模态 RAG 系统的三种主要技术路径如下:传统对象识别与解析(雕花路线)传统的多模态文档处理首先会运用图像识别技术,如 OCR(Optical Character Recognition,光学字符识别),从图像中抽取出文字、表格和图片等元素。 之后,这些独立的对象会被进一步解析,转换成文本格式,以便于后续的信息检索与分析。
1/2/2025 8:36:25 AM
金海
Switch 2 发布之际,任天堂“机器学习超分”专利公开
专利示例显示,假设某款游戏原生支持 4K 纹理,可能需要60GB的存储空间,而1080p版本仅需20GB,从而可以装入目前最大容量为32GB的 Switch 游戏卡带。在设备端,游戏将实时进行4倍分辨率升级。
1/2/2025 7:42:39 AM
清源
本科学历但创造出GPT,奥特曼盛赞为「爱因斯坦级」天才,OpenAI总裁:他想要的,我们都给
奥特曼称他是爱因斯坦级别的天才;OpenAI总裁更是直言:只要他想要的,我们都给。 Alec Radford大神离职OpenAI,现在牵出更多细节:改变世界的GPT,竟然是在Jupyter notebook上诞生的。 而他只负责提供背后的灵感,剩下的由工程师来解决。
1/2/2025 7:30:00 AM
英伟达 2024 年豪掷 10 亿美元,为 AI 初创公司提供资金支持
英伟达在刚刚过去的2024年向人工智能初创企业投入了10亿美元(当前约 73.16 亿元人民币)资金,成为推动 AI 革命的重要支持者,而这场革命正是由其芯片技术驱动的。
1/2/2025 7:19:23 AM
清源
1080P高清视频十秒生成!广告创意秒出片,支持动漫风,国产玩家出品
马上就要2025了,没想到国产AI视频模型PixVerse又给咱们整了一波新活! 继上次席卷全网的万物皆可毒液之后,它们又火速更新了3.5版本。 新模型不仅能10秒光速生成高清视频,而且复杂运动、各种二次元风格也都轻松拿捏——△提示:尼克和朱迪(《疯狂动物城》)在森林里一起骑车这次他们还内置了更多有趣的模版:成为肌肉猛男、圣诞礼物盲盒等等,非常适合快速生成短视频。
1/2/2025 7:10:00 AM
没有博士学位却开启了GPT时代,奥特曼盛赞Alec Radford,爱因斯坦级天才
《连线》曾在一篇报道中将 Alec Radford 在 OpenAI 扮演的角色,比作 Larry Page 发明 PageRank。 PageRank 彻底革新了互联网搜索方式,Radford 的工作(特别是在 Transformer 和后来的 GPT 方面的研究)从根本上改变了 AI 语言模型的工作方式。 几天前,OpenAI 宣布组织结构调整,裂变成了一家营利性公司和一个非营利组织。
1/2/2025 7:05:00 AM
上交大揭露大模型审稿风险:一句话就能让论文评分飞升
大语言模型(LLMs)正以前所未有的方式,深刻影响着学术同行评审的格局。 同行评审作为科学研究的基石,其重要性毋庸置疑。 然而,随着大语言模型逐渐渗透到这一核心过程,我们是否已经准备好面对它可能带来的深远影响?
1/2/2025 7:00:00 AM
尹同跃:把 AI 定义为改变奇瑞未来命运的重要机遇和突破口
奇瑞控股董事长尹同跃昨日发布 2025 年新年献词,其中提到,把 AI 定义为改变奇瑞未来命运的重要机遇和突破口。
1/1/2025 6:34:23 PM
汪淼
百度增设搜索产品:上线“AI 搜”,通过 @与不同智能体交互
百度“AI 搜”是基于百度文心大模型打造的桌面端 AI 搜索引擎,目前内容侧已经打通百度搜索引擎、百度健康、百度律临、百度文库、百度教育等内容生态。
1/1/2025 1:34:48 PM
文猛
2024 年另类 AI 评测标准走红:“威尔・史密斯吃意大利面”领衔
随着人工智能视频生成技术的不断发展,一个有趣的现象开始在业内流行:当一家公司发布全新的人工智能视频生成器时,似乎总有人会第一时间用它来制作威尔・史密斯吃意大利面的视频。这不仅演变成了一种网络热梗,更成为衡量新型 AI 视频生成器性能的非官方基准 —— 检验其能否逼真地呈现史密斯狼吞虎咽吃面的场景。史密斯本人也在去年二月通过 Instagram 发布了一段模仿视频,亲自参与了这场网络狂欢。
1/1/2025 12:17:19 PM
远洋
2025 年考研数学一得 126 分,智谱深度推理模型 GLM-Zero 预览版上线
GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型,擅长处理数理逻辑、代码和需要深度推理的复杂问题。
12/31/2024 5:53:12 PM
沛霖(实习)