AI在线 AI在线

Niantic 宣布将根据《宝可梦 Go》玩家数据构建“大型地理空间模型”

该公司表示,空间智能是人工智能模型的下一个前沿领域。这种 AI 模型可以使计算机和机器人以新的方式理解和与世界互动。

Niantic 宣布将基于数百万《Pokémon Go》玩家的数据来开发一个新的“大型地理空间模型”(LGM)。

该公司表示,空间智能是人工智能模型的下一个前沿领域。这种 AI 模型可以使计算机和机器人以新的方式理解和与世界互动。

Niantic 宣布将根据《宝可梦 Go》玩家数据构建“大型地理空间模型”

当你看到一种熟悉的建筑 —— 无论是教堂、雕像还是广场 —— 都很容易想象出它从其他角度看起来是什么样子,即便你并未从其他角度看到过它。

作为人类,我们拥有“空间理解力”,这意味着我们可以根据之前遇到的无数类似场景来脑补这些细节。但对于机器来说,这项任务极其困难。即使是今天最先进的 AI 模型也难以想象和推断出场景中缺失的部分,或者从新的角度想象一个地方。

据介绍,作为 Niantic 视觉定位系统 (VPS) 的一部分,他们训练了超过 5000 万个神经网络,拥有超过 150 万亿参数,可在超过一百万个地点运行,而 LGM 的“空间智能”正是建立在这层基础之上。

“在过去的五年中,Niantic 一直专注于打造我们的视觉定位系统 (VPS),该系统使用来自手机的单个图像来确定其位置和方向,使用由人们扫描我们游戏和 Scaniverse 中有趣地点构建的 3D 地图。”并且,“这些数据是独一无二的,因为它们是从行人的角度拍摄的,包括汽车无法到达的地方。”

Niantic 宣布将根据《宝可梦 Go》玩家数据构建“大型地理空间模型”

Niantic 首席科学家 Victor Prisacariu 表示:“利用我们的用户在玩 Ingress 和 Pokémon Go 等游戏时上传的数据,我们打造了世界的高保真 3D 地图,其中包括 3D 几何形状(或事物的形状)和语义理解(AI在线注:主要是指地图中的物体类型,例如地面、天空、树木等)。”

相关资讯

全面超越GPT-4?一文详解Google新模型Gemini

大家好我是花生~ 最近 Google 发布了一个新的多模态大模型 Gemini,在 AI 模型领域掀起了一轮新的讨论热潮,风头一时间甚至盖过了 GPT-4。那么 Gemini 的具体功能有哪些,相比其他大模型又有何特点呢?今天我们就一起来看看。 了解 GPT-4:一、 Gemini 的功能 Google 称 Gemini 是其历史上最强大、最通用的模型,在许多基准测试中都具有最先进的性能。Google DeepMind 的 CEO Demis Hassabis 称 Gemini 可以像人类一样理解我们周围的世界,并
12/12/2023 7:00:22 AM
夏花生

AI一键生成3D模型!这 5 款免费神器不容错过!

大家好我是花生~ 之前为大家推荐过的 AI 3D 模型生成工具 Genie 在前几天推出了新的 1.0 版本, 今天为大家介绍一下此次更新的特点,再为大家推荐另外 4 款同类的 AI 3D 工具,可以帮助我们通过文本或图像快速生成完整的 3D 模型。 相关推荐:一、Genie 网址直达: Genie 是 Luma AI 推出的一个文本到 3D 的生成模型,可以在 10 秒生成 4 款 3D 模型,自动精修后质感非常逼真,目前支持免费使用。 此次的 1.0 版本更新后将生成功能由 Discord 转到了单独的网页,
1/12/2024 1:41:56 AM
夏花生

万字干货!Stable Diffusion基础入门+案例实操+参数讲解+工具模型

相关阅读推荐:
3/29/2024 8:16:01 AM
大摸鱼家_Xr

微软或窃取你的Word、Excel文件以训练人工智能模型?

微软在其生产力套件中的Connected Experiences选项已经引起了人们的恐慌,有人指责默认设置可能会允许微软使用客户的Word和Excel文档及其他数据来训练AI模型。 微软否认窃取个人文件的相关说法Windows相关方面强烈否认这些说法。 一位发言人告诉The Register 杂志:“在 Microsoft 365的消费者和商业应用程序中,微软不会在未经用户许可的情况下使用用户数据来训练大型语言模型。
11/28/2024 3:05:02 PM
bug胤

AWS宣布新应用市场Amazon Bedrock上线100多个AI模型

AWS正在通过Amazon Bedrock服务向AI应用开发人员提供更多的大型语言模型,同时增强该平台的优化推理工作负载和为他们提供所需数据的能力。 AWS在年度盛会AWS re:Invent上发布的最新公告中包括了推出新的Amazon Bedrock Marketplace,这个主要门户将让开发人员可以访问100多个最强大的大型语言模型,其中包括一些只能在那里找到的大型语言模型。 Amazon .
12/5/2024 11:01:05 AM

你永远不应该外包给AI模型的一件事

在这个效率至上、颠覆性创新能一夜之间创造出亿万美元市场的世界里,企业不可避免地将GenAI视为强大的盟友。 从OpenAI的ChatGPT生成类似人类的文本,到DALL-E根据提示创作艺术,我们已经窥见了一个未来:机器将与人类并肩创造,甚至引领潮流。 为何不将这种趋势延伸到研发(R&D)领域呢?毕竟,AI可以加速创意生成,迭代速度超过人类研究人员,并且可能以惊人的轻松发现“下一个大事件”,对吗?且慢,理论上这一切听起来都很美好,但让我们面对现实:押注GenAI接管你的研发工作,很可能会以重大、甚至灾难性的方式适得其反。
12/10/2024 8:34:28 AM
Ashish Pawar

如何在安卓手机上本地安装和运行LLM?

译者 | 布加迪审校 | 重楼了解如何将AI的力量径直带入到你的安卓手机上:没有云,没有互联网,只有纯粹的设备端智能! 在安卓手机上本地运行大语言模型(LLM)意味着你可以在不依赖云服务器或互联网连接的情况下访问人工智能(AI)模型。 这种本地环境通过确保数据安全、并在设备端来确保隐私。
12/12/2024 8:26:50 AM
布加迪

微软发布2025年六大AI预测:AI模型将变得更加强大和有用

微软在2025年对人工智能(AI)的未来做出了六项重要预测,包括AI模型将变得更加强大和有用、AI . Agents将彻底改变工作方式、AI伴侣将支持日常生活、AI资源的利用将更高效、测试与定制是开发AI的关键、AI将加速科学研究突破。 以下是微软的预测及其潜在影响的详细解读:一、AI模型将变得更加强大和有用推理效率和功能提升:过去一年中,AI模型在推理效率和功能方面取得了显著进步。
1/6/2025 12:59:52 PM
极客AI

一文看懂推理并行的定义及其工作原理

译者 | 布加迪审校 | 重楼近年来,我们见证了两个反复出现的趋势:发布的GPU功能越来越强大,以及拥有数十亿、乃至数万亿个参数和加长型上下文窗口的大语言模型(LLM)层出不穷。 许多企业正在利用这些LLM,或进行微调,或使用RAG构建具有特定领域知识的应用程序,并将其部署在专用GPU服务器上。 现在说到在GPU上部署这些模型,需要注意的一点是模型大小,即相比GPU上的可用内存,将模型加载到GPU内存中所需的空间(用于存储参数和上下文token)实在太大了。
1/9/2025 11:14:14 AM
布加迪

如何使用基于AI的 Suno创作自己的音乐?

译者 | 布加迪审校 | 重楼Suno将使用其AI技能根据你对音乐的特定流派和主题的描述来创作歌曲。 你可能已经使用生成式AI来创建文本、图像甚至视频,但有没有用它来创作自己的音乐呢? 几种不同的文本转音乐工具可以充当虚拟作曲家,不过值得一试的此类工具是Suno。
1/10/2025 7:53:13 AM
布加迪

英伟达发布 6.3 万亿 Token 大型 AI 训练数据库 Nemotron-CC

据英伟达官方博客,英伟达宣布推出一款名为 Nemotron-CC 的大型英文 AI 训练数据库,总计包含 6.3 万亿个 Token,其中 1.9 万亿为合成数据。英伟达声称该训练数据库可以帮助为学术界和企业界进一步推动大语言模型的训练过程。
1/13/2025 9:18:27 PM
漾仔

Sam Altman称OpenAI将在几周内发布推理AI模型o3-mini

为了在人工智能技术竞赛中保持领先地位,OpenAI现在已经准备好了最新的人工智能模型,名为“o3-mini”该公司已经完成了其最新推理AI模型的第一个版本,OpenAI首席执行官Sam Altman在他的X帖子中证实了这一点。 经过外部安全研究人员的测试,新模型将在几周内推出。 值得注意的是,在2024年12月,ChatGPT制造商正式宣布开发和测试其先进的推理模型——o3和o3-mini。
1/20/2025 7:52:50 PM
Yu

DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临

DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。 西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。 去年12月,杭州幻方量化推出DeepSeekV3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 .
1/23/2025 3:58:02 PM
小刀

胜过Transformer?谷歌推出新型AI模型架构Titans

自2017年推出以来,Transformer模型架构一直是人工智能的基础要素,推动了自然语言处理、机器翻译等领域的进步。 不过,该模型在可扩展性、计算效率以及应对日益复杂任务等方面,仍面临着诸多挑战。 而Titans模型架构的诞生,旨在通过整合受人类认知过程启发的机制来克服这些障碍,如记忆优先级和适应性注意力。
1/26/2025 1:20:49 PM
Yu

人工智能席卷华尔街,高盛为其员工推出了AI助手

华尔街在人工智能技术的应用上走在了前沿,尤其是生成式人工智能的迅猛发展。 高盛近日宣布推出一款名为 “GS AI 助手” 的生成式 AI 工具,旨在帮助其银行家、交易员和资产经理更高效地完成工作。 这一工具目前已向约1万名员工推出,预计在今年内将覆盖所有知识工作者。
1/23/2025 4:49:00 PM
AI在线

Hugging Face 推出小巧AI模型,助力设备性能提升

近期,人工智能开发平台 Hugging Face 团队发布了两款新型 AI 模型,SmolVLM-256M 和 SmolVLM-500M。 他们自信地声称,这两款模型是目前为止体积最小的 AI 模型,能够同时处理图像、短视频和文本数据,尤其适合内存少于1GB 的设备如笔记本电脑。 这一创新让开发者在处理大量数据时,能够以更低的成本实现更高的效率。
1/24/2025 10:13:00 AM
AI在线

发烧友!一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek

最近,一位软件工程师安纳奈・阿罗拉(Ananay Arora)以 “不到一顿 Chipotle 餐” 的价格购买了域名 OGOpenAI.com,并将其重定向至中国的 AI 实验室 DeepSeek。 这个决定引发了许多人的关注,因为 DeepSeek 近期在开源 AI 领域中取得了显著进展,成为了热议的话题。 DeepSeek 发布的 AI 模型在技术上与早期的 OpenAI 模型相似,能够离线使用,并且任何具备相应硬件的开发者都可以免费使用。
1/24/2025 10:31:00 AM
AI在线
  • 1