资讯列表
刚刚,李飞飞创业首个项目引围观:单图生成交互3D场景,空间智能来了
这是空间智能的第一步。 「无论怎样理论化,我们还是很难用语言来描述与照片或句子生成的 3D 场景交互的体验,」李飞飞说道。 北京时间今天凌晨,著名 AI 学者、斯坦福大学教授李飞飞公布了她的第一个创业项目。
12/3/2024 10:22:00 AM
机器之心
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
随着人工智能技术的快速发展,让机器理解并执行复杂的空间任务成为一个重要研究方向。 在复杂的3D结构组装中,理解和执行说明书是一个多层次的挑战:从高层的任务规划,到中层的视觉对应,再到底层的动作执行,每一步都需要精确的空间理解能力。 斯坦福Vision Lab最新推出的IKEA Video Manuals数据集,首次实现了组装指令在真实场景中的4D对齐,为研究这一复杂问题提供了重要基准。
12/3/2024 10:15:08 AM
新智元
李飞飞「世界实验室」重磅推出 AI“造物主”:一张图片生成 3D 世界“任意门”
刚刚斯坦福大学的李飞飞教授宣布,她带领的World Labs团队推出一个能从单张图片生成 3D 世界的 AI 系统! 不是简单的 3D 建模,而是真正可以交互的 3D 物理场景! 3D场景在浏览器里就能实时渲染,还能用WASD键和鼠标自由控制视角,就像玩游戏一样!
12/3/2024 10:15:00 AM
MIT 76页深度报告:AI加速创新马太效应,科学家产出分化加剧!缺乏判断力将被淘汰
AI的最新进展显示出帮助科学突破的潜力,尤其是在药物发现和材料科学等领域。 来自MIT的Aidan最近发布了一篇长达76页的深度研究报告,内容关于AI对科学发现和产品创新的影响。 通过分析一家美国大型企业研发部门引入AI技术前后的情况,研究发现,在AI辅助下,科学家们发现新材料的数量增加了44%,这些新材料具有更独特的化学结构,导致专利申请数量增加39%,下游产品的创新率上升17%!
12/3/2024 10:10:27 AM
新智元
2024浦东国际人才港论坛丨人工智能产业人才论坛最新日程出炉,扫码报名开启“AI人才进阶之旅”
大型语言模型和机器学习方法的突破,以及算力硬件的快速升级,让现今人工智能已然发展到了“推动新一轮工业革命”的程度。 伴随着大量资本和人力的相继投入,人工智能领域的竞争日益激烈,其中非常核心的竞争要素就是“人才”。 据最近发布的《全球人工智能人才追踪调查报告 2.0》显示,中国培养了相当大比例的全球优秀 AI 研究者,2019 年这一比例为 29%,2022 年上升至 47%。
12/3/2024 10:09:00 AM
机器之心
使用 OCR 识别手写文本
本文实现了基于微调TrOCR模型进行手写文本识别。 1.GNHK手写笔记数据集GNHK(GoodNotes Handwriting Kollection)手写笔记数据集由GoodNotes提供,包含来自世界各地学生的数百份英文手写笔记。 下载数据集访问GNHK数据集官方网站:(),滚动到底部,同意使用条款和条件;点击第二个链接下载数据集。
12/3/2024 9:59:00 AM
小喵学AI
亚马逊 AWS 将使用 AI 开发的材料来减少数据中心碳排放
亚马逊云服务业务 AWS 今日宣布与一家名为 Orbital Materials 的公司建立合作关系,后者使用 AI 来开发脱碳技术。
12/3/2024 9:58:36 AM
汪淼
3DGS自监督预训练全新范式!VisionPAD:三大感知任务全部暴力涨点(港中文&华为)
写在前面 && 笔者理解虽然近一年端到端的自动驾驶发展火热,但是以多视角图像推导BEV视角和占用空间的感知技术引领的自动驾驶框架,仍然在很多企业中占据主体。 比如今天要分享的这篇,就是华为诺亚方舟实验室对BEV OCC的继续研究。 但是不得不说,这些模型在很大程度上依赖于精确的3D标注,而数据标注的高成本使得越来越多的研究人员和工程师开始关注预训练策略。
12/3/2024 9:49:07 AM
黄哲威 hzwer
大幅超越所有SOTA!地平线DiffusionDrive:生成式方案或将重塑端到端格局?
写在前面&笔者的个人理解近年来,由于感知模型的性能持续进步,端到端自动驾驶受到了来自工业界和学术界的广泛关注,端到端自动驾驶算法直接从原始传感器采集到的信息输入中学习驾驶策略。 这种基于数据驱动的方法为传统的基于规则的运动规划提供了一种可扩展且强大的替代方案,而传统的基于规则的运动规划通常难以推广到复杂的现实世界驾驶环境。 为了有效地从数据中学习驾驶过程,主流的端到端规划器通常从自车查询中回归出单模轨迹,如下图所示。
12/3/2024 9:36:52 AM
Bencheng Liao等
消息称三星和 SK 海力士达成合作,联手推动 LPDDR6-PIM 内存
三星电子的一位代表表示:“两家公司正在交换意见,并就产品标准化进行合作,”他补充说:“由于合作刚刚开始,我们正在制定标准化目标时间表的实施计划。”
12/3/2024 9:21:06 AM
汪淼
轻松掌握 AI 大模型!Windows 新突破:Ollama 赋能本地部署
Ollama—— 这是一个专为本地部署优化的 AI 模型。 Ollama 在模型大小、性能和部署灵活性等方面都有非凡的表现,与传统云端部署相比,它可以轻松运行在普通的台式电脑或笔记本电脑上。 这无疑是 AI 大模型的一次重大突破!
12/3/2024 9:11:45 AM
不码不疯魔
为什么在人工智能时代基础设施必须是无服务器的
开发者们正从创建单个应用程序转向编排由 AI 构建的应用程序集群。 译自Why Infrastructure Must Be Serverless in the AI Age,作者 Nikita Shamgunov。 Replit 的新 AI 代理将编写您的代码,然后配置、调配、构建和部署该代码,只需几秒钟。
12/3/2024 8:41:57 AM
岱军
李飞飞空间智能首秀:AI靠单图生成3D世界,可探索,遵循基本物理几何规则
就在刚刚,李飞飞空间智能首个项目突然发布:仅凭借1张图,就能生成一个3D游戏世界的AI系统! 重点在于,生成的3D世界具有交互性。 能够像玩游戏那样,自由地移动相机来探索这个3D世界,浅景深、希区柯克变焦等操作均可行。
12/3/2024 8:23:53 AM
终于把 LSTM 算法搞懂了!!!
今天给大家分享一个强大的算法模型,LSTMLSTM(长短期记忆网络)是一种特殊类型的循环神经网络(RNN),它能够有效地解决传统 RNN 在处理长序列时遇到的梯度消失和梯度爆炸问题。 LSTM 的核心思想是通过多个门控机制来控制信息的流动,这些门控机制可以选择性地保留或丢弃输入数据,从而帮助网络捕捉长时间跨度的依赖关系。 LSTM的工作原理LSTM 的核心思想是通过引入记忆单元来存储信息,并使用三个主要的门(输入门、遗忘门、输出门)来决定哪些信息应该保留,哪些信息应该遗忘,以及哪些信息应该更新。
12/3/2024 8:16:57 AM
程序员小寒
最大限度提高人工智能训练效率:选择合适的模型
译者 | 李睿审校 | 重楼快速准确地训练人工智能模型,对于建立对这些工作流工具的信任非常重要。 随着人工智能驱动的应用程序执行复杂任务的能力越来越强,数据科学家和机器学习工程师需要探索新方法。 要为特定用例开发最佳模型,利用合适的模型、数据集和部署可以简化人工智能开发过程并产生最佳结果。
12/3/2024 8:08:13 AM
李睿
Arc 浏览器开发商预告全新 AI 浏览器 Dia,计划 2025 年初推出
该公司最新的宣传片显示该产品为 Dia,这是一个利用 AI 工具简化日常互联网任务的网络浏览器,计划于 2025 年初推出。
12/3/2024 7:12:37 AM
沛霖(实习)
地瓜机器人与清华大学达成全面深度合作,推出 RDK UniBots 具身智能科教平台
该平台是具身智能科教的标准化体系架构,以RDK算力平台与板载具身智能算法为基础,融合了机器人产业与科教产业上下游,可支持用户根据个性化需求,快速创建具身智能科教应用。
12/2/2024 11:13:01 PM
清源
杭州滨江公安投用人形机器人:可语音播报反诈信息,巡逻时支持全程录音录像
综合滨江发布、滨江公安等消息,在11月30日-12月1日凤凰传奇杭州演唱会期间,杭州滨江公安的“新成员”——人形机器人在大莲花体育场周边亮相。
12/2/2024 10:00:48 PM
清源