应用
CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法
物体姿态估计对于各种应用至关重要,例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据,并且不能应用于测试时未见过的新物体;而类别级方法消除了这些假设(实例训练和 CAD 模型),但获取类别级训练数据需要应用额外的姿态标准化和检查步骤。为了解决这些问题,来自英伟达的研究团队提出了一个统一的框架,称为 FoundationPose,它在基于模型和无模型设置下,使用 RGBD 图像对新颖物体进行姿态估计和跟踪。如下图所示,FoundationPose 优于现有专门针对这四项任务中每一项的 SOT
4/6/2024 11:26:00 PM
机器之心
德科集团发布报告:41% 高管认为企业借助 AI 可精简员工规模
最新调查报告显示,人工智能固然无法完全取代现有工作岗位,但 41% 的高级管理人员认为,人工智能技术会导致员工人数减少。图源 intelligentliving全球知名人力资源公司德科集团(Adecco Group)就 AI 技术未来发展,以及对企业发展影响,询问了全球 2000 家大型公司的高级管理人员,这是同类调查中规模最大的一次。德科询问了来自美国、英国、法国、德国、日本、西班牙、加拿大、澳大利亚和新加坡的 2000 多家大型公司,涉及国防、制药、医疗保健、物流等行业。虽然大多数受访者表示人工智能将带来革命性
4/6/2024 3:06:42 PM
故渊
谷歌安卓版 Gmail 将迎新特性:整合 Gemini,帮用户总结邮件内容
消息源 @AssembleDebug 近日发布推文,挖掘安卓版 Gmail v2024.03.31.621006929 版本更新,发现谷歌正在测试“Summarize this email”功能,帮用户总结当前邮件内容。根据曝光的截图,Gmail 新版在邮件标题下方会出现“Summarize this email”按钮,只是现阶段该功能没有生效,但从名称判断可以确认是总结当前邮件内容。网友推测在点击该按钮之后,将在屏幕底部弹出一个窗口,以要点形式显示电子邮件的摘要。这与网页上的操作方式有些类似,只是网页版会跳出侧边
4/6/2024 10:39:00 AM
故渊
3 个月增长 300%,OpenAI 企业版 ChatGPT 用户规模突破 60 万
感谢OpenAI 首席运营官布拉德・莱特凯普(Brad Lightcap)本周四接受彭博商业周刊采访时表示,当前企业版 ChatGPT 注册用户数量超过 60 万。IT之家注:OpenAI 于 2023 年 8 月发布企业版 ChatGPT,不仅可以无限制地快速访问强大的 GPT-4 模型,还可以进行更深入的数据分析,帮助企业快速理解信息,并且可以向 ChatGPT 提出更复杂的问题。OpenAI 曾于 2024 年 1 月发布报告,表示企业版 ChatGPT 注册用户数量为 15 万,也就是说在过去短短 3 个月
4/6/2024 10:28:09 AM
故渊
YouTube CEO 点名 OpenAI:若利用其平台视频训练 AI 模型属违规行为
感谢YouTube 首席执行官尼尔・莫汉(Neal Mohan)近日在采访中公开表示,尽管没有直接证据表明 OpenAI 使用 YouTube 视频来训练 Sora(文本生成视频的 AI 模型),但警告称这种行为违反了 YouTube 现行的平台服务条款。莫汉在接受彭博社采访时强调,下载 YouTube 视频,然后用于训练 Sora 等 AI 模型显然违反了平台的相关条款。莫汉表示:“从创作者的角度来看,当创作者将他们的辛勤劳动上传到我们的平台时,他们有一定的期望。其中之一就是符合 YouTube 的服务条款,不允
4/6/2024 9:20:33 AM
故渊
应对隐私 / 版权问题,5 月起 Meta Threads / Instagram 等平台将标记“疑似由 AI 生成的内容”
感谢AI 兴起产生的各种隐私 / 版权问题如今已成为科技行业许多人越来越关注的重点,而 Meta 公司今日发布新闻稿,宣布将在 5 月起在自家 Instagram、Threads 及 Facebook 平台为 AI 内容添加“水印标记”。Meta 在新闻稿中声称,这些变化来自公司内部监督委员会的建议、公共调查的结果和“学术界、民间社会组织和其他方面”的建议。IT之家注意到,Meta 公司将使用算法及真人检测“可能由 AI 生成的内容“,而用户也可以自行在图片中注释”相关图片由 AI 生成”,此类消息将作为水印添加至
4/6/2024 7:38:56 AM
漾仔
人形机器人也要服“软”
机器之能报道编辑:SIA用整个身体(而不是双手),携带、搬挪更多的东西。你能想象这些台上的明星人形机器人给你一个舒适、温暖的拥抱吗?或者模仿你怀抱一堆快递包裹进门的样子?受限于刚性材料,这些人形机器人的运动能力也受到极大限制。嗯.......它们做不到。这些钢铁战士的工作方式未能跳脱传统大型工业机器人的窠臼——用一双“手(末端执行器)”干活,虽然常见但也非常低效。有什么办法能让大家做事更高效呢?想想我们平时是如何创造性地动用全身部位,像杂技演员一样应对各种情况的吧。比如,怀抱一堆快递来到楼下,好不容易腾出一只手打开
4/5/2024 6:37:00 PM
机器之能
目标 10 年培养 9500 万 AI 人才,思科牵头微软等 8 家公司组建新联盟
思科公司牵头,携手微软等 8 家企业共同组建了人工智能信息与通信技术劳动力联盟,计划未来 10 年内培养超过 9500 万的 AI 领域人才。该联盟全称为 The AI-Enabled ICT Workforce Consortium,由思科公司牵头,埃森哲、Eightfold、谷歌、IBM、Indeed、英特尔、微软和 SAP 八家公司共同组建而成。此外该联盟雇佣了包括美国劳工联合会和工业组织大会、CHAIN5、美国通信工人协会、DIGITALEUROPE、欧洲职业培训协会、Khan Academy 和 SMEU
4/5/2024 9:43:45 AM
故渊
OpenAI 展示 Sora AI 生成的首支音乐短片《Worldweight》
感谢OpenAI 近日在其 YouTube 官方频道发布视频,介绍了由 August Kamp 参与制作,完全由文本转视频 AI 模型 Sora 生成的首支音乐短片《Worldweight》。 这支音乐短片(Music Video)完全由 Sora 生成,然后 Kamp 再拼接相关片段形成时长为 2 分 19 秒的音乐短片,宽高比为 8:3,展现了各种环境的模糊镜头。Kamp 并未透露《Worldweight》具体使用了哪些提示词,IT之家翻译该视频描述如下:身心融合,完全沉浸、徜徉在艺术世界中的那个时刻至今仍萦绕
4/4/2024 4:29:28 PM
故渊
Stable Audio 2.0 发布:生成最长 3 分钟音频,能帮音乐家补全创意作品
Stability AI 近日发布新闻稿,宣布推出 Stable Audio2.0,可以基于用户输入的提示词,生成最长 3 分钟的完整音轨。Stable Audio 2.0 在此前 1.0 版本基础上,进一步为音频生成扩展了前奏、副歌、收尾和立体声效果等内容,最长可以生成 3 分钟的音频内容。Stable Audio 2.0 扩充了生成功能之外,还提供了音频生成音频功能,基于用户上传的一小段音频内容,扩展生成、补充相关的音频内容。IT之家附上演示视频如下: 例如音乐家如果在创作某段音乐的时候“卡壳”了,可以上传某段
4/4/2024 10:23:56 AM
故渊
消息称谷歌考虑对基于 AI 的搜索引擎收费,将部分功能添至高级订阅服务
感谢据英国《金融时报》援引三位熟悉谷歌的知情人士消息称,谷歌考虑对基于人工智能的搜索收费,这对其商业模式来说是一次重大变化。因为自 2000 年以来,谷歌的搜索产品一直都是依靠广告盈利的。据报道,谷歌正在考虑保持标准搜索(不含 AI 功能)免费,谷歌正在考虑各种选择,包括将某些基于 AI 的搜索功能添加到其高级订阅服务中。但是,付费用户仍将在 Gemini 驱动的搜索结果中看到广告。尽管搜索广告去年为谷歌带来了 1750 亿美元的收入,但仍可能不足以弥补 AI 搜索增加的成本。根据路透社去年的报告,通过 Gemin
4/4/2024 8:45:32 AM
清源
第一波!2024年4月精选实用设计工具合集
大家好,这是 2024 年 4 月的第 1 波干货合集!这一期干货合集包含了不少颇为实用的设计和灵感工具,比如号称世界上最大的 logo 案例库,在线免费的封面快速设计工具,免费的情绪板制作工具,精选各类设计工具和素材的合集网站,可以免费上手使用的 3D AI 工具以及 AI 图片放大工具。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、世界上最大的 LOGO 案例库
LOGO 案例库,网站从网络上搜集了大量的品牌 LOGO 设计案例,这些案例绝大多数都来自一些在行业内
4/4/2024 8:28:12 AM
陈子木
SK 海力士拟投资近 40 亿美元,建设其首家美国芯片工厂
感谢据彭博社报道,全球排名第二的内存芯片制造商 ——SK 海力士表示,计划斥资 38.7 亿美元(IT之家备注:当前约 280.58 亿元人民币)在印第安纳州建造一座先进的封装厂和人工智能产品研究中心。SK 海力士计划在美国西拉斐特市建设首个工厂,并计划于 2028 年下半年开始量产。该工厂将重点建设下一代高带宽存储芯片生产线,这些芯片是训练人工智能(AI)系统图形处理器的关键组件。作为 HBM 芯片的主要设计者和生产商,SK 海力士已逐渐成为 AI 发展大潮中的关键参与者,其生产的芯片与英伟达公司的处理器协同工作
4/4/2024 7:01:34 AM
清源
准确率达100%,「人机交互」机器学习,驱动有机反应精确原子映射研究
编辑 | X原子到原子映射(Atom-to-atom Mapping,AAM)是识别化学反应前后分子中每个原子位置的任务,这对于理解反应机理非常重要。近年来,越来越多的机器学习模型用于逆合成和反应结果预测,这些模型的质量高度依赖于反应数据集中 AAM 的质量。虽然有一些算法使用图论或无监督学习来标记反应数据集的 AAM,但现有方法是基于子结构 alignments 而不是化学知识来映射原子。在此,来自韩国首尔大学(Seoul National University)和韩国科学技术院(KAIST)的研究团队,提出了一
4/3/2024 5:30:00 PM
ScienceAI
ICML 2024 AI for Math Workshop 征稿和挑战赛启动!
ICML 2024, AI for Math Workshop面向形式化和自然语言AI数学推理的研讨会时间:2024年7月26/27日地点:奥地利,维也纳。现场、线上同步举行。研讨会主页:。人类在数学推理的发展进程中总结出了各种形式化语言,得以严格地描述数学问题和证明过程。而近年来的机器学习算法和大规模语言模型正在逐步接近甚至超越人类在一些数学推理的表现。那么,下一步我们该如何发展AI数学推理,使之成为人类突破未知数学领域的最强辅助?本次研讨会旨在将不同学科背景、来自工业界和学术界的专家和学者汇集在一起,共同探讨A
4/3/2024 4:36:00 PM
新闻助手
以假乱真,天工音乐大模型带来颠覆式AI体验
昨日,昆仑万维AI音乐生成大模型「天工SkyMusic」开启了免费邀测活动,诚邀媒体、行业专家以及感兴趣的音乐从业者们共同体验人声情感表达 SOTA 的音乐大模型产品。邀测开始后,广大用户对「天工SkyMusic」AI音乐生成大模型的热情远超我们的预期,工作人员在极短时间内收到了几十万份测试申请,其中包括众多专业的音乐创作人、媒体及行业专家,还有大量测试申请被源源不断地发至后台。同时,我们也收到了大量来自用户的真实反馈与高度评价:“人声很清晰 抒情旋律也好”“好听!”“这是天工做的??太厉害了!”“《悟空》这首歌是
4/3/2024 3:52:00 PM
新闻助手
国内首个AI程序员入职阿里云:专属工号AI001,KPI是一人写完公司20%代码
你肯定听过一句话:学计算机要从娃娃抓起。在过去的很多年,学习编程都曾经是一件时髦的事,但随着生成式 AI 技术的发展,科技圈对此的态度似乎有些转向。英伟达 CEO 黄仁勋就表示:「未来编程交给 AI 就行了,以后人人都是软件工程师。」不久之后,全球首个 AI 软件工程师 Devin 给开发者们带来了亿点点震撼,真正引发了人们对程序员这个职业未来前景的热议。难不成,码农的饭碗真要被 AI 端走了?其实不然,现在 AI 还只是程序员的工作助手。实际上,国内有一位 AI 程序员,已经在某互联网大厂上岗一段时间了。它就是阿
4/3/2024 2:59:00 PM
机器之心
开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k Star
不到 24 小时,Star 量突破 1400。最近,有很多人在为 AI 代替自己的工作而担忧。上个月火遍 AI 圈的「首位 AI 程序员」Devin,利用大模型能力已经掌握了全栈技能,仅需要人类给出自然语言指令,就可以自动完成复杂的代码任务。Devin 展示的能力非常惊艳,不过这款工具出自走闭源路线的创业公司,现在只有一小部分获得了内测名额的人才能使用。本周二,来自普林斯顿大学 NLP 组的研究人员放出了 SWE-agent —— 一个开源版 AI 程序员,不到一天就获得了上千的 GitHub Star 量。SWE
4/3/2024 2:45:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
蛋白质
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
字节跳动
工具
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉