应用
人形机器人商业化步伐加快,Digit接受亚马逊业务大考
机器之能报道编辑:sia一直以来,亚马逊就是全球仓储机器人技术的风向标。最新迹象表明,这家巨头与去年投资的人形机器人初创公司 Agility Robotics 的合作进一步深入:该巨头正在位于位于萨姆纳的 BFI1 运营中心测试 Digit 双足机器人。它有两只胳膊,两条腿,能够向前和向后移动,转身和弯曲身体。Digit 目前测试的岗位是负责回收亚马逊标志性的黄色箱子,它会将这些空箱子递给员工。当里面的物品被清空时,他们会回收这些空箱并放到架子上。Digit 拥有一个蒂凡尼蓝色的胸部和两个方形的眼睛灯。身高约 1
10/23/2023 6:43:00 PM
机器之能
口型几乎完美、还能卡点,霉霉说地道中文的视频火了,背后AI工具原来是它
这么看来,AI 配音真的可以「以假乱真、真假难辨」。这两天,美国女歌星霉霉(泰勒・斯威夫特)一则说中文的短视频在各社交平台火了起来。有的播放量已经达到了 600 多万。在视频里,霉霉操着一口流利、地道的中文,神情自若,几乎没有早期译制片女主角的那种腔调,口型也能对得上。 图源:微博 @会火还没有看过视频的小伙伴们,我们先来一睹为快。 视频作者:johnhuu 教英语
10/23/2023 4:25:00 PM
机器之心
AIGC时代的视频扩散模型,复旦等团队发布领域首篇综述
AI 生成内容已经成为当前人工智能领域的最热门话题之一,也代表着该领域的前沿技术。近年来,随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布,AI 图像生成和编辑领域实现了令人惊艳的视觉效果,并且在学术界和工业界都受到了广泛关注和探讨。这些方法大多基于扩散模型,而这正是它们能够实现强大可控生成、照片级生成以及多样性的关键所在。然而,与简单的静态图像相比,视频具有更为丰富的语义信息和动态变化。视频能够展示实物的动态演变过程,因此在视频生成和编辑领域的需求和挑战更为复杂。尽管在
10/23/2023 3:43:00 PM
机器之心
ChatGPT与DALL·E 3之间的行业「黑话」被人发现了
原来,礼貌和强调(emphasis)在大型语言模型(LLMs)的沟通中也发挥着意想不到的作用。上个月底,OpenAI 发布了最新图像生成器 DALL・E 3,除了炸裂的生成效果外,最大看点是其与 ChatGPT 的集成。DALL・E 3 构建在 ChatGPT 之上,用 ChatGPT 来创建、拓展和优化 prompt。这样一来,用户无需在 prompt 上花费太多时间。随着用户不断测试 DALL・E 3 应用程序的功能,有人开始注意到一些非常有趣的 bug,显示出了 DALL・E 3 与 ChatGPT 之间共享
10/23/2023 3:25:00 PM
机器之心
解决大模型复现难、协作难, 这支95后学生团队打造了一个国产AI开源社区
过去十年间,AI 技术经历了巨大的飞跃,无论是在自然语言处理、图像识别,还是在更多的创新领域,AI 的影响已无所不在。伴随着研究数量的爆炸性增长,学术界和工业界同样面临着一些挑战,其中就包括「论文复现」和「跨学科协作」的难题。特别是当我们来到了大模型时代,面对动辄百亿参数量的模型研究,开源、复现、协作变得更加重要,但难度却更上一层楼。论文复现,首先是评判一项成果价值的重要参考因素。同时,在快速发展的 AI 领域,确保研究的可复现性将更好地推动知识的积累和技术的普及,也是维护学术诚信和促进持续创新的关键所在。面对这些
10/23/2023 3:17:00 PM
机器之心
清华朱文武团队:开源世界首个轻量图自动机器学习库AutoGL-light
清华大学朱文武教授团队自 2020 年发布智图库(AutoGL)以来,在图自动机器学习的可解释性和可泛化能力等方面取得新进展,特别关注于图 Transformer、图分布外泛化(OOD)、图自监督学习等方面,发表图神经架构搜索评测基准,并在中国新一代开源创新服务平台 GitLink 上发布首个轻量智图库(AutoGL-light)。智图库回顾图(graph)是描述数据间关系的一般抽象,广泛存在于不同的研究领域中并有许多重要应用,例如社交网络分析、推荐系统、交通预测等互联网应用,新药物发现、新材料制备等科学应用(AI
10/23/2023 3:09:00 PM
机器之心
聚焦计算赋能创新,第三届智能计算创新论坛成功举行
新型计算方法的最新发展状况如何?能够帮助实现智能计算系统的先进技术是怎样的?如何利用智能方法辅助计算系统设计、调度和理论研究?怎样推动智能计算软硬件平台在科学研究、产业创新和社会发展中得到更广泛的应用?10月19日-20日,由之江实验室与Science/AAAS共同主办第三届智能计算创新论坛顺利举行,美国国家工程院院士、摩根大通人工智能研究负责人Manuela Veloso,中国科学院院士、之江实验室计算材料首席科学家张统一,清华大学类脑计算研究中心主任施路平教授,英国帝国理工学院教授Björn W.Schulle
10/23/2023 2:38:00 PM
机器之心
评论能力强于GPT-4,上交开源13B评估大模型Auto-J
随着生成式人工智能技术的快速发展,确保大模型与人类价值(意图)对齐(Alignment)已经成为行业的重要挑战。虽然模型的对齐至关重要,但目前的评估方法往往存在局限性,这也让开发者往往困惑:大模型对齐程度如何?这不仅制约了对齐技术的进一步发展,也引发了公众对技术可靠性的担忧。为此,上海交通大学生成式人工智能实验室迅速响应,推出了一款全新的价值对齐评估工具:Auto-J,旨在为行业和公众提供更加透明、准确的模型价值对齐评估。论文地址:::,该项目开源了大量资源,包括:Auto-J 的 130 亿参数模型(使用方法,训
10/23/2023 2:30:00 PM
GAIR
智加科技多项成果亮相ITS World Congress 两款智能重卡计划量产
2023年10月16日-20日,第29届智能交通世界大会(ITS World Congress)在苏州国际博览中心成功举办。智能交通世界大会被誉为智能交通领域的“奥运会”,是智能交通领域最具影响力的综合性国际会议,也是智能交通业界规格最高、规模最大、范围最广的成果展示与技术交流平台。智加科技携自动驾驶技术多项应用成果精彩亮相在第29届智能交通世界大会。与两大头部重卡主机厂达成合作 两款智能重卡计划量产智加科技宣布联合江淮汽车专为快递快运市场打造的智能重卡K7 ,将于10月底量产交付于中通快运,在双十一快递快运运营中
10/23/2023 12:50:00 PM
新闻助手
如何使用ChatGPT定制各种实用小工具?我总结了6个!
ChatGPT 的能力让人难以想象,限制 ChatGPT 能力的只会是使用者的想象力。
在日常使用中,我通过 ChatGPT 定制了很多实用小工具。以前需要借助其他产品完成的需求,现在通过 ChatGPT 就可以完成,而且效果很好。
之前我分享了如何使用 ChatGPT 做定制化模型:一、翻译工具
在以前日常工作生活中,需要翻译时,我都是通过搜索使用百度/谷歌翻译。
对于句子的翻译,机器翻译往往不够精准,有一股机译的味道。而 ChatGPT 具备强大的语言能力,在翻译这一点上质量更高。
如下图,当我输入英文,则 C
10/23/2023 6:25:36 AM
团队ASAK设计
科学家使用外推ML方法加速发现新型催化剂
编辑 | 萝卜皮设计新型催化剂是解决许多能源和环境挑战的关键。尽管包括机器学习 (ML) 在内的数据科学方法有望加速催化剂的开发,通过机器学习方法很少发现真正新颖的催化剂,因为它最大的局限性是假设无法推断和识别特殊材料。北海道大学(Hokkaido University)的研究人员展示了一种外推机器学习方法来开发新型多元素反向水煤气变换催化剂。使用 45 个催化剂作为初始数据点,并执行闭环发现系统的44个循环(ML预测 实验),研究人员对总共 300 种催化剂进行了实验测试,并鉴定出 100 多种催化剂,这些催化剂
10/21/2023 6:04:00 PM
ScienceAI
大厂出品!如何用 ControlNet 实现精准的画面色彩控制?
颜色控制一直是 AIGC 的难点,prompt 会污染、img2img 太随机… 今天带来利用controlnet,实现对画面颜色的有效控制。都说AIGC是抽卡,但对把它作为工具而非玩具的设计师,必须掌握如何控制它,让我们一起开始可控AI生成。
更多相关干货:一、想给 AI 点颜色瞧瞧,怎么这么难
大家或许已经通过各种《三分钟包会》《五分钟出道》的教程,可以手拿把掐的将一张商品图,完美植入需要的背景中。客观的说,无论从角度、投影、还是商品与背景的语义关系,以下都能算是合格的图片。但是作为视力 255³的设计师,总能
10/21/2023 6:41:51 AM
团队京东JellyDesign
病毒式传播的短视频,也许就是这个GPT-4工具剪出来的
器之能报道编辑:大盘鸡真正实现人人能做短视频。「视频为王」的环境下,短视频可谓是正在称霸,它的传播速度甚至被称为「病毒式」传播。正是短视频传播迅速、内容简练、节奏快速,填补了快节奏生活的空白。你会不会也经常看短视频来充当自己休闲时光的活动?短视频虽然看着简单,但是制作起来也是颇为费心的。想要将内容极度精炼、做到短时间内快速吸引观众的眼球、视频节奏好,这都需要反复琢磨。Klap 的出现,或许能帮助大家更好地制作短视频。官方网站地址: 是一款 AI 驱动的工具,旨在自动创建短视频内容。它所使用的 AI 技术由 Open
10/20/2023 5:48:00 PM
机器之能
腾讯OCR团队斩获ICDAR大赛四项冠军
在全球文字识别(OCR)领域顶级盛会ICDAR 2023上,腾讯OCR团队基于自研算法,斩获四项冠军,这是继2017年、2019年、2021年以来,连续四届参会同时创造佳绩,共获得18项官方认证冠军,展示了腾讯OCR技术在全球的一流水平。ICDAR大会是全球文档图像分析识别领域公认的权威学术会议,每两年举办一次,赛事举办至今已经吸引了超过100多个国家的近8000支队伍参与其中。ICDAR竞赛因其极高的技术难度和强大的实用性享誉国内外,与赛后非正式刷榜不同,ICDAR官方认证的正式竞赛采用全新的数据集,并且在比赛期
10/20/2023 3:51:00 PM
新闻助手
智加科技与东风柳汽达成深度合作 自动驾驶重卡计划2024年初量产交付
(2023年10月19日,苏州)全球领先的重卡自动驾驶技术公司智加科技与东风柳汽宣布,双方共同开发的自动驾驶重卡H7计划2024年初实现量产交付。未来,双方将携手推出安全可靠、高性价比、性能卓越的自动驾驶重卡产品,共同开拓自动驾驶重卡的市场需求,加速推进干线物流场景自动驾驶重卡的应用及商业化运营。 图注:东风柳汽首席师曹越与智加科技商务副总裁刘立签约智加科技长期深耕干线物流重卡自动驾驶技术的研发落地,针对事故频发、司机短缺、运营成本居高不下等物流行业痛点,率先推出了前装量产自动驾驶重卡产品,并联合头部物流客户开展商
10/20/2023 3:05:00 PM
新闻助手
获1000万美元捐款,用于代码重构、上云,论文预印版平台arXiv「好起来了」
上云、代码重构一起来。对于节奏越来越快的学术研究领域而言,arXiv 是非常重要的论文预印版平台。和维基百科一样,它是个非营利性机构。当地时间本周四,康奈尔大学科技校区(Cornell Tech)宣布了 arXiv 获得巨额捐款的好消息。作为一个非营利数据库,arXiv 是所有人均可以免费访问的,长期以来一直依赖人们的捐赠。康奈尔科技校区宣布,西蒙斯基金会和美国国家科学基金会(NSF)已提供了总额超过 1000 万美元的赠款以支持 arXiv。据介绍,这笔资金将使这个拥有超过 200 万篇论文的研究存储库迁移到云端
10/20/2023 3:03:00 PM
机器之心
专访MIT贾皓钧&段辰儒博士:AI4S时代的化学材料发现——「AI炼金术」
作者 | MIT 贾皓钧&段辰儒博士编辑 | 凯霞大家可能从小就听说过爱迪生尝试上千种材料作为灯丝,凭着不断试错方法以及永不言弃的精神,最后研发出日用白炽灯的故事——天才靠的是百分之一的灵感和百分之九十九的汗水。然而,随着科学的进步和现代社会的发展,新型材料的研发变得愈发复杂。现在,研究者经常需要在上百万大小的材料空间同时优化数十个不同的性质,以寻找适用于电池、半导体、催化剂和合金等领域的新材料。如果说爱迪生需要 99% 的汗水,那现在研究者可能需要 99.99% 的汗水。而新型材料的研发历程就有点像人们去「沙滩」
10/19/2023 6:07:00 PM
ScienceAI
二次元专供:Midjourney发布动漫风格图像生成APP
机器之能报道编辑:大盘鸡Midjourney 自己的应用将被提上日程。Midjourney 已经被捧上了 AIGC 的神坛,但是显然它并不满足于此。随着越来越多的高质量图片生成 AI 兴起,如 OpenAI 的 DALL-E 3 嵌入 ChatGPT Plus、 Adobe 最近发布的 Firefly image 2,Midjourney 也在产品和技术上不断进行尝试,继续保持用户关注度与使用。本周,Midjourney 创始人 David Holz 介绍,Midjourney 与日本游戏公司 Sizigi Stu
10/19/2023 5:52:00 PM
机器之能
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind