资讯列表
清华出品!AI视频神器 Vidu 横空出世,效果直追 Sora!
大家好,这里是和你们一起探索 AI 的花生~
这两天一款名为 Vidu 的视频生成模型火爆网络,它由北京生数科技与清华大学联合发布,能直接通过文本生成 16 秒 1080P 的高清视频,且视频质量与 OpenAI Sora 不相上下, 因此被认为是 Sora 目前最有力的竞争对手。
Vidu 内测名额申请: shengshu.feishu.cn当视频在手机上无法加载,可前往PC查看。相关推荐:Vidu 是中国首个具备长时长、高一致性及高动态性的视频大模型,从官方的演示视频中也可以切实感受到其强大的生成能力。对于 “
4/30/2024 8:26:56 AM
夏花生
超全合集!2024 年 UX/UI 设计师都必须尝试的 21 款 AI 工具
编者按:设计师对于 AI 工具的需求其实还是蛮旺盛的,针对不同的设计环节、不同需求的细分 AI 工具往往能够很好地满足不同需求点。对于设计师来说,要想在这个崇尚速度、效率和创新的行业中脱颖而出,用好 AI 已不再是一种选择,而是一种必然地趋势。这篇文章来自设计师 Yulia Lápicus,总结梳理了 21 款目前主流、好用、专业的 AI 工具。以下是正文:
在当今数字化为主的生活环境中,设计任务变得越来越复杂和繁重。在设计工作流程中集成 AI ,可以帮助我们更好应对这些挑战。它使设计师能够快速测试、迭代创意,相比
4/30/2024 8:23:37 AM
Yulia Lápicus
掌握这3个技巧,学会用Midjourney绘制连环漫画
前言
相信大家在使用 Midjourney(以下简称 MJ)在生成角色人物时,都遇到过相同的难题:很难保持角色的一致性!当然 MJ 也在努力优化这个问题,例如,近期推出的“风格一致性”功能,即 cref,官方宣称是一个可以解决角色一致性的方案。但是经过测评后发现,此功能仍需完善,比如无法独立控制姿态或发型、技术精度有限、发挥不稳定等。因此,我们通过在实际工作中不断尝试和对比,发现了 3 个控制角色一致性的隐藏技巧!接下来,我们将通过分享一个连环漫画实战项目的制作流程,来揭秘如何生成角色与画风高度一致的技巧,希望可以
4/30/2024 8:20:52 AM
团队新浪MDC
OpenAI 增强内容合作,签署使用英国《金融时报》资料库训练 AI 模型
感谢OpenAI 近日和英国新闻媒体《金融时报》签署协议,利用后者的资料库内容训练人工智能模型。OpenAI 此前已经与美联社等四家媒体达成了类似协议。IT之家从双方协议中获悉,英国《金融时报》将其内容授权给 OpenAI,帮助后者开发生成式人工智能技术,可以创建接近于人类创作的文本、图像和代码等。根据双方的合作内容,ChatGPT 用户能够看到精选的摘要、引述以及《金融时报》新闻的链接,此外可以就某条新闻展开聊天。英国《金融时报》已成为 ChatGPT Enterprise 的客户,为所有《金融时报》员工购买访问
4/30/2024 8:04:35 AM
故渊
OpenAI 向 ChatGPT Plus 用户开放“记忆”功能
感谢OpenAI 公司今天宣布,面向所有 ChatGPT Plus 用户开放“记忆”(Memory)功能,可以让 ChatGPT 记住用户在聊天中讨论过的事情,并避免重复信息。用户可以控制 ChatGPT 需要记住的内容,可向 ChatGPT 发出明确指令使其记住指定内容,同时也可以询问 ChatGPT“你记住了什么”。用户也可以完全关闭该功能,或者通过对话、设置来让 ChatGPT“忘记”此前要求记住的内容。ChatGPT 的记忆能力将会随着使用次数的增加而逐渐提升,OpenAI 总结了如下场景,IT之家附上示例
4/30/2024 6:20:24 AM
故渊
别再说国产大模型技术突破要靠 Llama 3 开源了
Meta 表示,Llama 3 已经在多种行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型。 根据Meta的测试结果,Llama 3 8B模型在语言(MMLU)、知识(GPQA)、编程(HumanEval)等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct,70B 模型则超越了名声在外的闭源模型 Claude 3的中间版本 Sonnet,和谷歌的 Gemini Pro 1.5 相比三胜两负。 Meta还透露,Llama 3的 400B 模型仍在训练中。
4/29/2024 7:54:00 PM
张进
消息称小红书内测自研大模型“小地瓜”,有望落地社交和搜索
感谢据 36 氪报道,多个独立信源透露,由小红书 AI 创新负责人张德兵(薯名:宇尘)牵头的大模型团队,在部分内部产品灰度测试自研通用大模型基座“小地瓜”。小红书 AI 产品的探索,则主要由小红书产品和设计负责人邓超(薯名:樱木)负责。报道称,知情者透露小红书对上线新 AI 产品的态度非常谨慎,原因是害怕破坏现有的内容生态。一名知情者说:“小红书的内容生态是活人种草,AI 在里面怎么样才不违和,这是困扰小红书的一个问题。”据悉,社交和搜索则是小红书希望走出图文种草的舒适区,用 AI 触达更多用户的新场景。IT之家注
4/29/2024 7:39:57 PM
浩渺
AI在用|视频风格,一键七变,用Pika玩出新高度
机器之能报道编辑:山茶花以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。Pika 又又又上新了!近日,Pika 在 X 上宣布,新推出「风格生成」功能,并向所有人开放。在其宣传视频中,用户可以在不改变画面的情况下随意切换相框中小狗的风格,黑白风、动漫风、自然风等均可一键实现。网友评价称「Pika 的
4/29/2024 6:47:00 PM
机器之能
GTC大会开完一个月,英伟达的Omniverse Cloud API正在快速落地
今年的 GTC 大会上,英伟达宣布利用生成式 AI 等技术构建了业内领先的元宇宙、工业数字孪生、机器人训练软件体系。新技术基于英伟达实时模拟和协作平台 Omniverse。随着 Omniverse Cloud API 的推出,模拟现实环境的工具已经扩大了覆盖范围,现在已经被很多公司用于创建工业数字孪生应用程序和工作流程。在 3 月,共有五个新的 Omniverse Cloud 应用程序编程接口被引入,使开发人员能够轻松地将核心 Omniverse 技术直接集成到数字孪生的现有设计和自动化软件应用程序中,或者用于测试
4/29/2024 4:53:00 PM
李泽南
从材料设计合成,到催化剂创新、碳中和,清华王笑楠团队探索「AI+材料」前沿与落地
作者 | 清华大学王笑楠编辑 | 凯霞在当今科技飞速发展的时代,新材料的研究与开发已成为推动科学进步和工业革命的关键力量。从能源存储到信息技术,再到生物医药,创新材料的设计、合成及其功能表征是实现这些领域突破的基石。随着人工智能(AI)技术的不断进步,其在新材料研究中的集成应用已逐步开启一个全新的研究范式,成为超越传统研发模式的新质生产力,特别是在材料的设计、合成和表征过程中,AI 的助力大大提高了研究效率和精度。「17 岁上清华,27 岁做博导,30 岁回归清华,90 后科研女神,入选 2023 全球学者终身学术
4/29/2024 4:35:00 PM
ScienceAI
“不服请自删照片”:摄影平台 EyeEm 声称将默认使用摄影师作品训练 AI 模型
摄影分享平台 EyeEm 近日变更其服务条款,宣布将默认使用平台上的照片来训练 AI 模型,如果用户不同意条款,需要自行删除自己的所有作品。据介绍,EyeEm 摄影平台创立于 2011 年,该平台在 2015 年上线 EyeEm Market 照片交易市场,允许用户出售自己的摄影作品,在 2021 年以接近 4000 万美元的价格被瑞士社交网站 Talenthouse 收购,不过自 2022 年夏天开始,EyeEm 平台上的摄影师开始对外抱怨没有收到应有的报酬,该平台也在 2023 年 4 月申请破产,而在 202
4/29/2024 4:25:28 PM
漾仔
老黄最新采访出炉!自述 61 年坚持成就了英伟达,AI 革命点燃全世界
【新智元导读】过去一年的时间,英伟达市值突破 2 万亿美元,一举成为 21 世纪的 AI 巨头。在老黄的最新采访中,向我们展示了即将到来的工业革命是怎样的。全球进入 2 万亿美元俱乐部的公司,仅有 4 家 —— 微软、苹果、谷歌,以及英伟达。在过去一年中,位于加利福尼亚的计算机芯片制造商英伟达,市值从 1 万亿,飙升到 2 万亿美元。这得益于大模型掀起的 AI 狂潮,急剧放大了全世界对算力的需求。从 Grace 架构,到全新的 Blackwell,英伟达的创新为生成式 AI 和加速计算,带来了突破性的进步。那么,这
4/29/2024 3:49:12 PM
清源
人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora
在 4 月 27 日召开的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎隆重发布全新的多模态大模型 Awaker 1.0,向 AGI 迈出至关重要的一步。相对于智子引擎前代的 ChatImg 序列模型,Awaker 1.0 采用全新的 MOE 架构并具备自主更新能力,是业界首个实现 “真正” 自主更新的多模态大模型。在视觉生成方面,Awaker 1.0 采用完全自研的视频生成底座 VDT,在写真视频生成上取得好于 Sora 的效果,打破大模型 “最后一公里” 落地难的困境。Awaker 1.0 是一个将视
4/29/2024 3:04:00 PM
机器之心
首届AI方程式大赛,8圈开了一个小时
好消息:大多数 AI 赛车都完赛了。在阿布扎比的 F1 赛道上,8 辆赛车使用相同的轮胎,相同的发动机,完全一样的车身,唯一不同之处就是自动驾驶代码。全球第一场自动驾驶大奖赛开战了。上周日,阿布扎比自动驾驶赛车联赛 A2RL 的第一场比赛在 Yas Marina 阿布扎比一级方程式赛道上举行;这场比赛汇集了来自世界各地的技术娴熟的科学家、工程师和开发者团队,并将尖端技术融入赛车中,所有这些都是为了通过极限运动重塑移动性的未来。智能驾驶技术在量产汽车上一直处于正在发展,以及「即将覆盖城区」的阶段。因为 AI 技术的快
4/29/2024 2:59:00 PM
机器之心
Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果
「不怕 AI 消灭人类,就怕用 AI 的人太聪明。」今年 2 月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片段,掀起了 AI 生成视频浪潮。目前,Sora 仍未进行公测,只有一些视觉艺术家、设计师、电影制作人等获得了 Sora 的访问权限。他们发布了一些 Sora 生成的视频短片,其连贯、逼真的生成效果令人惊艳。最近,被誉为「朋克摇滚皮克斯」的加拿大多媒体制作公司 Shy Kids 发布了一段借助 Sora 制作的视频短片《Air Head》,在社交媒体上迅速引起广泛关注。据悉,这
4/29/2024 2:53:00 PM
机器之心
因生成错误信息,ChatGPT 在奥地利遭投诉
总部位于维也纳的隐私权倡导组织 NOYB (None of Your Business) 周一表示,将针对聊天机器人 ChatGPT 在奥地利提起投诉。他们指控这款由 OpenAI 开发的人工智能工具会“编造错误信息”,而 OpenAI 公司也无法纠正这些错误答案。NOYB 组织表示,目前没有办法保证 ChatGPT 提供的信息准确无误。“ChatGPT 一直在编造信息,OpenAI 甚至都无法阻止它,” 他们在声明中写道。该组织称,OpenAI 公司已经公开承认它们无法纠正其生成式 AI 工具产生的不准确信息,并
4/29/2024 2:42:03 PM
远洋
亚马逊研究奖获奖名单出炉:谢赛宁、Mamba作者Albert Gu等入选
与去年的 79 位获奖者相比,2023 年「亚马逊研究奖」获得者的人数有了一定的增加,达到了 98 位。近日,亚马逊研究奖(Amazon Research Awards,ARA)获奖名单公布,今年共有 98 名获得者,来自 15 个国家 51 所大学。完整获奖名单: (ARA) 成立于 2015 年,该计划旨在为多个学科研究主题的学术研究人员提供不受限制的资金。获奖者可以公开访问 300 多个亚马逊公共数据集,并可以使用亚马逊的 AI/ML 服务和工具。除此以外,获奖者还将与亚马逊专家建立联系,以获得咨询和建议,还
4/29/2024 2:42:00 PM
机器之心
CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。想象一下,你仅需要输入一段简单的文本描述,就可以生成对应的 3D 数字人动画的骨骼动作。而以往,这通常需要昂贵的动作捕捉设备或是专业的动画师逐帧绘制。这些骨骼动作可以进一步的用于游戏开发
4/29/2024 2:32:00 PM
机器之心