应用
Meta生成式AI连放大招:视频生成超越Gen-2,动图表情包随心定制
生成式 AI 进入视频时代了。提到视频生成,很多人首先想到的可能是 Gen-2、Pika Labs。但刚刚,Meta 宣布,他们的视频生成效果超过了这两家,而且编辑起来还更加灵活。这个「吹小号、跳舞的兔子」是 Meta 发布的最新 demo。从中可以看出,Meta 的技术既支持灵活的图像编辑(例如把「兔子」变成「吹小号的兔子」,再变成「吹彩虹色小号的兔子」),也支持根据文本和图像生成高分辨率视频(例如让「吹小号的兔子」欢快地跳舞)。其实,这其中涉及两项工作。灵活的图像编辑由一个叫「Emu Edit」的模型来完成。
11/18/2023 9:56:00 AM
机器之心
数智上海2023峰会将于12月举办,邀各界共享数字化转型最新成果与经验
数字技术创新和数字经济发展已经成为推进新型工业化的加速器,为经济高质量发展注入强劲动能、形成强力支撑。为了进一步推广上海数字化转型最新成果与可行性经验,助力数字技术交流与科技创新合作,「2023 上海数字化转型体验周」期间将举办首届「数智上海 2023 峰会」。以「数字化转型推进新型工业化」为主题,「数智上海 2023 峰会」将于 12 月中旬在上海杨浦举办。峰会将设置多场聚焦前沿数字技术创新与应用赋能的活动,并进行多项重磅发布,邀请众多政府领导、院士专家、数字化转型场景方与技术方企业代表,带来一场顶级智慧与前瞻思
11/18/2023 9:47:00 AM
机器之心
保姆级教程!Stable Diffusion LoRA模型训练教程(新手篇)
本篇文章仅整理归纳我的LoRA训练思路及步骤,以及自己遇到的问题和解决方案的复盘整理。希望对新手炼丹师们有所启发和帮助。
LoRA 相关干货:
11/18/2023 8:42:07 AM
Wincy_Fu
2023 戈登贝尔奖揭晓:Frontier 超算「量子级精度」材料模拟获奖
编辑 | 泽南、杜伟戈登贝尔奖(ACM Gordon Bell Prize)设立于 1987年,由美国计算机学会颁发,被称为超算界的「诺贝尔奖」。该奖项每年颁发一次,用以表彰高性能计算领域取得的杰出成就。奖金 1 万美元,由高性能和并行计算领域先驱戈登·贝尔提供。近日,在全球超级计算大会 SC23 上,2023年ACM 戈登贝尔奖授予了美国和印度研究人员组成的 8 人国际团队,他们实现了大规模量子精度的材料模拟。相关项目名称为「量子精度的大规模材料建模:金属合金中准晶体和相互作用扩展缺陷的从头计算模拟」。团队成员分
11/17/2023 2:18:00 PM
ScienceAI
台式PC上可运行,DeepMind天气AI以0.25°分辨率预测全球10天内数百个天气变量,仅1分钟
编辑 | 萝卜皮全球中期天气预报对于许多社会和经济领域的决策至关重要。传统的数值天气预报使用增加的计算资源来提高预报精度,但无法直接使用历史天气数据来改进基础模型。Google DeepMind 团队介绍了「GraphCast」,一种直接从再分析数据训练的基于机器学习的方法。它可以在一分钟内以 0.25° 的分辨率预测全球 10 天内的数百个天气变量。研究人员用 1380 个验证目标进行了测试,GraphCast 在 90% 的验证目标中显著优于当前最准确的操作确定性系统,其预测支持更好的严重事件预测,包括热带气旋
11/17/2023 11:26:00 AM
ScienceAI
数因智科袁野:CINS模型依据单细胞数据揭示细胞间互动的秘密
编辑 | X随着单细胞测序技术的发展,我们能够在单个细胞水平上观察基因表达,这就像是能够听到一个巨大合唱团中每个人的声音,但是如何理解这些细胞之间的交流和合作却是一个并不容易解决的问题。如在肿瘤生物学中,肿瘤细胞与其周围的微环境中的细胞(如免疫细胞、纤维细胞和血管细胞)之间存在复杂的相互作用,这些相互作用对于肿瘤的生长、转移和治疗反应都至关重要。如果我们能够研究清楚这些相互作用网络,就可能找到新的治疗方法,比如靶向微环境中的特定细胞或通讯通路的药物分子。数因智科创始人袁野博士发表于期刊PLoS Computatio
11/17/2023 10:20:00 AM
ScienceAI
该更新啦!6款超好用的SDXL负面提示词Embedding模型
大家好我是花生~
SDXL 1.0 模型发布以来,优质的 SDXL 大模型不断涌现,让图像的生成质量越来越高。但版本迭代后,之前的 SD1.5 的负面提示词 Embedding 并不能和 SDXL 大模型配合使用,而每次都输入一大串的反向提示词又实在麻烦。所以今天就继续给大家推荐 6 款可以配合 SDXL 模型使用的负面提示词 Embedding,它们可以在 SD WebUI 和 ComfyUI 中使用,能有效修复图像缺陷,提升画面细节和质感。
上期回顾:一、UnaestheticXL
链接直达: (文末有资源包
11/17/2023 8:28:39 AM
夏花生
一句话秒出4K高清大片,视频生成Gen-2重磅更新又炸了
机器之能报道编辑:咚咚锵难以置信的高清、流畅、稳定,视频效果震撼人心。「我坚信 2023 年会是属于视频生成模型的一年。」总部位于纽约的当红生成式 AI 视频初创公司 Runway CEO 预测。今天,这家喜欢创造不可能的公司再次应验这一预言——Runway 当家 AI 视频生成工具 Gen-2 迎来重大更新,结果又是一个王炸!现在,你仅需一句简单输入,即刻获得高达 4K 水平的高保真视频。效果有多惊艳?官方视频为证,先睹为快。Gen-2史诗级更新目前 AI 生成的视频存在两个主要的问题:首先,单帧并不完全逼真;其
11/16/2023 10:07:00 PM
机器之能
一句输入、秒出 3D 全景,自由打造你的VR世界
机器之能报道编辑:佳琪、大盘鸡用 AIGC 工具体验虚拟世界奇妙游。精美的游戏场景与卓越的视觉效果让玩家在虚拟世界中流连忘返。然而,想要搭建出想象中的画面,无疑需要消耗大量成本。相比于 2D 场景,3D 场景的生成需要原画、建模、渲染、优化等重重考验,难度更是层层累积。想要开发出一个 3D 游戏更是难上加难。不过,新的工具出现了,不需要复杂的步骤,也不需要高昂的成本,只需几笔、几句话,就能让想象成为真正的游戏环境。Blockade Labs 新推出的 Skybox AI 就能做到这一点。使用者无需设计或代码基础,也
11/16/2023 9:59:00 PM
机器之能
「OpenAI春晚」对我们意味着什么?比尔·盖茨亲笔撰文讲透了
机器之能报道编辑:吴昕这篇文章发布时间正好在OpenAI首届开发者大会(也被一些人称为开发者的春晚)之后,盖茨显然也了解发布会内容,在这篇文章中,他对GPT技术将走向何方以及将如何影响我们的生活做了最通俗易懂的解读。今天,我仍然和创办微软时一样热爱软件。软件在之后几十年里有了很大改进,但在许多方面仍然相当笨拙。在电脑上执行任何任务,必须告诉设备使用哪个应用程序。你可以用 Microsoft Word 和 Google Docs 起草商业计划书,但它们无法为你发送电子邮件、分享自拍、分析数据、安排聚会或购买电影票。即
11/16/2023 9:55:00 PM
机器之能
OpenAI CEO:GPT-5在开发中,拟进一步向微软寻求资金支持
机器之能报道编辑:吴昕公司还在开发下一代人工智能模型 GPT-5,可能比它的前辈更复杂。他没有承诺发布时间表, 不过通向 AGI 之路还需要更多的数据、资金和芯片。据《金融时报》消息,OpenAI 计划从其最大的投资者微软那里获得进一步的资金支持。因其 CEO Sam Altman 正在推进创建通用人工智能 (AGI) 的愿景——与人类一样智能的计算机软件。 Altman 在接受英国《金融时报》采访时表示,公司与微软 CEO 萨蒂亚·纳德拉的合作关系「运作得非常好」,他预计「随着时间推移,将从这家科技巨头和其他投资
11/16/2023 9:51:00 PM
机器之能
被谷歌收购后,我终于知道为什么大模型竞争落后于OpenAI了
机器之能报道编辑:sia俨然一部豪门生存指南。2018 年 3 月,一家科技教育初创 Socratic 被谷歌收购。当时这家仅 10 人的小公司打造了一款家庭作业助手(也被国内媒体称为海外「作业帮」)——学生拍下家庭作业的问题,助手就能帮助解答。除了数学,Socratic 还可以解决科学、文学、社会研究等学科的问题。「一入豪门深似海」,成为谷歌旗下一款产品后,Socratic 历经了一系列变化,并以谷歌的方式重建自身。如今,Socratic 在豪门争斗中活了下来,每年处理大约 50 亿次查询,但距离创业团队愿景中的
11/16/2023 9:49:00 PM
机器之能
Copilot 正在吞噬世界,与 ChatGPT 一起
机器之能报道编辑:SIa2023 年属于 AI (尤其是生成式 AI ),几乎每个人都或多或少尝试过大型语言模型 ( LLM ),无论是教师、政客、脱口秀甚至儿童活动支持人。凭借每周超过 1 亿的活跃用户,ChatGPT 跻身当之无愧的顶流。不过,很多日常用例只触及了可能性表面。透过表面,那些真正从事技术工作的人们正在使用广泛 AI 工具来改造产品、重构业务,或者以前所未有的方式提供客户体验.......至少,大家承诺如此。那么,真实情况是什么呢?8月,低代码开发平台独角兽 Retool 对 1,578 名技术人员
11/16/2023 9:45:00 PM
机器之能
BCG联手哈佛,史无前例验证GPT-4是把双刃剑,OpenAI总裁转发
机器之能报道编辑:吴昕比尔·盖茨说 GenAI 将彻底变革人类知识工作,但终归是一个预测。经验层面,没有人真正了解最先进的大型语言模型(如 GPT-4)的全部功能。没有人真正知道使用它们的最佳方法,或者它们在什么条件下会失败。我们手里没有使用手册。在某些任务上,GenAI 非常强大,但在其他任务上又会或完全或微妙地失败。除非经常使用 GenAI,否则你都搞不清楚自己遇到的到底是哪种情况。最近,OpenAI 总裁 Greg Brockman 转发了一项被顶尖咨询公司波士顿咨询集团( BCG )称为「史无前例」的实证研
11/16/2023 9:39:00 PM
机器之能
有人要做「AI 科学家」,每天刷上万篇论文还能提出假设,前谷歌董事长背书
机器之能报道编辑:sia当今生物学的根本瓶颈不仅仅是数据或计算能力,还有人类的局限性:没有一个科学家有时间设计数以万计的假设,阅读完每天发表的数千篇生物学论文。如果在 19 世纪之前的科学和自然主义作品集,(比如英国皇家学会档案、植物学之父泰奥弗拉斯托斯的《植物探究》、亚里士多德的《动物志》、收集标本的照片)上训练一个 LLM,它会不会像达尔文那样悟出进化论这个大胆假设?这是《大西洋月刊》记者采访 OpenAI CEO Sam Altman 时抛出的一个问题。「我想尝试一下,我相信答案是肯定的,」Altman 当时
11/16/2023 8:56:00 PM
机器之能
0.6秒出图!手机跑Stable Diffusion创下最快速度,而这仅仅是开始
如今,随着将大模型塞进手机的进程加快,普通用户也能亲自体验生成式 AI 的魅力了。2023 已经行至尾声,这一年大模型和生成式 AI 成为人工智能圈的主流趋势。自 ChatGPT 出现以来,各式各样通用、专业的 AI 大模型层出不穷,喷涌之势已经不可阻挡。随着量化、网络剪枝和知识蒸馏等模型压缩技术进步,手机等终端设备 AI 算力持续增强,大模型在云端部署之外正在向终端落地迈进。对于这场已经拉开了序幕的「终端侧革命」,芯片巨头和手机厂商们成为主力军,他们不断尝试在手机等终端设备上部署运行生成式 AI 大模型,时不时给
11/16/2023 3:53:00 PM
机器之心
微软深夜放大招:GPT-4 、DALL·E 3、GPTs免费用,自研大模型专用AI芯片
今天凌晨,微软公司召开最新一场 Ignite 大会,CEO 萨提亚・纳德拉在大会上介绍了 100 多项产品和技术的发布与更新,涉及范围非常广泛,包括应用、生产力以及安全性等多个方面。Microsoft Ignite 是该公司为开发人员和 IT 专业人士举办的年度会议,而生成式 AI 的一切无疑是本年度的最大热点。不出意外,在本次大会上,我们看到了来自 Bing Chat、专用 AI 芯片、Windows、Microsoft 365 和 Azure 等业务的最新动态。大会现场还请来了英伟达创始人黄仁勋,之后微软会将
11/16/2023 3:43:00 PM
机器之心
当韩国女团BLACKPINK进军二次元,清华叉院AI神器原来还能这么玩
看看这个 AI 生成的女团 MV 效果如何。如果你手机里有一些修图软件,你可能用过里面的「AI 绘画」功能,它通常会提供一些把照片转换为不同风格的选项,比如动漫风格、写真风格。但如今,视频也可以这么做了:这些动图来自 X 平台(原推特)网友 @CoffeeVectors 生成的一段视频。他把韩国女团 BLACKPINK 代表作《DDU-DU DDU-DU》的原版 MV 输入了一个 AI 工具,很快就得到了动漫版的 MV。完整效果是这样的:这个视频是借助一个名叫 ComfyUI 的工具来完成的。ComfyUI 是一个
11/16/2023 3:32:00 PM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind