资讯列表
ComfyUI 进阶篇!完整梳理 ComfyUI 的核心节点(一)
前言:
学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理,并详细解释每个参数。希望大家在学习过程中培养自我思考的能力,真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结,才能在面对复杂的工作流时游刃有余。祝大家学习顺利,早日成为 ComfyUI 的高手!一、Load Check
7/12/2024 1:51:37 AM
AI实战
三星 Galaxy AI 新增“作业帮手”功能,可教学生解数学题
在昨天的发布会上,三星不仅发布了两款全新折叠屏手机 Galaxy Z Fold 6 和 Galaxy Z Flip 6,还着重展示了 Galaxy AI 人工智能功能。三星自豪地宣布,到今年年底,搭载 Galaxy AI 的设备将达到 2 亿台。外媒 Sammobile 称,这是一个巨大的成就,要知道苹果尚未将任何近期发布的人工智能功能应用到手机上。而三星仍在不断推出新功能,其中一项可以帮助孩子们完成作业。据AI在线了解,“圈选搜索”是 Galaxy AI 的核心功能之一,这个功能允许用户通过长按虚拟主页键后圈选屏
7/11/2024 9:47:36 PM
远洋
商汤发布“东风”泰语大模型:全球首次实现可在泰 / 中 / 英环境下高效工作
商汤科技官方公众号今日晚间发文宣布,7 月 10 日,商汤联合泰国 DTGO 集团及旗下 Quinnnova 共同发布“东风”泰语大模型(DTLM)。“东风”号称全球首个能在泰文、中文、英文三种语言环境下高效工作的 AI 大语言模型,将商汤的基模型和算力优势与 DTGO 的泰国语言文化优势相结合,提供本地化的生成式 AI 体验。其能够实现自然、流畅的实时对话、文本阅读理解等功能。官方表示,“东风”来自在中泰两国都深受欢迎的中国古典名著《三国演义》,寓意两国自古以来的文化交流,借生成式 AI 时代的东风进一步发扬光大
7/11/2024 8:14:41 PM
清源
人形机器人将当上银行“大堂经理”,国内首个场景训练基地在上海浦东启用
据“上海金融官微”公众号,国内首个人形机器人银行大堂经理场景训练基地在建行上海浦东分行正式启用。银行大堂经理场景训练基地是业内首个商业银行场景应用训练基地,其首次采用开放式的创新训练模式,有助于加快提升人形机器人的能力,推动关键技术、重点产品和重点场景应用。据介绍,此次参训的机器人拥有高度仿生的躯干构型和拟人化的运动控制,结合视觉、听觉、语音等人工智能技术,科学家可以通过具身智能的推理和规划等对其进行训练。目前,该银行已对智能人形机器人开展银行大堂业务咨询、业务分流、智慧柜员机个性化操作指南、反欺诈宣传等面向客户的
7/11/2024 6:03:37 PM
清源
落幕再谈,「WAIC 2024」的一些细节与预判
机器之能报道作者:姜菁玲在这次的世界人工智能大会上,百度CEO李彦宏提到的一句话吸引了很多关注。他说,没有应用,光有基础模型,不管是开源还是闭源都一文不值。「大家不要去卷模型了,要去卷应用」。这句话虽然有些极端,但是在当下的阶段有几分代表性。正如这句话所表达的,如果说去年的WAIC上,各家厂商还在展示自己的大模型本身实力,今年的WAIC的主要观赏点则已经集中在应用上。一众AI厂商从去年的「占位」秀,来到了新阶段。应用成为新赛点大模型厂商应用大规模试错技术本身是抽象的,但应用却是具象的。在今年的WAIC现场,凝聚在观
7/11/2024 5:19:00 PM
机器之能
韩国美妆业拥抱 AI:机器人调配专属粉底,还能帮你选口红色号
据路透社报道,韩国美妆巨头爱茉莉太平洋的人工智能 (AI) 美容实验室最近客似云来。在这里,机器人可以根据顾客皮肤状况调配专属粉底,还能推荐最适合顾客的口红色号。32 岁的顾客 Kwon You-jin 在体验了定制护肤品服务后表示:“每个人的肤色都独一无二,但通常只能买到市面上最常见的色号。通过 AI 生成的数据更深入了解自己的肌肤状况,并能亲眼目睹前后对比,这太棒了!”在收到一份由 AI 生成的皮肤状况报告后,一台机器人随即为她调配了完美匹配其肤色的粉底液。AI在线注意到,如今,越来越多的化妆品公司开始拥抱 A
7/11/2024 5:16:23 PM
远洋
18个月326项能力,这家大厂猛猛上新生成式AI,如今纯靠Prompt就搞定企业级应用了
构建生成式 AI 应用,现在只需要几分钟。「生成式 AI 的半衰期只有六个月,」亚马逊云科技全球 AI 产品副总裁 Matt Wood 说道。2024 开启下半年,人们发现,生成式技术和落地之间的距离,已经不能用「远」或「近」完全概括。狂热的百模大战之后,即使生成式 AI 技术展现出了前所未有的能力,为何一部分企业还没有投身到新技术的变革之中?技术门槛和高昂的研发投入、应用成本是它们保持谨慎态度的主要影响因素。今天凌晨,亚马逊云科技给全世界带来了解决方案。一系列生成式 AI 技术的重磅发布,将全球最先进的大模型技术
7/11/2024 4:54:00 PM
机器之心
GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了
字节跳动大模型团队成果 Depth Anything V2 现已被苹果官方收入 Core ML 模型库。本文介绍了 Depth Anything 系列成果的研发历程、技术挑战与解决方法,分享了团队对于 Scaling Laws 在单一视觉任务方面的思考。值得一提的是,Depth Anything V1 与 V2 两个版本论文一作是团队实习生。近日,字节跳动大模型团队开发的成果 Depth Anything V2 ,入选苹果公司 Core ML 模型库,目前已呈现在开发者相关页面中。Depth Anything 是一
7/11/2024 4:49:00 PM
机器之心
AI 根据声音内容帮照片“对口型”,蚂蚁集团开源 EchoMimic 项目
蚂蚁集团 10 日开源了名为 EchoMimic 的新项目,其能够通过人像面部特征和音频来帮人物“对口型”,结合面部标志点和音频内容生成较为稳定、自然的视频。该项目具备较高的稳定性和自然度,通过融合音频和面部标志点(面部关键特征和结构,通常位于眼、鼻、嘴等位置)的特征,可生成更符合真实面部运动和表情变化的视频。其支持单独使用音频或面部标志点生成肖像视频,也支持将音频和人像照片相结合做出“对口型”一般的效果。据悉,其支持多语言(包含中文普通话、英语)及多风格,也可应对唱歌等场景。 AI在线附相关链接:项目地址: G
7/11/2024 4:48:41 PM
清源
这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试
四大 VLM,竟都在盲人摸象?让现在最火的 SOTA 模型们(GPT-4o,Gemini-1.5,Sonnet-3,Sonnet-3.5)数一数两条线有几个交点,他们表现会比人类好吗?答案很可能是否定的。自 GPT-4V 推出以来,视觉语言模型 (VLMs) 让大模型的智能程度朝着我们想象中的人工智能水平跃升了一大步。VLMs 既能看懂画面,又能用语言来描述看到的东西,并基于这些理解来执行复杂的任务。比如,给 VLM 模型发去一张餐桌的图片,再发一张菜单的图片,它就能从两张图中分别提取啤酒瓶的数量和菜单上的单价,算
7/11/2024 4:39:00 PM
机器之心
ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star
同样是图生视频,PaintsUndo 走出了不一样的路线。ControlNet 作者 Lvmin Zhang 又开始整活了!这次瞄准绘画领域。新项目 PaintsUndo 刚上线不久,就收获 1.4k star(还在疯狂涨)。项目地址:,用户输入一张静态图像,PaintsUndo 就能自动帮你生成整个绘画的全过程视频,从线稿到成品都有迹可循。绘制过程,线条变化多端甚是神奇,最终视频结果和原图像非常相似:我们再来看一个完整的绘画过程。PaintsUndo 先是用简单的线条勾勒出人物主体,然后画出背景,涂上颜色,最后精
7/11/2024 4:30:00 PM
机器之心
CVPR'24 Highlight|一个框架搞定人物动作生成,精细到手部运动
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文作者蒋楠是北京大学智能学院二年级博士生,指导教师朱毅鑫教授,与北京通用人工智能研究院黄思远博士联合开展研究工作。他的研究重点是人-物交互理解和数字人的动作生成,并于ICCV,CVPR和
7/11/2024 4:24:00 PM
机器之心
视频生成新公司!马尔奖、清华特奖得主曹越创业,「风投女王」押注
继月之暗面之后,眼光毒辣的「风投女王」徐新又投了一家 AIGC 创业公司。近期,有关今日资本裁撤一级市场团队的传言在业内引发关注。7 月 10 日晚,今日资本集团总裁徐新亲自在微信朋友圈辟谣,并透露了一则投资消息:2024 年 5 月,今日资本领投了 SandAI 的早期融资轮。据 IT 桔子数据,北京 SandAI 成立于 2023 年,是一家志在「做世界有影响力的事情」的 AI 创业公司。目前,SandAI 主要聚焦于类似 OpenAI Sora 的视频生成技术,为用户提供高效、便捷的视频生成服务。公司创始人兼
7/11/2024 4:18:00 PM
机器之心
首届AI奥数竞赛方案公布:4支获奖队伍,竟都选择国产模型DeepSeekMath
获胜的 AI 数学奥林匹克模型出炉!几天前,随着榜单的公布,大家对全球首届 AI 数学奥林匹克竞赛(AIMO)进步奖的讨论量居高不下。这次比赛共有 5 个团队胜出,获得第一名的是 Numina 的团队,CMU_MATH 位列第二,after exams 暂居第三,codeinter、Conor #2 团队分别拿到第四、第五的成绩。 图源:,曾让陶哲轩感到惊讶。当时官方只公布了获奖名单,并未透漏背后模型的更多信息。大家都在好奇,获得冠军的队伍到底是用了哪种模型?
7/11/2024 4:11:00 PM
机器之心
三星确认今年将推出 AI 升级版 Bixby,由自研大语言模型提供支持
三星确认 Bixby 将很快获得人工智能升级。在 Galaxy Z Flip 6 和 Galaxy Z Fold 6 发布后,三星移动部门 CEO TM Roh 在接受 CNBC 采访时表示,公司将在今年晚些时候发布升级版 Bixby,并由三星自家的大语言模型(LLM)提供支持。Roh 表示:“我们将通过应用生成式人工智能技术来提升 Bixby 的能力。”几个月前,三星推出过名为“Samsung Gauss”的自研 LLM。此前曾有报道称三星正在研发升级版 Bixby,但这是三星首次确认相关消息,并透露了大致发布时
7/11/2024 3:59:02 PM
远洋
帮你把草图变成完整画作,三星 One UI 6.1.1 引入“手稿到图像”等 AI 功能
三星在昨晚的 Galaxy Unpacked 发布会上带来了 Galaxy Z Fold6 / Flip6 等手机新品,两款新机都将内置基于 Android 14 的 One UI 6.1.1。据悉,在此次更新中,三星还带来了一系列基于 Galaxy AI 的新功能,预计后期会登陆其他支持的 Galaxy 系列设备。据介绍,三星此次引入了名为“手稿到图像(Sketch To Image)”的新功能。用户可预先在手机上使用 S-Pen 或徒手绘制草图,Galaxy AI 就会通过 AI 和机器学习创建图形元素,使草图
7/11/2024 3:58:09 PM
清源
“云计算一哥”亚马逊深夜放大招:几分钟纯靠 Prompt 打造一个 App
现在开发一个 App 需要多久?“云计算一哥”亚马逊云科技,深夜给出了一个新标准 —— 只需三步,几分钟,纯靠自然语言和鼠标“点点点”即可。话不多说,直接展示!第一步:说出你的想法我们首先可以直接用自然语言描述一下想要打造 App 的需求,例如:为我的团队创建一个应用程序,可以通过一个表单提交项目审批。这个表单将接受详细信息,并允许用户上传相关文件。静候几秒之后,这个 AI 便会根据你的需求,分析总结 App 的用例、流程和关键特征等信息。在确认没问题之后,我们就可以点击右下角的“生成 APP”按钮。第二步:编辑
7/11/2024 2:50:30 PM
清源
精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作
编辑 | 枯叶蝶蛋白质是生命的基石,参与几乎所有的生物过程。了解蛋白质如何相互作用对于解释细胞功能的复杂性至关重要,对药物开发和疾病治疗也具有重要意义。洛桑联邦理工学院(École Polytechnique Fédérale de Lausanne,EPFL)的 Anne-Florence Bitbol 团队提出了一种配对相互作用的蛋白质序列的方法,该方法利用了在多个序列比对上训练的蛋白质语言模型的强大功能;它对于小型数据集表现良好,它可以通过监督方法改进蛋白质复合物的结构预测。该研究以「Pairing inte
7/11/2024 11:53:00 AM
ScienceAI