应用
金出武雄和他的中国学生们,计算机视觉五十载风云
突破性的成就对金出武雄来说并不新鲜。 自上世纪八十年代以来,金出武雄(Takeo Kanade)一直是卡内基梅隆大学的基础。 他发起、领导、合作了几个主要的自主移动机器人和各种应用系统,譬如该校的无人驾驶汽车(NavLab)、自主直升机(Robocopter)、计算机辅助髋关节置换手术系统(HipNav)和视频监控系统(VSAM),只要是与计算机视觉技术的相关项目,总能看到金出武雄的名字。
1/31/2024 11:09:00 AM
吴彤
如何用Midjourney轻松搞定微信红包封面设计?案例来了!
在这篇文章中,我们将深入探讨如何利用 Midjourney 来设计微信红包,让你的红包更具个性和吸引力。通过学习和应用这一技术,你将能够轻松地为自己的红包设计出独特的封面,让你的红包在众多传统红包中脱颖而出,成为一道亮丽的风景线。同时,我们还将分享一些实用的技巧和建议,帮助你更好地运用 Midjourney 进行设计,让你的设计之路更加顺畅。让我们一起踏上这场充满创意与惊喜的设计之旅,探索 AI 技术与设计领域的无限可能。
更多红包教程:在这个快速发展的数字化时代,人工智能技术已经渗透到了我们生活的方方面面,成为了
1/31/2024 7:08:43 AM
团队58UXD
Stable Diffusion ComfyUI 基础教程(八):如何使用 Controlnet
一、前言
终于到了最激动人心的时刻,我们使用 Stable Diffusion 最重要的就是他的可控性,其中 Controlnet(控制网络)的作用居功至伟,它可以引入更多的条件来让我们出图更加可控。
往期回顾:在最开始之前我们需要安装 Controlnet 预处理器插件以及下载 Controlnet 模型:
①Controlnet 预处理器插件:插件地址:
如果安装后,运行 ComfyUI 显示无法导入插件
请运行“ComfyUI\custom_nodes\comfyui_controlnet_aux”目录下的
1/31/2024 6:35:11 AM
搞设计的花生仁
这款国产免费编程工具火了!清华博士团队开发,响应延迟短、准确率高
在过去一年中,随着大模型技术的广泛应用,我们已经见证了 AI 如何深刻地改变着我们的工作方式。在程序编写领域,AI 的介入同样将为程序员们带来前所未有的便利。近日,非十科技推出了一款基于自研代码大模型打造的 AI 代码助手 ——Fitten Code,它可以帮助程序员更迅捷、更准确、更高质量地完成编码任务,大幅提升编码效率,并且向用户免费开放使用!产品官网地址: Code 自上次发布以来迅速走红。开发团队日以继夜地工作,带来了功能、性能和速度上的重大升级。此外,还增加了对更多编辑器的支持,为开发者们提供了全新的福利
1/30/2024 3:16:00 PM
机器之心
大模型时代,南大周志华埋头做学件,最新论文上线
机器学习在众多领域取得巨大成功,海量的优质机器学习模型被不断开发。但同时,普通用户想要得到适合自己任务的模型并不容易,更不用说从头开始构建新模型了。南京大学周志华教授提出的「学件」范式通过模型 规约的思路构建学件市场(现称学件基座系统),让用户根据需求从中统一地选择和部署模型。如今学件范式迎来了首个开源的基础平台 —— 北冥坞(Beimingwu)。在经典的机器学习范式中,为一项新任务从头训练高性能的模型需要大量的高质量数据、专家经验和计算资源,无疑耗时耗力且成本高昂。此外,复用已有的模型也存在很多问题,比如很
1/30/2024 3:10:00 PM
机器之心
马斯克:Neuralink首次将芯片植入人体,产品已在路上
第一个商用产品名字有了:Telepathy。马斯克的脑机接口公司 Neuralink,终于开始人体临床研究了。今天早晨,伊隆・马斯克宣布了一个重要消息。根据他在推特上的说法,Neuralink 已在上周日首次将脑机接口设备植入了一个人体,患者「恢复良好」。这是 Neuralink 在去年获得 FDA 批准开展人体临床研究,于秋季开始招募患者后进行的首次人体临床试验。也是 Neuralink「脑后插管」技术通往商业化道路上的最新一步。与 SpaceX 火箭、特斯拉电车相比,马斯克旗下的脑机接口创业公司 Neurali
1/30/2024 3:05:00 PM
机器之心
小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制
功能更强大的 Code Llama 70B 模型来了。今天,Meta 正式发布 Code Llama 70B,这是 Code Llama 系列有史以来最大、性能最好的型号。我们正在开源一个全新的改进版 Code Llama,包括一个更大的 70B 参数模型。编写和编辑代码已成为当今人工智能模型最重要的用途之一。事实证明,编写代码的能力对于人工智能模型更严谨、更合理地处理其他领域的信息也非常重要。我为这一进展感到自豪,并期待着将这些进展纳入 Llama 3 和未来的模型中。Code Llama 70B 提供与之前发布
1/30/2024 2:52:00 PM
机器之心
ICLR 2024|把图像视为外语,快手、北大多模态大模型媲美DALLE-3
动态视觉分词统一图文表示,快手与北大合作提出基座模型 LaVIT 刷榜多模态理解与生成任务。当前的大型语言模型如 GPT、LLaMA 等在自然语言处理领域取得了显著进展,能够理解和生成复杂的文本内容。但你是否想过,如果能够将大语言模型这强大的理解和生成能力迁移到多模态数据上,就可以轻松理解海量的图像与视频,并辅助创作图文并茂的内容。近期,来自快手和北大合作的最新多模态大模型 LaVIT, 正在让这个想法逐步变为现实。论文标题:Unified Language-Vision Pretraining in LLM wi
1/30/2024 2:48:00 PM
机器之心
AI Infra 往事之异构计算篇:吴韧与他的学生们
2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院(IDL),此时正值他五十知天命的年纪。 吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。 2012年深度学习崛起前后,多年在AI领域的研究和工作经验让他坚信:这一轮人工智能竞争其实比拼的是计算能力。
1/30/2024 2:35:00 PM
张进
采摘场面如此魔性,难怪比尔·盖茨也要给它点赞
机器之能报道编辑:sia2023 年,位于意大利东北部艾米利亚-罗马涅波河畔的城市费拉拉迎来苹果收获季节。在意大利三大顶尖种植基地 Vivai Mazzoni 田园诗般的果园里,八个会飞的采摘机器人正熟练地收获苹果。2023 年苹果收获季节,在意大利费拉拉的 Mazzoni 集团果园机器人自如盘旋在果树旁,在 AI 和计算机视觉算法帮助下精确评估每个苹果的大小和颜色,然后用高吸力臂毫不费力地摘下完全成熟的果实,轻轻地放入传送带,滚入收集箱。系统由八个自动飞行机器人组成,连接到自动传送带上,每 2.5 秒采摘并存放一
1/30/2024 11:50:00 AM
机器之能
第五波!2024年1月精选实用设计工具合集
大家好,这是 2024 年 1 月的第5波干货合集!这一期干货合集中有一些非常稀有的东西,比如来自瑞士工作室的在线字体设计工具,也有非常有用的工具,比如免费的 3D 角色素材和免费的 3D 材质库,当然还有非常新的工具,比如可以调整照片内容的 AI 工具。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、在线字体排版设计网站
、包豪斯,对于相关的设计感兴趣,那么很大概率你会爱上这个网站。这其实是来自瑞士的独立设计工作室 Studio Feixen 的网站功能的一部分,这个生
1/30/2024 2:24:51 AM
陈子木
Midjourney 再更新!V6 模型支持外绘拓展与局部重绘了!
大家好我是花生~
上周末 Midjourney 又更新了一波新内容,一是 V6 版本增加了 3 个功能,二是 Alpha 内测网站调低了进入门槛,用户只要生成图像超过 5000 张就能体验网站内的图像生成功能,今天就为大家详细介绍一下相关内容~
相关推荐:一、V6 功能完善
此次更新最值得关注的就是 Zoom Out 外绘拓展、Pan 平移外绘和 Vary (Region) 局部重绘 3 种图像编辑功能终于能在 V6 版本中使用了,用法还是和之前也是一样的:先将图像放大,然后通过底部的按钮进行对应操作。官方提到 V
1/30/2024 1:14:20 AM
夏花生
深度解析!ControlNet模型的工作原理与应用场景(附案例解析)
一、川言川语
大家好,我是言川。本期文章是 2024 年的第一篇文章,也是 2023 年农历的最后一篇文章。截至这篇文章完成时,距离春节也只有最后一周的时间了,我无法单独向支持我的朋友们传达祝福之意。所以在本篇文章的开头,向大家说一些祝福之词:
2024 年,祝大家在新的一年里事业有成,大展宏图,前程似锦。同时在事业之外,祝大家健康、快乐以及幸福。
2024 年,辰龙年,祝大家龙飞凤舞,事业腾飞;祝大家金龙献瑞,好运连连;祝大家龙年吉祥,幸福安康。
最后,新年快乐,准备准备回家吃饺子咯~二、生成式 AI 回顾
开始
1/30/2024 12:11:46 AM
言川Artie
基于量子辅助深度学习的逆向分子设计
作者 | 康奈尔大学 Fengqi You 团队编辑 | ScienceAI康奈尔大学Fengqi You教授团队,通过结合量子计算(QC)与生成式AI的优势,提出了一个新颖的逆向分子设计框架。该框架利用QC辅助的深度学习模型来学习和模拟化学空间,从而预测并生成具有特定化学性质的分子结构。生成式AI在此过程中起着核心作用,它能够从大量的分子数据中学习潜在的结构-性质关系,并生成新的分子候选物,这些分子不仅符合预设的性质,还考虑到合成的可行性。量子计算的加入则为这一过程提供了高效的计算能力和优化算法,克服了传统计算机
1/29/2024 5:56:00 PM
ScienceAI
王延峰:迫切需要重新审视我国大模型科研组织模式
ChatGPT 掀起的通用人工智能热潮仍在快速向前,产业竞争关键要素日渐明确,中美在通用人工智能领域的竞争也进入更高的战略层面。上海是中国人工智能发展最先进的城市之一。在 1 月 26 日结束的上海市第十六届人民代表大会第二次会议上,第十六届上海市人大代表王延峰教授提交了《关于上海加快建设具有全球影响力的大模型创新集聚区的建议》(下称《建议》)。王延峰建议,上海应当集中精力,抢抓发展机遇,加快建设具有全球影响力的大模型创新集聚区,避免中美大模型方面的差距进一步拉大。王延峰是上海人工智能实验室主任助理、上海交通大学人
1/29/2024 3:22:00 PM
机器之心
500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了
你可以说我「借鉴」,但我是真开源。来了,贾扬清承诺的 Lepton Search 开源代码来了。前天,贾扬清在 Twitter 上公布了 Lepton Search 的开源项目链接,并表示任何人、任何公司都可以自由使用开源代码。项目链接:,你也可以用不到 500 行 Python 代码构建自己的对话搜索引擎了。今天,Lepton Search 又登上了 GitHub trending 榜单。此外已经有人将这个开源项目用来构建自己的 Web 应用程序了,并表示质量非常高,与 AI 驱动的搜索引擎 Perplexity
1/29/2024 3:17:00 PM
机器之心
哈工大联合快手提出CogGPT:大模型也需要认知迭代
在认知科学领域,人类通过持续学习改变认知的过程被称为认知迭代(Cognitive Dynamics)。形象地说,认知迭代就像是我们大脑的「软件更新」过程,手机应用通过不断的更新来修复 bug 和增加新功能,我们的大脑也通过不断学习新知识、经验,来改善和优化思考方式。从我们判断感冒吃什么药效果好,到一代代数学家如何证明费马大定理,无论是个人的心智发展还是人类文明的进步,认知迭代都扮演了不可或缺的角色。如今,像 GPT-4 等大型语言模型(Large Language Models,LLMs)为通用人工智能(Artif
1/29/2024 2:27:00 PM
机器之心
OpenAI新模型用的嵌入技术被网友扒出来了
学起来吧。前几天,OpenAI 来了一波重磅更新,一口气宣布了 5 个新模型,其中就包括两个新的文本嵌入模型。我们知道,嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使得机器学习模型和其他算法更容易理解内容之间的关联,也更容易执行聚类或检索等任务。使用更大的嵌入(比如将它们存储在向量存储器中以供检索)通常要比更小的嵌入消耗更高的成本、以及更多的算力、内存和存储。而 OpenAI 此次推出的两个文本嵌入模型分别是更小且高效的 text-embedding-3-small 模型和更大且更强大的 text-embe
1/29/2024 11:36:00 AM
机器之心
资讯热榜
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
蚂蚁集团携手北医三院成立AI医疗联合实验室 打造专属AI就医助理
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
OpenAI豪赌5000亿美元估值神话:60亿股权大甩卖背后,GPT-5却遭用户冷遇
心理学家警告:与 AI 聊天可能导致严重心理健康问题
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
OpenAI加速推进GPT-6开发,奥尔特曼承诺打造"有记忆"的个性化AI助手
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
Stable Diffusion
AI新词
芯片
LLM
蛋白质
腾讯
开发者
苹果
生成式
Claude
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
RAG
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视频生成
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用