应用
5000字干货!盘点2023年Stable Diffusion GUI工具及其创作生态
正文开始之前,这里先用一句话概括性的介绍一下 Stable Diffusion:它是一种基于深度学习的文本到图像的生成模型。能够根据文本描述创造出丰富多样且具有高质量和细节的图像。它的生成模型是通过大规模图像及其描述的数据集训练而成,所以生成的图像在保持高创造性的同时,还具有较高的高分辨率。另外因其开源性质和强大的功能在 AI 绘画领域具有重要的地位。具体的原理这里就不展开讲了,我们只需要知道它是一种能够通过文本描述生成图像的 AI 绘画工具就够了。2023 年是 AI 相关技术井喷式爆发的一年,在 AI 绘画领域
2/7/2024 8:37:17 AM
五幺六
ML Blocks!全新的节点式 AI 图像处理神器
大家好,我是花生~
之前为大家介绍过不少 AI 图像处理神器,比如 Clipdrop、Pixian、Upscayl 等,可以帮我们便捷地完成抠图、修图、高清放大等任务。最近又发现了一个新的 AI 图像处理工具 ML Blocks,非常有意思,今天推荐给大家~
相关推荐:ML Blocks
官网直达:
官方教程:
与我们常用的图像处理工具不同,ML Blocks 的工作界面是一块白板,它的各种图像处理功能则被分为一个个独立的模块,当我们想实现某种图像处理效果时,可以自己将对应的模块连接到一起形成的工作流(work
2/7/2024 8:23:11 AM
夏花生
俄罗斯小哥ChatGPT找女友:聊了5239个女生,现在订婚了
有事 AI 它是真上啊。「我向一位女生求婚,ChatGPT 已经和她交流了一年。为了走到这一步,AI 已经尝试了和 5239 名女生进行过沟通……」 来源:,社交网络上人们正在轮番向一位俄罗斯小哥送去祝福。23 岁的 Aleksandr Zhadan 是一名 AI 开发者,也是社交平台 TenChat 的一名产品经理。故事是这样开始的:GPT 除了搜索之外,还可以在配对后写入。这样在 50 次自动执行中,他可以获得 18 次配对。GPT 在没有 Aleksa
2/6/2024 9:08:00 PM
机器之心
徒手搬汽车配件,波士顿动力Atlas再进化:兄弟们,准备进厂了
在如今颇为火热的人形机器人赛道,波士顿动力是较早入局的一位选手。过去几年,Atlas 人形机器人的动态跑酷能力已经让全世界的关注,后来我们还看到 Atlas 在模拟建筑工地上搬搬扛扛。Atlas 目前仍然是一个开发平台,尚不能在现实世界中工作,一部分原因是它的液压驱动设计。不过,波士顿动力最新公布的一个演示视频表明了 Atlas 和其他人形机器人一样能够完成高难度的操纵任务,包括在装备适当的情况下操纵重物。在视频中,Atlas 稳稳抓起一个比自己手臂还粗的汽车配件,搬运到目标位置:实际上,Atlas 在很长一段时间
2/6/2024 9:00:00 PM
机器之心
胡渊鸣创业公司Meshy产品升级:文本转3D,25秒就能出预览
Meshy-2 的文本转 3D、图像转 3D、文本到纹理效果均有所提升。刚刚,胡渊鸣创业公司 Meshy 官宣了他们的第二代产品 ——Meshy-2。Meshy 是一款 3D 内容生成工具,只需一分钟,即可使用 Al 生成 3D 内容(模型)。公司联合创始人兼 CEO 胡渊鸣是计算机图形学知名学者,毕业于清华大学姚班,是 MIT 博士,也是「太极」(TaiChi)编程语言作者。具体来说,Meshy 提供三种很容易上手的使用方式,包括文本转 3D(输入文字 —— 输出 3D 模型)、图像转 3D(提供图片 —— 生成
2/6/2024 8:50:00 PM
机器之心
通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5
超越 Claude、GPT-3.5,提升了多语言支持能力。赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 AI 社区关注。新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了 GPT 3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多语言支持。阿里通义千问团队表示,相关技术也已经上线到了通义千问官网和通义千问 App。除此以外,今天 Qwen 1.5 的发布还有如下一些重点:支持 32K
2/6/2024 8:41:00 PM
机器之心
向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」
「以史为鉴,可以知兴替。」 人类的进步史,可以看作是一个不断吸取过去经验、不断推进能力边界的自我演化过程。在这个过程中,我们吸取过去失败的教训以纠正错误,借鉴成功的经验以提升效率和效果。这种自我进化的过程在我们的生活中无所不在:从如何总结经验以更好地解决工作中的问题,到如何利用规律更精确地预测天气,我们都在不断地从过去的经验中学习和进化。成功从过去的经验中提取知识并将其应用于未来的挑战,这是人类进化之路上重要的里程碑。那么在人工智能时代,AI 智能体是否也可以做到同样的事情呢?近年来,GPT 和 LLaMA 等语言
2/6/2024 8:36:00 PM
机器之心
摧毁房价的,可能是Apple Vision Pro
机器之能报道编辑:吴昕公共场合,“演技”趋于浮夸的人越来越多......辛普森一家早就预言了 Apple Vision Pro:)视频链接: Vision Pro 以来不到 48 小时,人们开始为之疯狂。一些大城市中心已经出现佩戴 Vision pro 逛街的人,甚至有人戴着它开车、上飞机旅行。有意思的是,在此之前,Meta Quest 已售出超 2000 万台(去年 11 月份的媒体数据,其中 1800 万台是 Quest 2 ),我们几乎看不到类似场景,没人戴着它出街。据媒体披露,早在苹果发布第一代苹果手机
2/6/2024 5:50:00 PM
机器之能
夸克大模型应用为先加持夸克网盘深挖相册使用场景
2024年将是大模型应用落地的爆发年,这已经成为业界共识。夸克大模型自去年11月份发布以来,结合自身业务小步快跑,在夸克App上已经落地了多个应用。最近,夸克网盘结合春节场景和大模型技术,升级几项图片处理智能工具。夸克网盘即将上线的“春节图片故事”,是为用户春节期间拍摄上传的图片自动智能筛选生成合辑。该功能除了基于时间、地点两个维度筛选,还会基于人物智能筛选,并剔除掉过亮或过暗等不符合要求的图片。夸克网盘还会利用AI算法为图片合辑智能生成文案,比如鲜花影集的文案是“花与美妙人间”。此前,AI技术还被应用在夸克网盘相
2/6/2024 5:24:00 PM
新闻助手
上海街头偶遇未来科技!机器狗和外骨骼机器人都来为2024 GDC造势
2024全球开发者先锋大会(2024 GDC)将于3月23日-24日在上海举行。在这场科技嘉年华即将拉开帷幕之际,昨日上海西岸一场别开生面的活动吸引了众多市民的目光:穿戴外骨骼机器人,牵着机器狗漫步上海街头。这一幕犹如未来科技走进现实,点燃了上海这座城市的科技热情!是的,除了敲代码,我们还可以玩转科技新宠!01 外骨骼机器人外骨骼机器人作为科幻元素的“扛把子”,是一种可以增强人体肌肉力量和精确控制能力的装置,通过硬件传感器收集人体信号,实时监测人机交互力矩,识别用户意图,并作出步态响应,特别适合重复劳作、精细操作或
2/6/2024 2:42:00 PM
新闻助手
「天工2.0」MoE大模型发布——「天工AI」国内首个MoE架构免费向C端用户开放的大语言模型应用全新问世
北京时间2月6日,昆仑万维正式发布新版MoE大语言模型「天工2.0」与新版「天工AI智能助手」APP,这是国内首个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用。用户即日起可在各手机应用市场下载「天工AI智能助手」APP,体验昆仑万维「天工2.0」MoE大模型的卓越性能。「天工2.0」是昆仑万维自去年4月发布双千亿级大语言模型「天工」以来的最大规模版本升级,其采用业内顶尖的MoE专家混合模型架构,应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。此次更新全面升级了AI
2/6/2024 2:23:00 PM
新闻助手
第一波!2024年2月精选实用设计工具合集
大家好,这是 2024 年 2 月的第1波干货合集!这一期干货合集开头是 3 个素质过硬的灵感网站,一个是关于包装,另外两个分别偏向网页领域的视觉设计和动态设计,都是相当值得收藏的网站。之后还有两款 AI 相关的工具,以及一个 3D 插画素材。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、包装设计领域顶级在线杂志
,那么这个名为 Dieline 的网站一定要收藏一手,这个2007 年创建的网站如今已经是消费产品品牌和包装领域的权威媒体。网站最初是分享创新设计和优秀设计作
2/6/2024 8:24:53 AM
陈子木
可多模态数据集成、插补和跨模态生成,中科院&树兰医院&北师大团队开发带有掩码模块的深度生成框架
编辑 | 红菜苔随着单细胞技术的发展,许多细胞特性可以被测量。此外,多组学分析技术可以同时联合测量单个细胞中的两个或多个特征。为了快速处理积累的各种数据,需要多模态数据集成的计算方法。树兰医院、中国科学院和北京师范大学的合作团队提出了 inClust ,一个用于多组学分析的深度生成框架。它建立在之前针对转录组数据所开发的 inClust 的基础上,并增加了两个专为多模式数据处理设计的掩码模块:编码器前面的输入掩码模块和解码器后面的输出掩码模块。InClust 可用于整合来自相似细胞群的 scRNA-seq 和 M
2/5/2024 6:14:00 PM
ScienceAI
王长虎:PixVerse 实测效果已超过 Pika,抖音经验让我们有足够优势
今年 4 月宣布创办爱诗科技,加入视频生成赛道后,王长虎就消失在舆论场中了。他在抖音的职业经历,让爱诗科技在视频生成的牌桌上拥有一席重要位置。2017 年,王长虎加入字节跳动开始担任 AI Lab 总监,在这个岗位上,他为抖音和 Tiktok 从 0-1 构建了视频AI能力。用王长虎本人的话说,为抖音所做的工作,让他的团队涉猎了几乎所有与视频智能相关的领域,包括且不限于数据处理、内容生成、安全问题处理、视频内容精准理解以及全方位广告场景。近期,王长虎接受了机器之心的独家专访。在采访中,王长虎详细介绍了抖音的视频智能
2/5/2024 3:25:00 PM
机器之心
罕见!苹果开源图片编辑神器MGIE,要上iPhone?
拍张照片,输入文字指令,手机就开始自动修图?这一神奇功能,来自苹果刚刚开源的图片编辑神器「MGIE」。 把背景中的人移除 在桌子上添加披萨最近一段时间,AI 在图片编辑这一应用上取得了不小的进展。一方面,在 LLM 的基础上,多模态大模型(MLLM)可以自然地将图像视为输入,并提供视觉感知响应。另一方面,基于指令的编辑技术可以不依赖于详细描述或区域掩码,而是允许人类下达指令,直接表达如何编辑以及编辑
2/5/2024 3:05:00 PM
机器之心
2亿参数时序模型替代LLM?谷歌突破性研究被批「犯新手错误」
照箭画靶,跑分自设标准?最近,谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。这篇论文的标题是「A decoder-only foundation model for time-series forecasting(用于时间序列预测的仅解码器基础模型)」。简而言之,时间序列预测就是通过分析历史数据的变化趋势和模式,来预测未来的数据变化。这类技术在气象预报、交通流量预测、商业销售等领域有着广泛的应用。例如,在零售业中,提高需求预测的准确性可以有效降低库存成本并增加收入。近年来,深度学习模型已成为预测丰富的多变量
2/5/2024 2:56:00 PM
机器之心
CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!
足式机器人领域又一次迎来创新!CMU 与 ETH Zurich 团队联合研发了一个名为 「敏捷但安全」(ABS,Agile But Safe)的新框架,为四足机器人在复杂环境中实现高速运动提供了解决方案。ABS 不仅在避免碰撞方面展现出高效能力,还在极速上达到了前所未有的 3.1 米秒!在高速机器人运动领域,实现同时兼顾速度和安全一直是一大挑战。但现在,卡内基梅隆大学(CMU)和苏黎世联邦理工学院(ETH)的研究团队带来了突破性进展。他们开发的新型四足机器人算法,不仅能在复杂环境中高速行进,还能巧妙避开障碍,真正做
2/5/2024 2:52:00 PM
机器之心
“女巴菲特”惊人预测人形机器人将于2030年进入家庭,通用AI出现,赞中国开源力量
机器之能报道编辑:sia年关将近,方舟投资(ARK Invest )2024 年《 Big ideas 》报告如期而至,深入分析了 AI 、机器人等颠覆性技术融合及其巨大的行业和经济变革潜力。作为一家专注投资颠覆性创新( Disruptive Innovation )的公司,ARK 主要投资AI、区块链、储能、机器人等技术。他们认为,这些领域将改变世界的运作方式,同时也创造了长期的投资机会。这张图表被认为很有可能是对2024年AI发展做出了预测,并被视为2024最重要的AI图表之一,正是出自方舟投资。过去几年,方舟
2/5/2024 2:37:00 PM
机器之能
资讯热榜
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
蚂蚁集团携手北医三院成立AI医疗联合实验室 打造专属AI就医助理
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
OpenAI豪赌5000亿美元估值神话:60亿股权大甩卖背后,GPT-5却遭用户冷遇
心理学家警告:与 AI 聊天可能导致严重心理健康问题
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
OpenAI加速推进GPT-6开发,奥尔特曼承诺打造"有记忆"的个性化AI助手
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
Stable Diffusion
AI新词
芯片
LLM
蛋白质
腾讯
开发者
苹果
生成式
Claude
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
RAG
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视频生成
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用