应用
秒杀 Canny ! 一文详解2款 ControlNet 新模型 Anyline & Mistoline
大家好,这里是和你们一起探索 AI 的花生~
最新 ControlNet 有两款新模型非常热门,一个是用于提取图像线稿的预处理模型 Anyline,一个是 SDXL 线条类控制模型 Mistoline。它们不仅单独的功能强于目前的 canny、lineart、softedge 等模型,组合在一起更是可以快速准确地处理超复杂的图像,今天就为大家详细介绍一下它们的特点和用法。
相关推荐:一、Anyline
Anyline 是一款新的线条类预处理模型,可以从大部分图像中快速提取高精度的线稿图。与其他常用的线条预处理器相比
5/24/2024 12:52:42 AM
夏花生
回望 AI 大爆炸的前夜,他们是这样预测未来的
这篇文章发布于 2022 年 9 月,在 GPT-3.5 即将引起全球关注的前夜。如今 AI 的生态日新月异,两年后的我们再回顾这篇文章时,仍能深切感受到,最初的探索者对生成式 AI 未来发展所构想的蓝图如此清晰而具有前瞻性。在大模型应用日益丰富多彩的当下,这篇文章可以是理解和探索生成式 AI 潜力的宝贵资料。
AI 最新动态:人类擅长分析事物,机器则更胜一筹。无论是欺诈或垃圾邮件检测、预测快递的预计到达时间,还是预测下一个要向您展示的 TikTok 视频,机器都能从数据中找出模式,以满足多种用途的需要。它们在这些
5/24/2024 12:05:56 AM
潮矽
AI应用实战!如何用 Stable Diffusion 提高设计效率?
继去年发表了多篇赶集视觉 AIGC 探索的文章后,本期首次呈现 AIGC 能力在大型项目中的设计过程与创新应用,我们期待与大家深入交流和共同学习。一、前言
回顾 2024 年赶集新春招聘活动的设计项目中,我们采用了创新手段,将春节文化与招聘场景巧妙融合,提升了用户的求职体验和视觉感受。同时,本篇文章还将详细探讨如何借助 AIGC 技术打造独树一帜的视觉创意设计,为求职者打造一个充满吸引力的招聘活动。二、主题内容设定
1. 视觉主题设定
随着 2024 年——甲辰龙年的到来,龙象征的形象成为本次活动设计的焦点。经过深
5/24/2024 12:01:57 AM
团队58UXD
赛诺菲与OpenAI、Formation Bio合作,加速AI药物发现
编辑 | X5 月 21 日,法国制药公司赛诺菲(Sanofi)宣布与 OpenAI 和美国生物技术公司 Formation Bio 建立合作伙伴关系,以加速人工智能在药物开发中的应用。此次合作将改变制药行业的游戏规则。通过结合数据、人工智能技术和药物开发方面的专业知识,他们的目标是彻底改变新药的发现和推向市场的方式。赛诺菲首席执行官 Paul Hudson 表示:「这次合作是我们成为一家以人工智能为动力的制药公司的重要一步。」OpenAI 首席运营官 Brad Lightcap 表示:「AI 在加速药物开发方面具
5/23/2024 7:01:00 PM
ScienceAI
Nature回应:为什么在没有代码的情况下发布AlphaFold3?
编辑 | 枯叶蝶近期,AlphaFold3 在《Nature》杂志发布,但是它没有开源,因此引来了学界的一些争议。《Nature》官方对此做出了回应,以下为回应内容。蛋白质结构预测算法 AlphaFold 的最新迭代自发布以来,引起了人们的极大兴趣。2024 年 5 月上旬,《Nature》杂志上发表了一篇论文,介绍了 AlphaFold3。与其前身 AlphaFold2 不同,AlphaFold3 不仅可以预测蛋白质复合物的结构,还可以预测蛋白质何时与其他类型的分子(包括 DNA 和 RNA)相互作用。人工智能工
5/23/2024 7:00:00 PM
ScienceAI
天猫精灵 X6 智能音箱正式发布:“天空音”布局,歌手周深为品牌代言人
5 月 23 日,阿里巴巴旗下人工智能品牌天猫精灵于杭州天目里举办了新品品鉴会,正式发布了天猫精灵 X6 智能音箱新品。据官方介绍,天猫精灵 X6 智能音箱是天猫精灵年度扛鼎之作,其独创了“天空音”布局,采用 1.1 声学架构,通过独立高音单元的天空方向扬声设计,构建出天籁之音回荡的穹顶效果。同时,天猫精灵 X6 智能音箱采用的 Hi End 音响在高音单元上采用的散热磁流体材料,能够使高音单元更灵敏,音质更清晰。图片来源:IT之家在音质表现上,天猫精灵 X6 智能音箱搭载了 Hi-Fi 级高保真数字功放,拥有 1
5/23/2024 6:51:13 PM
马卡
第一个 iPhone 刺客,倒下了
机器之能报道编辑:Sia旗舰产品推出才一个月,创始人就想卖掉公司。败局来得太快。推出 AI Pin 仅一个月后,Humane 试图为其业务寻找下家。就在上周, AI Pin 还接入了 GPT-4o,改善产品体验。据彭博社援引匿名消息人士的话报道,Humane 正在寻找下家,出售价格在 7.5 亿美元到 10 亿美元之间。消息称,出售过程处于早期阶段。公司已为此聘请了一名财务顾问,收购是否成功还不确定。7.5 ~10 亿美元的报价,被一些人嘲笑为「彻头彻尾的搞笑。」Humane 至今从未透露过任何一轮融资的官方估值,
5/23/2024 6:49:00 PM
机器之能
AI生图、扩图、去水印……全免费!「Sora 平替」Viva 玩了把大的
机器之能报道编辑:山茶花通通免费!AI功能「大杂烩」Viva,抢了美图秀秀的饭碗。话接上回。(查看详情请移步:「Sora 平替」来了!一键生成 5 秒视频,还免费,我们实测:很顶!)国内的美图秀秀有 AI 视觉设计「大杂烩」之称,只要是市面上比较火的图片处理功能,都能在美图秀秀上找到身影。而 Viva 堪称国外版「美图秀秀」,除了视频生成功能外,还有文生图、图生文、智能抠图、AI 扩图等,而且是把免费进行到底!文生图:Midjourney 被「偷家」Viva 野心不小,既想和 Sora 一较高下,又要抢 Midjo
5/23/2024 6:48:00 PM
机器之能
北京:推进数字疗法、AI 辅助治疗等产品研发应用,支持医疗大模型开发、落地
北京市人民政府办公厅今日印发《北京市加快医药健康协同创新行动计划(2024-2026 年)》,提到人工智能技术、大模型、算力等一系列内容。IT之家汇总部分重点任务:实施医疗大数据共享与应用。建设全市共享的门急诊、住院、体检、科研等电子病历体系。推动标准化、信息化临床研究数据共享,明确数据脱敏标准,打通医院之间数据链接。推动检验结果、医疗影像在全市三级医院实现互联互通互认。推动医院开展医疗大数据的登记、评估、流通,拓展在创新研发端应用。推动临床样本数字化管理使用。建立面向全市开放、充分保护隐私的临床样本共享信息系统和
5/23/2024 5:52:08 PM
清源
斯嘉丽・约翰逊控诉 ChatGPT 复制其声音,OpenAI 文件显示并非故意模仿
好莱坞明星斯嘉丽・约翰逊此前指控人工智能公司 OpenAI 的聊天机器人 ChatGPT 的 “Sky” 语音上复制了她的声音。据《华盛顿邮报》披露的 OpenAI 内部文件显示,该公司并没有刻意模仿斯嘉丽的声音。图源 Pexels文件显示,为“Sky”配音的实际上是另一位演员,而且该演员的聘用时间早于 OpenAI 邀请斯嘉丽为 ChatGPT 配音数月。参与“Sky”配音创作的多位人员也证实,OpenAI 在寻找配音演员时并没有要求声音接近斯嘉丽。文件显示,OpenAI 在招聘启事中对配音演员的描述包括:非工会
5/23/2024 4:50:34 PM
远洋
初创公司 BrainBridge 提出全球首个“人头移植机”概念,目标 8 年内推出
神经科学和生物医学初创公司 BrainBridge 当地时间 21 日宣布,该公司已开发出一种用于进行头部移植的人工智能机械化系统,并演示了其工作机制。据介绍,这一概念可将头部移植到脑死亡捐赠者的身体上,还能保持被移植者的记忆、认知能力和意识。IT之家注:身体部分来自脑死亡患者,头部则是来自身患绝症或瘫痪等疾病的患者。研究人员表示,该技术还适用于阿尔茨海默症和帕金森等神经系统疾病患者。该公司表示这种概念“技术上可行”,利用高速机器人系统,可防止脑细胞退化,并确保头与身体无缝兼容。“整个过程由实时分子级成像和人工智能
5/23/2024 4:41:57 PM
清源
5.31·上海丨华东师大上海人工智能金融学院正式成立!MIT教授Max Tegmark与5 位院士、12 位 人工智能金融顶尖专家齐聚上海,共探 AI-Fin 新机遇
近年来,AI、特别是机器学习,已经在金融数据分析、风险预估、投资管理等任务中实现了效率、准确率的提升,为银行、保险、基金、券商等机构的业务转型提供了强劲动能。 随着大模型概念的持续走热,「金融大模型」也成为行业热议话题。 然而,不同于工业、建筑等传统行业大刀阔斧地进行智能化升级,金融与 AI 的结合在数据合规、隐私安全、市场监管等方面面临着更加严苛的挑战,需要政产学研多方协同推进。
5/23/2024 3:03:00 PM
我在思考中
编写脚本、生成和优化视频广告,TikTok 推出 Symphony AI 套件
感谢TikTok 宣布推出“TikTok Symphony(交响乐)”AI 套件供品牌方使用,该套件将帮助营销人员编写脚本和制作视频。IT之家从 TikTok 官方获悉,61% 的用户在 TikTok 上直接购物或在看到广告后购买,59% 的用户使用 TikTok 决定下载哪个游戏,52% 的用户甚至因为看到的 TikTok 内容而研究汽车。“TikTok Symphony”套件包含一个名为“Symphony Creative Studio(创意工作室)”的 AI 视频生成器。TikTok 称,该工具只需广告商提供
5/23/2024 11:34:53 AM
沛霖(实习)
彩云科技DCFormer模型架构发布,效率是Transformer的两倍!
自2017年Transformer架构诞生之后,到现在为止其仍然是人工智能领域研究和应用的基础,鲜少有团队能够在最底层架构上进行一些变革和开发且做出较大的成效。 一方面是由于Transformer确实好用;另一方面,在最底层上做突破并非易事。 然而,彩云科技是那个反共识者。
5/23/2024 11:27:00 AM
王悦
AI音乐创作神器Suno再融1.25亿美元,超千万用户喜迎上新
机器之能报道编辑:山茶花4个学霸决心改造音乐圈。风靡一时的 AI 音乐创作神器 Suno 有了融资新进展。5 月 21 日,Suno 宣布完成新一轮融资 1.25 亿美元,用于打造一个任何人都可以制作音乐的未来。此次投资阵容强大,投资方包括光速创投、Nat Friedman、Daniel Gross、Matrix 和 Founder Collective。Suno 承诺将利用这笔资金加速产品开发,壮大世界级的音乐制作人、音乐爱好者和技术专家团队。其实,早在 2022 年,Suno 就进行了种子轮融资,融资金额达到
5/23/2024 10:11:00 AM
机器之能
Adobe 预告安卓版 Acrobat 新功能:本地调用 Gemini Nano 汇总 PDF 文档内容
开发者米沙尔・拉赫曼(Mishaal Rahman)昨日发布博文,表示 Adobe 公司将充分利用 Gemini Nano 模型,计划在安卓新版 Acrobat 中实现汇总文档内容等 AI 功能。谷歌推出了名为 AICore 的全新工具,可以让应用开发者调用 Gemini Nano 本地模型。谷歌基本解决所有的技术问题,因开发人员可以专注于为他们的应用程序构建新功能。IT之家从报道中获悉,在谷歌 I / O 主题演讲中,Adobe 表示已着手利用该工具改造 Acrobat 应用程序,实现快速总结 PDF 文件内容,
5/23/2024 8:34:01 AM
故渊
效率翻倍!6 款不容错过的免费 AI 神器(五)
大家好,我是花生~
今天继续为大家推荐一些好用的 AI 效率工具,包括图像矢量化、Midjourney 风格库、AI 免费图库、AI 音乐 MV 生成工具等。
上期回顾:一、图像矢量化工具
Adobe Express 链接直达:
之前为大家介绍了 3 款免费的图像矢量化 神器,后来有小伙伴在评论区提到 Adobe 的 Express 中也有免费的图像矢量化功能,并且效果也非常不错,使用前记得先注册登录。前几天还有另一位创作者分享了一款新的工具 Tmttool,这样我们就一共有 5 款可以免费使用的 AI 图像矢量
5/23/2024 8:07:03 AM
夏花生
OpenAI 和新闻集团签署多年协议,ChatGPT 可引用《华尔街日报》等媒体内容
感谢OpenAI 公司宣布和新闻集团(News Corp)签署多年协议,意味着 ChatGPT 等相关产品可以引用该集团的相关内容。IT之家注:新闻集团是一家位于美国的出版业跨国公司,是由前新闻集团的报纸和出版业务分拆而成。OpenAI 将获得新闻集团主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》、《巴伦周刊》、《市场观察》、《投资者商业日报》、《FN》和《纽约邮报》;《泰晤士报》、《星期日泰晤士报》和《太阳报》;《澳大利亚人报》、news.com.au、《每日电讯报》、《信使邮报》、《广告人报》和《先驱
5/23/2024 7:26:12 AM
故渊
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
奥特曼:我承认GPT-5发布搞砸了
OpenAI突然"背叛"自己:推理与创作分家,万能AI时代终结?
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷
谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
LLM
AI新词
蛋白质
开发者
腾讯
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
人形机器人
xAI
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用