给一个词就能仿照你的笔迹，Facebook这个AI强大到不敢开源代码

机器之心 • 2021年 7月 27日下午3:03 • AI

你在纸上写个词，AI 只要看一眼就能仿照你的笔迹，还是看起来毫无破绽的那种。

Facebook 近日公布了一项新的图象 AI——TextStyleBrush，该手艺可以复制和再现图象中的文本气概。

借助该手艺，你只需要输出一个词作为「标准」，AI 就能全篇仿照你的书写气概，一键执行，效果可谓惊艳。

此外，你还可以用它交换分歧场景中的笔墨（比如海报、垃圾桶、路标等）。下图中左侧为原始场景图象，单词显示在蓝色矩形中；右侧为文本交换后的图象。

从图中可以看出，各种气概的字体 AI 几乎都能 hold 住。下图中每个图象对在左边显示输出源款式，在右边显示新实质(字符串)，左右两端字体看起来气概完全相同。与源图象相比，输出的图象在外观上似乎都有些模糊，但我们可以看到，在大多数情况下，该手艺似乎工作得很好。

与其他字迹仿照 AI 相比，TextStyleBrush 功能更强大，可以从更细微的角度分析笔墨款式，从而做到在各种角度和背景下进行字迹仿照。下图是酱油瓶（Soya）交换为茶瓶(Tea）的实现过程：

这款强大的仿照神器正是 Facebook AI 推出的「TextStyleBrush」，只需输出一个单词，就能完美复现笔迹。这项手艺的原理类似于笔墨处理 APP 中的款式笔刷工具，可以将笔墨和气概分开。

论文地址：https://scontent-sjc3-1.xx.fbcdn.net/v/t39.8562-6/10000000_944085403038430_3779849959048683283_n.pdf?_nc_cat=108&ccb=1-3&_nc_sid=ae5e01&_nc_ohc=Jcq0m5jBvK8AX–fG2A&_nc_ht=scontent-sjc3-1.xx&oh=8b7e8221bba5aba6b6331c643764dec5&oe=60EF2B81

数据集地址：https://github.com/facebookresearch/IMGUR5K-Handwriting-Dataset

它具有以下特点：

只需要一个单词，就能复制照片中的笔墨气概。利用该 AI 模型，你可以编辑和交换图象中的文本。

与大多数 AI 系统分歧的是，TextStyleBrush 是首个自监视的 AI 模型，利用单个示例词一次性交换手写和图象中的文本。

将来它会在个性化信息和字幕等领域释放新的潜力，比如在增强现实 (AR) 中实现逼真的语言翻译。

通过公布这项研讨所具有的能力、格式和结果，研讨者希望推动对话和研讨，以发现这类手艺的潜在应用，如深度假文本攻击——这是人工智能领域的一大挑战。

由于 TextStyleBrush 也可能被用来制作误导性的图象，所以 Facebook 的 CTO 在个人社交网站表示，他们只发布了论文和数据集，但没有公开代码。并表示正如我们对 deepfakes 的格式一样，我们认为共享研讨和数据集将有助于构建检测系统并提前预防攻击。

可以学习文本气概表征的 TextStyleBrush用 AI 天生图象一直在以惊人的速度发展，这种天生手艺能够重现历史场景，或者将照片变成梵高等绘画气概。现在，Facebook AI 已经建立了一个可以交换场景和手写文本气概的 AI，只需要一个单词作为输出。虽然大多数 AI 系统都可以完成定义明确的、专门的任务，但构建一个足够灵活的 AI 系统，以理解现实场景中文本和手写体的细微差别，具有很大的挑战。这意味着需要了解众多的文本款式，不仅包括分歧的字体和书写气概，而且也包括分歧的转换，如旋转、弯曲的笔墨以及图象噪声等问题。Facebook AI 提出了 TSB（TextStyleBrush）架构。该架构以自监视的格式进行训练，没有利用方向气概监视，只利用了原始气概图象。该框架可以自动地寻找图片真实气概。在训练时，它假设每个词框有真实值（出现在框中的文本）；推理时，它采用单一源款式图象和新实质（字符串），并天生带有方向实质的源款式的新图象。

该天生器架构是基于 StyleGAN2 模型。然而，它有两个重要的限制：首先，StyleGAN2 是一个无条件模型，这意味着它通过对一个随机的潜在向量进行采样来天生图象。但 TextStyleBrush 必须要天生指定文本的图象。其次，TextStyleBrush 天生的文本图象气概不受控制。文本气概涉及全局信息（例如调色板和空间变换），以及精细的比例信息组合（例如单个笔迹的细微变化。研讨者通过实质和气概表征来调节天生器以解决上述限制。通过提取特定于层的气概信息并将其注入到天生器的每一层来处理文本气概的多尺度特性。除了以期望的气概天生方向图象外，天生器还天生表示前景像素 (文本区域) 的软蒙版图象。通过这种方式，天生器可以控制文本的低分辨率和高分辨率细节，以匹配所需的输出气概。

该研讨还引入了一种新的自监视训练准则，该准则利用字体（typeface）分类器、文本辨别器和对抗式鉴别器来保留源气概和方向实质。首先，研讨者通过利用预训练的字体分类网络来评估天生器捕获输出文本气概的能力。另外，他们利用预训练文本辨别网络来评估天生图象的实质，以反映天生器捕获方向实质的效果。总而言之，这种格式能够对训练进行有效的自监视。实行表 2 提供了评估分歧损失函数、气概特征扩展以及训练 TSB 时 mask 的作用消融实行结果。实行结果显示，TextStyleBrush 天生的图片在 MSE（合成误差）上大幅降低，PSNR（峰值信噪比）、SSIM（结构相似性）均获得了提高。

表 3 是在三种数据集图象上测得的文本辨别准确率。实行结果显示，TSB 的辨别效果最好，在 IC13 上的辨别准确率为 97.2%，IC15 上的辨别准确率为 97.6%，TextVQA 上的辨别准确率为 95.0%。

表 4 提供了天生的手写文本的定量比较，将 TSB 格式与 Davis 等人 [14] 专门为天生手写文本而设计的 SotA 格式进行了比较。FID 分数越低，天生质量越好。显然，TSB 格式优于以前的工作。

TextStyleBrush 证明了 AI 在笔墨上面可以比过去更加灵活、准确地辨别，但这项手艺仍然存在许多问题，如无法仿照金属表面的字符或彩色字符等， Facebook 希望这项研讨能继续扩展，突破翻译、自主表达和 deepfake 研讨之间的障碍等。

失败案例。参考链接：https://ai.facebook.com/blog/ai-can-now-emulate-text-style-in-images-in-one-shot-using-just-a-single-word

原创文章，作者：机器之心，如若转载，请注明出处：https://www.iaiol.com/news/gei-yi-ge-ci-jiu-neng-fang-zhao-ni-de-bi-ji-facebook-zhe-ge/

AI TextStyleBrush 图象文本气概

机器之心

中国队喜提六枚金牌，实现IMO团队三连冠：王一川拿下全场唯一满分

上一篇 2021年 7月 26日下午4:03

案例 | 二手车智能质检：以双流分组残差搜集为核心，结合计算机视觉构建智能车辆检测零碎

下一篇 2021年 7月 27日下午4:01

AI

朱松纯：从人工智能的角度解读《赤壁赋》兼谈“心”与“理”的平均

作者 | 朱松纯北京通用人工智能研究院院长北京大学讲席教授清华大学基础科学讲席教授目录第一节引言人生轨道：跃迁与升华苏轼的哲思：人生的意义什么是活大白当今学子的困惑第二节初读文学《赤壁赋》：横槊赋诗第三节重读学术《赤壁赋》：月白风清做学问的本质——登无人之境、享月白风清第四节再读形而上学《赤壁赋》：“心”与“理”的平均人生的有限和无穷出生与出生：“心欲”与“天理”的平均从人

2022年 1月 7日
AI

图神经网络精确预计有机化合物性质，加速静态电池的设计

编辑/绿萝大规模从头较量争论与布局预计的进步相结合，在有机功能资料的发觉中发挥了重要作用。目前，在有机资料的广阔化学空间中，只发觉了一小部分。实验和较量争论研讨职员都需要加速探索未知的化学空间。来自美国国家可再生能源实验室（NREL）、科罗拉多矿业学院和伊利诺伊大学的研讨职员展示了一种可以精确预计有机化合物性质的机械进修方法。展示了基态（GS）和更高能量布局的平衡训练数据集，对使用通用图神经网络（GNN）架构精确预计总能量的重要性。该研讨可加速静态电池的设计。该研讨以「Predicting energy and stabi

2021年 12月 24日
AI

得州、佛州也对「一生传授」轨制下手了，每年评绩效，有大学准备捡漏

终结一生教职轨制，佐治亚州起了个头，后来者不止一个。

2022年 4月 23日
AI

时隔近50年，剑桥团队首次检测到量子自旋液体，钻研登上《Science》

钻研者应用量子摹拟器检测到一种难以捉摸的物资形态：量子自旋液体，可用于量子计算机等技术的发展。

2021年 12月 9日
AI

每小时挪动800例货箱，波士顿能源推出商用仓储呆板人Strentch

当地时间3月29日，波士顿能源公司宣布推出一款可间接搬运货箱的智能仓储呆板人Stretch，支持物流行业对灵巧自动化解决方案日益增长的需求。这款呆板人的首次亮相，标志着波士顿能源正式进入快速增长的堆栈自动化市场。波士顿能源的标志性产品是仿生呆板狗Spot，这款呆板人设想用于从海上石油钻机到深井等环境中歇息。与波士顿能源以往的产品不同，Stretch不是以人类或动物为模型，而是以实用为目的。报道 | 呆板之能Stretch由一个带轮子的方形挪动底座，一个带有摄像头和其他传感器的“感知桅杆&rdq

2021年 3月 30日
AI

暴雪也没拦住的新版本：Linux之父家中停电6天，「冰冻荒原」版Linux内核还是来了

既然是冬天停电的时候诞生的，那就叫它「冰冻荒原」吧。

2021年 3月 2日
AI

CVPR 2022 | 联邦学习审计隐衷新手段，田纳西大学等提出天生式梯度流露格式GGL

本文提出一种利用天生模型作为图片先验的梯度袭击格式GGL，由来自美国田纳西大学，美国橡树岭国家试验室，和谷歌共同完成，论文已被 CVPR 2022 接收。

2022年 4月 10日
AI

库克、盖茨等500余人联名倡议：让每一个中小先生都能学计算机课程

蒂姆 · 库克、杰夫 · 贝佐斯、比尔 · 盖茨等科技界知名人士在公开信上签了名。近日，500 余名商业、培养和非营利部门的知名人士签订了一封联名信，呼吁州长和培养领导者更新美国基础培养 K-12 课程，让「每所书院的每一个先生都有时机进修计算机科学」。签订者名单包含许多科技界的知名人士，包孕苹果首席执行官蒂姆 · 库克、亚马逊创始人兼执行主席杰夫 · 贝佐斯、Alphabet 首席执行官桑达尔 · 皮查伊、微软联合创始人比尔 &mi

2022年 7月 13日
AI

CS上榜超百，华夏要地本地935人，2021全球「高被引科学家」名单揭晓

备受期待的科睿唯安「高被引科学家」名单公布。其中，就华夏要地本地的高校来说，清华大学当选 58 位，华夏科学技术大学当选 41 位，浙江大学当选 29 位，北京大学当选 28 位。

2021年 11月 17日
AI

影响众多编程语言、引发供应链袭击，剑桥大学发布「木马源」缝隙

最近，剑桥大学的研讨者公布了一种名为 Trojan-Source 缝隙，可能危及软件和第一手供应链。

2021年 11月 23日

给一个词就能仿照你的笔迹，Facebook这个AI强大到不敢开源代码

相关推荐

发表回复