【AI绘画】入门英文名词解析

2023-11-13 01:03| 来源: 网络整理| 查看: 265

最近AI绘画爆火，出现了大量专有名词，文章罗列的一些词汇和说明以及官方链接，更好的方便理解

本文撰写于2022-10-24 如有谬误不吝指正

最近AI绘画爆火，由于是艺术和技术的跨界结合，因此出现了大量专有名词（英文和中文都有），有些是公司名，有些是项目名，有些是技术名词，有些特指模型，有些特指插件或者网站，有些是二次元人物，游戏风格等，经常还会缩写简写等，初入坑者听到或者看到了这些名词往往一头雾水，即使想通过某度或者某歌搜索也很难得到正确的结果，在此罗列了一些名词和满含个人观点的解析，同时贴出官方原始链接，通过使用浏览器的翻译功能看原文能更好的理解，希望这些对他人有帮助。

****************************************************

英文：AI 全写：Artificial Intelligence

说明：在本文论述范围内指人工智能，而不是Adobe Illustrator绘图软件，也叫AI，两者容易混淆。

****************************************************

英文：Stable-Diffusion 简写：sd 中文直译：稳定-扩散

说明：简单粗暴的理解为AI绘画的一种技术，项目名，于2022年8月10日官宣开放源代码，8月22日在github上放出源码，同时提供了训练后的计算模型，母公司是Stability AI(英国公司成立于2020年)其最大的特色在于开源、许可宽松、硬件设备要求低（普通家用级单张n卡10系列 16系列显卡就可实现Text To Image、Image To Image、Inpainting（图像修复）、Textural Inversion（神经网络文本学习），而无须专业的集群GPU来进行深度学习才能使用）操作简单，出图快，平均10-20秒，画人物很强，西方魔幻风格

其实AI绘画从21年起就开始快速发展，但只有sd项目开源（关于开源下面有论述）了，其他诸如Dall-E（读音达里），Dall-E-2、Imagen、GLIDE等等要么只提供接口，开始收费，有些只有展示一个结果。这些名词下面有论述。

官方BLOG：https://stability.ai/blog

官宣开源申明：https://stability.ai/blog/stable-diffusion-announcement

2022-8-10官宣开源官宣里放出的代码地址和模型地址

sd开源项目链接：https://github.com/CompVis/stable-diffusion

查看后可以发现该代码是于2022-8-23提交的

参看：https://www.oschina.net/news/206691/stable-diffusion-open-sources

提外话：

开源和不开源的区别

一、开源有源代码可以自行修改重新编译增加功能等等不仅可以离线断网获得结果并且还能在代码里学习是如何实现的可以不受限制(除了开源许可本身的限制)的增加扩展各种功能这就是开源魅力之所在

二、不开源再分两种

编译后直接使用的工具软件（例如：Office软件、WinRAR压缩软件等等）可以安装使用，断网也不受影响但只有程序没有代码并不能学习到如何实现的除了使用软件本身带的扩展接口外进行编程开发无法增加功能

只提供网络API接口只能在线联网调用接口提交数据获得返回结果并不知道是怎么来的会有很多限制为了避免法律风险 AI绘画项目对于某些人名或者不可描述画面作了限制不允许生成此外对于调用频次数量也有限制限于GPU算力费用很多可能一开始免费后续就开始收费以充值点数或以按月订阅（subscribe）的形式（大部分其他AI绘画都是这种形式）

****************************************************

英文：Stability AI CompVis Runway

说明：Stability AI是公司名称 CompVis和Runway是其中两个Team小组

Stability AI主页: https://stability.ai/

RunWay主页：https://runwayml.com/

Stability AI出钱：计算模型需要租用Amazon云服务器对图片集进行运费，耗资巨大，目前放出的1.4版本的计算模型就是用托管在Amazon云上的A100 GPU集群在进行了深度学习后的结果

runwayml 出力：算法，想法，代码，架构

****************************************************

英文：github

说明：代码仓库的网站，开源项目托管在上面

网站链接：https://github.com/

****************************************************

英文：sd模型

官方链接：https://huggingface.co/CompVis/stable-diffusion

说明：Stable-Diffusion开源后同步发布的官方原始模型，该模型擅长风景，二次元并不擅长该模型是托管在huggingface上并没有和源代码一起放在github上撰文时最新版本为1-4 至于每一个版本怎么迭代来的参看原网页更易理解

很多人在官方链接上找不到入口因为该网站是需要注册登录后才能看到的

官方对于模型的说明下载位置下载位置

磁力链接下载：magnet:?xt=urn:btih:3a4a612d75ed088ea542acac52f9f45987488d1c&dn=sd-v1-4.ckpt

推荐官网下载

****************************************************

英文：dreamstudio dream

官方网址：https://beta.dreamstudio.ai/dream

说明：stability.ai官方运用自己的stabel-diffusion搭建的平台谷歌账号登录有两个模型可以选择 1.4 和 1.5

1个点数1张图初始200点数价格说明

使用参看：https://zhuanlan.zhihu.com/p/560226367

****************************************************

英文：Disco Diffusion

说明：Disco Diffusion 是发布于Google Colab 平台的一款利用人工智能深度学习进行数字艺术创作的工具，它是基于MIT 许可协议的开源工具，可以在Google Drive 直接运行，也可以部署到本地运行。Disco Diffusion 有一个弊端，就是速度非常慢，动辄10多分钟半小时起步。上手较难，画面主要为大场景和抽象画面，不擅长人物和具象的物体

项目：https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb

使用参考：https://baijiahao.baidu.com/s?id=1742217322940045162

****************************************************

英文：DALL-E DALL-E-2

说明：OpenAI公司出的AI绘画项目实现了更高分辨率和更低延迟，而且还包括了新的功能，可以对图像进行非常逼真的改动，即用嘴PS。但是需要提交资格审核才能参与

图中的狗由AI添加很好的融合进图片

****************************************************

英文：Midjourney

官网：https://www.midjourney.com/

说明：Disco Diffusion的原作者Somnai所加入的AI艺术项目实验室对 Disco Diffusion 进行了改进，平均1分钟能出图目前是依托于discord(相当于微信QQ）聊天软件中的聊天机器人初始免费20张图后面以订阅的形式提供分10美元档和 30美元档

右上角的画廊里有大量公共作品

英文：Discord

官网：https://discord.com/

Disocrd上的Midjourney频道midjourney频道中newbies(新用户)房间里 midjourney机器人回复用户提示词的图片私聊(DM DirectMessage)Midjourney Bots机器人 /subscribe 进行订阅10美元1月200张图 30美元无限制

****************************************************

英文：colab

谷歌的平台可以理解为云电脑通过网页运行代码需要挂载Google Drive来使用免费的只有15G 而不需要在你自己的电脑上运行一开始GPU资源也是免费的可以用来对模型进行计算现在可能只有CPU资源是免费的了

****************************************************

英文：naifu

说明：对stable-diffusion进行封装，目前据我解的只有整合包，界面风格和novelai（后文有解释）的界面很像，而novelai又和dream的界面很像，可调节的参数不如webui的

****************************************************

英文：stable-diffusion-webui 略写：webui （AUTO111）

项目链接：https://github.com/AUTOMATIC1111/stable-diffusion-webui

说明：其实不止一个webui版本对stable-diffusion进行了封装，但目前基本上只要提及webui都是指AUTOMATIC1111的这个版本更新快

另一个webui链接:

https://colab.research.google.com/github/altryne/sd-webui-colab/blob/main/Stable_Diffusion_WebUi_Altryne.ipynb

****************************************************

英文：novelai

官网：http://novelai.net/

说明：原是AI辅助写小说的网站，为了给小说角色配图使用了stable-diffusion，训练了大量二次元图片后，扩展了通过图片生成可视化角色的功能，后来由于泄露了训练的模型包（俗称52G包下载链接在下面），该模型包基于stable-diffusion的模型包。由于该模型生成二次元图片效果很不错，所以大量的文章提及如何仿novelai就是这个原因。

通过图片生成功能来可视化你喜欢的角色收费方式

泄露包的磁力链接：magnet:?xt=urn:btih:5bde442da86265b670a3e5ea3163afad2c6f8ecc&dn=novelaileak

****************************************************

英文：Danbooru

网址：https://danbooru.donmai.us/

说明：二次元图片网站，对图片有关键字标柱前方高能谨慎打开

Danbooru官网

****************************************************

英文：DeepDanbooru

项目链接：https://github.com/benbenmumu/DeepDanbooru

可以理解为stable-diffusion-webui的插件，增加生成图片带Tag的文本文件

****************************************************

英文：Waifu

说明：指Waifu模型二次元生成模型本质还是使用sd的模型并进行了训练调整

链接：https://gist.github.com/harubaru

链接：https://github.com/harubaru/waifu-diffusion

链接：1-3版本https://gist.github.com/harubaru/f727cedacae336d1f7877c4bbe2196e1

目前是1-3版本 1-4进行中

4个最终模型的不同用途

训练过程：

模型下载：https://huggingface.co/hakurei/waifu-diffusion-v1-3

模型托管在huggingface上

1-4版本的目标：

****************************************************

英文：waifu2x

链接：http://waifu2x.udp.jp/

说明：日本的一个网站使用卷积神经网络对动漫风格的图片进行放大操作（支持照片）。

****************************************************

【本文地址】

【AI绘画】入门英文名词解析

【AI绘画】入门英文名词解析

今日新闻

推荐新闻