【AI绘画】入门英文名词解析

您所在的位置:网站首页 绘画英语怎么说读 【AI绘画】入门英文名词解析

【AI绘画】入门英文名词解析

2023-11-13 01:03| 来源: 网络整理| 查看: 265

最近AI绘画爆火,出现了大量专有名词,文章罗列的一些词汇和说明以及官方链接,更好的方便理解

本文撰写于2022-10-24 如有谬误 不吝指正

最近AI绘画爆火,由于是艺术和技术的跨界结合,因此出现了大量专有名词(英文和中文都有),有些是公司名,有些是项目名,有些是技术名词,有些特指模型,有些特指插件或者网站,有些是二次元人物,游戏风格等,经常还会缩写简写等,初入坑者听到或者看到了这些名词往往一头雾水,即使想通过某度或者某歌搜索也很难得到正确的结果,在此罗列了一些名词和满含个人观点的解析,同时贴出官方原始链接,通过使用浏览器的翻译功能看原文能更好的理解,希望这些对他人有帮助。

****************************************************

英文:AI  全写:Artificial Intelligence

说明:在本文论述范围内指人工智能,而不是Adobe Illustrator绘图软件,也叫AI,两者容易混淆。

****************************************************

英文:Stable-Diffusion 简写:sd 中文直译:稳定-扩散

说明:简单粗暴的理解为AI绘画的一种技术,项目名,于2022年8月10日官宣开放源代码,8月22日在github上放出源码,同时提供了训练后的计算模型,母公司是Stability AI(英国公司 成立于2020年)其最大的特色在于开源、许可宽松、硬件设备要求低(普通家用级单张n卡10系列  16系列显卡就可实现Text To Image、Image To Image、Inpainting(图像修复)、Textural Inversion(神经网络文本学习),而无须专业的集群GPU来进行深度学习才能使用)操作简单,出图快,平均10-20秒,画人物很强,西方魔幻风格

其实AI绘画从21年起就开始快速发展,但只有sd项目开源(关于开源 下面有论述)了,其他诸如Dall-E(读音 达里),Dall-E-2、Imagen、GLIDE等等要么只提供接口,开始收费,有些只有展示一个结果。这些名词下面有论述。

官方BLOG:https://stability.ai/blog

官宣开源申明:https://stability.ai/blog/stable-diffusion-announcement

2022-8-10官宣开源官宣里放出的代码地址和模型地址

sd开源项目链接:https://github.com/CompVis/stable-diffusion

查看后可以发现 该代码是于2022-8-23提交的

参看:https://www.oschina.net/news/206691/stable-diffusion-open-sources

提外话:

开源和不开源的区别

一、开源 有源代码 可以自行修改重新编译 增加功能等等 不仅可以离线断网获得结果 并且还能在代码里学习是如何实现的 可以不受限制(除了开源许可本身的限制)的增加扩展各种功能 这就是开源魅力之所在

二、不开源 再分两种

编译后直接使用的工具软件(例如:Office软件、WinRAR压缩软件等等)可以安装使用,断网也不受影响 但只有程序 没有代码 并不能学习到如何实现的 除了使用软件本身带的扩展接口外进行编程开发 无法增加功能

只提供网络API接口 只能在线联网调用接口提交数据 获得返回结果 并不知道是怎么来的 会有很多限制 为了避免法律风险 AI绘画项目对于某些人名或者不可描述画面作了限制不允许生成 此外对于调用频次 数量也有限制 限于GPU算力费用 很多可能一开始免费 后续就开始收费 以充值点数或以按月订阅(subscribe)的形式(大部分其他AI绘画都是这种形式)

****************************************************

英文:Stability AI  CompVis  Runway

说明:Stability AI是公司名称 CompVis和Runway是其中两个Team小组

Stability AI主页: https://stability.ai/

RunWay主页:https://runwayml.com/

Stability AI出钱:计算模型需要租用Amazon云服务器对图片集进行运费,耗资巨大,目前放出的1.4版本的计算模型就是用托管在Amazon云上的A100 GPU集群在进行了深度学习后的结果

runwayml 出力:算法,想法,代码,架构

****************************************************

英文:github

说明:代码仓库的网站,开源项目托管在上面

网站链接:https://github.com/

****************************************************

英文:sd模型

官方链接:https://huggingface.co/CompVis/stable-diffusion

说明:Stable-Diffusion开源后同步发布的官方原始模型,该模型擅长风景,二次元并不擅长 该模型是托管在huggingface上 并没有和源代码一起放在github上 撰文时最新版本为1-4 至于每一个版本怎么迭代来的 参看原网页更易理解

很多人在官方链接上找不到入口 因为该网站是需要注册登录后才能看到的

官方对于模型的说明 下载位置下载位置

磁力链接下载:magnet:?xt=urn:btih:3a4a612d75ed088ea542acac52f9f45987488d1c&dn=sd-v1-4.ckpt

推荐官网下载

****************************************************

英文:dreamstudio dream

官方网址:https://beta.dreamstudio.ai/dream

说明:stability.ai官方运用自己的stabel-diffusion搭建的平台 谷歌账号登录 有两个模型可以选择 1.4 和 1.5

1个点数1张图 初始200点数 价格说明

使用参看:https://zhuanlan.zhihu.com/p/560226367

****************************************************

英文:Disco Diffusion

说明:Disco Diffusion 是发布于Google Colab 平台的一款利用人工智能深度学习进行数字艺术创作的工具,它是基于MIT 许可协议的开源工具,可以在Google Drive 直接运行,也可以部署到本地运行。Disco Diffusion 有一个弊端,就是速度非常慢,动辄10多分钟半小时起步。上手较难,画面主要为大场景和抽象画面,不擅长人物和具象的物体

项目:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb

使用参考:https://baijiahao.baidu.com/s?id=1742217322940045162

****************************************************

英文:DALL-E DALL-E-2

说明:OpenAI公司出的AI绘画项目 实现了更高分辨率和更低延迟,而且还包括了新的功能,可以对图像进行非常逼真的改动,即用嘴PS。但是需要提交资格审核才能参与

图中的狗由AI添加 很好的融合进图片

****************************************************

英文:Midjourney

官网:https://www.midjourney.com/

说明:Disco Diffusion的原作者Somnai所加入的AI艺术项目实验室 对 Disco Diffusion 进行了改进,平均1分钟能出图 目前是依托于discord(相当于微信QQ)聊天软件中的聊天机器人 初始免费20张图 后面以订阅的形式提供 分10美元档 和 30美元档

右上角的画廊里有大量公共作品

英文:Discord

官网:https://discord.com/

Disocrd上的Midjourney频道midjourney频道中newbies(新用户)房间里 midjourney机器人回复用户提示词的图片私聊(DM DirectMessage)Midjourney Bots机器人 /subscribe 进行订阅10美元1月200张图 30美元无限制 

****************************************************

英文:colab

谷歌的平台 可以理解为云电脑 通过网页运行代码 需要挂载Google Drive来使用 免费的只有15G 而不需要在你自己的电脑上运行 一开始GPU资源也是免费的 可以用来对模型进行计算 现在可能只有CPU资源是免费的了

****************************************************

英文:naifu

说明:对stable-diffusion进行封装,目前据我解的只有整合包,界面风格和novelai(后文有解释)的界面很像,而novelai又和dream的界面很像,可调节的参数不如webui的

****************************************************

英文:stable-diffusion-webui 略写:webui (AUTO111)

项目链接:https://github.com/AUTOMATIC1111/stable-diffusion-webui

说明:其实不止一个webui版本对stable-diffusion进行了封装,但目前基本上只要提及webui都是指AUTOMATIC1111的这个版本 更新快

另一个webui链接:

https://colab.research.google.com/github/altryne/sd-webui-colab/blob/main/Stable_Diffusion_WebUi_Altryne.ipynb

****************************************************

英文:novelai

官网:http://novelai.net/

说明:原是AI辅助写小说的网站,为了给小说角色配图使用了stable-diffusion,训练了大量二次元图片后,扩展了通过图片生成可视化角色的功能,后来由于泄露了训练的模型包(俗称52G包 下载链接在下面),该模型包基于stable-diffusion的模型包。由于该模型生成二次元图片效果很不错,所以大量的文章提及如何仿novelai就是这个原因。

通过图片生成功能来可视化你喜欢的角色收费方式

泄露包的磁力链接:magnet:?xt=urn:btih:5bde442da86265b670a3e5ea3163afad2c6f8ecc&dn=novelaileak

****************************************************

英文:Danbooru

网址:https://danbooru.donmai.us/

说明:二次元图片网站,对图片有关键字标柱 前方高能 谨慎打开

Danbooru官网

****************************************************

英文:DeepDanbooru

项目链接:https://github.com/benbenmumu/DeepDanbooru

可以理解为stable-diffusion-webui的插件,增加生成图片带Tag的文本文件

****************************************************

英文:Waifu

说明:指Waifu模型 二次元生成模型 本质还是使用sd的模型 并进行了训练调整

链接:https://gist.github.com/harubaru

链接:https://github.com/harubaru/waifu-diffusion

链接:1-3版本https://gist.github.com/harubaru/f727cedacae336d1f7877c4bbe2196e1

目前是1-3版本 1-4进行中

4个最终模型的不同用途

训练过程:

模型下载:https://huggingface.co/hakurei/waifu-diffusion-v1-3

模型托管在huggingface上

1-4版本的目标:

****************************************************

英文:waifu2x

链接:http://waifu2x.udp.jp/

说明:日本的一个网站 使用卷积神经网络对动漫风格的图片进行放大操作(支持照片)。

****************************************************



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3