admin管理员组

文章数量:1530085

前言

在过去的几年里,人工智能(AI)取得了极大的进展

一种能够将输入的语句转换为图像的工具

最突出的就属

DALL-E 2、Stable Diffusion 和 Midjourney

DALL·E 2

DALL-E 2 由 OpenAI 开发,它通过一段文本描述生成图像。其使用超过 100 亿个参数训练的 GPT-3 转化器模型,

一幅描述篮球运动员灌篮的油画,具有星云爆炸的效果 - 图片由 DALLE 2 创作

DALL-E 2 主要由两部分组成——将用户输入转换为图像的表示(称为 Prior),然后是将这种表示转换为实际的照片(称为 Decoder)。

Source: https://www.youtube/watch?v=F1X4fHzF4mQ

其中使用到的文本和图像嵌入来自另一个叫做 CLIP(对比语言-图像预训练)的网络,这也是由 OpenAI 研发的。CLIP 是一种神经网络,为输入的图像返回最佳的标题。它所做的事情与 DALL-E 2 所做的相反——它是将图像转换为文本,而 DALL-E 2 是将文本转换为图像。引入 CLIP 的目的是为了学习物体的视觉和文字表示之间的联系。

所有的AI设计工具,模型和插件,都已经整理好了,👇获取~

CLIP - 为图像返回最佳的文本

Stable Diffusion 及其技术

Stable Diffusio其使用了 CLIP ViT-L/14 文本编码器,能够通过文本提示调整模型。它在运行时将成像过程分离成“扩散 (diffusion)”的过程——从有噪点的情况开始,逐渐改善图像,直到完全没有噪点

一个可以看到埃菲尔铁塔的皮卡丘高级餐厅- 图片由 Stable Diffusion 生成

Stable Diffusion 是基于 Latent Diffusion Model(LDM)的,LDM 是一款顶尖的文转图合成技术。在了解 LDM 的工作原理之前,让我们先看看什么是扩散模型以及为什么我们需要 LDM。

扩散模型(Diffusion Models, DM)是基于 Transformer 的生成模型,它采样一段数据(例如图像)并随着时间的推移逐渐增加噪声,直到数据无法被识别。该模型尝试将图像回退到原始形式,在此过程中学习如何生成图片或其他数据。

DM 存在的问题是强大的 DM 往往要消耗大量 GPU 资源,所以为什么SD的使用者总是要有好的显卡或者是租凭远程GPU

Midjourney 及其是如何工作的

Midjourney 也是一款由人工智能驱动的工具,其能够根据用户的提示生成图像。MidJourney 善于适应实际的艺术风格,创造出用户想要的任何效果组合的图像。它擅长环境效果,特别是幻想和科幻场景,看起来就像游戏的艺术效果。

夜晚的云端城堡,电影般的画面 - 图片由 Midjourney 生成

Midjourney 也是一个人工智能图像生成工具,它通过输入文本和参数,并使用在大量图像数据上训练出的机器学习(ML)算法来生成独一无二的图像。

Midjourney 目前只能通过其官方 Discord 上的 Discord 机器人使用。用户使用“/imagine”命令生成图像,并像其他 AI 图像生成工具一样输入命令提示。然后机器人会返回一张图片。

下面的 prompt 有助于了解每种模型的相似性和差异。

由于目前业内已经有事务所在尝试

通过SD(stable diffusion)上传手稿垫底图

**AI尝试画效果的方式推进方案
**

【从线稿到方案渲染,结果我惊呆了!】

我们就主要介绍SD的安装流程以及方法

如果你做好了上述准备,我们就开始行动吧!

Stable Diffusion安装教程:前期准备工作

第一步:下载Python 3.10.9版本Windows installer (64-bit)

第二步:下载t64-bit Git for Windows Setup

https://git-scm/download/win

第三步:点击下方链接,在Github下载stable-diffusion-webui

第四步:下载最新版的Stable-diffusion

(需要免费注册一下网站的账号)

第五步:下载面部重建插件GFPGAN,建议把1.3和1.4版本都下载下来

https://github/TencentARC/GFPGAN

第六步:下载Notepad++

(下最新版即可,不用完全和我下载一致的版本)

https://notepad-plus-plus/downloads/

上述内容全部下载完成后

你应该有了以下这些文件在你的文件夹中

Stable Diffusion安装教程:安装与启动

建议将所有文件安装至C盘,在文档中创建文件夹“SDlocal”。(我第一次装的时候嫌文件太大有的放在D盘)

(有的放在C盘就出现错误,安装失败了!)

第一步:将已下载完成的Python、Git和Note++全都安装在C盘默认路径中,所有选项都以默认为准,无脑安装。

第二步:将stable-diffusion-webui-master.zip解压至前述新建立的SDlocal文件夹

第三步:将GFPGAN1.3和GFPGAN1.4文件拖入SDlocal夹

第四步:将“v1-5-pruned-emaonly.ckpt”拖拽到SDlocal>models>Stable-diffusion文件夹下

第五步:右键点击webui-user.bat文件,选择Edit with Notepad++,将文件中的路径设置为你Python的存储路径。以我自己为例:

“C:\Users\你自己的用户名\AppData\Local\Programs\Python\Python310\python.exe”

比如我的是

那就是

“C:\Users\NINGMEI**\AppData\Local\Programs\Python\Python310\python.exe”**

第六步:双击”webui-user.bat”文件后

就开始运行stable diffusion了

如果运行成功,这个页面将会返回给你一个地址,将这个地址复制到浏览器中,就可以正常运行了

Stable diffusion安装成功!

Stable Diffusion安装教程:疑难杂症Q&A

通常来说前面的安装步骤非常简单,基本上30分钟之内就可以全部搞定。但是,一个像我一样小白的电脑99%会在第六步运行“webui-user.bat”这块出现各种各样的报错,基本上我安装stable-diffusion的8个小时里面有7个多小时都是在google和各大论坛搜索怎么解决这些报错和bug。

下面我大概说一下我遇到的问题和解法:

第一类问题:Python未安装成功

很多新手第一次安装python的时候因为整个电脑环境等原因没有将正确的文件全部安装完毕

我们需要先检查这些文件是否安装成功。
使用Win键+R打开运行,在对话栏中输入cmd进入后台:

cmd进入后台

在后台输入python指令,如果返回如下图所示,代表Python安装成功,如果报错则需要重新安装python

第二类问题:系统环境配置

建议下载MicroSoft Visual Studio,

并把所有Python相关联的软件全都下载安装。

第三类问题:网络造成的无法下载某些文件,比如BLIP、CLIP等

通常cmd中会报出类似“Couldn’t Clone Taming Transformers”这样的错误

网络问题造成的报错

遇到这类问题一般两种解法:

解法1:把VPN的全局模式打开,反复尝试启动“webui-user.bat”,这些文件有几率可以下载完成。

解法2:仔细看一下报错的具体是哪个文件打不开

下载不下来或安装不上,基本上这些文件通过google搜索或者github都能找到,如此一来可以通过主动下载这些文件,然后使用windows的cmd指令,直接将这些文件安装好。

举个栗子:我安装的时候有一个“CLIP”文件死活安装不上反复报错,于是我去github下载了这个文件,然后在cmd里面进入到文件夹下载路径

输入指令python setup.py install就完成人工手动安装

各位旅途愉快!

**以上图片亲测通过Stable diffusion实现
**

这里直接将该软件分享出来给大家吧~

1.stable diffusion安装包

随着技术的迭代,目前 Stable Diffusion 已经能够生成非常艺术化的图片了,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。

最新 Stable Diffusion 除了有win多个版本,就算说底端的显卡也能玩了哦!此外还带来了Mac版本,仅支持macOS 12.3或更高版本

2.stable diffusion视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。

5.SD从0到落地实战演练

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名SD大神的正确特征了。

这份完整版的stable diffusion资料我已经打包好,需要的点击下方插件,即可前往免费领取!

本文标签: 画图方法stableDiffusion