AI又进化了,突破性革命来了!
Posted 程序员小灰
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AI又进化了,突破性革命来了!相关的知识,希望对你有一定的参考价值。
大家好,我是 程序员小灰。
2023 年,AI 真的杀疯了。短短不到一年的时间,当我们还在感慨 AI 一键生成的二次元画作精美万分的时候,它已经进化到了写实美照也能手到擒来的地步。
更多的效果,可以看刚刚发布的视频,求个免费的赞啦~
https://www.bilibili.com/video/BV1X24y1n77u/
今天分享一下可以学习的资源。
1、Stable Diffusion WebUI
这个项目是 Stable Diffusion 算法的 Web 版,就是增加了一个 Web 交互界面,方便运行算法。
data:image/s3,"s3://crabby-images/0db36/0db3647b854a6ecd5af99b4272ae05a99e331d21" alt=""
我出过这个项目的部署视频,不了解的可以先看这个视频:
https://www.bilibili.com/video/BV1q84y1i78L/
视频提到的一键安装包,已经有些老了,可以用最新的:
https://pan.baidu.com/s/1raISOqEcYi9M_3E68kcuow?pwd=jack
里面已经包含了文章开头的所展示的真人生成模型、Lora模型等。
还有汉化插件、ControlNet插件等。
2、模型分享网站
网友很强大,训练好的模型,还有一些 prompt 参数,都有人分享。
模型资源很多,可以看看这里:
https://civitai.com/
data:image/s3,"s3://crabby-images/bfb01/bfb013952d570264fd4f6b140713f0d69f5a2f4c" alt=""
比如第二个 ChilloutMix,就是一个效果非常好的真实图片生成模型。
data:image/s3,"s3://crabby-images/b43f0/b43f071213d9225ba0c609171bb60f10b1ecfd0f" alt=""
点击这里就能下载了。
下载好后的模型,需要放到工程目录的:models/Stable-diffusion 里。
data:image/s3,"s3://crabby-images/01dbc/01dbcf882afb6283e8af85bf8a9f8772dc981db7" alt=""
这个我已经打包好了。
除了这种模型可以下载,还能下载 Lora 模型,可以理解为这个是一种画风的小模型,可以配合 Stable Diffusion 模型一起使用,放在 prompt 中。
比如我已经安装好了一个 koreanDollLikeness_v10 Lora 模型,就可以使用以下步骤找到:
data:image/s3,"s3://crabby-images/3afb7/3afb780e07dfd08a22d794ff6011563e07b10ef8" alt=""
选中这个模型,会自动生成 prompt 指令, <lora:koreanDollLikeness_v10:1>,最后跟着的 1 就是权重,可以是0.1,也可以是1,甚至2,数越大使用的权重越多。
data:image/s3,"s3://crabby-images/7861e/7861e3a7d2fc9bb48ba42226fa78b70167f54a04" alt=""
模型也是可以在 civitai 下载:
data:image/s3,"s3://crabby-images/01610/01610087f3cab0519ae10022d9b98608fc72afe6" alt=""
比如第一个就是上文所展示的 Lora 模型开源页面。下载好的模型,需要放到 models/Lora 目录下:
data:image/s3,"s3://crabby-images/409c8/409c81205a5a400437e1ab088a19e655d1f0c9a9" alt=""
3、第三方插件
这个项目还支持我们安装第三方扩展插件,比如汉化插件、集成ControlNet的插件。
汉化插件下载地址:
https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN
直接打包下载 ZIP 压缩包:
data:image/s3,"s3://crabby-images/09f31/09f31aa663fb05c4a07348393936ab6d11934c59" alt=""
然后将文件解压放到 extensions 目录下:
data:image/s3,"s3://crabby-images/83eed/83eed653aaea0bc8e439efdcc22f070316557c80" alt=""
我们重启 Web 服务:
data:image/s3,"s3://crabby-images/3e6c2/3e6c233545f3de0377770f21dd2fadc9fbeccdbd" alt=""
勾选上插件,就能使用了:
data:image/s3,"s3://crabby-images/e2793/e2793186f002d642da722256e312f512bb9847d5" alt=""
然后在 Show all pages 里:
data:image/s3,"s3://crabby-images/7a819/7a819d4ce39880b042cdc420d809b8b521f9ee19" alt=""
英文直接搜 local 就能找到,选择 zh_CN 即可完成汉化。
data:image/s3,"s3://crabby-images/6a7a4/6a7a46d54e19b98f3d7088e24b32a64b59f31eb2" alt=""
记得设置完,重新 Web 生效。
ControlNet 插件下载同理。
https://github.com/Mikubill/sd-webui-controlnet
直接下载文件,并放到指定目录即可(extensions)。
这个不用额外配置,放到指定目录后,重启就可以看到生效了:
data:image/s3,"s3://crabby-images/50570/50570dd4c4bf8ad6d0ee1320b9f0b6dacd4c04d4" alt=""
想要使用 ControlNet 需要提前下载好权重文件:
https://huggingface.co/toyxyz/Control_any3/tree/main
比如这个姿态估计模型:
data:image/s3,"s3://crabby-images/13e28/13e281d38e56cd0a09678d35032ce92bcee6c989" alt=""
点击下载按钮即可下载,下载好的模型放到工程目录的 extensions/sd-webui-controlnet/models 中即可。
4、其它
1)ChatGPT
chatgpt的使用,我出过一期视频:
https://www.bilibili.com/video/BV1yP4y1Q7PH/
对应的注册教程:
https://docs.qq.com/doc/DT2FEQXNZcE1hUFZ3
2)Wav2lip
Wav2lip就是语音转音频,这个算法老了一些,可以看看是否有更新的。
2020年,这个算法刚出的时候,我第一时间写过简单的文字版教程:
https://mp.weixin.qq.com/s/6AP_Dl4T75lkviPAOJyHDA
项目地址:
https://github.com/Rudrabha/Wav2Lip
3)Chat-GPT-LangChain
已经有集文本对话、语音识别、表情驱动的项目了,虽然目前效果有限,但对这方面感兴趣的,可以提前看看,做个调研够用了:
data:image/s3,"s3://crabby-images/2e482/2e482eebbace033d953dfbd7a13859098cc31854" alt=""
项目地址:
https://huggingface.co/spaces/JavaFXpert/Chat-GPT-LangChain
5、絮叨
近两年是 AI 爆发的两年,无论是文本领域还是图片领域,都有了突破性的进展。
各种 AI 技术,我会持续分享,感谢各位小伙伴一直以来的关注与支持啦~
期待你在这里有所收获,有所感触,悄悄拔节,惊艳所有~
以上是关于AI又进化了,突破性革命来了!的主要内容,如果未能解决你的问题,请参考以下文章