技术标签: AI作画
写在前面
Hi, 欢迎大家来到 AI 绘画学习 | 学习手册,相信在接下来的日子里,我们将在这里见面很多次。 AI 绘图,顾名思义,即用 AI 实现绘图,在特定程序中输入特定关键词/指令,即可产出新的图片,而图片的主人就是你自己。简单来说,这是一种让你即使没有绘画能力,也能产出画作的技术。 目前 AI 绘画在全球已经有了非常良好的开源生态,拥有了 “Stable Diffusion” 和 “Disco Diffusion” 等优质的开源项目。而在 NovelAI 模型泄露事件中,我们又进一步验证了市场对于 AI 绘画需求。 一句话来说,AI 绘图,来路清晰,前路已通。但据了解,目前国内跑的最快的中文 AI 绘画产品,也只是到了“做出来”这步,正在探索“引爆的方法”。 所以,此时不下场,更待何时呢? • 如果你以前从未接触过 AI,但最近看到 AI 绘画被频频提起,想做个基本了解,这个课程将向你简单介绍 “AI 绘画” 的发展历程和技术原理; • 如果你正想入局 AI 绘图,却不知道从何开始、如何创作,这个课程将教给你简易与进阶绘图方式,总有一种适合你; • 如果你已经在使用 AI 绘画工具进行创作,但是总是画不出自己想要的效果,这篇手册将告诉你怎么使用 “咒语”,才能把心中的景象,清晰明白地传达给你的 “法杖”; • 如果你已经发现了 AI 绘画的异常值,但在变现道路上找不到方向,我们也会提供基础与进阶两类变现方法供你选择。 先进入跑道了解赛制,远比在观众席等待结果更加有趣。 希望大家可以在这个课程中,结识一群战友。 |
一.AI绘画技术介绍
1.1 AI绘画简介
AI绘画是指利用人工智能技术来生成或辅助艺术作品的一种新兴技术。它可以帮助人类艺术家更快、更精准地创作出自己想象中的艺术作品,同时也能自动创造出新的艺术作品。
具体来说,AI绘画技术是通过训练计算机模型来模拟人类艺术家的创作过程,包括创作风格、色彩运用等,然后通过计算机程序生成艺术作品。这些技术的应用范围非常广泛,包括绘画、设计、动画、游戏等领域。
例如,在绘画领域,AI绘画技术可以根据输入的图片自动完成线稿、着色等任务,辅助人类艺术家更快速地完成作品。此外,AI绘画技术还可以自动生成新的艺术作品,包括画作、插画、漫画等,展现出不同的风格和风格组合。这些作品可以用于装饰、印刷品、广告、游戏和电影等领域。
总之,AI绘画技术是一种新兴的艺术创作方式,它可以为人类艺术家带来新的灵感和技术支持,同时也可以为艺术领域带来更多的创新和可能性。
1.2 AI 绘图发展背景
AI绘画的出现时间可能比很多人想象的要早。
1、1990年代:AI绘画技术的探索
1973年,一位艺术家,哈罗德·科恩Harold Cohen(画家,加利福尼亚大学圣地亚哥分校的教授) 发布了可以进行机器作画的电脑程序——Aaron(亚伦)。这是世界上第一个计算机艺术程序。
Harold 对 AARON的改进一直持续了几十年, 直到他离世,在80年代的时候, ARRON"掌握"了三维物体的绘制;90年代时,AARON能够使用多种颜色进行绘画,据称直到今天,ARRON仍然在创作。
2006年,出现了一个类似ARRON的电脑绘画产品 The Painting Fool. 它可以观察照片,提取照片里的块颜色信息,使用现实中的绘画材料如油漆,粉彩或者和铅笔等进行创作。
2、2010年左右:基于深度学习的AI绘画技术开始崭露头角
到了2010年左右,随着深度学习技术的发展,基于深度学习的AI绘画技术开始崭露头角。
2012年Google两位大名鼎鼎的AI大神,吴恩达和Jef Dean进行了一场空前的试验,耗资100万美元,集结1000台电脑、16000个CPU的资源训练了一个当时世界上最大的深度学习网络, 用来指导计算机画出猫脸图片。经过整整3天训练, 画出来了一张模糊的猫猫头:
虽然基本很难看出这是一张猫脸,且价格昂贵,根本没有商用的机会,但这是AI绘画的起点,意义重大。
3、2015年,迷幻和超现实
谷歌在2015年开源了deep dream项目,可以用它画出非常迷幻和超现实的图画,生成痕迹非常明显,但看起来已经比上面的猫脸像那么回事了,不是吗?这种画作,看起来并不比直接在照片上加滤镜来得高明,也不是大家想象中的,人来输出口令,AI来产生跟指令相关的绘画。
4、2014年,GAN 的时代到来
AI学术界提出了一个非常重要的深度学习模型,这就是大名鼎鼎的对抗生成网络GAN (Generative Adverserial Network, GAN)。GAN模型一问世就风靡AI学术界,在多个领域得到了广泛的应用。它也随即成为了很多AI绘画模型的基础框架,其中生成器用来生成图片。而判别器用来判断图片质量。GAN的出现大大推动了AI绘画的发展。
GAN 这种方案就是训两个模型,一个造假,一个判真,两个模型相互卷,直到卷到造假的模型能造出 “以假乱真” 的图片时,就算练成了。但 GAN 有个致命缺陷叫做 “鞍点问题”,它造成 “模型训练过程中,数据处理的难度很大”,而且数据越复杂、越多样,难度就越大。这时的模型是很不稳定的,自然也不可能依托它形成什么商业模式。
5、2018年:基于GAN的AI绘画技术取得突破
2018 年,第一幅由 AI 生成的肖像《Edmond de Belamy》问世,它由生成对抗网络(GAN)创建,是 Obvious Art 的 “La Famille de Belamy” 系列的一部分,最终在佳士得艺术品拍卖会上以 432500 美元成交。
6、2020年:Diffusion问世
2020 年发布的开创性论文《Denoising Diffusion Probabilistic Models》,带来了一种新的图像生成范式。用这个方法生成出来的图片效果非常好,比 GAN 要好的多,而且不存在 GAN 的缺陷,由此,这种新范式突破了实用化的临界点。(PS:这就是为什么后来的模型多叫做 XX Diffusion 的原因。)
Diffusion 算法的原理是先将一幅画面逐步加入噪点,一直到整个画面都变成白噪声,记录这个过程,然后逆转过来给 AI 学习(当然不只是一副画,而是极大数量的画)。从 AI 视角看,就是学习一副全是白噪声的画面,怎么一点点去除噪点变清晰,直至变成一幅画。用说的可能不清楚,我弄一组图片在下面,大家看了就明白了。
这一时期出现了很多运用 Diffusion 技术的模型,比如 DALL-E 系列,Midjourney 等等,它们都有非常不错的效果,例如使用 Midjourney 创作的画作《太空歌剧院》就在美国科罗拉多州博览会的艺术比赛中获得了第一名,引发了媒体的竞相转载,以至于在指数工具里飙出了一个很高的 “异常值”,但因为它们要么是彻底闭源的,要么是只开放一些 api,所以 “异常值” 飙的快降得也快,最终没有特别出圈,停留在了新闻和少量技术尝鲜者中。
7、2022年2月,Disco Diffusion 模型问世
2022年的2月由somnai等几个开源社区的工程师做了一款基于扩散模型的AI绘图生成器——Disco diffusion。从它开始,AI绘画进入了发展的快车道,潘多拉魔盒已经打开。
3月 Midjouney发布,Midjouney发布5个月后,美国科罗拉多州博览会的艺术比赛评选出了结果,一张名为《太空歌剧院》的画作获得了第一名,但它甚至不是人类画师的作品,而是一个叫MidJourney的人工智能的画作。参赛者公布这是一张AI绘画作品时,引发了很多人类画师的愤怒和焦虑。
8、4月 DALL·E 2发布
9、2022年7月 Stable diffusion问世
7月29日 一款叫Stable diffusion的AI生成器开始内测,人们发现用它生成的AI绘画作品,其质量可以媲美DALL·E 2,而且还没那么多限制。Stable diffusion共分4波邀请了 15000 名用户参与了内测,仅仅十天后,每天就有一千七百万张图片通过它生成。最关键的是,Stable diffusion的开发公司Stability AI崇尚开源,他们的宗旨是“AI by the people,for the people”。
10、2023年3月 Midjouney v5问世
Midjouney v5问世再次改变了 AI 驱动的艺术创作世界。它拥有显著增强的图像质量、更多样化的输出、更广泛的风格范围,以及对无缝纹理的支持、更宽的宽高比、改进的图像提示、扩展的动态范围等.
1.3 AI绘画工具和软件的使用介绍
目前比较前沿的 AI 绘画模型主要有以下 5 个,其中只有前 2 个是开源的,国内大多数中文 AI 绘画应用都是基于这两个开源模型封装的。
Stable Diffusion(开源):
https://dreamlike.art/create
https://playgroundai.com/create
https://dreamstudio.ai/dream
更多 Stable diffusion 教程
Disco Diffusion(开源):https://github.com/alembics/disco-diffusion
Midjourney(未开源):www.midjourney.com
DALL-E-2(未开源):https://openai.com/dall-e-2/
NovelAI(未开源):novelai.net/
1.4 Al绘画的当前与未来应用场景
当前,AI绘画技术已经在多个领域得到了应用。以下是AI绘画技术的当前应用场景:
1. 艺术创作:基于AI的艺术创作已经开始受到艺术家的重视,他们利用AI生成的艺术作品,探索新的艺术形式和语言。
2. 影视游戏制作:影视游戏制作中需要大量的角色设计、场景设计等,利用AI生成的设计素材可以大大节省制作成本和时间。
3. 室内设计:AI可以根据用户的需求和喜好,自动化生成室内设计方案。
4. 广告设计:AI可以根据产品的特性和目标受众,生成符合广告效果的设计素材。
未来,随着AI技术的不断发展和进步,AI绘画技术的应用场景也将继续扩大和深化。以下是AI绘画技术未来的应用场景:
1. 自动创作:未来的AI绘画技术将可以实现完全自动的创作,生成高质量的艺术作品。
2. 教育培训:AI绘画技术可以帮助学生快速学习绘画技巧和艺术知识,提高学习效率。
3. 三维建模:AI可以根据二维图像或文字描述,自动生成三维模型,为工业设计和建筑设计带来便利。
4. 智能交互:AI绘画技术可以与语音识别、自然语言处理等技术相结合,实现智能交互,为用户提供更加个性化和便捷的服务。
总之,未来AI绘画技术的应用场景将越来越广泛,它将成为不同领域的工具和创新来源,带来更多的商业机会和社会价值。
----------------------------------------------------------------------------------------------------------
后续章节
请到到百度网盘自由观看
链接:https://pan.baidu.com/s/1hypTcsulMyf3esDYemmNzA?pwd=pp4j
提取码:pp4j
文章浏览阅读645次。这个肯定是末尾的IDAT了,因为IDAT必须要满了才会开始一下个IDAT,这个明显就是末尾的IDAT了。,对应下面的create_head()代码。,对应下面的create_tail()代码。不要考虑爆破,我已经试了一下,太多情况了。题目来源:UNCTF。_攻防世界困难模式攻略图文
文章浏览阅读2.9k次,点赞3次,收藏10次。偶尔会用到,记录、分享。1. 数据库导出1.1 切换到dmdba用户su - dmdba1.2 进入达梦数据库安装路径的bin目录,执行导库操作 导出语句:./dexp cwy_init/[email protected]:5236 file=cwy_init.dmp log=cwy_init_exp.log 注释: cwy_init/init_123..._达梦数据库导入导出
文章浏览阅读1.9k次。1. 在官网上下载KindEditor文件,可以删掉不需要要到的jsp,asp,asp.net和php文件夹。接着把文件夹放到项目文件目录下。2. 修改html文件,在页面引入js文件:<script type="text/javascript" src="./kindeditor/kindeditor-all.js"></script><script type="text/javascript" src="./kindeditor/lang/zh-CN.js"_kindeditor.js
文章浏览阅读2.3k次,点赞6次,收藏14次。SPI的详情简介不必赘述。假设我们通过SPI发送0xAA,我们的数据线就会变为10101010,通过修改不同的内容,即可修改SPI中0和1的持续时间。比如0xF0即为前半周期为高电平,后半周期为低电平的状态。在SPI的通信模式中,CPHA配置会影响该实验,下图展示了不同采样位置的SPI时序图[1]。CPOL = 0,CPHA = 1:CLK空闲状态 = 低电平,数据在下降沿采样,并在上升沿移出CPOL = 0,CPHA = 0:CLK空闲状态 = 低电平,数据在上升沿采样,并在下降沿移出。_stm32g431cbu6
文章浏览阅读1.2k次,点赞2次,收藏8次。数据链路层习题自测问题1.数据链路(即逻辑链路)与链路(即物理链路)有何区别?“电路接通了”与”数据链路接通了”的区别何在?2.数据链路层中的链路控制包括哪些功能?试讨论数据链路层做成可靠的链路层有哪些优点和缺点。3.网络适配器的作用是什么?网络适配器工作在哪一层?4.数据链路层的三个基本问题(帧定界、透明传输和差错检测)为什么都必须加以解决?5.如果在数据链路层不进行帧定界,会发生什么问题?6.PPP协议的主要特点是什么?为什么PPP不使用帧的编号?PPP适用于什么情况?为什么PPP协议不_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输
文章浏览阅读587次。软件测试工程师移民加拿大 无证移民,未受过软件工程师的教育(第1部分) (Undocumented Immigrant With No Education to Software Engineer(Part 1))Before I start, I want you to please bear with me on the way I write, I have very little gen...
文章浏览阅读304次。Thinkpad X250笔记本电脑,装的是FreeBSD,进入BIOS修改虚拟化配置(其后可能是误设置了安全开机),保存退出后系统无法启动,显示:secure boot failed ,把自己惊出一身冷汗,因为这台笔记本刚好还没开始做备份.....根据错误提示,到bios里面去找相关配置,在Security里面找到了Secure Boot选项,发现果然被设置为Enabled,将其修改为Disabled ,再开机,终于正常启动了。_安装完系统提示secureboot failure
文章浏览阅读10w+次,点赞93次,收藏352次。1、用strtok函数进行字符串分割原型: char *strtok(char *str, const char *delim);功能:分解字符串为一组字符串。参数说明:str为要分解的字符串,delim为分隔符字符串。返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。其它:strtok函数线程不安全,可以使用strtok_r替代。示例://借助strtok实现split#include <string.h>#include <stdio.h&_c++ 字符串分割
文章浏览阅读2.3k次。1 .高斯日记 大数学家高斯有个好习惯:无论如何都要记日记。他的日记有个与众不同的地方,他从不注明年月日,而是用一个整数代替,比如:4210后来人们知道,那个整数就是日期,它表示那一天是高斯出生后的第几天。这或许也是个好习惯,它时时刻刻提醒着主人:日子又过去一天,还有多少时光可以用于浪费呢?高斯出生于:1777年4月30日。在高斯发现的一个重要定理的日记_2013年第四届c a组蓝桥杯省赛真题解答
文章浏览阅读851次,点赞17次,收藏22次。摘要:本文利用供需算法对核极限学习机(KELM)进行优化,并用于分类。
文章浏览阅读1.1k次。一、系统弱密码登录1、在kali上执行命令行telnet 192.168.26.1292、Login和password都输入msfadmin3、登录成功,进入系统4、测试如下:二、MySQL弱密码登录:1、在kali上执行mysql –h 192.168.26.129 –u root2、登录成功,进入MySQL系统3、测试效果:三、PostgreSQL弱密码登录1、在Kali上执行psql -h 192.168.26.129 –U post..._metasploitable2怎么进入
文章浏览阅读257次。本文将为初学者提供Python学习的详细指南,从Python的历史、基础语法和数据类型到面向对象编程、模块和库的使用。通过本文,您将能够掌握Python编程的核心概念,为今后的编程学习和实践打下坚实基础。_python人工智能开发从入门到精通pdf