开篇词 AI技术爆发,如何实现绘画模型自由?
你好,我是南柯,非常欢迎你加入我的课程,与我一起探索AI绘画技术背后的奥秘。
先做个自我介绍,作为一名计算机视觉从业者,我一直活跃在AI绘画技术领域。这么多年的工作里,我在图像风格化、图像生成、数字人等技术方向积累了丰富经验。目前我在一家头部互联网公司工作,正带领我的团队全力推动多模态大模型领域的能力建设。
我们后面要讨论的AI绘画,是AIGC技术的一部分。AI绘画正处在百花齐放的上升期,就在2022年,一系列的天才画师模型相继推出,比如DALL-E 2、Imagen、Parti、Stable Diffusion等。更让人兴奋的是,这些新技术并非昙花一现,而是为更多更出色的工作铺平了道路,比如AI绘画领域的MidjourneyV5。
可以预见,在未来几年AI绘画模型的生成能力、编辑能力仍将持续演进。现在选择入场做AI绘画技术是一个好时机。
一起迎接AI绘画的浪潮
结合近期我的一些工作经历和线下交流经历,不难看到大家对AI绘画非常好奇。让我比较意外的一点就是,除了正在研发和探索AI绘画算法、应用的专业人士之外,很多算法工程师、产品经理、艺术创作者,甚至我的老板们,也非常热衷和我讨论AI绘画背后的技术原理和未来的发展趋势。
设计师朋友正在担心“卷不过” AI画师。未来AI绘画工具的普及程度,差不多会和现在的CAD技术一样。如果不尽快掌握AI绘画工具,并把它融合到自己的个人风格,就要面临被AI绘画工具挑战的风险。
有多年工作经验的资深产品经理正在负责AI绘画项目,却发现自己几乎听不懂算法同学的讨论了。想要追问,却常常得到“产品不需要深入了解这个”的回应,这让他深感无奈。
即便是有基础的算法工程师、技术同学,也很容易发现过往的传统深度学习方法和AI新技术中间有很大的知识鸿沟。因为缺乏指导,最多只能调用现成的AI绘画模型简单玩玩,新技术的原理仍然还是黑盒。
就连投资人、CEO这样的角色也在有意识地培养自己对于AI绘画技术原理的理解、能力边界的认识,闲暇时间会拉着一线同学请教相关知识。搞懂了AI绘画背后的逻辑,有助于他们从公司视角去调整下一步的产品战略。
我自己也常常思考类似的问题。
- 为什么像Stable Diffusion这样的AI绘画模型一出现,GAN就显得黯然失色了?
- 随着AI绘画和GPT技术的不断突破,图像编辑未来的交互形式是怎样的?
- Midjourney靠AI绘画取得了巨大成功,他们可能采用了哪些独特的算法方案?
- 我能否训练一个自己专属的AI绘画模型,随心所欲创造富有创意的内容?
如果你也在脑子里也闪过类似想法,那加入我的专栏将会是一个绝佳的选择。在接下来的学习中,我们将一同揭开这些问题的答案,探索AI绘画技术的奥秘。
我们课程是怎么安排的?
不过,对于初学者来说,想要系统了解学习AI绘画并不容易,主要障碍包括后面这几方面。
- 没有合适的系统学习资料。网上随便搜到的资料过于零散,不够深入,更不要说建立自己的知识体系;而AIGC方向的论文啃起来也很晦涩,而且读论文的方式并不适合所有人。
- 止步简单体验,无法做进阶尝试。只能简单体验开源模型,无法更进一步理解AI模型的技术原理,那么自然也就没办法随心所欲地做能力扩展。
- 缺少从业级别的指导。接触不到企业级的AI绘画项目和技术,自己摸索制作的只是“玩具水准”,难以达到各种APP上看到的从业者实现出的效果。
为了摆脱上述困境,这门课程将理论与实战相结合,在帮你搞懂AI绘画技术原理的基础上,通过多次实战课将AI绘画转化为你自己的工具。
具体来说,在这门课程中我们要一起经历四个阶段。
首先是热身阶段,相当于AI绘画旅程中的“新手村”,我会引领你熟悉各种令人着迷的免费开源AI绘画工具和模型,感受超参数在效果中的差异。此外,我们还会探索Stable Diffusion和WebUI的来龙去脉,一起安装和部署WebUI,探索AI绘画的无限潜能。
接下来的基础篇,我会为你夯实AI绘画技术的基本原理,让你真正了解AI算法从业者需要掌握的理论技术基础,理解图像生成如何从GAN过渡到扩散模型的全过程,并掌握扩散模型各个模块的算法原理。产品和设计同学固然可以跳过理论,直接到下一章,但如果想搞明白AI绘画背后的黑魔法,多少需要了解这一章的基础知识。
有了前面的基础,我们就可以运用已学内容来解读分析业界主流的AI绘画模型了。进阶篇里,DALL-E 2、Imagen、Stable Diffusion、DeepFloyd、Midjourney等业界最新最火的模型都会涉及到。掌握了这些模型的设计原理,不但能让我们充分学习、发掘这些模型的长处为己所用,还能为我们训练自己的专属AI绘画模型、实现“模型自由”打下坚实基础。
在下面的图中,我整理了从DALL-E 2推出以来,AI绘画领域一些有影响力的模型和算法。你可以点开查看。
了解了AI绘画的基本原理、常见模型方案,也熟悉了开源工具和代码仓的使用,下一步便是如何“炼丹”,即自己定义风格训练模型,完成类似于AI绘画这类的项目。
我们将一起完成DreamBooth、LoRA模型的训练,使用ControlNet精细化控制内容的生成,做出类似于LensaAI这样的相册类效果,借助Stable Diffusion给你的照片渲染出各色风格。经过这些实战课的洗礼,相信你对AI绘画的应用能力会得到质的飞跃。
下面,我为你梳理了一个简化的AI绘画知识体系图,也是这门课程涉及的全部知识点。这些概念、模型、算法、工具,乍一看好像是孤立的,但串联起来就是一张大网,能帮助我们在AI绘画的浪潮下释放创意、做出很多有意思的事情。
你能获得什么?
正如你看到的,AI绘画是个很大的话题,背后涉及的理论体系非常庞杂,领域相关的论文浩如烟海,并且每周都还在大量涌现出新的研究工作。在我的职业生涯之初,经常用很多个周末去啃英文版原汁原味的算法书籍,日积月累有不少的收获,可是这种方法实践下来,也经常会发现一些知识晦涩难懂,花费了大量时间却收获甚微。
幸运的是,后来在工作中我遇到了很多良师益友,他们能够深入浅出、三言两语把知识点讲清楚,帮助我积累了很多有用的经验、少走了很多弯路。后来我也开始渐渐成为了别人请教的对象,比如我曾被邀请和一些艺术家、企业家分享对于AI绘画技术的理解与思考,碰撞出很多有趣的火花。
因此,极客时间邀请我开设这门课程的时候,我们一拍即合。我非常期待在这门课里,用最简单的描述和例子,帮助你理解那些晦涩难懂的公式和理论,系统入门AI绘画这个领域。
学完整个课程,我们最终的目的地是这样的:真正打开AI绘画领域的大门,理解AI绘画的黑魔法背后的支撑技术和算法原理,搭建起自己的知识体系,未来遇到新的AI绘画论文、代码、模型,也能举一反三。实战方面,让主流AI绘画工具成为我们发挥创意的强大助力,做出我们在各种App看到的、从业者实现出的商用级算法效果。
AI绘画技术实战之旅即将开启,期待你的加入!
- 听水的湖 👍(4) 💬(4)
你好,我是这门课的编辑小新,欢迎加入课程学习。 这门课程的实战课需要用到的工具包括WebUI(实战1)和Colab(实战2-6)。关于WebUI的安装,在第一讲中有分平台的解释,需要大家参考提供课程里的指引进行WebUI配置,需要注意,每个人在安装过程中也许会遇到一些独特的环境问题,建议多谷歌查查资料解决。 如果有更具体的问题也可以在01讲留言里提出,我们一起探讨,另外01里也有用户分享了自己的配置经验(01置顶留言处),可以参考。关于Colab的使用,在第3讲中会有介绍,实战篇2-6的实战代码,会在Colab中帮助大家进行配置。 鼓励大家踊跃留言,记录和分享收获,积极参与有助于提升学习效果(PS:这门课的头图就是AIGC绘图而来)。
2023-07-18 - null 👍(5) 💬(4)
看了课程大纲,热血沸腾
2023-07-17 - neohope 👍(3) 💬(1)
这个课程等了一个多月啦,加油!
2023-07-19 - 失落的走地鸡 👍(2) 💬(1)
我是一个web程序员,购买学习课程的主要目的是开发一个类似妙鸭的应用,会python。为了达成目的,我需要学习什么技术栈?需要从机器学习、pyTorch开始学习吗?请南柯老师帮忙列出我的学习路径,感谢!
2023-08-31 - 里咯破 👍(2) 💬(1)
请问需要什么基础才能看懂这门课?
2023-07-31 - Mistletoe 👍(2) 💬(1)
一直很想看AIGC相关的资料,但是也一直没有找到系统的东西。感谢老师分享!
2023-07-20 - 🇨🇳🇩🇪Holger肥巴哥 👍(1) 💬(1)
自己之前看网上零零碎碎的SD教程不但费时而且效果一般,终于等到极客时间的官方课程了,立个flag,希望能把课程认认真真啃三遍
2023-08-07 - 互联网砖瓦匠 👍(1) 💬(1)
太好了,正发愁没有系统性资料学习呢,这就来课了哈哈。
2023-07-18 - 学习兔 👍(1) 💬(1)
老范推荐,必属精品。
2023-07-17 - IT蜗壳-Tango 👍(1) 💬(1)
打卡
2023-07-17 - 王晨宇 👍(1) 💬(1)
内容很棒,已学习~~
2023-07-17 - 花见笑 👍(0) 💬(1)
期待大佬的精彩讲解
2023-08-29 - Chengfei.Xu 👍(0) 💬(1)
跟着勤劳的小编一起入坑~期待自己能够完成以下沉淀: 1、从理论到实战,能够清楚AI绘画的各种实现原理 2、能够独立完成让自己满意的头像、风景画等图片处理 另外有一些疑惑与思考: 1、作者与小编如何看待GPT4.0最新插件功能,可以上传图片、文件,在油管里我看到可以完成很多功能,例如水印、上色、美化调色等,甚至还能将图片合成视频! 2、妙鸭相机之类对线下海马体造成了冲击,至少对于我而言,我更愿意尝试AI(接受程度),国内此类AI相机产品的破局、发展?
2023-08-23 - Geek_86e0f9 👍(0) 💬(1)
占座评论
2023-08-09 - 林清扬 👍(0) 💬(1)
学习!学习!虽然用了很多绘图AI,但跟随大佬的脚步会更轻松~赞,追更@!
2023-07-20