ai 绘画机器人如何制作？

一、ai 绘画机器人如何制作？

扫码关注《Python学研大本营》，加入读者群，分享更多精彩

我创作了“诗人皮耶特拉”。它使用 MidJourney 模型自动生成图像，最后使用 GPT-3 davinci 模型生成文本。

这是连续运行我的脚本 3 次的样子，用了non-cherry-picked的结果是：

让我们来看看这是如何实现的过程

1.生成图像：

为了生成图像，我使用了一个名为 MidJourney ，让我们先谈谈图像生成过程，然后我将讨论以自动化方式制作它的挑战。

图像模型接收某种形式的输入并生成输出（图像），在 MidJourney 的情况下，输入称为** prompt** （包含您希望模型生成的文本）。

一些例子：

一个简单的提示：“死神”

一个复杂的提示：“女战士作为死亡天使，身穿盔甲，背部有巨大的黑色翅膀，黑暗幻想，薄雾，雾气，天堂之光，史诗，巴洛克，洛可可，细节，逼真渲染，3ds max + v ray，非常详细和复杂，中心构图，优雅，vfx，虚幻引擎 5，辛烷值渲染，极端对比度，极其锐利的线条，8k，--ar 2:3"。

请注意，提示中的详细程度和“标签”在生成更复杂、详细和有创意的图像方面起着巨大的作用，这通常被称为“ 提示质量 ”，有趣的是它不一定是关于提示的大小，它是关于使用模型将理解的“标签”。

这是我们刚刚生成的图像的放大版本。

如何生成高质量的提示？

就我而言，我创建了一个机器学习模型，该模型从高质量提示数据集中学习，现在能够生成随机的高质量提示。

为了实现这一点，我必须创建这样的数据集，我使用了 selenium，这是一个浏览器自动化工具，并使用它进行了所谓的网络抓取，访问 MidJourney 网站和一些不和谐频道以检索大量高质量提示别人做的。如果您在桌面上，您可以在此链接。（https://datastudio.google.com/reporting/3fd9c46a-bae3-4e54-9cc3-05f7a5e10c74）

MidJourney 网站有一个关于特色创作的部分，展示了令人惊叹的创作以及用于生成它们的提示，这一事实确实很有帮助。

在网络抓取提示后，根据他们生成的图像和我对图像的个人意见，手动标记并为每个人分配一个分数，我终于准备好使用我的数据集了。

然后我训练了一个机器学习模型来预测一个可以从我那里获得高分的提示。

唯一剩下的就是将提示传递给 MidJourney，以便它可以生成图像，但这有一个挑战。

像 DALL-E 这样的一些图像模型计划提供一个 API，一种在代码中与模型交互的方式，通过 API，集成图像模型并使用该模型创建您自己的项目、产品或解决方案非常简单，无需API 仍然有一些方法可以与之交互，但它们更加不一致，我不建议在任何严重或生产中这样做。

目前（在撰写本文时）MidJourney 没有 API，因此要使用此模型自动生成图像，我必须制作一个使用 selenium（我提到的浏览器自动化工具）的自定义脚本来登录不和谐浏览器中的帐户，然后使用它的 /imagine 命令与 MidJourney 机器人交互。

2.生成文本：

为了生成文本，我使用 OpenAI 模型 text-davinci-002。

起初，我想只是将 MidJourney 提示发送给 davinci，但结果总是很笼统，或多或少相同。

由于诸如“渲染”、“8k”、“插图”、“详细”、“虚幻引擎”、“hdr”、“高对比度”之类的词在这些提示中很常见，我经常看到达芬奇谈论它们并离开主题，谈论视频游戏行业等（因为渲染和虚幻引擎等主题）。

结果感觉纯粹是描述性的，我在中途意识到这并不是我的目标，我意识到我想要一些更有诗意的东西，但不是一首明确的诗。

所以一开始我对提示进行了清理，删除了一堆让 davinci 跑题的词，它变得更好了，但我仍然对结果不满意。

然后我考虑将图像中可以找到的确切内容传递给davinci，而不仅仅是用于生成它的提示。

为了实现这一点，我使用 Google Vision 来获取图像的确切特征和元素。

如果您不熟悉此 Google 产品，请查看它的一些功能。

认识谷歌愿景

它提供了一个“标签”列表，这些标签是模型进行的分类，它通常包含图像中存在的对象以及一些见解，如“虚构人物”。

它提供了一个“对象”列表，通常，它返回的对象很少，但图像中出现的对象更多。

它提供了一个“属性”列表，其中包含图像中存在的颜色及其纵横比等信息。

通过向 davinci 提供所有这些信息，它将生成的文本将与图像中可以找到的元素、颜色和特征有关，因此它将不那么通用，而对图像本身更加具体。

目前，我正在混合我的两个想法，我已经从提示中排除了一组单词（如“虚幻引擎”和“渲染”），并且我正在通过经过清理的提示以及谷歌云视觉达芬奇模型的图像信息。这是最终结果：

不和谐的死亡天使结果

总而言之，这就是正在发生的事情：

我的云架构如下所示：

（由于我无法修改谷歌云功能运行时来安装 chrome 并使用 selenium，所以我使用 google cloud run with docker 代替）

您可以在下面准确找到我正在执行的 davinci API 调用，其中变量“formatted_all_features”包含图像中的颜色、标签和对象，“formatted_sanitized_prompt”包含没有与 davinci 无关的关键字的 MidJourney 提示文本生成。

response = openai.Completion.create(
  model='text-davinci-002',
  prompt=(
    f"Write a text talking loosely about the art that you made and its"
    f" {formatted_all_features} and {formatted_sanitized_prompt}"
  ),
  temperature=1,
  max_tokens=800,
  top_p=1,
  frequency_penalty=1.02,
  presence_penalty=1.02
)

希望您喜欢阅读。

这篇文章的横幅是使用 MidJourney 生成的
MidJourney 是一个不断发展的项目，体验仍在显着变化，本文中包含的图像生成于 2022 年 8 月 7 日 (%m/%d/%Y)

二、深度学习ai和机器学习ai哪个更有前景？

严格来说，深度学习是机器学习的子集。从学科的角度看，关系大概是人工智能包含机器学习包含深度学习。

人工智能是一个很大的箩筐，里面包含着各种学派从不同角度提出的用人工方法实现智能的技术路线，机器学习是其中之一。

机器学习也是一个很大的箩筐，还是各种学派从不同角度借助不同的概率统计工具实现各种算法模型，比如KNN、SVM、决策树。

其中有一个分支叫人工神经网络，也简称神经网络的算法，大家发现把网络层数做多了做深了，模型就能效果拔群，这一支一直发展，后来单独成军，这就是深度学习。

深度学习是机器学习的子集，就好比问代数和数学学哪个更有前景，总感觉有点怪怪的。

另外，无论是机器学习也好，深度学习也好，训练模型都需要依赖同一样东西，就是数据。机器学习的数据集是共通的，深度学习模型也可以用，不太明白题目“深度学习ai自己不断生成互相影响把库污染了导致达到瓶颈”是什么意思。

我的理解，题主是看到现在有一些新闻，说LLM也就是大语言模型的训练数据都来自于其它LLM的输出，未来可能存在“污染”问题。

污染问题有点意思，展开讲讲。

LLM由于需要消耗大量数据，人工成本太高，直接使用其它模型的生成结果能够降低数据门槛，但是其它模型可能存在幻觉等问题，导致数据有问题。用有问题的数据训练的模型可能也有问题，如果再用这个模型的输出结果加以训练，层层套娃下去“污染”就成了大问题。

大概是这个意思。会不会成为瓶颈？不太可能。

深度学习是大力出奇迹的典范，只要人工比硬件值钱，未来很长一段时间这个奇迹应该还会继续，至于数据问题，这里的污染说的是LLM，LLM也只是深度学习的其中一小部分，先不说最后污染问题是不是真的会成为大问题，LLM才开始爆发，污染问题已经得到重视，重视就有投入，投入就有办法，是在不行还可以回到人工标的老路上去嘛。

最重要的是，LLM也只是深度学习的一小部分，就算LLM翻车了，深度学习还会有其它L*M站起来。

三、怎样系统的学习 AI 绘画？

最近看到很多收费的AI绘画教程，但内容大都乏善可陈。所以总结了下自己的学习路径，帮助想学习StableDiffusion的朋友快速入门。我目前也在学习中，如有遗漏欢迎大家指正补充。有新玩法欢迎后台私信我，共同学习进步！

中心化的形成也是垄断的形成，开源社区更符合我对去中心化的想象：没有去中心化的贡献，不可能有去中心化的回报。

安装篇

星空大佬的整合包安装教程：https://space.bilibili.com/250989068 整合包下载：https://pan.baidu.com/s/1_FYbDpkX6Q6hDVHJpCMRxA?pwd=o852

如果不会配置环境还有UP主“秋葉aaaki”发布的StableDiffusion一键启动器。 https://www.bilibili.com/video/BV1ne4y1V7QU/ 有了它，麻麻再也不用担心我不会配置环境了！

入门篇

一、下载模型

下载模型的网站：https://civitai.com/ 下载模型时要学会辨别模型的type，模型的种类不同各种功能也不一样

civitai中的模型中有不同的Type

二、模型的存放路径

常见错误纠正和基础知识补充：https://www.bilibili.com/video/BV1r24y1s7p6/ 1.cpkt，safetensors（CHECKPOINT MERGE）存放路径：E:\stable-diffusion-webui\models\Stable-diffusion )

路径下存同名png图片会在WebUI中显示缩略图

路径下存同名png图片会在WebU中显示缩略图

2.vae，去灰滤镜存放路径：E:\stable-diffusion-webui\models\VAE3.lora存放路径：E:\stable-diffusion-webui\models\lora （存放路径二：E:\stable-diffusion-webui\extensions\sd-webui-additional-networks\models\lora 两种路径效果一样，只是调取的位置不同）4.pt存放路径：E:\stable-diffusion-webui\embeddings

三、txt2img文本到图像

https://www.bilibili.com/video/BV1V8411s76T/ 辣椒酱讲课一直事无巨细，跟着他能全面了解StableDiffusion的功能。

四、img2img图像到图像

https://www.bilibili.com/video/BV1HK411Q7uk/

五、TAG标签用法

https://www.bilibili.com/video/BV1zL411Z7LB/

六、ControlNet的安装使用

人物动作控制/景深/线稿上色 Controlnet安装使用教程：https://www.bilibili.com/video/BV1Wo4y1i77v/

进阶篇

一、进阶使用Prompt

通过 ChatGPT生成Prompt：

插件收录了很多功能，生成Prompt只是其中之一。选择Midjourney Prompt生成器，只需要简单描述，GPT会自动为你生成一系列Prompt。

以输入现代建筑为例：Modern architecture

AIPRM for ChatGPT插件界面

通过ChatGPT快速得到propmt

生成的Prompt经过筛选处理，若是Midjourney用户可以直接使用。

AIPRM for ChatGPT安装教学：https://www.bilibili.com/video/BV1LT411S7GK/插件地址：AIPRM for ChatGPT - Chrome 应用商店 (https://google.com)

注：此方法需要科学上网，并注册有ChatGPT账号。如果ChatGPT登陆被拒绝，这是因为openAi的地区限制。

ChatGPT登陆被拒绝

此时需要将缓存清除，更换好魔法后再次登入进行验证即可。方法如下：

第一步，复制下面代码到浏览器地址栏 avascript:window.localStorage.removeItem(Object.keys(window.localStorage).find(i=>i.startsWith('@@auth0spajs')))
第二步，在上述代码的头部写个j 即：javascript:window.localStorage.removeItem(Object.keys(window.localStorage).find(i=>i.startsWith('@@auth0spajs')))
第三步回车后，更换魔法，如日本、韩国、印度、美国等，建议日本。之后重新登录即可。

2.通过输入图片解析图片中内容生成prompt，如下：

解析过程

输出结果

教学：https://www.bilibili.com/video/BV1Aj411u7yQ/（01:26）

网址：https://replicate.com/pharmapsychotic/clip-interrogator

3.这是一个用于构建 Danbooru 标签组合的网站。应用场景：抽卡时有奇效

网址：https://tags.novelai.dev/

二、利用ControlNet修改图片色彩、光影

Multi-ControlNet和ControlNet修改色彩的技巧：https://www.bilibili.com/video/BV1Mj411V7tT/此方法通过ControlNet控制图像不变，img-to-img控制色彩的方法修改光线。还有一种思路是用seed控制图像。B站故障君的测试的效果如下：

用模型、seed、prompt控制图像不变，用img-to-img控制光线色彩

输出结果

用模型、seed、prompt控制图像不变，用img-to-img控制光线色彩

输出结果

三、场景解析

OneFormer可以将你输入图片所包含的元素解析出来，在场景设计、画面构图的工作中有奇效。

OneFormer场景解析

场景设计中的应用：https://www.bilibili.com/video/BV1DY4y1C76o/Seg（ControlNet）语义分割控制网络：https://www.bilibili.com/video/BV1bM411x7nD/OneFormer 网址：https://huggingface.co/spaces/shi-labs/OneFormer

四、训练模型

1.训练LoRa模型教程：Stable Diffusion LoRa 极简训练方法：https://www.bilibili.com/video/BV1Kj411V78D/LoRA模型训练教程：https://www.bilibili.com/video/BV1fs4y1x7p2/

其他视频： https://www.bilibili.com/video/BV1K84y1N7oi/ https://www.bilibili.com/video/BV1cs4y157Ed/

2.炼丹常用参数详解：https://www.bilibili.com/video/BV1rs4y1o7V8/

附加篇

结语

感谢您阅读本文，希望您能从中学到一些有关 AI 绘画的知识和技巧。

如果您喜欢这个教程，或者有任何建议和反馈，请给我留言或者添加我的微信。

如果您在学习过程中遇到了一些困难，欢迎加入互助群，一起学习交流。

沙雕AI互助群

Akidio-

四、ai机器学习计划

AI机器学习计划：开启智能未来的关键一步

人工智能（AI）和机器学习（Machine Learning）已经成为当今科技领域的热门话题。随着技术的不断进步和应用的普及，AI机器学习正逐渐改变着我们的生活和工作方式。无论是自动驾驶汽车、智能助理，还是语音识别和自然语言处理，这些都是AI和机器学习的应用领域。因此，对于想要在这个领域取得进展的个人和企业来说，制定一个合适的AI机器学习计划是至关重要的。

步骤1：确定学习目标

在开始AI机器学习计划之前，首先需要明确学习的目标。根据个人或企业的需求，可以选择性地学习关于AI机器学习的基础知识、算法和技术。对于初学者来说，可以通过在线课程、教程和书籍了解基本概念和原理。而对于已经有一定了解的人来说，可以选择深入研究某些特定领域的高级算法和模型。

关键词：AI机器学习，学习目标

步骤2：选择合适的学习资源和平台

为了实现学习目标，需要选择合适的学习资源和平台。现在有许多在线学习平台提供了关于AI和机器学习的课程，如Coursera、edX和Udacity等。这些平台提供了丰富的学习资源，包括视频课程、实践项目和在线讨论论坛。同时，还可以参加一些AI和机器学习的研讨会和培训班，与业界专家和从业者交流和学习。

关键词：学习资源，学习平台

步骤3：实践项目和案例研究

除了理论学习，实践项目和案例研究是提高AI机器学习技能的关键。通过参与实际项目，可以应用所学知识解决实际问题，同时也可以提高自己的实践能力和团队合作能力。可以参加一些开源项目，如GitHub上的AI项目，或者自己选择一些感兴趣的问题进行研究和实现。

关键词：实践项目，案例研究

步骤4：与业内专家和从业者交流

与业内专家和从业者的交流是AI机器学习学习过程中的另一个关键步骤。可以参加一些学术会议和研讨会，与专家和其他学者交流和分享经验。同时，加入一些AI机器学习的社区和线上论坛，与同行进行讨论和合作。从他们身上可以学到很多实用的技巧和经验，也能了解到最新的研究进展和行业趋势。

关键词：业内专家，从业者交流

步骤5：持续学习和更新知识

AI机器学习是一个快速发展的领域，因此持续学习和更新知识是至关重要的。可以定期阅读相关的学术论文和行业报告，了解最新的研究成果和应用案例。同时，参加一些进修课程和培训班，学习新的算法和技术。保持好奇心和求知欲，不断探索和尝试新的方法和思路。

关键词：持续学习，更新知识

结语

AI机器学习是开启智能未来的关键一步。通过制定合适的学习计划，选择合适的资源和平台，参与实践项目和案例研究，与业内专家和从业者交流，以及持续学习和更新知识，我们可以不断提升自己的技能和能力，在AI机器学习领域取得进步。

无论是个人还是企业，都应该重视AI机器学习的发展。只有不断学习和适应新的技术和方法，才能在这个竞争激烈的时代中保持竞争力。相信通过我们的努力和探索，AI机器学习将为我们创造更多的机遇和挑战。

五、AI绘画软件？

adobe illustrator2022

是一款专业的图形设计软件，广泛应用于广告设计、印刷出版、海报书籍、插画绘制、图像处理、PDF文档设计、WEB页面等设计，借助这款矢量绘图工具，可以制作适用于印刷、Web、视频和移动设备的徽标、图标、绘图、版式和插图，您可以用符号和创新的切割选项制作精美的网页图形，还可以用即时变形工具探索独特的创意。

六、如何AI绘画？

方式一

新建ai空白画布，点击左侧的钢笔工具。

步骤/方式二

然后使用钢笔工具画出需要的物件，这里以荷叶为例。

步骤/方式三

选中荷叶，单击右键，选择编组。

步骤/方式四

选择合适的颜色，将荷叶进行填色即可。

七、ai绘画原理？

原理用智能电脑自动生成的绘画方式,我们可以使用人工智能算法来进行绘画和创作,简单的来说就是通过算法完成的艺术创作

八、ai绘画软件？

极客星球APP，宇宙领域科技耗费很久倾情推出的AI智能绘画，市面上价值年费会员上千的AI智能绘画功能，可输入详细到细节的描述，AI助力创作一键生成三张高质量画作，画质高清且注重细节，它的能力甚至让一众画家都望尘莫及，未来还将支持更多模型，为你提供丰富的生成选择。可以在微信搜一搜，了解更多相关详情

九、ai绘画介绍？

AI绘画是指使用人工智能技术生成艺术作品的过程。随着计算机技术的不断发展，越来越多的艺术家和设计师开始利用AI技术来创作新的艺术形式。

AI绘画的实现方式有很多种，其中最常见的是使用深度学习算法对大量艺术作品进行学习和模拟，从而生成新的艺术品。这些算法可以识别不同的颜色、形状、纹理等特征，并根据这些特征来生成新的图像。

AI绘画的应用范围非常广泛，包括数字艺术、游戏设计、建筑设计等领域。例如，在数字艺术领域，AI绘画可以帮助艺术家快速生成大量的艺术作品，从而提高创作效率；在游戏设计领域，AI绘画可以帮助游戏开发者创建更加逼真的游戏场景和角色形象。

虽然AI绘画技术还存在一些局限性，例如对于复杂的概念和情感表达能力较弱等问题，但是随着技术的不断进步和发展，相信AI绘画将会在未来的艺术领域发挥越来越重要的作用。

十、ai绘画前景？

前景不错，通过AI绘图软件生成初版作品，画师在此基础上对作品进行进一步调整。从这一方向来看，AI和人工原画并不一定就是敌对关系。

一、ai 绘画机器人如何制作？

让我们来看看这是如何实现的过程

1.生成图像：

一些例子：

如何生成高质量的提示？

2.生成文本：

认识谷歌愿景

不和谐的死亡天使结果

推荐书单

《Python数据可视化》

《精通Tableau 2019》

二、深度学习ai和机器学习ai哪个更有前景？

三、怎样系统的学习 AI 绘画？

安装篇

入门篇

一、下载模型

二、模型的存放路径

三、txt2img文本到图像

四、img2img图像到图像

五、TAG标签用法

六、ControlNet的安装使用

进阶篇

一、进阶使用Prompt

二、利用ControlNet修改图片色彩、光影

三、场景解析

四、训练模型

附加篇

一、视频转动画

二、人物三视图

三、云端配置环境、训练模型

四、使用频率超高的几个网站：

结语

四、ai机器学习计划

AI机器学习计划：开启智能未来的关键一步

步骤1：确定学习目标

步骤2：选择合适的学习资源和平台

步骤3：实践项目和案例研究

步骤4：与业内专家和从业者交流

步骤5：持续学习和更新知识

结语

五、AI绘画软件？

六、如何AI绘画？

七、ai绘画原理？

八、ai绘画软件？

九、ai绘画介绍？

十、ai绘画前景？

为您推荐

教育机器人智慧学习环境

深入探讨：机器学习如何

猎人如何学习宝宝技能？

从零开始：如何自学机器

abb机器人仿真设置？

小米机器人充电多久啊