
如果你想使用 Midjourney 创建图像,你就只能使用 Discord。
算是吧。
Midjourney 尚未发布 API,但他们正在逐步推进。毫无疑问,他们有一个内部私有 API,但对于外部公共用户而言,这项技术完全依赖于 Discord。在 midjourney.com 上进行身份验证需要通过 Discord,与这项技术交互的唯一方式也是在 Discord 上提交 `/imagine` 命令。
这会阻碍一些逻辑工作流程。例如,您可能希望预先设计一组提示信息,然后批量提交,以便程序在夜间运行。或者,您可能希望自动放大每张图片,并将其与描述所用提示信息的文本文件(或数据库条目)一起保存到某个目录中。
显而易见,Midjourney 这种技术最适合大量使用。没错,如果你随意尝试,输入一些有趣的创意提示,就能生成一些不错的图像。但如果你想获得特定类型的图像或效果,就需要反复生成并调整结果。
例如,以下是一个典型的工作流程。我有个朋友患有渐冻症(肌萎缩侧索硬化症),正在接受全天候的医疗管理。我想到给他发一些长得像他的搞笑图片来逗他开心,这样我们其他的朋友就可以评论并和他聊天了。
要实现这一点,需要采取以下步骤:
- 请用一句话来形容我的朋友。例如,“一位面容友善、手臂粗壮的中年意大利男子”。
- 加上“不留胡子”的字样,并调整一下年龄,否则每张图片看起来都像是马里奥和绿巨人霍根的结合体。
- 找一个有趣的场景——例如“一位英俊潇洒、脾气暴躁的意大利男子,手臂粗壮,在二战时期的德国U型潜艇上与水兵们自拍,大家都在笑,啤酒洒得到处都是”。
- 尝试调整灯光、氛围、艺术风格以及其他几十个参数。
- 然后剔除所有手部动作错误、背景人物缺眼或其他人工智能缺陷的生成器。
所以你可以轻松生成 50 次来获得你想要的东西。我的意思是,这就是 /relax 命令的作用。
唉,要做到这一点,你需要在 Discord 中输入所有这些命令。别指望用 Python 脚本就能生成你想要的所有变体,并能将其整齐地传递给 API 了。
其实,你也不必完全忘记它……
我在 Medium 上看到一篇很棒的文章,它采用了一种很有意思的方法。文章使用PyAutoGUI构建了一个可以在 Discord 上聊天的机器人,并根据文本文件中的提示进行操作。我试用了一下,它确实像文章里描述的那样工作。你只需要创建一个 prompts.txt 文件,然后就可以观察机器人输入命令了。
仅仅编写一个普通的 Discord 机器人是行不通的,因为 Midjourney 机器人需要“/imagine”命令,然后是“tab”键,最后才是你的提示信息。这很繁琐。
遗憾的是,由于它是一个等待事件的虚拟 GUI 操作符,我还没有完全修改它以创建数据库条目。理论上应该可以获取附件并保存它们——正在进行中!
同时,您或许会发现以下资源很有用:
- 首先,一般建议是创建自己的 Discord 服务器并将 Midjourney 机器人添加到其中。否则,如果您使用他们的官方服务器,您的结果会和其他所有人的结果混在一起,看起来会很混乱。
- 所有主要样式和命令:这个 GitHub 仓库是一个非常棒的资源。它包含了大量的光照、样式、氛围、艺术家、透视等命令。
- GitHub 主要命令的简要概述
- 一个令人难以置信的 50TB Google 表格,展示了所有艺术家和风格(好吧,它实际上并没有 50TB,但确实非常庞大)。