2022-10-18

2022-10-18 杂谈

关于 AI 绘画

一幅图画囚禁了我们。我们逃不脱它，因为它在我们的语言之中，而语言似乎不断向我们重复它。—《哲学研究》115 节，维特根斯坦。

我的想法：NovelAI 揭露了人们之前一直掩盖的一个事实：二次元绘画是二次元人设的堆砌。

在 AI 绘画中，这很容易证明：我们使用一堆 tag 作为这个符号系统的输入，输出的是一张图片，其中严格包含了这些 tag。这当然是没有意义的符号组合，只不过我们对着这张图构建了一个意义，然后声称这是 AI 艺术。

我们以前都认为，二次元绘画都是艺术 ^[1]。实际上绘画要分成两块：工业生产的有目的性的画作，以及艺术性的创作。这种分类并不是对立的，我们用番剧来举例：番剧中的关键帧都是工业生产的画作，但连贯起来却具有了一种艺术性。

对于二次元（这里其实应该专指萌系画风）来说，一部商业作品的成功需要做市场调研，调查受众的口味。在这个过程中我们标签化了角色，我们分成了无数种萌属性。这样的商业作品，显然是工业生产的批量画作。

画师要做的是把人们心目中的某种描述性的（descriptive）图景，语言化为的标签的图景，具象化，变成我们可以看到的画作。

首先谈谈这些标签：缺乏所指定义的符号，类似在光学出现之前我们对于“红色”的定义。这些标签都不是纯概念上的，都内涵了一种叙事，我们构建了一个符号然后把这个符号安在某个角色身上。

我们给出的某种标签的定义，是基于前人的某个具体的图景抽象出来的，那么之后要画出这种标签的人物就必须依赖之前的某种图景。

因此，就不难理解一种观点：我能看出这个角色身上有某些角色的影子。

而当我们去把这些较强的标签（像 XXX 一样的）转化成较弱的，一个公共叙事上的，概念性的标签，问题又出现了：这些标签若不是依托于某些角色而存在的，那么就是空洞无物的。我们的具象化过程是不可能进行的。

我说人物 A 像明日香，所以人物 A 是傲娇；人物 B 像明日香，所以人物 B 是傲娇；

但我们能说人物 C（死了母亲）像明日香，然后说人物 C 是傲娇吗？

我们应当直接叙事而不是使用 tag 来构造图片。什么是标签，什么是叙事？傲娇是标签，嘴巴上扬气鼓鼓这是叙事，后者可以让你看出傲娇这个属性。

这里很有文学的影子！在文学中我们就不是直接设定一个人物，而是通过各种描写来丰满一个人物形象。

不知道读者有没有思考过“按标签分类”这个想法。例如你想给自己收藏的沙雕表情包打上标签然后分类，你会发现这玩意简直没法使用：一些图片既符合一个标签，又符合另一个标签，而我们想要的却是查询某一个叙事的图片！

属性、标签、叙事，和某个具体人物，它们之间都不具有强关联性。当我们给出一个“属性”标签时，AI 会挑选带有该属性的人物进行缝合。因为我们的标签化过程是如此的，于是 AI 进行了一个反过程。

因为标签没有所指，AI 当然也不能自己理解出/创造标签的所指，因此 AI 并不能理解这个标签。我们可以说，AI 是一个标签集合内的猴子打字机。

目前 AI 绘画的特点是：想要得到非常特定的图有困难，但无心插柳往往能得到意外惊喜的图。就像是 AI 绘画的作图者们自称的，像是“抽卡”一样的体验。^[2]

但是，当你给定的限定范围越多，猴子打字机输出的结果当然越准确：如果你准确描述了蒙娜丽莎，你当然只能画出蒙娜丽莎！

实际上也是，我们对 AI 的图片标签输入越来越叙事化。我们甚至开始使用嵌套的标签，而嵌套的标签就是迈向类型系统的关键一步。既然类型系统是图灵完备的，那么我们这样一种与 AI 交流的语言当然也是图灵完备的。

实际上根据日常语言分析学派来说，这些标签就应当被引导为日常语言中的运用，也因此在日常语言中才具有意义。

我们把语词从形而上学的用法重新带回到日常用法。—《哲学研究》116 节，维特根斯坦。

所以可以得出结论：我们创造一个与 AI 交流的语言是重要的。

A：能看得见我说话吗？
B：看不见
C：看不见
A：？？？

我们可以换作如下句子来考虑。

(i) A：能看得见我说话吗？

(ii）B：这是真的，我看不见。

(iii) B：看得见你说话的这个命题为假。

(iv) B: 回应“能看得见我说话吗”这个问题时候，给出这是假的。

B 断言了某件事为假，然而 B 的回应行为蕴含了对 A 问题为真的回应。所以 B 给出的命题便被无效化了。那么我们应当说语言退化了吗？前言语的东西能否直接覆盖后面的言说？这里留给读者自行思考了。