2022-10-18 杂谈
关于 AI 绘画
一幅图画囚禁了我们。我们逃不脱它,因为它在我们的语言之中,而语言似乎不断向我们重复它。—《哲学研究》115 节,维特根斯坦。
可以先看一篇知乎回答:https://www.zhihu.com/answer/2716507220
我的想法:NovelAI 揭露了人们之前一直掩盖的一个事实:二次元绘画是二次元人设的堆砌。
在 AI 绘画中,这很容易证明:我们使用一堆 tag 作为这个符号系统的输入,输出的是一张图片,其中严格包含了这些 tag。这当然是没有意义的符号组合,只不过我们对着这张图构建了一个意义,然后声称这是 AI 艺术。
前 AI 时代的二次元绘画
我们以前都认为,二次元绘画都是艺术 [1]。实际上绘画要分成两块:工业生产的有目的性的画作,以及艺术性的创作。这种分类并不是对立的,我们用番剧来举例:番剧中的关键帧都是工业生产的画作,但连贯起来却具有了一种艺术性。
对于二次元(这里其实应该专指萌系画风)来说,一部商业作品的成功需要做市场调研,调查受众的口味。在这个过程中我们标签化了角色,我们分成了无数种萌属性。这样的商业作品,显然是工业生产的批量画作。
画师要做的是把人们心目中的某种描述性的(descriptive)图景,语言化为的标签的图景,具象化,变成我们可以看到的画作。
标签化的错误在哪里?
首先谈谈这些标签:缺乏所指定义的符号,类似在光学出现之前我们对于“红色”的定义。这些标签都不是纯概念上的,都内涵了一种叙事,我们构建了一个符号然后把这个符号安在某个角色身上。
我们给出的某种标签的定义,是基于前人的某个具体的图景抽象出来的,那么之后要画出这种标签的人物就必须依赖之前的某种图景。
因此,就不难理解一种观点:我能看出这个角色身上有某些角色的影子。
而当我们去把这些较强的标签(像 XXX 一样的)转化成较弱的,一个公共叙事上的,概念性的标签,问题又出现了:这些标签若不是依托于某些角色而存在的,那么就是空洞无物的。我们的具象化过程是不可能进行的。
我说人物 A 像明日香,所以人物 A 是傲娇;人物 B 像明日香,所以人物 B 是傲娇;
但我们能说人物 C(死了母亲)像明日香,然后说人物 C 是傲娇吗?
我们应当直接叙事而不是使用 tag 来构造图片。什么是标签,什么是叙事?傲娇是标签,嘴巴上扬气鼓鼓这是叙事,后者可以让你看出傲娇这个属性。
这里很有文学的影子!在文学中我们就不是直接设定一个人物,而是通过各种描写来丰满一个人物形象。
不知道读者有没有思考过“按标签分类”这个想法。例如你想给自己收藏的沙雕表情包打上标签然后分类,你会发现这玩意简直没法使用:一些图片既符合一个标签,又符合另一个标签,而我们想要的却是查询某一个叙事的图片!
AI 中发生了什么?
属性、标签、叙事,和某个具体人物,它们之间都不具有强关联性。当我们给出一个“属性”标签时,AI 会挑选带有该属性的人物进行缝合。因为我们的标签化过程是如此的,于是 AI 进行了一个反过程。
因为标签没有所指,AI 当然也不能自己理解出/创造标签的所指,因此 AI 并不能理解这个标签。我们可以说,AI 是一个标签集合内的猴子打字机。
目前 AI 绘画的特点是:想要得到非常特定的图有困难,但无心插柳往往能得到意外惊喜的图。就像是 AI 绘画的作图者们自称的,像是“抽卡”一样的体验。[2]
但是,当你给定的限定范围越多,猴子打字机输出的结果当然越准确:如果你准确描述了蒙娜丽莎,你当然只能画出蒙娜丽莎!
实际上也是,我们对 AI 的图片标签输入越来越叙事化。我们甚至开始使用嵌套的标签,而嵌套的标签就是迈向类型系统的关键一步。既然类型系统是图灵完备的,那么我们这样一种与 AI 交流的语言当然也是图灵完备的。
实际上根据日常语言分析学派来说,这些标签就应当被引导为日常语言中的运用,也因此在日常语言中才具有意义。
我们把语词从形而上学的用法重新带回到日常用法。—《哲学研究》116 节,维特根斯坦。
所以可以得出结论:我们创造一个与 AI 交流的语言是重要的。
关于语言的退化
1 | A:能看得见我说话吗? |
我们可以换作如下句子来考虑。
(i) A:能看得见我说话吗?
(ii)B:这是真的,我看不见。
(iii) B:看得见你说话的这个命题为假。
(iv) B: 回应“能看得见我说话吗”这个问题时候,给出这是假的。
B 断言了某件事为假,然而 B 的回应行为蕴含了对 A 问题为真的回应。所以 B 给出的命题便被无效化了。那么我们应当说语言退化了吗?前言语的东西能否直接覆盖后面的言说?这里留给读者自行思考了。