前段时间做了个可以「微信红包封面设计?」GPT,这款工具的能力之一是可以接受用户发送的图片,将图片转化为抽象画的文字,再以该文字作为AI的prompt,使用文字生成图片的工具(DALLE)生成相似的图片。
但,实际使用的体验距离我预期颇远,你可以看下下面这段对话(注:发送给AI的原图使用的是公众号「槽边往事」中和菜头使用Midjourney生成的图)
你会发现,现在AI图生文,再文生图的能力很贴切的体现了人类沟通的困难。
不管是使用Midjourney还是DALLE,你常常会发现上传后得到的文字prompt还挺像那么回事的,但是再次使用AI生成了,则完全不是那么回事了。
人类沟通也是如此,当与人沟通想法时,你脑子中想象的是图1的画面,表达出来的是“一位女性与中国龙的元素结合的幻想插画。她拥有精致的龙鳞装饰,龙角,以及金色的装饰,整体色调为深邃的蓝色和金色,给人一种神秘而优雅的感觉。”
与你对话的那个人接收到信息后,脑中生成的是图2的场景。
谁都没错,但是文字或语言就是对图像、对思想的一个凝练,这种凝练再还原就是会失真的。