有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
上传一张图片,或者输入一些简单的关键词,系统就能自动生成一张卡通图像……最近一段时间,AI绘画开始在互联网社交平台走红。
AI绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容的典型应用场景之一。其主要原理是收集大量已有作品,通过算法对其内容和风格特征进行解析,最后再生成新的作品,所以算法是AI绘画的核心。
当前,“凭空”生成图像的AI绘画,其实也会动辄“翻车”:也许上一秒AI通过你的照片绘出的是一张充满艺术感的二次元画像,下一秒你的宠物猫、狗则可能被画成可爱少女或肌肉猛男。
事实上,AI绘画早已火爆全球。第一张公开展出的、由人工智能创作的绘画作品《埃德蒙·贝拉米的肖像》曾于2018年在佳士得拍卖行以43.25万美元成交,那是一张由机器学习了从14世纪到20世纪的1.5万张肖像画之后自动生成的一张肖像画作品。
AI绘画是如何实现“凭空”生图的?除了娱乐外,AI绘画还有哪些潜在的应用前景?
从“以图生图”到“语音生图”
2022年,由人工智能创作的《太空歌剧院》一度火出圈。在美国科罗拉多州举办的新兴数字艺术家竞赛中,《太空歌剧院》获得“数字艺术/数字修饰照片”类别一等奖。它的构图、配色以及画面的细节堪称精致。然而,这个作品的创作者不是艺术家,而是来自美国科罗拉多州的游戏设计师。
这位游戏设计师在一个名为“Midjourney”的AI创作工具里,先输入几个关键词,如光源、构图、氛围等,得到了100幅作品,再进行约80小时的修图修饰,最终选出3幅作品,最后把图像打印到画布上。
通过简单交互式对话在短时间内生成的“艺术”作品,让人类艺术家展开了一场关于“AI绘画作品参赛是否属于作弊”的争论。这场声势浩大的争论也令大众直观地意识到如今的AI绘画水平已经发展到了何种程度。
“人工智能在艺术方面的创作最早可以追溯到上个世纪末,当时的人工智能绘画技术叫作‘图像的风格化滤镜’。”中国科学院自动化研究所多模态人工智能系统全国重点实验室研究员董未名说,最初的AI绘画方法比较简单,比如一张普通的照片,通过一些图像处理的算法,把照片像素进行几何或者色彩上的变换,然后再调节不同参数,就可以模拟出类似油画或者水彩画的风格。
经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
AI绘画主要依靠三种技术模式实现
董未名介绍,目前AI绘画主要借助图像风格迁移技术、图文预训练模型和扩散模型实现。
“图像风格迁移技术指的是图像处理算法通过对输入的真实图像内容特征和对参考的艺术图像风格特征的提取,实现真实图像内容特征和艺术图像风格特征的融合,从而生成新的艺术图像。”董未名举例,如果将美国旧金山艺术宫的外景照片和印象派创始人莫奈绘制的作品,通过图像风格迁移技术进行融合,就能得到一张看起来像是由莫奈绘制的美国旧金山艺术宫的绘画作品。最初的AI绘画采用的正是这种技术。
不过,在董未名看来,图像风格迁移技术大多依赖的是生成式对抗网络(GAN)算法,它最大的问题是生成的绘画作品艺术性不强,笔触和构图让人觉得与真实的绘画有差距,所以长久以来,AI绘画一直“籍籍无名”。
当图像风格迁移技术还在挣扎于输出作品的审美问题时,图文预训练模型的出现,加速了AI绘画的崛起。
“依托图文预训练模型,只要输入一句话或者上传一幅风格明显的图片,算法就能将图像特征和文字特征‘对齐’。生成的绘画作品的内容特征和上传图片的内容相似,艺术性也比图像风格迁移技术生成的图片强很多。”董未名举例,比如支撑图文预训练模型的可对比语言—图像预训练(CLIP)算法,就是利用图文特征“对齐”的能力,再结合已有的生成模型,实现“以图生图”或者“图+文”生图。
不过,董未名坦言,图文预训练模型的推广也存在一些争议,有部分人认为,该模型在训练前期,需要用大量的图形处理器(GPU)进行数据训练,耗电量大、成本很高,而该模型的应用场景却不够清晰。但也有人认为,也许该模型未来可以打造为通用的人工智能模型,用它完成更多的算法作业,只是这还需要时间的验证。
诚然没有一项技术是完美的,这也为人类探究更先进的技术提供了无限动力。当下最流行的扩散模型便是其中之一。
“目前最新的AI绘画技术采用的就是扩散模型,这种模型可以把一个随机采样的噪声输入模型,然后尝试通过去噪来生成图像。”董未名表示,扩散模型也存在弱点,由于模型对图片内容识别的能力不足,或者难以完全理解识别文字的意义,以及训练数据的偏差,有时便会生成“四不像”的作品。此外,扩散模型生成图片的速度比较慢,目前还达不到实时生成图片。
互联网治理、元宇宙或潜藏应用前景
AI绘画目前的应用场景,更多聚焦于社交软件。近期在国内社交网络“火出天际”的AI绘画软件主要集中在小程序及App。随着AI绘画小程序的火爆,短视频平台抖音也迅速上线了AI绘画特效。同时,此前腾讯上线了“QQ小世界AI画匠”活动,百度也推出了首款AI艺术和创意辅助平台“文心一格”。
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”“AI现在已经完美实现了这一目标,人们可以通过机器计算来绘制出很多现实中见不到的场景。”董未名畅想,不远的将来,AI绘画或许还将展现更丰富的应用场景。
“现在网络上充斥着很多不良内容,这些内容为了逃避监管经常以绘画的形式出现,而当前很多内容识别模型对真实图片识别得很准确,但缺乏不良内容艺术作品的相关训练数据,所以对不良内容识别不准确。也许可以用AI绘画技术,积累不良内容艺术作品的数据,并用以训练识别模型,以提升互联网内容的安全监管能力和识别的准确率。”董未名建议。
在董未名看来,作为一种艺术呈现形式,AI绘画也将在元宇宙、设计、文旅等行业催生新的商业模式。例如AI绘画目前在AI辅助创作、短视频、影视制作和元宇宙等方面都有布局,因为这些赛道都离不开创意,AI绘画可以帮助创作者通过简单的特征输入,实现对其创意的预览,甚至可以直接进行创作。
不过,董未名并不讳言,当下AI绘画仍然存在版权争议问题。AI绘画的核心是模型,而训练模型需要使用大量图像、文本数据。对于未经授权的图片,经过运算之后所生成的图像版权归属尚难界定。“有的画家风格特别明显,如果用画家的画去训练算法模型生成作品,那最后的版权属于谁呢?”董未名提出的问题,正是多数AI绘画作品所面临的现实问题。
AI绘画掀起了一场资本的群体狂欢,希望有一天它能走出“照猫画虎”的尴尬,真正服务艺术创作、创造更多价值。(科技日报记者 金凤)
对话丨电竞“名嘴”管泽元:解说不能只在意金句******
“究竟什么样的结局才配得上这一路的颠沛流离?从差一点无缘季后赛,到最终杀进决赛。Deft最后一舞还在继续,他甚至站在了舞台的正中央!”
在英雄联盟S12半决赛第四局,DRX推掉GEN的水晶后,以黑马之姿闯进了S12决赛。管泽元的声音一如既往充满激情,尽管被淘汰的GEN是他喜欢的战队。
入行八年,管泽元和中国电竞一同成长。如今,他已成为中国电竞解说的招牌之一,“跨界”之旅更是颇受好评。这些经历,让管泽元对解说、对电竞有了更深刻的认识。
鸟巢
“小时候,从家一出来就能看到鸟巢,见证它从无到有,一点点建起来。鸟巢叫国家体育场,它就是咱们中华民族的体育象征。”
2017年,中国大陆地区第一次承办S赛,英雄联盟全球总决赛的冠亚军决赛在鸟巢举行。于管泽元而言,那是他解说生涯迄今颇为难忘的一场比赛,也是职业生涯的重要一环。
决赛开场环节壮观而热烈,周杰伦现场为观众献唱,场面之盛大不逊色于任何赛事。
但对于很多中国电竞观众来说,那是一段令人百感交集的回忆。因为最终在鸟巢登场比赛的,是两支来自韩国LCK赛区的战队。
S7决赛海报。图片来源:英雄联盟赛事官博。彼时,中国电竞正走在飞速发展的道路,以英雄联盟项目为例,更多资本进入职业战队,受众市场不断增大。次年举办的S8比赛中,iG在韩国为LPL赛区拿下了历史上第一个S赛冠军。
直至今天,英雄联盟仍是中国最受欢迎的电竞项目之一。此外,王者荣耀、和平精英等项目的赛事也日渐红火。过去十年,中国电竞行业迎来了飞速发展。
2014年开始解说生涯的管泽元身处其中,真切感受到了变化的发生。“第一是受众影响,大家对电竞的接受程度更高。其次出现了非常多伴生的产业。另外,中国电竞项目在全世界范围内的影响力,跟我刚入行那会是不一样的。”
解说
S12期间,管泽元的预测频频登上微博热搜。当然,LPL战队在S12的表现,没有几个人事前能预测正确。
管泽元为S12决赛解说之一。图片来源:英雄联盟赛事官博。“毒奶”是管泽元身上一张著名的标签,这起源于几次不成功但令人印象深刻的预测。实际上,他也有很多次预测正确,由于“幸存者偏差”,往往被人们忽略。
“大家把这个东西当成一个梗去玩,我也欣然接受。但认真讲,任何预测在没有出现结果前都是不确定的。现在为了避免再有类似情况,我尽量避免参与预测。”
“毒奶”这张标签只是锦上添花的点缀,管泽元一路走到今天,成为S赛决赛解说台上的常客,更多是因为专业、努力与热爱。
就如同S12半决赛GEN被DRX淘汰后,管泽元那番解说词所展现出来的——他有着自己支持的战队,更在工作中保持着超出战队、赛区局限的纯粹热爱,这正是电竞行业很多从业者所缺少的。
图片来源:英雄联盟赛事官博。尽管解说时金句频出,但管泽元对此并没有刻意追求。“解说工作,在一局甚至一周的比赛里,90%的时间需要稳定地娓娓道来,不出问题。或许有10%是高潮,但不可能满脑子想着这10%。”
伴随着电竞赛事日渐红火,站在台前的从业者们逐渐成为公众人物,赞美与争议也不可避免地接踵而至。管泽元对此看得很谈,在他眼中,既然是表达者,就要接受被误解。“这个世界上这么多人,不可能所有人都理解你,更不可能所有人都认同你。”
破圈
无论是欧冠、NBA的解说台,抑或少年偶像参加的运动综艺,如今在很多地方都能看到管泽元的身影。
“年轻时也是在天上摘星星的人,到这个时候宁愿在泥地里打滚也要把球给救回来。”客串NBA解说时,管泽元形容格里芬的这番话,深深触动了很多老球迷。
受访者供图。在中国电竞行业追求大众化、追求“破圈”的时候,管泽元成为了走在最前面的人之一。他跨界的成功,更多是由于自身职业素养过硬。其他领域的观众喜欢他不因为他是“电竞解说”管泽元,而因为他是对这些项目“了解而热爱”的管泽元。
涉足篮球、足球等崭新领域,让管泽元有了横向对比的机会。“在中国,电竞的实力以及整个全球范围内的影响程度都是最好的那一批。我去解说其他项目的比赛,更多还是别人的比赛,本土化方面的区别是非常大的。”
在他看来,目前中国的电竞赛事直播制作已经达到较高水平。“在制作跟直转播的规模以及质量上,我觉得电竞现在是最牛的。以英雄联盟电竞转播规模和制作水准举例,比起很多传统项目要好太多了。”
尽管如此,与历史久远的传统体育行业相比,电竞在文化底蕴方面有着天然的劣势。管泽元认为,以电竞的运行方式和年限,很难出现像传统体育那样的文化,也很难通过单一项目产生文化层面的东西。
北京,夜色中的国家体育场“鸟巢”点亮绚丽灯光。中新社记者 易海菲 摄“电竞作为一个概括词,包含了太多不同的内容、不同的项目,电竞的单一项目很难持续较长时间。”他说,电竞行业从业者们目前主要在做的,还是服务眼前的观众和赛事。
采访摘要
Q:你的解说生涯伴随着中国电竞行业的发展,你觉得其改变最大的是哪方面?
A:第一是受众影响,大家对电竞的接受程度更高,电竞赛事赞助商的阵容越来越强大、直转播的覆盖面越来越广、各个平台渠道以及媒体都在做跟电竞相关的事情。
第二就是出现了非常多伴生的产业。第三是全世界范围内,中国在电竞这个项目上的影响力,跟我刚入行那会是不一样的。
Q:你认为LPL的“周末饭堂夜”这类节目,是不是关于电竞文化的有益尝试?
A:我个人认为以电竞的运行方式和年限,很难出现像传统体育那样的文化,也很难通过单一项目产生文化层面的东西。
电竞作为一个概括词,包含了太多不同的内容、不同的项目,电竞的单一项目很难持续较长时间。我们这些节目在努力,但是目前真正的意义还是服务观众和赛事。
Q:你曾解说NBA、欧冠等比赛,是电竞“破圈”的代表。你觉得传统体育和电竞之间差异最大的是什么?
A:我个人而言,解说工作的差异并没有那么大。电竞解说是所有项目解说中最困难的,也是要求最高的。
在中国,电竞的实力以及全球范围内的影响程度都是最好的那一批,我去解说其他项目的比赛,更多还是别人的比赛,本土化方面的区别是非常大的。
在制作跟直转播的规模以及质量上,我觉得电竞现在是最牛的。以英雄联盟电竞转播规模和制作水准为例,比起很多传统项目要好太多了。
Q:电竞项目解说在光鲜背后,是否也有不为人知的困难?
A:任何事情你想把它做好,背后一定要付出相应的努力和代价。应该去学会接受所有它带来的好的和坏的,没有觉得有那么多行业辛酸。
你要接受你是表达者,被误解就是表达者的使命,这个世界上这么多人,不可能所有人都理解你,更不可能所有人都认同你。
Q:你觉得电竞解说和电竞选手之间应该是什么样的关系?
A:应该处于一种稍有配合但尽量不要有过多接触或者连带的关系。
毕竟解说是剥离于赛场之外的职业,并没有参与到竞技本身。可以有轻度的关联,比如说有一些专业性的问题,私下请教一下选手,或者说通过官方节目,跟一些选手建立比较良好的交流,但是在解说这份工作当中,你对他们应该是一视同仁的。
Q:在你解说过的比赛中,印象最深刻的是哪场?
A:应该就是2017年在鸟巢解说比赛。我是北京人,家在四环边上。小的时候,从家一出来就能看到鸟巢,能看到它从无到有,一点点建起来。
申奥成功后,作为一个北京人就有那种自豪感——北京要承办奥运会了。鸟巢叫国家体育场,它就是咱们中华民族的体育象征。有一天,你因为工作做得不错,有机会可以在里面去工作。那是你从小看到大,一直仰慕的东西。
Q:你的解说语录有很多,自己最满意的是哪一句?
A:解说工作本身是很难复制的。我会去避免说同样内容,哪怕我觉得它真的很好,但我最多说两次。如果作为一个解说,你在意的是所谓的金句,你很难把工作做好。
解说工作,可能一局游戏甚至一周的比赛里,90%的时间需要做的都是稳定地娓娓道来,不出问题,可能有10%是高潮,但不可能满脑子想着这10%,更需要注意的是怎么让观众舒服。
Q:对于自己所谓的“毒奶”体质,你如何看待?
A:大家把这个东西当成一个梗去玩,我也欣然接受,但认真讲,任何预测在没有出现结果之前都是不确定的。
最开始出现这个事的时候,我确实预测错的比较多,其实我之后也很多次预测对,但没有人注意。现在为了避免再有类似情况,我尽量避免参与预测。
Q:你也是资深足球迷,卡塔尔世界杯马上开幕了,有没有支持的球队?
A:这还真没有。世界杯肯定最支持的是自己国家,但是在世界杯咱没有国家队。我可能就都看看,没有说特别支持的队伍。
跟最喜欢的俱乐部相关,所以皇马球员肯定会格外关注,要硬说我觉得今年巴西可能会多关注,也是因为它有比较多皇马年轻一代的球员。加之我在足球启蒙的时候巴西强,是比较喜欢巴西国家队的。
Q:很多年轻人想做职业电竞解说,你对他们有什么建议?
A:如今,入行电竞行业是比较简单的事情。现在电竞项目、经纪公司都有非常固定且公开的面向社会、校园的招聘,不太会求职无门。
你要做的就是加强自己,无论是学历,还是专业能力。
Q:一些青少年梦想成为职业选手,你作为职业解说和玩家,想给他们什么建议?
A:时代的发展已经不太会出现你想打职业,实力够,但你没有门路这种情况。
任何竞技游戏现在都有其自己的排行榜,只要你的实力够,甚至可以通过自己玩游戏就能找到工作,因为只要排名够高,就会有人来问你要不要去打职业。
如果你现在想打,努力一段时间,还没有任何人接触你,没有找到所谓的门路,可能你真的不适合这件事。
(记者 王昊)
(文图:赵筱尘 巫邓炎) [责编:天天中] 阅读剩余全文() |