
中青报·中青网记者 傅瑞
今年4月初,报社中英文人机协同MV作品《平行世界企划》诞生,由于本人在该片中深度参与了中英文词曲制作,经过小组讨论后,由我主要负责《Reading BaoBao》英文版的策划工作,负责歌词、歌曲、图画和视频等环节。
当时《Reading BaoBao》中文版MV已经以竖屏形式发布,该MV中采用了青小豹的动画形象,可爱生动。但是,我们希望在此基础上让BaoBao“成人”,并将其与时下国际流行文化产品(如游戏、电视剧等)的画风相结合。与编辑叶雨婷老师讨论后,我们决定采用“赛博世界+摇滚歌星”的方式,定位国际主流社交媒体平台,让这只“小豹子”在平行世界里当一名“潮流巨星”——他爱阅读、懂穿搭、玩说唱,是年轻“弄潮儿”的缩影,我们决定为这名又酷又帅的青年创建一个电子世界。
未曾尝试的新型创作
整部MV的设计顺序是歌词、歌曲、角色设计、分镜脚本、文生图稿、图生视频、剪辑制作。报社党委书记张坤作词,我们在维持中文原意的情况下,将更多的说唱元素加入到英文版中。譬如,英文歌词采用了大量欧美说唱歌曲采用的意向和暗喻,使得中文概念可以对应到英文语境里的具体事物,利于国际传播。歌词再加工环节多次运用了AI刷写,在韵脚、韵律、节奏等多维度设置了细节。此外,还对整首歌的分段进行了再制,形成主歌、副歌一、Bridge、副歌二等段落,缩紧节奏,让歌曲不仅是简单的重复,而是层次分明、细节丰富、起伏多变的“惊喜”。歌曲总时长最终定在了两分钟。
曲风决定了整首MV的走向,因此选曲是一切工作的根基。英文歌曲制作采用了传统词生曲的方式,与《Reading BaoBao》中文版中大量采用的中式乐器、戏剧唱腔等中式元素不同,英文版选择纯粹欧美音乐元素。在紧扣“国际潮流风格”的前提下,歌曲保留经典4/4拍的节奏型,选择轻松、优雅的Funk元素,把独属于青年人的些许热血、骄傲、率性写入主角的性格,在符合BaoBao基本形象的同时,也让其在赛博世界里“大展宏图”。
歌曲的生成就像抽奖,我希望任何听众都能告诉我,“就是这个味儿”,所以我一直在等一首让人“如听仙乐耳暂明”的“奖品”。好在运气不错,在“摸奖”50余次之后,总算等到了想要的结果。当时我就把歌曲发给了同事和我的朋友们,他们的反馈都很好,我知道曲子选对了。
下一步是制作分镜脚本。“要让这个角色有中国味儿、有国际范儿”,一个全新的形象跃然脑海。为了尽最大可能固定角色的面部特点,主角选用一位人物原型面部进行“文字建模”,用AI详细分析了五官,将其作为固定数据进行存储,方便之后时常调用。
然而,AI“生图却不记图”,如何将形象固定下来一直都是一个难题。在实操过程中,每次刷出的图片都会有较大差距,甚至在背景、衣着等方面还有较大概率出错。因此,每次生成过后,都需要调整指令,其中包括镜头、面貌、神态、身材、身高、衣着、配饰、背景、光影等十余项,每一项都需要微调。以最为“短小精悍”的动画片头为例,由于需要交代主角和环境,仅此一项就调整超过20张静态图稿。
为了制作顺利进行,我按照每一句歌词对应1-2幅画面的原则,在每句歌词所对应的画面上设定指令,构建起这支MV的静态图框架。为了让MV的画面更为生动,我们讨论总结并加入了许多时下热点国际电视剧、电影的“名梗”,选材来源于《人生切割术》《魔戒》《福尔摩斯》《破产姐妹》《老友记》《星球大战》《银翼杀手》等近20部作品,还特别选用了宫崎骏先生的吉卜力画风作为歌曲Bridge彩蛋,用以配合音乐变调。在不侵犯版权的情况下,据不完全统计,我们总共生成了105张可选用图稿,而在服务器上的废案则远远不止于此。特别感谢小组的同事王忻媛和樊星,她们替我分担了一部分的工作,让原本庞杂的任务变得轻松了一些。
我们从合格的百余张图中挑拣了五分之二作为图生视频的储备,而在这些图中,有一部分仍然需要人工PS,这部分工作不再赘述。图片到视频是一场新的征程,“怎么动”是一个大问题。在原先静态图稿的基础上,我设计了大量动作、运镜、光影变化的表述,制成了一份全新的“动画分镜脚本”。在新的脚本里,有男主合上《中国青年报》站起的动作,也有男主在舞台上激情表演的动作,甚至还有燃烧着火焰的“Reading BaoBao”戒指旋转缩小套入手指的动作,这些动作从构思到成型的过程中需要规划大量指令,细到背景颜色和特写纹理。我把新脚本再次分发给了帮助AI生图的二位同事,她们出色的审美和热心的帮助在很大程度上减轻了“新征程”的压力。当然,生成的视频也存在大量废案,选取比例约为四选一,这些生成失败的动画依然也还在服务器上。
所有动画汇总后,剪辑工作得以开始。按照脚本所示,我将画面与镜头进行匹配,除了需要反复调整音乐卡点位置,技术并不难。剪辑过程中,我们使用了部分中文版MV中的镜头,但发现片段仍不够用,于是对相应歌词表述的画面进行了补充,工序与之前的动画一致。剪辑并不复杂,可以说是最省心的一环。
在粗剪完成后,我与同事叶雨婷、王梓元一起推敲画面细节。在头脑风暴中,我们设计制作了充满力量感的特大号Slogan和颇具个性的“Explorer Lab”徽章,也做成了“人在字前走”的包装,还为MV“特调”了霓虹色彩字幕。经过一遍又一遍的调试、播放,MV最终以“零粗糙”的形式完成,3人离开单位时已近夜里11点。

当一回不典型的“记者”
于我而言,这支MV是一次对技术与审美边界的探索,也是一次来自人机协同议题的重大考验。它离“极致”还有很远,但在当时,它已到了极限。整个任务从策划到完结用了近一个月的时间,那时住在报社宿舍,每天晚上回到宿舍后,我都会到编辑楼的无人会议室一遍遍磨指令,直到生成令人满意的结果。
每位记者对“工作到深夜”都不会陌生。在以往的夜里,安静地策划提纲、梳理记录、组织文字是家常便饭。那时,我总是有迹可循得去翻看报道、查找资料,让文稿更有厚度。但这次是没有参考的,它像是一种对所有来自工作生活中感知的集合,发散到的每一个记忆点,再带进画面里。可能是某一天看到的建筑,可能是某一刻听到的歌,可能是曾经见过的人,他们都化作文字指令,成为了那个世界里的角角落落。
人机协同是一扇新世界的大门。在此之前,记者用记忆工作——不论它们被记在本子上、电脑中,还是记在脑海里,这些真实而细致的信息会被一遍一遍打磨,直到炼成精简的文本和视频。在这之后,创造也成为一种工作方式。阅历和想象变成了指令与表述,在AI上生成产物。我们提供给AI灵感,AI反馈以结果,这是一种双向互动。我们也会经常惊讶于AI的设计——有时是“这可真好”,有时是“什么玩意”——制作者从中获得提示,AI也获得新的创意,制作者修正表述,AI也转换方向。
生成的过程就像是与AI的“共脑”,每当我确信自己已殚精竭虑确保指令精准无误时,还是会产生诸多纰漏。常常面部错了,衣服错了,抑或是字符错了。让AI完美履行想法是一件极为困难的事情,但有趣的是,它可以在多次生成中作出超越原本想象的答案。或许AI的创作仍然不够精准,不够细节,不够有质感,但它为对绘画、动画一窍不通的人添上“三头六臂”,让内容生产变得高效,让“从无到有”变得易如反掌,让不可能成为可能。
或许在将来,产品质量的边界将取决于AI技术的边界,AI技术的边界将取决于指令表述的边界,而指令表述的边界依然是文字与审美的边界——这么看来,记者这个“用笔杆炼心血”的职业,正是“AI”的重要战略合作伙伴。