

当字节跳动Seedance 2.0、快手可灵AI等视频生成模型相继落地,AI在2026年开始进入技术狂奔的时代,影视行业面临着新的机遇与挑战,其中的视觉特效领域也正在经历一场前所未有的变革。AI在所谓的“降本增效”优势背后有哪些技术局限性?AI现在能替代真人演员到什么程度?面对AI的冲击,传统视效大制作的护城河是资金,还是创意和审美?AI现在有什么短板……近日,新京报记者带着这些问题专访北京天工异彩影视科技有限公司视效总监刘松、武世杰,以及AI首席内容官郭小川,请他们畅所欲言。
北京天工异彩影视科技有限公司(后文简称“天工”)是一家全流程影视技术服务公司,参与制作了500余部影视作品,包括《我和我的祖国》系列、《哪吒》系列、《悬崖之上》、《满江红》等大片特效,获得过各大电影奖项的最佳视觉效果奖。而作为中国影视工业从“手工时代”向“智能时代”跨越的亲历者,也是技术浪潮里的前行者,在刘松等人看来,AI是一条搅动行业的“鲇鱼”,它收割着平庸的重复性劳动,但只要驾驭它,便能迸发出影视制作与科技融合浪潮下独有的天工优势。


从上至下分别为天工参与制作的影片《长津湖之水门桥》《哪吒之魔童闹海》剧照。
电影这门“造梦”的工业,曾经历过无声到有声、黑白到彩色、胶片到数码的数次革命。每一次,人们都担心艺术会被技术扼杀,但每一次,艺术都通过对技术的驯服,焕发出新的生机。AI或许真的能算出一张完美的脸,但它永远算不出人类情感在某一秒钟的偶然进发。那是带着缺陷的灵光现世,是计算不出来的。
带情绪的表演,核心必须是人
AI并不是一个横空出世的“外星文明”。AI对面部图像的处理有着不同时期的演进史。如今,这种技术已经进化到了能够凭空捏造出一张“从未存在”的面孔——通过素人采样,结合所谓“最漂亮的一些脸蛋儿”与明星特征,最终“算出”一个新的人。直到今年3月,耀客传媒签约两位AI数字艺人秦凌岳、林汐颜,并宣布将推出其主演的首部AI剧集《秦岭青铜诡事录》。
刘松对此有着清醒的技术分析:“群众演员现在就可以做,整个宫殿里一大堆人,那肯定是可以的。不干扰观众欣赏的那些不重要角色肯定是可以的,甚至是女二号、男二号某种‘行活表演’,随着大模型的进步未来应该也行。”
但他随后划出了一道很难逾越的红线——“主角,我认为是永远不能替代的。”刘松认为,带情绪的表演,核心必须是人。无论应用了什么技术,是动作捕捉还是真人驱动,核心是人要在表演。因为真人的表演是可以突破的,是可以探索边界的。而这一代生成式AI,其本质逻辑是基于过去的数据集训练的。“它不能从过去的表演里再去找一个更好的,它无法学习‘突破天花板’这件事。”
算法算不出“有缺陷”的真人
为什么AI模拟的表演总会给观众一种“死感”?这涉及视效领域挥之不去的“恐怖谷效应”。视效界有一个著名的理论叫“恐怖谷效应”(Uncanny Valley):当人造物与人类的相似度达到临界点,由于微小的非人细节(如眼神的死板、肌肉牵动的僵硬),会引发人类极度的生理性排斥。
刘松在访谈中指出了人与AI表演上的本质区别——随机性。“人的表情有很多微动作,这些微动作其实是有随机性的。AI很难跟真人产生情感链接,因为它无法领会到情感链接带来的反馈。”在刘松看来,真人表演的魅力往往来自于其“缺陷”。“真人其实都有缺陷,无论你长得什么样都是有缺陷的,但是AI不会。人是带有缺陷的一个自然体,他做出来的表情和回馈具有随机性,这是AI无法完成的。”
武世杰补充了技术层面的控制难题。一个专业的演员能根据导演的要求,在悲伤中加入20%的克制或30%的愤怒,但目前这一代AI在算法上对这种细微表达的理解极其迟钝。“AI能做一个悲伤的表情,但这个悲伤的程度,首先你就很难用语言去控制它。”武世杰说,“我是想要一个小一点的悲伤,还是一个很严重的悲伤?AI理解不了。它目前只能做到一个大概。”

影片《少年的你》剧照。像这样细微精妙的悲伤表情,AI在算法上是无法理解的。
这种对微观情绪把控能力的缺失,使得AI演员在处理深度戏份时,始终像是一层漂浮在银幕上的“画皮”,它能模拟皮肉的抖动,却模拟不出灵魂的搏动。
AI面临审美短板与伦理红线的巨大挑战
支撑生成式AI狂飙突进的是海量的数据,但这也成了它最致命的命门。刘松坦言,“这一代AI的数据集训练还不够丰富,所以导致它是有上限的。”他举了一个例子:在参与毕赣导演的《狂野时代》制作时,团队遇到了一个尴尬的困境。“生个美女,数据集太多了,惟妙惟肖。但那个孔雀,就生不出来。孔雀开屏,因为数据集太少了,AI就生不出来。”在刘松的观察中,AI的数据集呈现出一种严重的不均衡感。纽约大街的街景照片成千上万,AI可以生成得极其逼真;但若要求它生成农村里某个特定的垃圾堆,它可能就无能为力,还是需要制作人员来实现。
当科技的锐度与人文的厚度互为底色,天工便拥有了跨越周期的底气。
更令业内忧虑的是“数据污染”。随着AI生成影像在互联网上的爆发,未来的AI将不可避免地在“AI生成的影像”中进行再训练。在刘松看来,这种自我复制的循环,正让影像审美陷入一种平庸的、似曾相识的泥淖。“总之就是你再生成、再训练,这种污染也是短时间内也克服不了,也真假难辨。如果数据集不改变一些训练方法的话,它很难提升。”
这种局限性也体现在物理规律的遵循上。武世杰指出,一个真正的动画师或特效师,在处理一团火的燃烧、一滴水的落地时,必须遵循物理特性。AI目前最大的短板是没有审美,它无法理解“美感”需要来源于生活且高于生活。

蒂莉·诺伍德(Tilly Norwood)是由英国制作公司Particle 6人工智能部门Xicoia使用AI技术创造的虚拟演员。 视频截图
当技术试图取代人类劳动时,伦理的红线就会变得格外紧绷。访谈中,刘松提到了轰动一时的“蒂莉(Tilly)”事件。这个外形漂亮、操着英伦腔的数字女孩,本是一个趋于完美的虚拟角色——永远不老、不会塌房、演技和颜值时刻在线。但她遭到了美国好莱坞演员工会成员的集体抵制。“不接受,因为它是非公平竞争。”刘松解释道,“它是用虚拟角色打造了一个完美形象,而且它的训练数据集来自于各种演员。这种似曾相识的角色是不被接受的。”
这涉及到行业底层的生存逻辑。一个真人演员授权了自己的肖像和数据给AI生成,在行业从业者看来,这是对行业基石的动摇。“我作为观众我能接受,但是行业从业者不接受。这个关过不去的话,可能这个永远都实现不了。从伦理上,工会、各个方面的利益组织都得接受,有一环节不成立,他就完全做不到。”
即便在观众端,伦理关口依然坚硬。2025年感恩节,原本应是北美电影市场的黄金档期,却因为一部仅有几分钟的短片演变成了一场载入影史的“审美暴动”。由AI深度生成的短片《感恩节》在AMC院线贴片放映后,遭遇了前所未有的抵制。社交媒体上的谩骂并非针对剧情,而是针对那种极度逼真却又透着丝丝寒意的“算力质感”,最终迫使院线紧急撤档。AMC院线撤掉AI短片的动因,正是因为观众拒绝为“没有灵魂的粗制滥造”买单。这意味着,在电影这种极其昂贵的艺术消费中,观众对“真”的需求,依然高于对“快”和“多”的追求。
AI的“降本增效”暂时影响不到专业赛道
站在AI浪潮前,天工也提早布局,成立了六大AI内容制作工作室。其中IP内容工作室负责人郭小川看来,他希望完成的不是用AI把内容做得更像世界,而是用AI去生长出一个可以成立的世界。在这个过程中,有一个很重要的“同事”,就是AI本身。最开始大家是把它当工具用的,但在一次次反复生成、推翻、再生成的过程中,慢慢发现,它不只是执行,它会在某种程度上“回应”工作安排。“在持续的互动和沟通中,我们慢慢意识到,这个世界不一定真实存在,但它在逻辑上是自洽的,在情绪上是可信的。所以如果说独特性,可能也不是‘用AI做内容’,而是用AI,让一个世界慢慢长出来。”

AI生成概念图。 天工供图
在资本市场,“AI降本增效”被描绘成一种福音。武世杰承认,在视效行业,这种效率的提升也是直观的。“以前特别好的概念师画一张比较好的概念图,效率是一周画出来一张,到现在我们(结合AI)一天出100张,让你去选择。”
这种数量级的飞跃,确实让资本们看到了降低成本、消解“成本护城河”的希望。但刘松对此持有一种职业性的冷静。他认为,虽然成本在降低,但赛道也在发生剧烈的细分。一方面是短剧、短视频赛道。“这个赛道对分辨率和艺术精度要求不高,现在的AI模型,个人就能做片子,大幅度提高效率没有问题。”另一方面则是专业领域的精品电影、电视剧,在这个赛道上,“至少从分辨率上暂时达不到影视级的清晰度和细节。”刘松坦言,在专业赛道上,总有一群人是在追求极致的,这种极致是AI这种基于概率生成的工具一时半会儿无法替代的,而这也正是天工所擅长的,能立在行业里的根源。
守住最后10%的“灵魂”把控力
面对诸如“干翻影视行业”这种制造焦虑的标题,刘松认为,这种舆论误导了公众,让很多毫无相干的人觉得只要有工具就能拍片,导致原本的小众蓝海迅速变成了浮躁的红海。“我们是匠人精神。”刘松强调,“我们做东西没有那么浮躁,我们从来没有期待过一键生成电影长片。每一个步骤都是深思熟虑、反复推敲。”

交付镜头截图。 天工供图
天工AI团队在开发自研的AI工具时,采取了一种更审慎的思路。他们并不追求全自动生成,而是要求艺术家必须在工具中注入思考。“如果我们的艺术家、视效总监,天天用某些AI来做活的话,时间久了会丧失把控力。永远是在做选择,而且没有自己的思考过程了。”刘松回忆起在电影学院学摄影的日子,老师总是强调即便是数码时代,也要有“计划感”,脑袋需要锻炼。他的AI工具逻辑在于:艺术家必须提供那一小部分灵魂的东西,告诉工具你怎么做,而不是等着工具给你惊喜。“你可以让AI解决大部分工作,可以解决70%、甚至90%都行,但是总得有一点是你自己要把控的灵魂之处,这个是你要创造出来的。”
在郭小川看来,AI对于影视行业的影响,是在改写一件很底层的东西—— “真实”。过去的影视,是在不断逼近现实,通过不同部门的协作,去构建一种“看起来成立”的现实。但现在,AI可以直接生成一种新的存在方式。甚至有一些表达方式,比如画面的转场,其实并不符合在学校里学到的影像逻辑。因为它是“错的”,但很快又会发现,它是成立的,所以影视的底层逻辑正在变化:从“以现实为基底的再现”,变成“构建一种不真实但成立的世界”。这种“成立”,一方面建立在成本被大幅降低之上,另一方面也来自观众审美的变化。“大家开始接受那些本来不存在、但依然成立的内容。情感没有变,但承载情感的方式,已经彻底改变了。”
AI可以做辅助,也可以起到“鲇鱼效应”
访谈中,刘松提到了一个令他深受触动的案例:奈飞Netflix最近斥资高达6亿美元收购了演员、导演本·阿弗莱克创立的人工智能电影公司InterPositive,这是一家只有16名顶级专家的初创公司。让刘松诧异的是,奈飞买下它,并非为了让AI取代导演,而是为了处理那些极具“匠心”的琐事,“处理摄影的穿帮。不用人擦,是用AI擦。处理远处的调光,什么光没补好。我真的受触动,因为它处理得很扎实。”很多不知情的大众误将其与Sora等生成式AI工具混为一谈,但InterPositive的技术逻辑完全不同:它不是让AI去写剧本、生成角色或替代演员,而是专门服务于实拍影像的后期制作。它不追求“替代创作”,而是追求“赋能执行”——让后期团队从数月的重复劳动中解放出来,将精力聚焦于创意判断。

阿弗莱克将InterPositive定位为电影制作者的辅助工具。
与国内一些“3000元做5亿播放量”的AI短剧神话相比,奈飞目前走了一条完全不同的路——它不是在寻找一条绕过创作的捷径,而是在优化创作的“工业底盘”,奈飞此举更像是一次“工业升级”而非“产业革命”。阿弗莱克在收购公告中特意写道:“我感到自己有责任保护人类创意的力量和它背后的人们。”这种姿态,对安抚可能对AI心存戒备的创作者群体,意义不言而喻,因为将创作决策权牢牢握在艺术家手中,而非拱手让给算法。
未来影视制作的核心竞争将从“人力规模”转向“技术密度”与“审美判断力”的结合,这也是刘松和同事们做出的判断。在刘松看来,AI在未来三五年的角色,更多是“人机协同”中的辅助者。它可以提升抠像、擦除等重复工作的效率,开拓概念图产出的思路,比如要擦一个东西,要做抠像,把这个人物从绿幕下抠下来,这些可量化,有很明确的技术标准的劳动是可以让AI去完成的。可以通过开发工具,通过AI的手段能够去完成一部分。基于这些之外的,需要审美和创作的,AI只能是帮去做一些辅助,但它无法在核心创作上取代人。武世杰对此持相同观点。他认为,AI的出现更像是一条“鲇鱼”,它倒逼演员好好演,否则还不如数字人;倒逼特效师好好做,否则还不如AI生成。
“竞争是激烈的,但是精品化。”武世杰说。
这种竞争并非零和博弈。武世杰提到,一个普通人想用AI出一条不错的片子,成本其实并不低。一次生成需要几元到十几元不等,而且往往需要反复尝试。“普通人玩一玩、试一试,等到后边,没给你带来利润就不做了。最后还是真正想做这个事、一直想做的人留下来。”
拥抱星空,亦要凝望经典
在创作中,AI可以很好地替代执行。很多原本需要大量时间和人力的工作,现在都可以逐渐由它完成。虽然有些地方还不够完善,但它始终在快速进步。郭小川表示,AI无法替代的,是判断和方向。在创作中,他也试过让AI更“主导”一点去生成内容,但很快就会发现,内容是完整的,但它没有方向。那一刻会很明显地意识到,真正缺的不是能力,而是判断。“你要讲什么,为什么讲,这件事有没有意义——这些问题,最终仍然只能由人来决定。所以AI不是在取代创作者,而是在让创作者从‘生产者’,变成真正的‘定义者’。”
访谈的最后,两位前辈给正在迷茫中的年轻从业者和学子留下了几句寄语。刘松建议年轻人要具备两点:“一,拥抱科技,拥抱星空,不要抵触AI;二,一定要保存自己的把控力和创造力。对艺术、对审美的把控力,你不能让AI带节奏,你要主导这个事情。”武世杰则给出了一个更具古典情怀的方案:“去看老电影。去看真正的电影,去深入钻研电影诞生以来的经典作品。这样的话,你拥抱AI工具的时候,你才既有工具,又有灵魂。”
在这个喧嚣的时代,真正的领先,不是盲从技术,也不让固守成为发展的桎梏。让AI为我所用,成为影像创作中如虎添翼的利器,去攻克效率与规模的难关。而对于那些短期内AI触及不了的领域,长期信任、情感洞察以及现场应变的复杂场景,天工则依靠20年发展的底蕴深厚的传统制作板块铸就壁垒。当冰冷的算力遇上温热的手艺,这就是行业定义未来的底气。
【对话】
AI目前最大的短板是没有自己的审美
新京报:在你看来,如果AI代替一个真人演员,它到底可以代替到一个什么样的程度?
刘松:如果是群众戏份,比如整个宫殿众人一大堆,那是可以的。但是我认为AI永远不能替代主角的,带情绪的那种表演,他一定得是真人表演。不管是什么技术,是动作捕捉还是真人驱动,用AI的某些技术,但核心肯定要人来表演的。《阿凡达》中的那个角色,让我们印象特别深刻。这个角色一出现感觉特别妖、特别艳,还不让你讨厌。这是很高的一个境界,甚至连真人演都不一定能演出来的一个状态。但是你会发现一个问题,其实卡梅隆擅长用新技术,他是用运动捕捉技术获取真人演员的表演,再配合CG渲染来完成,CG是实拍电影之后的另一种新技术,现在AI是另一种新技术。但我认为《阿凡达》得不了表演奖,她不是一个角色,只是观众对她的容忍度能接受了,没有“恐怖谷效应”。
武世杰:一些角色的饰演者,可能是会有一定的表演瑕疵,或者是不一样的表演风格。但是这代AI还不行,但下一代如果有一个智能体能发展得更好,它可能会有自己的一些创新,基于这些训练也有创新。比如一个演员去演一个角色,他所能够承受的情绪跟他的阅历就是在这个范围内。但是如果当一个AI读了上万本书,又有一些新的体验,我觉得未来可能会出现。但这一代的AI还不行。它一定是“恐怖谷”,现在还没有能够到细微表情的调整,只能做到一个大概,AI能做一个悲伤的表情,但是这个悲伤的表情程度,首先你就很难用语言去控制它。我是一个小一点的悲伤,还是一个很严重的悲伤,AI它理解不了。
新京报:在你看来,目前AI现在最大的短板是什么?
刘松:目前AI最大的短板是没有自己的审美。一个是说相对简单的,比如火的燃烧、水滴怎么往下落,需要在特定环境中遵循什么样的物理特性,因为速度不一样,重力也不一样。但是这个好解决,我们找一些参考,真实的水,瀑布怎么流下来的,比着它做,临摹就可以。还有一部分难解决的是,为什么都是真实世界,摄影师拍的就好看,一个路人甲游客拍的就不好看,真实也得来源于生活,高于生活,我们就是做一个这样的筛选,就是我们这么多年审美,练出来这个眼光,我们展现的东西一定是好看,有美感在,有我们能捕捉到的精髓,都是既符合真实感,又符合我们审美的要求,还符合片子要传达的内在特性,或者美学风格是一致的,这是我认为是比较稀缺的。现在AI完全做不到这一点。为什么我们要开发自己的AI工具?不是我非要搞一个天工的工具,不是这个目的,我是突然意识到,如果我们的艺术家,我们的摄像总监,天天用某些AI工具来做活,时间久了就会丧失把控力。永远是在做选择,而且没有自己的思考过程了。总得有一点是你自己把控的灵魂之处,这是你要创造出来的。所以我们的AI工具开发出来之后,有些人可能用不惯。因为你得告诉AI你怎么做,有些人懒,AI给我就完了,我来选,那不行。所以还是要看人的,有些人没资格用我们的工具。大部分电影可能没有这么高要求,行活就够了,但是总有一块阵地是这样,最后那点阵地。
郭小川:它没有经验,没有立场,也没有选择。它可以完成任务,但并不知道这个任务为什么存在。它在学习人类,但学习的目标,很多时候只是为了“像”。所以它可以无限逼近“像”,但它并不对内容负责。因此,我更愿意把AI看作一种能力,而不是一个主体。

分层绘景图。 天工供图
新京报:假设有制片方希望把他们的真人配角全部用AI来代替,这种项目会有什么难度?或者有什么部分是没有办法用AI来帮制作方实现的吗?
刘松:AI本身是个工具,我们肯定会拥抱新的生产力工具,去解决一些重复劳动,降本增效。另一部分是要打破天花板,艺术家有些时候就是长时间投入到一个项目里。AI有时候能开拓一些思路,确实能提供很多灵感,比如它在生成概念图这方面,就替你产生了好多灵感,没有必要不接受。客户有需求就接待,都可以做,但只要是我们做,肯定是负责的。跟现在新生的AI公司最大的不同就是,我们有真正实打实的视效技术兜底。AI有很多东西是做不出来的。那怎么办?我们传统的视效能够给他做起来。举个简单例子,比如要做一个非常特殊的数字角色,他的毛发,如果用AI去算“飘动”的话,导演说这个毛不是这样飘的,毛应该是有硬有软的。AI就干不了的事。有的毛要飘,有的毛要硬。AI弄不明白。但是我们的传统特效能托底,这就是手艺人能干的事儿。
新京报:有没有具有哪种特质的特效师,是在AI这个时代来临时,更具价值的?
刘松:就是我们的经验、审美,我们是匠人精神。我们从来没有期待过一键生成电影长片,还是扎扎实实地稳扎稳打,一点点在做事情。深思熟虑、反复推敲,打造精品的这么一个工作方式,我认为这些是值钱的,到什么时候都是值钱的。我们一直在做这个事情,不可能说AI来了之后就清零了,我们也拥抱这种新的生产力工具,但是结合方式肯定不是那么粗暴的。
郭小川:因为过去的门槛,在于“能不能做出来”,但现在,这个门槛已经被大幅降低了。真正留下来的问题是:你有没有世界观,你有没有持续表达的能力,你到底在讲什么。所以AI不是让创作变简单,而是让“真正的创作”变得更难了。前两天我去一个书展,有一个很直接的感受——书更像是“生活本身的沉积”,而AI更像是“对生活的归纳与生成”。我当时在现场站了很久,看那些书,其实有一种很慢的感觉;但再回头看AI的内容,是完全另一种速度。一个是人在时间里写下世界,一个像是世界开始自己写自己。那我们在做什么?可能是在做一件有点笨、但也许最珍贵的事情——用人的视角,再去理解一遍这个世界。所以我不太会说观众一定会喜欢AI内容。但我更相信一件事:最后留下来的,不是因为它是AI做的、也不是因为它足够“视觉炸裂”,而是因为它里面有一个人用该有的视角所产生的一切。当一切都可以被生成的时候,真正不可替代的,是你用什么方式去看这个世界。
新京报记者 刘玮
编辑 黄嘉龄
校对 柳宝庆

