• +1

对话破亿AI文旅大片创作者海辛&阿文:AI是我的实习生,也是我的老师

澎湃新闻记者 吕妍 孔家兴 杜海燕 王亚赛
2026-01-13 11:56
来源:澎湃新闻
对齐Lab >
字号

【编者按】

海辛和阿文,是央视春晚首个AI动画《枕着光的她》背后的创作者,也是AI圈里有名的搭档。

他们用AI把猫猫变成了城市文旅名片。《故宫猫猫上班记》《文明小猫游浦东》《卢浮宫小猫》等城市文旅片,因为独树一帜的风格、萌趣可爱的画面,创下了全网累计破亿的播放量。此外,他们参与的作品还获得过北影节AIGC单元的最佳影片。

我们好奇在他们的创作中,AI扮演了什么样的角色。

对齐Talk是澎湃新闻对齐Lab栏目首档聚焦人工智能领域创作者、从业者和行业生态的对话节目。我们想找到AI浪潮中的头号玩家和弄潮儿,分享他们在AI最前线的发现和感悟,一起探寻AI对自我的重塑和赋能,展望人工智能的发展和未来。

【以下是澎湃对齐Lab专访内容】 

AI可以成为导演的“后悔药”

对齐Lab:你们创作AI短片的工作流是什么样的?

阿文:创作《故宫猫猫上班记》《文明小猫游浦东》的时候,就是用最好的图像模型和视频模型来文生图、文生视频或者图生视频。

浦东新区文明办联合海辛&阿文作品《文明小猫游浦东》(01:20)

我们把大量的时间花在了抽卡上。《故宫猫猫上班记》中有一个镜头,我花了差不多2000块钱都没有抽出来,当时就崩溃了。其实很简单,就一只猫跳上树。但我需要它在一个特定的机位、特定的构图,比如说让它跳到树干上的某个位置,后面这个镜头就没要。作为一个从传统行业过来的设计师和创作者,我接受不了花一整天的时间去做一个镜头,最后什么成果都没有。

海辛:我们会边创作做边推翻之前的想法,其实废稿会比正片多很多。这种把前期、后期、制作整合在一起的模式,我还挺喜欢的,能不断地进行调整。

这也是每个导演都最想要的一种创作模式,很少有人能前期百分百知道什么是自己想要的。其实很多导演会想换一些想法,但鉴于巨大的成本以及制作是一个不可逆推的环境,他可能没有办法随意改动。

对齐Lab:跟传统流程在周期和成本上的差别是什么?

海辛:AI短片和传统短片的区别,不同影片类型上会有一些差别。以《故宫猫猫上班记》为例,首先传统流程里很少能找到这么配合的猫咪演员,因此大概率得全部用特效制作。比较普通的工作室,特效的报价大概在一秒1500元到3000元。

由于(用特效做)写实的猫咪是非常难的,要花费大量的成本才能让猫咪的毛发渲染符合人的审美,AI能大幅削减这方面的成本。但对于一些真人影片或者是产品拍摄,可能成本的降幅就不会有那么大。

海辛和阿文在创作《故宫猫猫上班记》时用AI生成的橘猫。图片来源:通往AGI之路。

对齐Lab:猫猫会成为你们的一个IP或者坚持的主线吗?

阿文:我们没有刻意去强调这个,主要是我们就喜欢猫。

AI可以是老师也可以是实习生

对齐Lab:AI作为你们创作中的“第三人”,扮演了什么样的角色?

阿文:我觉得AI的角色定位是流动的。现实中很难找到一个人既是你的老师又是你的实习生。AI可以在工作流的各个环节里扮演不一样的角色。

海辛:AI可以让我更聚焦创作和内容本身。以前拍一个镜头,我会把想要的画面分解成很多具体的步骤,会考虑演员、走位、场面调度、灯光等各种细节,AI帮我做了很多这方面琐碎的工作。

对齐Lab:不同的AI工具会不会有不同的人设?

海辛:会,特别是早期的时候。早期不同AI模型的能力侧重方向不同,有的可能更擅长稳定角色,有的可能在物理运动方面更符合现实。但现在这些模型的gap在变小,会越来越像一个通用的模型。

我会觉得Sora和Veo是两个非常截然不同的路径。Veo能很好地执行你提供的制作需求,Sora因为有切镜头的能力,所以更多是帮助你进行创意策划。

对齐Lab:AI创作者的核心能动性体现在哪里?

海辛:我觉得是非工具化的那一部分,因为工具的部分迟早会被AI追上来。能做出什么样的东西取决于你的经历、你爱的东西、你在意的议题,这些东西会决定你的创作上限。

阿文:创作者的品味非常重要。过去看过什么?受过什么样的影响?这些都会体现在作品里。如果想要保持自己的品味,或者让自己品味越来越好的话,必须大量摄入优质的养分。

2025年11月28日举行的中国报业传媒行业人工智能应用大会上,海辛代表团队分享和AI一起跨界的多种可能。图片来源:澎湃新闻。

对齐Lab:你们有一个阶段说过自己的定位是AI艺术的科学家,现在还这么想吗?

海辛:我觉得这是一个非常好的时代,你可以去定义未来AI会怎么发展。我们会训练一些小模型,探索AI可以产出哪些与过往作品不同的东西。

我们自己探索的一个方向叫“潜空间计划”。我们发现,过去一个图像到一个图像之间的变化是像素之间的。在 AI 大模型里面,两张截然不同的图像之间是语义、文化概念加上像素的变化。

海辛将黑猫、黑桃、月相图和罗盘结合到一起做了一个动画,她认为这种AI动画就像诗歌一样,是意象之间的跳转。视频来源:海辛的微信视频号

阿文:ComfyUI里当时有一项比较有名的技术叫AnimateDiff,它能让两张图像非常丝滑地过渡。我们就会好奇,任意两张图像之间是否存在一个最短的距离。

对齐Lab:有点像六度社交理论。

阿文:对的,当时海辛就选了香蕉和圣经两个非常不相关的概念。我们测试下来发现,香蕉变成圣经自然过渡要80帧。

海辛:因为样本很小,这个实验可能不代表任何东西。但这个猜想本身我们特别喜欢,而且很浪漫。万物之间的任何概念,它可能都存在一个最短的距离。

多用AI工具,多看人类作品

对齐Lab:以电影节评委的角色来看,一部作品把AI用在哪些方面是更能打动你的?

海辛:我自己会特别喜欢在前一分钟能够给我很多信息量的作品。我更会被好的内容打动,而不是好的工具形式。

阿文:我不看AI短片(笑),我只制作。我经常会说多用AI工具,多看人类作品。

现在有一些不好的现象,大量的AI短片要么重复,要么过度地透支某种审美和风格。很多所谓的AI创作者,他只盯着头部的几个AI创作者去模仿、抄袭。明明AI是放大创意的工具,但很多人却用来偷懒,这是我非常不喜欢看 AI 短片的一个原因。

另外一个原因是学习的需求。以导演的视角再去看以前看过的电影时,往往会发现很多我可以学习的地方。补看过去的一些经典作品时候,我会感叹原来我们曾经吃得有这么的好。

对齐Lab:作为头部创作者,你们也会面临一些抄袭的问题,你们是怎么看待版权方面的问题的?

有公司直接把海辛和阿文的作品放在了自己公司的作品集里。图片来源:微博

海辛:我们会要求自己的商业作品符合商业版权的规范。这一方面是甲方的要求,另一方面也是对自己的保护。反过来说,我们没有好的保护自己作品不被侵权的方式。

阿文:我们商量下来的对策是每次都做得难抄一点,每次在技术上翻一翻或者想象力上翻一翻。

对齐Lab:一些娱乐公司或者影视公司开始向 AI 工具发起版权挑战,这方面你们怎么想?

海辛:他们有权这么做。AI公司也会有一些对策,比如用户生成带有IP的图像或者视频,AI公司会把提示词禁掉。我觉得整个行业会越来越规范。

阿文:我觉得只是表面上更规范了。OpenAI就是很好的例子,训练模型的时候没有征得你的同意,就先把你的作品练进去。等你有意见了,我再把关键词禁掉,但模型已经获得了所有的能力了。

中国团队对AI开源社区的贡献很大

对齐Lab:怎么理解“AI 让创作能力可以复用,创作者能够把能力变成产品”?

海辛:我们曾经在ComfyUI(一种节点式的AI视觉创作工具)里搭过一个很复杂的工作流,这个工作流能够把一张照片和文案变成一张精美的海报。我们把工作流导出后发给别人,这样就能复现我们的创作过程。

海辛和阿文用ComfyUI创作了把一张图片变成穆夏风格海报的工作流,并开源在了civitai上。图片来源:civitai

对齐Lab:你们主要还是开源的方式去分享?

海辛:我们自己的工作流是开源的,也会有一些合作。去年春晚的时候,我们作为顾问,参与了阿里团队春晚云参演证的生成器项目,用ComfyUI的流程做了一套AI滤镜放在了淘宝上。任何人上传自己的照片,就可以生成一张在春晚工作的云参演证。

春晚云参演证效果图。图片来源:数英网

对齐Lab:这算定制AI作品外的另一种商业模式?

海辛:ComfyUI 有段时间特别火,几乎成了 AI 应用的行业范式之一了:通过定制 comfyUI 工作流,来完成垂类具体的需求。但现在由于大模型足够聪明,很多工作流都被大模型内化了。你直接告诉大模型,大模型就可以帮你做出来。

阿文:GPT-4o刚出来的时候算是对我们过去工作流的一次打击,但我们并不觉得之前的工作就浪费了。有幸能参与到那个非常短暂的时代,成为开源社区的一部分,我们也很荣幸。

当媒体还在宣扬国外模型的时候,AI开源社区中超过一半的开源模型、插件和技术方案都来自中国团队。他们之间好像没有大厂之分,都是非常优秀的个体,轮番登上历史舞台。

AI让我有了完整的作品,抛开AI我更像工具人

对齐Lab:AI补全了你们什么?抛开AI,你们又看到了自己什么?

海辛:AI补全了我的学习途径。很多知识在过去是很难获得的,现在AI就是最好的老师。抛开 AI 我是什么?这也是我最近会思考一个问题。我觉得职业上的训练正在把人工具化,但人其实很难卷过AI,AI可能就是更好的工具。反过来我会去思考,作为一个人类我的情感是什么?我想传递的内容和价值是什么?

阿文:AI补全了我技能上缺失的版图,这对我来说非常重要。以前我过于沉迷技术,以至于我看起来很厉害,但能拿出来完整作品其实很少。虽然我整天活跃在社交媒体上,但我做出来的要么是demo,要么是半成品。

有了AI之后,我第一次意识到自己能做出完整的作品。我能做出大家喜欢的东西,不仅仅是个工具人。AI甚至改变了我的职业方向。

抛开AI的话,我能想象到职业生涯里会少非常多完整的作品。有了AI,我的作品集可能会变得很不一样。

对齐Lab:未来5年内,AI的哪些变化是值得关注的?

阿文:实时生成技术。目前谷歌发布了一个Demo,但还处于玩具的状态。这项技术如果真的落地,会改变我们对于内容方式呈现。比如游戏、电影,很值得期待。

2025年8月,谷歌DeepMind发布新一代Genie3世界模型。Genie3实现了用户交互的实时响应,支持使用提示词生成世界事件,并能维持数分钟的一致性。图片来源:谷歌

海辛:我觉得是硬件。我希望大模型能放进任何一个硬件(玩偶、手办等)里面,这样AI与人的交互就不单单仅限于屏幕。像这样可以脱离屏幕本身的交互会很让人期待,它不会局限在一个2D的环境里,未来可能整个房子都可以和我互动。

    责任编辑:沈关哲
    校对:刘威
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2026 上海东方报业有限公司