澎湃Logo
下载客户端

登录

  • +1

腾讯混元大模型“干”广告创意:那我走,都让AI来?

2024-01-22 16:30
来源:澎湃新闻·澎湃号·湃客
字号

原创 亲爱的数据 亲爱的数据

谁能体会,

短短几个月,

AI让打工人心情大起大落。

心路历程:

烦死AI,

理解AI,

用上AI。

心路历程一:烦死AI

搞广告营销创意,文案重要,

AI出文案;

虽然不是句句金句,

但是你扛不住AI生成得快,量大。

谭老师手上有个数据,

某头部电商营销文案由AI生成,再由人工审核,

通过率95%。

搞广告营销创意,图也重要,

AI文生图要接棒了。

Midjourney,Magnific AI这些出图软件

虽然不能直出广告海报,

但人家图片精美。

AI冲击广告创意,

AI冲击广告人心态。

心态大落:

惊艳,出图效果这么好,这么快;

心态大起:

AI生成的图,老有错误。

放心了,

内心OS:你AI也不是万能的。

过度吹捧AI没劲,

把AI生成效果说得天花乱坠不合适。

群众的眼睛雪亮。

文生图现存几个难点,都不好攻克:

第一,咒语理解不到位。

第二,构图不合理。

第三,细节质感不好。

难点的背后是现阶段的技术天花板,

两个办法:

办法一,技术持续攻坚;

办法二,把难题放到场景(业务)里解决,

缩小考试范围。

虽然考试范围缩小了,

但是业务本身的难度让考试题变深了。

尤其是面对广告这种水很深的业务。

心路历程二:理解AI

技术有难点,得攻坚。

腾讯混元大模型在技术上做对三道题:

一,让咒语理解到位

这个能力的背后,

是大模型的语义理解能力,

做好图文理解特别难。

文字理解对,图也理解对,不够,

图和文要配成对理解。

连喂给模型的数据,都用要图文对数据。

图文理解是一个热门学术问题,全球都在努力解决。

除此之外,文是哪种文?

中文 or 英文,

英文再溜,也难以用短短几个字

把中国古代的神话表达出来。

比如,女娲补天,

模型首先知道女娲,而不是女娃。

其次理解补天。

若要擅长游戏场景,模型得理解

战士,法师,游侠,风系,水系。

这些游戏特有的知识量,

模型都要学过,且学会。

二,让构图合理

AI出图很有想象力,

可就算再异想天开,

图片布局和结构得符合人的认知。

例如,一张人像图像,头身腿不能错位,

手指头的个数也不能错。

腾讯混元大模型苦练内功,其中就包括专门学习了人体骨架,

四肢和手的数据。

这样在生成人物图像时,

腾讯混元就会遵循骨架的结构,

从而生成正常的人体,

而不是“异常人类研究中心”档案册。

三,让细节有质感

质感和细节是微妙的美,

腾讯混元大模型做了细节学习题的题库,

例如,学习衣服褶皱(模型),

水面波纹(模型),

树叶纹理(模型)等。

最后融合学习效果,生成有质感的图像。

无论人类干活,还是AI干活,

魔鬼都在细节里。

混元大模型是腾讯自研。

腾讯有独创的数据飞轮,

喂给大模型安全,且正确的数据,

才能生成健康的图片。

腾讯混元技术实力支持创意能力,能力强,产品能力才强。

毕竟,

"卷"创意开始了,

得给大家"卷"创意的工具。

比如,腾讯广告妙思,一站式AI广告创意平台,

有两大类能力,文生图,图生图。

文生图的时候,

特定风格LORA很厉害。

LORA不是美女的名字,

是一种算法,

而且在游戏场景里异常重要。

游戏和IP的关系,就像灵魂和躯体的关系。

给IP玩花样,常玩常新;

给IP角色换动作,换形象。

只需要提供10张类似的图片,

模型就能满足游戏原画里的角色延展。

从平台角度,

本质上,LORA算法直接变成腾讯广告妙思平台的按钮了。

再看物体移除,

源于Inpaint算法;

在算法可自动填充图像中的缺失区域或移除不想要的元素。

而扩充尺寸,

源于Outpaint算法;

腾讯广告位多,广告用图的尺寸实在多。

还有,背景替换,局部修改

(比如修改提示词来改变人物头发的颜色)。

最后一个介绍的是图生图功能,

这可是“自己抄自己的好创意”的“神奇按钮”。

比如,阅读行业的广告,

生成一个爱看书的气质美女一个不够,

从一个变成N个。

因为要延续神图的跑量周期。

AI是能力很强的技术,

需要好产品来实现,腾讯广告妙思做到了。

心路历程三:用上AI

向大模型表达你的创意需求是一个技术活。

Midjourney的精细好图咒语,

动不动都成百上千,堪比小作文。

而腾讯广告妙思“咒语”数量大大减少,

且都和广告,和行业紧密相关。

金融,健康,教育,不同行业里热门的提示词也都提供。

这样,咒语稳了。

谭老师我试着“亲手”生成了一个Q版貂蝉。

(不过,这个是根据成熟的三国游戏微调过了。)

腾讯广告拿妙思解决的第一个问题是,

AI生成什么样的美,才是广告创意的美?

一方面,AI生成结果是概率性质的,

把AI的能力聚焦在广告场景,可以控制稳定性。

广告不是美术比赛,不是画廊艺术品。

而是追求广告效果。

用点击率,转化率来分析衡量广告效果。

这是老闭环。

当你用腾讯广告妙思生成广告图,

广告大模型能学到用户喜爱的广告图是什么样,

这种内在规律,有了数据,越学越理解。

这是新闭环。

本质是广告大模型和混元大模型同时发力。

当然,如果你把妙思生成的图下载,拿走了,

就没有这个新闭环了。

由此,引出了第二个问题,

AI创意工具如何彻底嵌入广告投放系统?

一种是别处来源的图,纯手工改;上传,下载,

搞N趟。

一种是嵌入广告投放流程,入库,审核都自动化。

技术再扎实,

也得走通产品最后一公里。

我和腾讯广告妙思的几位产品经理深聊了一下,

他们告诉我:“这一公里并不好走,但很值得走。”

在流程上提效,

意味着,

直接拉通创意和审核的链条,

做到一站式投放缩短审核时效。

审核是一个很大的痛点,

生成的素材免人物肖像权,

AIGC素材优先自动化机审,极大提升投放效率;

二次编辑的内容(提示词、底图、附加元素)

又能提前审核,

AI创意工具和业务深度融合。

相当于把广告投放流程的改变了。

省成本,省时间,可真香。

腾讯公司副总裁蒋杰的原话是:

“通过AIGC生成的这些创意能够实现免审,

让大家的整体效率提高,让素材直接到投放端进行投放,

让全流程的模式跑出来。”

文章标题说,腾讯混元大模型“干”广告创意?

不止于此,

混元大模型和整个腾讯广告体系做了紧密耦合。

腾讯广告希望能够借助混元的能力,

把广告整个生态体系全部打通。

AI产品这一步,必须迈出来。

腾讯广告用妙思“交卷”。

AI不会替代你,而是极大提高你的劳动效率,

相当于50个分身在同时工作,

你只要掌握如何用AI就行。

不卷了,

把精力从琐事中腾出来,

拿出更多注意力去洞察市场。

(完)

《我看见了风暴:人工智能基建革命》,

作者:谭婧

原标题:《腾讯混元大模型“干”广告创意:那我走,都让AI来?》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈