机器之心报道
编辑:杜伟
【资料图】
大模型和生成式 AI 如何深度赋能商业,让企业降本增效,这是新的 AI 技术浪潮下必须要考虑的重要课题。百度的 AI 商业化之路对于赋能千行百业而言意义重大。
8 月 17 日,一场由百度商业联合中国人工智能学会举办、英伟达提供战略支持的「首届百度商业 AI 技术创新大赛」落下帷幕。在这场历经区域赛、复赛和总决赛,并由各大高校队伍参加的赛事中,共计 12 支队伍分获两个赛道的一二三等奖,他们及区域赛获奖队伍将分享奖金池中 63 万元的丰厚奖金。
其中由社会人士及东南大学学子联合组队的参赛队伍「天才修笔匠」和南京理工大学队伍「NJUST-KMG」分别摘得赛道一(商业转化行为预测)和赛道二(AIGC 推理性能优化)的一等奖,携手将 20 万和 10 万奖金收入囊中。另外,有两名女性成员参与的中山大学「Echoch」团队获得了赛道一的二等奖。
NVIDIA 全球副总裁刘念宁、百度集团副总裁,移动生态商业体系负责人王凤阳为大赛一等奖队伍颁奖
2023 年是大模型和生成式 AI 的时代,大量通用和垂类大模型及生成式 AI 应用不断地涌现。企业也积极探索自身商业场景与它们的契合点,谋求业务智能化升级和经营效率提升。
作为国内 AI 领域的领头雁,百度一直深耕其中。面对新的 AI 技术浪潮,百度有着得天独厚的优势,其在四年前已开始布局大模型,推出并持续升级文心大模型及配套工具和平台,以及文心一格、文心一言等生成式 AI 应用。此外百度不断拓展 AI 技术在商业场景中的广度和深度,通过解决痛点问题,看到实际增益。
因此,此次百度商业 AI 技术创新大赛,通过设置与企业营销相关的赛题,汇聚和发挥高校年轻人的想象力和创新能力,通过技术优化和性能增强,不断提升大模型和 生成式 AI 的实际商业应用效果。其中赛道一瞄准企业数字营销场景中广告投放的转化率,赛道二则向百度 ERNIE 生成模型在部署实践中的最优推理性能发起挑战。
大赛自 5 月 17 日正式启动,并于 5 月 18 日开启高校巡回演讲。区域赛(东南西北四大赛区)阶段共有 2414 支队伍报名参赛,其中 506 支队伍提交作品并登上榜单,他们中有 81 支队伍进入复赛。最终决赛中,包括南理工、南大、中山大学、北邮、中科大、西电、中南大学、北航、华科大等 12 支参赛队伍成为了赢家。
此次大赛的举办不仅考验参赛队伍,更是对百度平台技术能力的考验。在获奖队伍的采访中,他们纷纷表示,百度不仅贡献了真实业务数据,还开放一站式 AI 开发实训平台 AI Studio,更加码提供 NVIDIA GPU 作为算力支持,飞桨 PaddlePaddle 提供了深度学习框架支持。此外比赛中很多东西开箱即用,因而可以在百度搭建好的底层逻辑上高效地创建算法、完成比赛。
而回到两个赛道本身,百度在利用大模型和生成式 AI 赋能商业运营,变革商业内容应用和营销方式上拥有大量「实战」经验,早已构筑并形成了完善的 AI 技术体系。
广告搜索和推荐 CTR 预估场景
从分布式 CPU 训练发展到分布式 GPU 训练
对于企业而言,大模型和生成式 AI 时代感知最明显的是 AI 技术对自身商业场景的改变和重塑,而且技术变革的速度非常快。这就要求在立足多样化商业场景、精准把握用户实际需求的同时,持续打磨大模型技术能力,创新生成式 AI 应用落地方式。
在现代企业经营中,互联网的高速发展促使流量场景日益丰富,各种 APP、智能场景和虚拟场景都成为角逐的阵地。智能化数字营销成为企业获取更多潜在客户、用户精准获取目标商品和服务的主要渠道之一,而广告投放转化率、推荐效果好与不好成为关键指标。这也是大赛赛道一「商业转化行为预测」的命题核心。
在这方面,百度商业形成了以个性化行为预测大模型和生成式大模型为技术底座的一整套智能营销体系,用技术创新持续赋能业务,最大化客户转化效果。
百度 "凤巢" 是国内最大的搜索广告平台,其 CTR 模型作用于广告触发、广告粗排、物料优选和广告精排等商业广告检索的各个环节,能准确预估广告点击率。百度 "凤巢" 的 CTR 演进历经四个时代,包括第一代大规模 LR 模型(2009-2012)、第二代连续值 DNN 模型(2013-2015)、第三代大规模离散 DNN 模型(2015-2018)以及基于 GPU 的超大模型训练框架开启的第四代复杂 DNN 模型技术(2019 年至今)。
在 AI 技术的加持下,第四代的百度搜索广告 CTR 模型进入 GPU 时代。最近 10 年 GPU 硬件发展迅猛,尤以英伟达为代表,从 2013 年的 K40 发展到 2020 年的 A100,GPU 性能增长 150 倍,显存容量增长近 7 倍,带宽也有量级提升。GPU 开始在语音、图像和 NLP 等 AI 领域全面落地,但在大规模稀疏场景中的落地尝试并不多。
2019 年,百度 "凤巢" 上线了业界首个基于 GPU 的超大规模离散模型训练框架 PaddleBox,训练效率大幅提升,支持复杂 DNN 网络结构和单机 10 TB / 多机数十 TB 级模型训练。相较于传统 CPU 解决方案,资源性价比提升 5-40 倍。框架全面用于百度广告系统,包括搜索广告、信息流广告和联盟广告三大主流场景。
2022 年,百度更进一步推出了基于 GPU 的超大规模图模型训练框架 PGLBox,在业内首次实现超大离散模型、超大语义模型和超大图的一体化联合训练。PGLBox 支持千亿规模节点 / 边的图模型全 GPU 训练,相较传统 GPU 分布式解决方案,它以相同的成本实现 27 倍训练速度提升。目前已在百度广告、推荐系统、百度搜索等内部业务场景广泛应用。
基于 GPU 的大规模离散 DNN 及大规模图模型训练,开启第四代 CTR 模型技术的新篇章,使得点击率、转化率模型对百度商业广告推荐等场景的增益提升到了一个全新水平。
此外,对于广告系统中文案、图片、视频等天然的多模态数据,多模态大模型对于充分理解这些内容有着天然优势,还能够将合适的内容推送给合适的受众,实现广告投送方和接收方的「双向奔赴」。百度商业通过多模态理解来提升商业系统对富媒体内容的高阶认知能力,在千亿富媒体数据驱动下,利用百亿参数多模态大模型,在 C 端和 B 端分别为用户和客户提供大模型赋能的多样化 AI 工具和更高效、便捷、优质的内容服务。
在广告搜索推荐这类投放转化效果极其重要的业务场景中,大模型技术可以将用户曝光、点击、阅读、转化等行为高维特征馈入模型,减少信息损失的同时大幅提升商品 / 服务 - 用户匹配度、准确度,既满足用户需求,又保证非常可观的转化率,为企业增收。
从图文、视频创意到智能客服
生成式 AI 在商业营销中落地生根
除了持续创新的模型训练框架等技术之外,大模型赋能下的各种生成式 AI 应用和产品越来越对商业营销产生直接的影响,比如广告营销中的文案、海报、视频等多模态内容从传统的人工制作演进成自动化生产,这样一来,客户内容的生产周期和成本大幅降低,迭代效率显著提升,整个营销链路变得更加通畅。
生成式 AI 对现代商业营销的重要性不言而喻,这也是百度商业此次大赛中着眼于 AIGC 推理性能优化的一大原因所在。
就百度商业自身而言,依托于百度深厚的生成式 AI 技术积累,形成了文本创意工具、图片创意工具、数字人视频平台和智能化客服等全方位生成式 AI 赋能营销链路,从内容、营销和经营层面提升客户营销效果
在广告文案创作领域,百度商业依托文心大模型研发了面向营销文案自动生成的大语言模型,显著提升了客户的文案生产效率和广告营销转化效率,该模型训练分为三个阶段:
预训练阶段以文心通用大语言模型为基础。监督微调阶段基于海量客户专有的营销知识和面向客户业务的 Prompt 生成对通用大模型进行监督学习微调,实现大模型从通用知识向营销知识的适配。对齐微调阶段专注于场景化反馈调优,即基于广告的点击和转化反馈信号对大模型进行端到端调优,实现大模型从营销知识向营销效率的适配。
下面是广告文案自动化生成的一个典型示例:
在广告图片创作领域,百度商业自研了面向商业营销场景的文生图大模型,实现了 Prompt 驱动的图片生成和背景图生成能力,缓解了特定行业图片素材缺少和场景适配度低的问题。与广告文案生成一样,文生图大模型训练也分三步走:
首先在基于大规模图文对比学习预训练模型来实现图文表征之间的理解对齐,同时引入了近千亿图搜行为反馈数据进行学习增强;接着基于扩散模型和元素级 Prompt 生成进行文生图模型的端到端学习;最后基于客户专有图文数据和用户行为反馈信号进行商业场景化精调。
下面是文生图的典型示例,客户既可以通过 Prompt 生成初始图,也可以通过 Prompt 来更换图的背景。
此外,数字人口播视频也越来越频繁地出现在各大平台的广告投放场景中, 数字人视频不仅可以大幅节省客户视频创作的成本,还能对它们的外貌、声音、交互方式等进行高度自由定制。百度商业打造了数字人口播短视频端到端生成解决方案,将客户短视频生产的时间从天级缩短到了分钟级。其中视频脚本、数字人模特、口播声音和风格以及视频背景都可以自主生成和选择,完全满足不同客户多样化的营销需求。
最后生成式 AI 技术也在改变着数字化客服领域,数字化客服在电商、金融等场景中已经得到一定应用,但是大都以人工定制模板和问答内容的检索交互为主,对话生硬、千篇一律且需求满足度覆盖很差,随着大语言模型能力的赋能,这些问题正逐渐得到改善。百度商业自研了商业营销对话和营销知识增强的百亿对话生成大模型,具备面向不同行业、不同客户、不同业务点的差异化智能对话能力,大大改善人机交互体验和营销效率。
今年 6 月底,百度营销旗下生成式 AI 创意平台「擎舵」正式亮相,在文心大模型赋能下实现了文案、图片和数字人视频自动化制作。据机器之心了解,该平台可以 2 分钟产出 100 条创意文案、3 分钟生成一个数字人建模、5 分钟制作一支数字人口播视频,相较传统制作方式效率惊人,成本自然而然被打下来了。
可以看到,从广告文案、图片到数字人口播、智能客服,生成式 AI 已经在百度商业的运营中无所不在,深刻变革了传统营销内容的生产方式。并且,生成式 AI 在商业领域的成功应用也为重塑千行百业「打了一个好样」。
结语
2023 大半年过去了,大模型推出的已经足够多, 不过很多仍停留在仅供用户体验的初步状态。但如果仅仅是秀肌肉,无法带来价值,它们也就失去了真正的用武之地。商业营销这个连通商户、场景和用户的「大秀场」为大模型和生成式 AI 提供了尽情释放和发挥能力的土壤。
近年来,百度致力于 AI 技术与商业的紧密结合,这是生成式 AI 对企业进一步发展的必然要求。抓住大模型和生成式 AI 这一技术窗口,则有可能在自身商业场景中迎来生产效率的大幅提升,并留住更多客户和用户。因此,让大模型和生成式 AI 渗透更深层次的企业经营是必由之路,最终形成它们赋能下的全方位商业生态。
百度商业则希望以此次 AI 技术创新大赛为契机,吸引更多年轻人探索 AI 技术的创新应用。我们知道,创新人才的培养是推动 AI 技术发展的根本源泉,更多人才以及他们的创新能力会充分挖掘大模型和生成式 AI 在商业领域的更多可能性。
大模型和生成式 AI 的商业化之路任重道远,百度显然已经走上了快车道。
关键词: