Bidding模型训练新范式:阿里妈妈生成式出价模型(AIGB)详解 ...

打印 上一主题 下一主题

主题 906|帖子 906|积分 2718

导读: 今天以ChatGPT为代表的生成式大模型让科技行业重新兴奋起来,也为广告营销注入了新的想象力。生成式大模型几乎一定会带来用户与互联网产品交互模式的改变,进而颠覆广告营销模式。广告技术人,你们预备好了吗?阿里妈妈技术已提前在该方向布局,并推出了新的广告营销智能技术体系,今天将揭暴露其神秘面纱的一角,窥探背后的思索和实践。
  ▐ 摘要

  出价产品智能化成为行业趋势,极简产品背后则是强大的主动出价的支持,其技术不停演进走过了3个大的阶段:PID控制、RL-based Bidding、SORL(Sustainable Online RL),那么下一步代际性技术升级是什么?今天以ChatGPT为代表的生成式大模型以汹涌澎湃之势到来,几乎一定会颠覆广告营销模式,一方面,新的用户交互模式会孕育新的商业时机,给主动出价的产品带来巨大改变;另一方面,新的技术理念和技术范式也会给主动出价算法带来革命性的升级。阿里妈妈技术团队提前布局,以智能营销决策大模型AIGA(AI Generated Action)为焦点重塑了广告智能营销的技术体系,并衍生出以AIGB(AI Generated Bidding)为代表的各种范畴技能模型。AIGB是一种基于生成式模型构造的出价模型优化方案,与以往办理序列决策问题的强化学习视角差别,其将策略建模为条件生成模型,从而消除了以往强化学习视角下的复杂性问题。具体实现上,将出价、优化目标和束缚等具备相关性的指标视为一个联合概率分布,并以优化目标和束缚项为条件,生成相应出价策略的条件分布。训练时将历史次优投放轨迹数据作为训练样本,以最大似然估计的方式拟合轨迹数据中的分布特性;推断时基于束缚和优化目标,以符合分布规律的方式输出出价策略。本文提出的方案可避免传统RL方案中的分布偏移和策略退化问题,又具备满足差别出价类型和差别束缚的灵活性。通过AIGB的技术研究和线上实践,我们愈发地感受到新的技术浪潮正在朝我们奔来,AIGB只是这一切的开始...
  一、配景

  1.1 出价产品智能化成为行业趋势

  广告平台吸引广告主持续投放的焦点在于给广告主带来更大的投放代价,出价产品的智能化已成为行业趋势并加以重点建设的本领(如图1)。以阿里妈妈为代表的互联网广告平台不停地探索流量的多元化代价,并计划更能贴近营销本质的主动出价产品,广告主只须要简单的设置就能清晰的表达出营销诉求。极简产品背后则是强大的出价策略支持,广告主出价策略从海量数据中挖掘更好的营销模式,提升广告主对特定代价的优化本领,赋能广告主投放。
     
       图1:出价产品的演进趋势,智能化徐徐成为互联网广告产品的标配       1.2 主动出价技术的不停演进

  阿里妈妈技术团队多年来致力于极致的优化主动出价策略,帮助广告主得到最好的投放效果,其主动出价策略的技术演进可以大要分为三个大的阶段,具体如下图。
     
       图2:典型的主动出价技术演进路线,从预算消耗控制->RL-based Bidding->SORL,下一步代际性升级是什么?       第一阶段:预算消耗控制,通过控制预算的消耗速率尽可能平滑来优化效果,一样平常通过经典的控制算法,如PID等。在假设竞价环境中流量代价分布均匀的情况下,这种方法可以或许达到比较好的效果。
  第二阶段:RL-based Bidding,现实环境中的竞价环境是非常复杂且动态变化的,只控制预算无法满足更多样的出价计划的进一步优化。AlphaGo的惊艳体现,显现了强化学习的气力,而主动出价是一个非常典型的序列决策问题,在预算周期内,前面花的好不好会影响到背面的出价决策,而这正是强化学习的强项,因此第二阶段我们用了基于强化学习的Bidding。Simulation based bidding 的一些工作[1]奠定了我们在广告主报价范畴的领先职位。
  第三阶段:SORL,它的特点是针对强化学习中离线仿真环境与在线环境不同等。我们直接在在线环境中举行可交互的学习,这是工程计划和算法计划联合的例子。SORL[2]上线之后,很大程度上办理了强化学习强依赖于仿真平台的问题。
  今天以ChatGPT为代表的生成式大模型让科技行业重新兴奋起来,也为广告营销注入了新的想象力。生成式大模型几乎一定会带来用户与互联网产品交互模式的改变,例如,多模态交互式对话方式会取代搜刮引擎的职位,以广告位拍卖为基础的互联网广告的逻辑也会发生改变。一方面,新的用户交互模式会孕育新的商业时机,给主动出价的产品带来颠覆的改变;另一方面,新的技术理念和技术范式也会给主动出价算法带来革命性的升级。
  现在,革命性升级已经到来!
  二、相关工作

  2.1 主动出价建模

  考虑到广告目标、预算和 个KPI束缚,计划的诉求可以通过(LP1)体现为统一的带束缚竞价问题。
                                                              如果已经知道流量集合的全部信息,包罗可以或许触达的每条流量i的流量代价      和成本      等,那么可以通过办理线性规划问题(LP1)来得到最优解      。然而,在现实应用中,我们须要在流量集合未知的情况下举行实时竞价。由于在线广告池的动态变化以及每天访问用户的随机性,很难通过准确的预测来构建流量集合。因此,通例的线性规划办理方法并不完全适用。所以在现实应用中,通过对上述出价公式的一些变换,构造一个最优出价公式,将原问题转化为求解最优参数的问题,从而大大降低了在线情况下求解此问题的难度。
  最优的出价公式为:
           
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

张国伟

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表