ToB企服应用市场:ToB评测及商务社交产业平台

标题: 及时保举算法的架构 [打印本页]

作者: 立聪堂德州十三局店    时间: 2024-11-14 14:21
标题: 及时保举算法的架构
1. 及时保举算法的架构设计

  偷得浮生半日闲,跟各人一起聊一聊各人最喜欢的及时保举算法架构,具体如图1.1,架构的详解则见下一章节《2. 及时保举算法架构设计详解》。

   图 1.1 及时保举算法的架构设计  
2. 及时保举算法架构设计详解

2.1 数据源

  保举算法的数据源主要泉源于两大部分:

2.2 数据消费和集成

  埋点数据和落库数据是技术手段大将两大类数据进行了拆分,但是在最后的数据应用侧,并不会单纯的说只用埋点数据大概说只用交易数据,因此必要根据后续投入算法盘算的特征工程进行数据源消费后的数据集成;

2.3 特征工程数据存储

  数据消费和集成的本质,就是为了实现特征工程的盘算,常见的特征向量有用户特征表,商品特征表,及时特征表等等,特征工程存储可以分为3大类:

但是这些DB肯定要适配你的及时流盘算引擎,否则数据及时盘算后的存储就是跟自己过不去。
2.4 算法模子

  算法模子就是部署在算法服务器一直Running的等候特征工程输入并得出盘算结果的一个或多个步伐包,此处通常是用python写的一个或多个算法包,在保举算法内里,办理的核心问题则是ReRank商品对用户的曝光排序,即将用户最喜欢的但用户自己又不知道的商品保举给到用户,通常的算法技术有:

2.5 算法结果集存储

   算法集的结果最核心的字段就是:用户ID,商品ID,Rank(用户对商品的喜欢排名);因此通常是存储在关系型数据库如MySQL即可,固然假如用户量和商品数特别庞大,也可以考虑存入特征工程中提到的分布式NoSQL数据库。
   表2.5.1 算法结果集核心数据列  用户ID商品IDRank1a1zAA11a1zBB26t7uCC1 2.6 算法结果集应用

   算法的最闭幕果聚集应用,自然是将算法结果通过API透传给到客户端,客户端前端根据算法给到的用户ID,商品ID,Rank(用户对商品的喜欢排名)给到每个用户对差别商品的瀑布流曝光,从而实现千人千面的保举算法结果,固然为了加快查询速度,通常假如算法结果集在MySQL的话,会再MySQL和API之间加一层Redis缓存。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4