摸鱼大数据——用户画像——怎样给用户“画像”

打印 上一主题 下一主题

主题 854|帖子 854|积分 2562

 2、怎样给用户“画像”

2.1 什么是标签体系

标签: 是某一种用户特征的符号表示
标签体系: 把用户分到多少类别里面去, 这些类是什么, 彼此之间有什么关系, 就构成了标签体系
标签解决的题目: 解决形貌(或命名)题目以及解决数据之间的关联

2.2.1 标签的分类

用户画像标签一般分为两大类: 底子属性标签和行为属性标签


  • 底子属性标签:
  1.  例如:
  2.  用户基本信息:  性别、年龄、上网场景、所在地等
  3.  ​
  4.  用户情况:  学历、婚恋情况、兴趣等
  5.  ​
  6.  用户行为: 付费用户、消费能力、移动定向(设备价格、操作系统、联网方式、移动运营商、移动媒体分类)等
复制代码


  • 行为属性标签:
  1.  例如:
  2.  个人喜好: 资源分类标签、喜好标签、风格标签、收听时间等
  3.  ​
  4.  收听行为: 主动播放、听完、跳过、单曲循环、分享、收藏、拉黑
复制代码

固然另有另一种说法: 静态标签和动态标签
  1.  静态:  不变的属性  如 性别 出生日期 出生地
  2.  动态:  变化的属性  如 爱好 职业 婚否等
复制代码


由于基于一个目的的画像,其标签是在动态扩展的,以是其标签体系也没有统一的模板,在大分类上,与自身的业务特征有很大的关联,在团体思路上可以从横纵两个维度展开思考:横向是产品内数据和产品外数据,纵向是线上数据和线下数据。而正中间则是永恒不变的“人物底子属性”。





2.2.2 标签的级别

分级有二层含义: 一是指标从最底层涵盖的层级 二是指标的运算层级


  • 指标桶运算层级角度分为三层: 事实标签、模子标签、预测标签

    • 事实标签(底子标签)/规则匹配类: 是通过对于原始数据库的数据举行统计分析而来的, 如用户投诉次数,是基于用户一段时间内实际投诉的行为做的统计
    • 模子标签(统计标签): 是以事实标签为底子, 通过构建事实标签与业务题目之间的模子, 举行模子分析得到的. 如: 结适用户实际投诉次数、用户购买品类、用户支付的金额等, 举行用户 投诉倾向类型的识别, 方便客服分类处理
    • 预测标签(发掘标签): 是在模子的底子上做预测, 如: 针对投诉倾向类型布局的变化, 预测平台舆情分险指数


2.2.3 标签命名&赋值



注意:根据实际业务场景标签分级和命名方式是差异的。

2.2.4 标签属性

标签属性可以理解为针对标签举行再标注, 这一环节的工作重要目的是帮助内部理解标签赋值的来源, 进而理解指标的含义。


  • 固有属性: 用户生而有之或者事实存在的。好比:性别、年龄、是否生养等。
  • 推导属性: 由其他属性推导而来的属性, 好比星座,我们可以通过用户的生日推导,好比用户的品类偏好,则可以通过一样平常购买来推导。
  • 行为属性: 产品表里实际发生的行为被记载后形成的赋值,好比用户的登陆时间,页面停留时长等。
  • 态度属性: 用户自我表达的态度和意愿。好比说我们通过一份问卷向用户询问一些题目,并形成标签,如询问用户:是否乐意完婚,是否喜欢某个品牌等。固然在大数据的需求配景下,利用问卷网络用户标签的方法服从显得过低,更多的是利用产品中相干的模块做了用户态度信息网络。
  • 测试属性: 测试属性是指来自用户的态度表达,但并不是用户直接表达的内容,而是通过分析用户的表达,布局化处理后,得出的测试结论。好比,用户填答了一系列的态度问卷,推导出用户的价值观类型等。
  1.  特别注意:
  2.      一种标签的属性可以是多重的, 比如: 个人星座这个标签, 既是固有属性, 也是推导属性
  3.      即使构建了用户画像标签体系, 但也不代表完成了用户画像, 因为需要对标签赋值, 但有些标签根据无法获得或者无法赋值
  4.      标签无法赋值的原因: 数据无法采集(如敏感数据) 数据库无法打通 建模失败 等等...
复制代码

2.2.5 标签体系布局



1: 原始输入层
重要指用户的历史数据信息,如会员信息、消费信息、网络行为信息。颠末数据的清洗,从而到达用户标签体系的事实层。
2: 事实层
事实层是用户信息的准确形貌层,其最重要的特点是,可以从用户身上得到确定与肯定的验证。如用户的生齿属性、性别、年龄、籍贯、会员信息等。
3: 模子预测层
通过利用统计建模,数据发掘、机器学习的思想,对事实层的数据举行分析利用,从而得到形貌用户更为深刻的信息。如通过建模分析,可以对用户的性别偏好举行预测,从而能对没有网络到性别数据的新用户举行预测。还可以通过建模与数据发掘,利用聚类、关联思想,发现人群的聚集特征。
4: 营销模子预测
利用模子预测层结果,对差异用户群体,雷同需求的客户,通过打标签,创建营销模子,从而分析用户的活跃度、忠诚度、流失度、影响力等可以用来举行营销的数据。
5: 业务层
业务层可以是显现层。它是业务逻辑的直接体现,如图中所表示的,有车一族、有房一族等。


2.2.6 标签体系布局分类

一般来说,设计一个标签体系有3种思路,分别是:1)布局化标签体系;2)半布局化标签体系;3)非布局化标签体系。



  • 布局化标签体系(最多)
  1.      简单地说,就是标签组织成比较规整的树或森林,有明确的层级划分和父子关系。结构化标签体系看起来整洁,又比较好解释,在面向品牌广告井喷时比较好用。性别、年龄这类人口属性标签,最典型的结构化体系
复制代码






  • 半布局化标签体系(少有)
  1.      在用于效果广告时,标签设计的灵活性大大提高了。标签体系是不是规整,就不那么重要了,只要有效果就行。在这种思路下,用户标签往往是在行业上呈现出一定的并列体系,而各行业内的标签设计则以“逮住老鼠就是好猫”为最高指导原则,切不可拘泥于形式。
复制代码


  • 非布局化标签体系(少有)
  1.      非结构化,就是各个标签就事论事,各自反应各自的用户兴趣,彼此之间并无层级关系,也很难组织成规整的树状结构。非结构化标签的典型例子,是搜索广告里用的关键词。
复制代码

2.2.7 用户画像标签层级的建模方法

用户画像的核心是标签的创建,用户画像标签创建的各个阶段利用的模子和算法如下图所示。





  • 原始数据层: 对原始数据,我们重要利用文本发掘的算法举行分析如常见的TF-IDF、TopicModel主题模子、LDA 等算法,重要是对原始数据的预处理和清洗,对用户数据的匹配和标识。
  • 事实标签层: 通过文本发掘的方法,我们从数据中尽可能多的提取事实数据信息,如生齿属性信息,用户行为信息,消费信息等。其重要利用的算法是分类和聚类。分类重要用于预测新用户,信息不全的用户的信息,对用户举行预测分类。聚类重要用于分析发掘出具有雷同特征的群体信息,举行受众细分,市场细分。对于文本的特征数据,其重要利用相似度盘算,如余弦夹角,欧式间隔等。
  • 模子标签层:利用机器学习的方法,结合推荐算法。模子标签层完成对用户的标签建模与用户标识。其重要可以采取的算法有回归,决议树,支持向量机等。通过建模分析,我们可以进一步发掘出用户的群体特征和个性权重特征,从而美满用户的价值衡量,服务满意度衡量等。
  • 预测层:也是标签体系中的营销模子预测层。这一层级利用预测算法,如机器学习中的监督学习,计量经济学中的回归预测,数学中的线性规划等方法。练习对用户的流失预测,忠实度预测,兴趣水平预测等等,从而实现精准营销,个性化和定制化服务。

2.2 怎样举行打标签

例如有如下标签信息:
标签ID标签名称标签级别标签关系(PID)1性别402男513女514学历405专科546本科547硕士54 打标签:
用户 ID用户标签100012, 5100023, 6100032, 6100043, 7100052, 7100062, 6
标签命名方式:




2.3 用户画像基本步调与验证

根据详细业务规则确定用户画像方向后,开展用户画像分析,总体来说,一个用户画像流程包罗以下几步:


  • 1-用户画像数据来源
  • 2-用户画像的标签体系构建
  • 3-用户画像的标签盘算
  • 4-用户画像的标签调度
  • 5-用户画像标签的管理




细化说明:


  • 用户画像数据来源:

    • 静态数据: 画像的数据重要来自数仓




动态数据: 用户行为日记


用户画像的标签体系构建



用户画像的标签盘算


用户画像的标签调度


用户画像标签的管理


用户画像何如验证?


  • 可以通过上游推荐系统和标签自己逻辑可靠性和完整性衡量




免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

魏晓东

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表