ToB企服应用市场:ToB评测及商务社交产业平台
标题:
大数据-223 离线数仓 - 数仓 概念篇 业务分析 数据埋点 指标体系 维度拆解
[打印本页]
作者:
立聪堂德州十三局店
时间:
2024-11-19 09:12
标题:
大数据-223 离线数仓 - 数仓 概念篇 业务分析 数据埋点 指标体系 维度拆解
点一下关注吧!!!非常感谢!!连续更新!!!
如今已经更新到了:
Hadoop(已更完)
HDFS(已更完)
MapReduce(已更完)
Hive(已更完)
Flume(已更完)
Sqoop(已更完)
Zookeeper(已更完)
HBase(已更完)
Redis (已更完)
Kafka(已更完)
Spark(已更完)
Flink(已更完)
ClickHouse(已更完)
Kudu(已更完)
Druid(已更完)
Kylin(已更完)
Elasticsearch(已更完)
DataX(已更完)
Tez(已更完)
数据发掘(已更完)
Prometheus(已更完)
Grafana(已更完)
离线数仓(正在更新…)
章节内容
上节我们完成了如下的内容:
究竟表
维度表
雪花模子
究竟星座
元数据
需求分析
近年来,中国的电子商务快速发展,生意业务额连创新高,电子商务在各个范畴的应用不断拓展和深化、相关业务蓬勃发展、支持体系不断健全完善、创新的冻梨和能力不断增强。电子商务与实体经济融合,进入规模性发展,对经济和生活的影响不断增大。
电商特点
技能新
技能范围广
分布式
高并发、集群、负载均衡
海量数据
业务复杂
体系安全
业务简介
类似某东、某宝、某猫,电商网站采用商家入驻的方式,商家入驻平台提交申请。有平台进行考核,考核通过后,商家拥有独立的管理后台录入商品信息,商品颠末考核后即可发布,网上商城主要分为:
网站前台,网站首页、商家首页、商品详情页、搜索页、会员中央、订单与支付相关、秒杀频道
运营商后台,运营人员的管理平台,主要功能包罗:商家考核、品牌管理、规格管理、模板管理、商品分类管理、商品考核、广告类型管理、广告管理、订单查询、商家结算等。
商家管理后台,入驻的商家进行管理的平台,主要功能包罗:商品管理、订单查询统计、资金结算的功能
主要分析
日志数据:启动日志、点击日志
业务数据库的生意业务数据:用户下单、提交订单、支付、退款等核心生意业务数据
分析使命
会员活跃度分析主题:每日新增会员数、每日每周每月的活跃数,留存会员数
广告业务分析主题:广告点击次数、广告点击购买率、广告曝光次数
核心生意业务 分析主题:订单数、成交商品数、支付金额
数据埋点
根本概念
数据埋点,将用户的欣赏、点击事件收罗上报的一套数据收罗的方法。
通过这套方法,能够记录到用户在APP、网页上的一些举动,用来跟踪应用使用的状况,后续用来进一步优化产物或是提供运营的数据支持,包罗访问数、访客数、停留时长、欣赏数、跳出率等。如许的信息收集可以大致分为两种:
页面统计举动
统计操作举动
埋点流程
在企业策划中,数据分析辅助决定是非常紧张的一环,而埋点收罗用户举动数据的工作则是基础中的基础。如果没有用户举动数据,策划将无从说起,埋点为数据分析提供基础数据,埋点工作流程可分为:
根据埋点需求完成开发(前端开发工程师)
APP或网页收罗用户数据
数据上报至服务器
数据的清洗、加工、存储(大数据工程师)
进行数据分析等得到相应的指标(大数据工程师)
在以上的过程中,涉及的相关人员可以分为如下:
埋点需求:数据产物经理,负责撰写需求文档,规定哪些地域、用户操作需要埋点
埋点收罗:前端工程师,通过一套JS代码对用户的请求时间上送至服务器
数据清洗、加工、存储:对埋点中的数据缺失、误报等情况需要进行清洗,并通过肯定的盘算加工,输出业务分析所需要的布局化数据,最后将数据存储在数据仓库中
数据分析:在数据仓库中对数据进行整理,成业务关注的指标
前端展示:前后端开发
埋点实现
主流的埋点实现方法如下,主要区别是前端开发的工作量。
手动埋点
开发需要手动写代码实现埋点,比如页面ID、地域ID、按钮ID、按钮位置、事件类型(曝光、欣赏、点击)等,一样平常需要公司自主研发的一套埋点框架
优点:埋点数据更精准
缺点:工作量大 容易出错
无痕埋点
不消开发写代码去实现,自动将设备号、欣赏器型号、设备类型等数据收罗。主要使用第三方统计工具,如友盟、百度移动、魔方等等。
优点:简朴便捷
缺点:埋点数据不统一,不够个性化和精准
指标体系
指标:对数据的统计值,如:会员数、活跃会员数、会员留存数,广告点击量,订单金额,订单数都是指标
指标体系:将各种指标体系的组织起来,按照业务模子、尺度对指标进行分类和分层。
没有数据指标体系的团队内数据需求经常表现为需求膨胀以及非常多的需求变更。每个人都有看数据的视角和诉求,然后以非专业的方式创造维度/指标的数据口径。数据分析人员被海量的数据需求缠住,很难抽离出业务规则计划好的解决方案,终极滚雪球似的搭建难以维护的数据仓库。
建立指标体系实际上是与需求方达成划一,能有用遏制不靠谱的需求,让需求变得条理和体系化。
指标体系是指导数据仓库建立的基石。稳定而且体系化的需求,有利于数据仓库方案的优化和效率的提升
由产物经理牵头、业务、IT方帮忙,订定的一套能从维度反应业务状况的一套待实施框架,在建立指标体系时,要注重三个选取原则:准确、可表明、布局性。
准确:核心数据肯定要明白到位和准确,不能选错
可表明:所有指标都要配上明确、详细的业务表明,如日活的界说是什么,是使用了什么APP,还是在APP中停留了一段时间,收藏了还是购买了什么商品
布局性:能够充分对业务进行解读,如果新增用户只是一个大数,还需要知道每个渠道的新增用户,每个渠道的新增转化率,每个渠道的新增用户价值等。
在建立指标体系之前,先了解一下指标的构成,在工作过程中遇见的指标多为派生性指标,指标的构成如下所示:
基础指示 + 【修饰词】 + 时间段
修饰词是可选的,基础指标和时间段是必须的
基础指标是不可拆分的指标,如:生意业务额、支付金额、下单数
修饰词多是某种场景的表现,如:通过搜索带来的生意业务等
时间段即为一个时间周期,如:双十一期间,618活动期间等
三者叠加在一起就形成了业务上常用的指标(这些指标也是派生指标),如:双11这一天通过搜索带来的生意业务额、双11这一天的生意业务额,同样,像此类日活、月活、次日留存、日转化率都属于是派生指标。
在筛选完合理的指标后,就要着手建立对应的指标体系。主要分为四个步骤:
理清业务阶段和需求
确定核心指标
对指标进行维度的拆解
指标的落地
理清业务阶段及需求
企业的发展往往分为三个阶段:
创业期
上升期
成熟发展期
不同阶段关注的核心指标也是不同的。
业务前期,最关注用户量,此时的指标体系应该精密围绕用户量的提升来做各种维度的拆解
业务中期,除了关注用户量的走势巨细,更加紧张的是优化当前的用户量布局,比如看用户留存,如果留存偏低,那就需要进一步分析查找缘故原由
成熟发展期,更多关注的就是产物变现能力和市场份额,要关注收入指标、各种贸易化模式的收入,同时做好市场份额和竞品的监控,以防止新起势力抢占份额等
确定核心指标
这个阶段最紧张的是找到正确的核心指标,比方,某款产物的日活口径是打开APP,而且日活量不小,而且稳定上升。然后分析的时候发现,打开APP的用户中,5秒的出跳率高达25%,这是非常不康健的,那么当前的核心指标日活实际上已经有了题目,更加好的核心指标应该是停留时长大于5秒的用户数。
每个APP的核心指标都不太一样,肯定要花时间去思量这件事,就像XX头条APP,它的日活和留存指标肯定非常高,但仅关注这种指标肯定是不对的,它的真正的核心指标绝对不是单纯的日活和留存。
核心指标维度拆解
核心指标的波动必然是某种维度的波动引起,要监控核心指标,本质上还是要监控维度核心指标。
在分析“进入APP用户数”指标时,要关注渠道转换率,分析用户从哪里来,同时通过哪种方式打开的,如通过点击桌面图标、点击通知栏、点击PUSH等。
在分析“停留时长大于5秒占比”指标时,要重点关注停留时长的分布,停留1秒-5秒的用户各有多少,详细分布情况,停留大于5秒的用户特征和举动特征是怎么样的情况,停留小于5秒的用户特征等。
电商平台注重生意业务额,在真正到达生意业务之前,用户要打开APP,选择商品,确认订单,支付订单等整个交换漏斗模子,每一个环节的关键指标都可以通过公式的形式进行拆解,在根据拆解公式逐个分析对应的影响因素。
指标宣贯、存档、落地
在完成整个指标体系搭建后,要告诉所有相关业务人员。一方面为下一步工作做铺垫,另一方面是为了所有相关人员知晓已经完成,防止甩锅。
对指标口径业务逻辑进行详细的描述并且存档,只有明确、清晰的界说才能明白指标的详细含义
就是建立核心指标的相关报表,实际工作中,报表会在埋点前建立好,如许的话一旦版本上线就能立即看到数据,而且也比较容易发现题目。
整个指标体系的搭建主要是由数分析人员或产物经理主导完成的,业务人员需要共同产物经理选择并确认指标的,这也是在建立之初最紧张的一点。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/)
Powered by Discuz! X3.4