距离2018Tableau峰会--上海站已经过去10天了,好记性不如烂笔头,干货太多很想把所有内容都记录下来,下面分享一篇《有关数据分析的7个方法》并结合我工作当中的一些心得~
当我们拿到海量的数据时,可能会因为数据体量过大而无从下手,于是我们就变成了数据的搬运工,老板实际上要的是一瓢数据,而我们给老板的是一池数据让老板在数据的池水中翱游。好的数据分析是让数据说话,那么我们怎样来让数据说话呢,上干货~~~7个分析方法
1.数据随时间变化:某一个指标在日期维度上的变化,找寻异常、趋势
tips:结合已知的事件来看待它的影响,最大值和最小值、异常值,等拐点都可以成为挖掘故事的金矿,可以将跨度时间切割为年度、季度、月度等,比较正常和不正常值的差异来探究异常。
结合工作当中的实例:上海一门店进行促销,老板一般会看截止某一时间节点的销量,当时我们在分析销量的时候我们分析了按小时的销量,发现门店的销量会在早晚高峰出现销量上升,但在晚高峰时突然出现了销量的短时下跌,后来结合CCTV发现门店因为进货短时间人手不足等原因造成销量下降。
2.数据的放大与缩小
tips:集中关注某一特定区域或者范围的数据,将其与其余的数据做对比,可以先从整体入手并选择感兴趣的的数据区间,或者从某些有特征的数据点入手,查看数据是否存在异常
结合工作当中的实例:每月在做月度分析的时候,比如涉及销量完成率等这一个指标,我们一般会先看当月的情况,根据预算分配,我们会再考察YTD的情况。
3.数据的对比
tips:展示不同区域或者不同类别为什么会呈现不同的现象,通常是将一个群组/维度/项目与另外一个做对比
确认对比的目的,比如证实或伪证自己的猜想,对比不一定需要产生于在同一层级之间,可以个体VS个体,VS整体/平均/中位数
结合工作当中的实例:我们在年初的时候,公司对亏损的门店进行指标分析和量化,我们选取了销量-服务-效率等几个维度进行对比。对于具体门店到具体指标时,我们采用门店指标与公司中位数进行对比。
4.数据的上钻/下钻
tips:在具有层级结构的数据中探索某一维度是如何影响全局的,可以有自下而上或者自上而下
当选择到底是自下而上还是自上而下时,考虑你的听众更熟悉的背景,如果他们是只处理工作流程的某一具体环节的同事,那么选择自下而上;如果他们是对全局有宏观把控但是你需要他们关注某些具体细节的领导,那么选择自上而下。
结合工作当中的实例:每月在做月度分析的时候,我们一般都会先关注公司整体销售数据,具体销量数字和完成预算情况,此外还会关注重点销售区域的销售数据,对于预算完成较差的区域,我们进一步再关注具体门店的情况。
5.突出值/异常值
tips:发现表现异常的时间段/个体,通过散点图或者盒须图进行呈现。异常值越突出,故事效果越好,越容易给观众以深刻的印象,用不同的颜色或者注释标记出异常值以达到突出的效果。结合其他的叙述类型来挖掘出异常值背后的故事。
结合工作当中的实例:笔者所在的行业为零售行业,每天的零售销售数据很多,记得一次月度汇报,销量Top5的门店竟然出现在利润后十名的表单中,当时细究原因是财务在账务处理时将利润进行了分割。此外,对于异常数据笔者发现很多情况是由于底层数据未经处理而导致数据不干净。
6.数据的交叉点:多条趋势线的相互交叉,或者某一个体超越了另外一个个体的时间节点
tips:通常代表着某种转折或某个标志性的时间,展示时将交叉点之前时段的数据带入到故事当中可以让听众对交叉点产生时的背景有大致了解,同样可以结合其他的故事类型一同讲述。
结合工作当中的实例:我们在做数据分析时,我们会对比同期销量趋势,对于本年度销量大于上一年度销量的月份,我们会具体去看上涨的原因,具体是因为某一营销政策、竞争对手等原因。
7.剖析原因:
tips:在关注某一指标时,分析哪些因素会影响该指标的表现,分析两个角度之间的关系。
一个普遍应用的结构叫做“Goldilocks", 先展示一个并非特别相关的因素,然后再讲述特别恰当的影响因子。如果有一个大家普遍认为很重要的因素但事实上并没有想象中那么重要,说明后面还有一个更恰当的因素。
结合工作当中的实例:我们在分析门店亏损情况的时候,通常会先找到几个可能影响利润的几个指标,然后进行参考环比数据进行解释,当我们用现有的几个指标不能解释利润变化的时候,说明我们查看的影响因素还不够全面或者门店周围环境发生了重大改变。
网友评论