普通企业里面普通的数据分析(2)-数据标识

-回复 -浏览
楼主 2019-10-10 16:44:46
举报 只看此人 收藏本贴 楼主

        从这个阶段开始,我们就开始了实际的数据分析。

        个人认为,普通企业里面普通的数据分析(以下简称数分)的第一步是要把要关注的数据标识出来,这些要标注的数据包括:

(1)我们关注的目标数据

(2)发生了一些异常变化,而这些异常变化对我们很重要

        我们关注的目标数据有很多,例如财务会关注某个比率值、坏账率的指标,营销人员会关注销售量和销售价格等,我们会在报表中把当月或者当周的数据标识出来。

        另外,我们也会关注指标值的变化量,例如某个区域的销售突然上升了,我们也希望将其标识出来。

        数据标注的方法很多,最常用的是按照业务逻辑标注、按照时间标注、异常值标注以及散点图中的一些标注等,以下逐步介绍:

(1)按照业务逻辑标注

        业务逻辑标注在数据标注中的体量很大,例如我们知道渠道A是我们的主要的营销渠道,但是渠道C不是,如果我们一旦发现某个地区的渠道C的销售量超过渠道A,这个显然就是要标注出来的:

        对于上面的数据,做数据透视表如下:

        做条件格式:

        放大一些看:

        得到效果如下:

(2)按照时间标注

        就是把特定的时间段里面的数据标注出来,例如我们特别关注2018年第一周的数据,就把这些数据特别标注出来。

(3)异常值标注

        要把什么是异常值讲清楚是一个很复杂的事情,这个恐怕要专门写一篇文章才能讲清楚了,异常值的标准也是多种多样,以下最简单地介绍一下著名的三倍标准差的方法。

        标准差是衡量数据波动的重要指标,excel里面函数是stdev,三倍标准差的基本原理是:平均值是数据波动的中轴线,例如数据的平均值是120,那么数据的波动就是围绕着120上下波动,标准差就是衡量其波动的大小。波动越大,数据的量就越小,如果数据波动超过了三倍标准差,百分比就是5%。

        异常值标注的技术比较复杂,有的甚至要用工具,这样先略过不提。

(4)散点图标注

        散点图是一个很好的标识数据的工具,看下面的例子:


        画散点图,如下:

        我们清楚地看到,散点图呈现出两个独立的区域,这是两个比较独立的量价分布的区域。



我要推荐
转发到