很多企业采集了大量的数据,但是没有从数据中得出有效结论,其中很重要的一个原因是数据分析的指示器设计的不合理,不便于直观地、快速的发现异常。在实践中我总结了如下的要点: 1 选择合适的图形 常见的分析图形有5种:饼图、条形图、直方图、折线图、散点图。 饼图主要用于比较分析总体中各成分的比例对比关系,一般不超过7种成分时适合采用,如果超过7种则采用条形图。 条形图主要用于比较各分类的数量的多少与大小,条形图一般不用于比较具有时间顺序关系的场景。 直方图用于分析落在等距区间的事件的数量多少。采用条形图和直方图一般要先排序。 折线图主要用于分析具有时间顺序的事件属性的数值,用以分析事件发生的趋势。 散点图主要用于分析2个变量之间的相关性,在进行相关性分析之前,一般是先采用散点图进行目测。 在选择指示器类型时,应根据分析的目的与分析数据的样本点个数来选择合适图形,同一组数据可能由于目的的不同而选择多种指示器。 2 先排序再分析 要么以时间排序,要么以数值的大小的排序,总之应根据分析的目的,先对数据排序后再画图。 3 选择合适的数据分组 同一组数据采用不同的数据分组方式,得到的结论可能不同。比如,某个项目组每天交付代码行,可以按周次分组也可以按星期几来分组。 4 选择合适的时间刻度 同一组数据采用不同时间刻度来分析,得到的结论可能不同。比如,某个项目每天投入的工作量,可以按天分析,也可以按周分析,还可以按月分析等。 5 使用静态的控制线 控制线的值应该是固定的,不要设定变动的控制线。比如对于计划工作量与实际工作量的比较,如果设定指示器的横坐标为日期,纵坐标为工作量,偏差率为20%,则每天的偏差上下线需要随计划工作量的变化而变化,形成一个变动的控制线,不利于发现异常。而应该将坐标表设置为偏差率,这样就可以是静态的控制线。 6 减少网格线及指示器中线的个数 否则,线太多,不便于发现异常。 7 表的标题、系列名称、坐标的含义、类别名称等设置全面、并准确命名。 |