最新工资水平表
3天前,即5月16日,国家统计局公布了就业人员分岗位年平均工资情况的数据。数据中显示科学研究和技术服务业、信息传输、软件和星系技术服务业。这几种行业的工资水平是最高的。单从这方面可以说是可喜可贺的,毕竟这说明了我们国家对科研人才等高级人才越来越重视。
平均工资代表的整体集中水平有待商榷
那么我们首先来看看这平均工资是怎么算的:
平均工资=从业人员工资总额/从业人员平均人数。
调查数据的来源是受调查单位在“联网直报平台”报送数据,依照《劳动工资统计报表制度》中的解释填报指标。从以上内容我们就能发现一个问题,那就是平均工资总额容易受到极端值得影响。 1 2 3 4 12 20 这6个单位的平均数就为7,那么就说总体工资水平约为7个单位。很明显只有少数人能达到这个水准,这意思就是说,大多数人的薪资水平不由大多数人来决定,而由少数人来决定。这势必会造成数据的代表性减弱,而根据该数据所做的决策也会又相对的偏离实际。
而在优秀班级的成绩评比中,如果某个班出现比较高的两极分化,然而其优秀的同学显著高于其他同学,那么该班的整体水平就会被往上拉,而实际情况是该班差生一大堆。除此之外该班的学习目标和任务会因排名的增加而相对增加,然而这对另外一部分同学来说就是极不公平的了,他们将会越来越赶不上别人的脚步。他们的成绩会越来越差,在这样的情况下。为了弥补平均成绩的波动,班级中的优势资源将越来越集中于少数人。这样的情况是非常不利于因材施教和教育公平的。
是否可以用其他方式来代表集中水平呢?
首先从均值的角度,为了消除极端值得影响。在计算的时候可以采用“切尾均值”和“截断均值”。切尾均值大家都明白,即去掉部分最高和部分最低后所得出的平均值。截断均值有着类似的效果,不同的是,截断均值给的是一个截断水平,然后根据该水平计算出相应前后要去掉的数据量后再求出平均数。这样的算法的优势是能够消除部分极端值的影响。这两种算法虽然能降低极端值的影响,但是不能避免,并且截断水平的选取会使最后的数据偏向于主观期望的值反而造成数据的不主观性。
中位数运用的可能性
既然均值有这些极端因素的影响。那么不会受到极值影响的中位数的运用可行吗?很明显是可以这么用,但不能大范围的用。比如1 2 3 4 12 20这组数据的中位数是3.5,有一半的人比这低,有一半的人比这高。似乎有人会觉得“嗯,对了嘛,这才是应该有的水平嘛”,可是你们注意没有,该值是显著小于总体的,一旦数据量过大这样的问题将会更明显,也会导致评估失误,所以中位数虽看似更公平可是依然存在着比较严重的问题。
尖峰分布、正态分布、平峰分布图
最能解释分布情况的工具
均值不好用、中位数也有问题,那么用“众数”呢?很显然也是不可取的。那么什么工具最能反映现实问题呢?其实如果我们把,这三个指标合在一起就可以对整体进行评估了。比如均值>中位数>大于众数,就是指右偏分布,这个时候说明了存在少数人的薪资水平或者成绩水平过高的情况。相反则是左偏,既少数人的收入或者成绩极端低,这个时候我们就可以进行对症下药。当然最理想的就是正态分布了。
实际运用
讲到这里很多网友肯定会觉得这个那么好,为什么不就这样来来使用呢?在这里我就想说,用肯定是在用的。只是公布出来怎么公布呢?直接公布某某地区的工资水平呈现右偏或左偏,偏离系数、均值、众数、中位数是多少?这样也不方便啊,并且不是所有人都轻易能看懂啊。
虽然很多人觉得,自己的收入比表中的收入差了不少,就吐槽拖了平均工资的后腿了。我想说的是,对啊你就是拖了平均工资的后腿了,但是只要不是在造成左偏的极端数据里面的那部分,你就没有拖整体的后腿。而这部分人除开特殊原因的,一般都是工作能力极度差,就像工作能力极度强的那样稀少的人,基本上就是我们所说的“脑壳有包”的了。