在R中计算四分位数

在统计中,方差或标准差是最常使用的衡量数据离散程度的指标,但是方差或标准差有其固有缺陷,当数据中存在离群值(outlier)时,即使outlier数量极少,也会使方差或标准差极度偏移,因此,我们需要一种统计工具来反映大部分数据分布在哪里,最常用的方法是计算75%与25%之间的差别,这称为四分位间距(interquartile range)。在R中,可以使用IQR()计算四分位间距,使用quantile()来计算向量的所有分位数。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
> x <- rnorm(100,mean=5,sd=1.2)
> x
[1] 3.344860 4.314303 5.259742 6.642526 6.458214 5.030996 5.526538 3.866030 5.152883 5.135912 6.010579
[12] 5.199178 4.673258 5.563149 5.663807 2.268774 3.974171 7.570706 5.354230 3.441178 5.336142 5.397549
[23] 6.295206 5.978662 5.389794 5.133840 5.752089 4.971203 5.146819 4.765819 7.122367 5.416928 5.400580
[34] 2.070468 4.243874 6.995033 5.854267 6.015518 5.375023 5.161929 2.867692 4.602293 4.931720 3.562440
[45] 5.203235 5.592098 5.646586 7.694937 4.820110 6.684675 4.165650 5.176470 5.430320 5.406880 6.836335
[56] 5.699121 6.424420 3.639120 6.670612 3.697681 2.813417 3.199165 4.858059 6.516864 4.165146 5.899056
[67] 4.145372 5.538209 5.269511 6.678199 4.815026 4.617706 4.923228 4.281446 4.346960 6.630204 4.452420
[78] 4.746863 4.586939 4.630323 4.922966 5.327350 3.658732 5.610512 3.980912 6.549318 7.398793 6.176837
[89] 4.913479 4.437707 6.204448 4.120004 5.745570 4.143726 3.151242 4.422654 5.892240 5.678614 3.890303
[100] 5.226019

> IQR(x)
[1] 1.343469

> quantile(x)
0% 25% 50% 75% 100%
2.070468 4.403730 5.187824 5.747200 7.694937

> boxplot(x,horizontal = T)

  • 本文作者:括囊无誉
  • 本文链接: R/R_quantile/
  • 版权声明: 本博客所有文章均为原创作品,转载请注明出处!
------ 本文结束 ------
坚持原创文章分享,您的支持将鼓励我继续创作!