python统计数据分析教程:测量方差

2018-10-0119:25:19后端程序开发Comments1,952 views字数 1119阅读模式

在统计中,方差是衡量数据集中的值与平均值相差多少的指标。 换句话说,它表示值的分散程度。 它通过使用标准偏差来衡量。 另一种常用的方法是偏斜。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/6082.html

这两个都是通过使用pandas库中可用的函数来计算的。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/6082.html

测量标准偏差

标准偏差是方差的平方根。 方差是数据集中平均值与平均值的平方差。 在python中,我们使用pandas库中的函数std()来计算这个值。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/6082.html

import pandas as pd

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Gasper','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#Create a DataFrame
df = pd.DataFrame(d)

# Calculate the standard deviation
print (df.std())

执行上面示例代码,得到以下结果 -文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/6082.html

Age       7.265527
Rating    0.661628
dtype: float64

测量偏斜度

它用于确定数据是对称的还是倾斜的。 如果索引在-11之间,则分布是对称的。 如果指数不超过-1,那么它向左倾斜,如果它至少为1,那么它向右偏斜文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/6082.html

import pandas as pd

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Gasper','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#Create a DataFrame
df = pd.DataFrame(d)
print (df.skew())
Python

执行上面示例代码,得到以下结果 -文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/6082.html

Age       1.443490
Rating   -0.153629
dtype: float64
Shell

因此,年龄分布是对称的,而年龄分布则偏向右侧。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/6082.html

  • 本站内容整理自互联网,仅提供信息存储空间服务,以方便学习之用。如对文章、图片、字体等版权有疑问,请在下方留言,管理员看到后,将第一时间进行处理。
  • 转载请务必保留本文链接:https://www.cainiaoxueyuan.com/bc/6082.html

Comment

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定