有时辰我们在利用Python的时辰,想进行相关性阐发,怎么阐发呢,下面来分享一下方式
第一步我们起首需要知道相关性本家儿要有两个偏向,一个是正偏向一个是负偏向,相关性系数是权衡两个变量之间影响水平,如下图所示:
第二步下面经由过程公式计较两个变量之间相关性系数,代码如下:
import numpy
import pandas
X = [52,19,7,33,2]
Y = [162,61,22,100,6]
#公式计较#均值XMean = numpy.mean(X)
YMean = numpy.mean(Y)
#尺度差XSD = numpy.std(X)
YSD = numpy.std(Y)
#z分数ZX = (X-XMean)/XSD
ZY = (Y-YMean)/YSD#相关系数
r = numpy.sum(ZX*ZY)/(len(X))
print(r)
第三步运行法式,可以获得相关性系数r ,r的值是0.999674032661831,相关性很是高,如下图所示:
第四步我们也可以经由过程numpy的corrcoef方式计较相关性系数,输入代码
t=numpy.corrcoef(X,Y)
print(t)
可以看到X与Y和Y与X的相关性系数,如下图所示:
第五步我们也可以经由过程pandas的corr方式计较相关性系数,代码
data = pandas.DataFrame({'X':X,'Y':Y})
t2=data.corr()
print(t2)
获得了不异的成果,如下图所示:
0 篇文章
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!