变量间的关系分析 |
您所在的位置:网站首页 › 雷达图主要用于描述多个变量之间的相关关系 › 变量间的关系分析 |
文章目录
1 变量间的关系分析1.1 变量间的关系1.2 案例分析①_单变量一元回归分析1. 读取数据2. 直观图示3. 两变量间统计量分析:4.建立一个离均差积和函数5.R语言中计算相关系数函数6.建立假设检验7.计算t值和p值,作结论8. 一元线性回归模型的额参数估计9.检验:方差分析与t检验:
1.3 案例分析②_单变量一元回归分析1.数据读取,拷贝读取2.拟合模型3.得到模型:4.模型检验_方差分析5.模型检验_t检验
1 变量间的关系分析
1.1 变量间的关系
函数关系(确定性关系)数学模型相关关系(非确定性关系)统计学
平行关系(相关关系)
一元相关分析多元相关分析 依存关系(回归分析)
一元回归分析多元回归分析
1.2 案例分析①_单变量一元回归分析
1. 读取数据
x = c(171, 175, 159, 155, 152, 158, 154, 164, 168, 166, 159, 164)
y = c(57, 64, 41, 38, 35, 44, 41, 51, 57, 49, 47, 46)
2. 直观图示
#散点图看x,y关系
plot(x, y)
总体线性相关系数 ρ = C o v ( x , y ) v a r ( x ) v a r ( y ) = σ x y σ x 2 σ y 2 \rho = \frac{Cov(x,y)}{\sqrt{var(x)var(y)}}=\frac{\sigma_{xy}}{\sqrt{\sigma_{x}^{2}\sigma_{y}^{2}}} ρ=var(x)var(y) Cov(x,y)=σx2σy2 σxy 样本线性相关系数: 样本化:样本矩代替总体矩(协方差与标准差){ l x x = ∑ ( x − x ˉ ) 2 = ∑ x 2 − ( ∑ x ) 2 ) n l y y = ∑ ( y − y ˉ ) 2 = ∑ y 2 − ( ∑ y ) 2 ) n l x y = ∑ ( x − x ˉ ) ( y − y ˉ ) = ∑ x y − ( ∑ x ) ( ∑ y ) n \left\{\begin{matrix} l_{xx}=\sum{(x-\bar{x})^{2}}=\sum{x^{2}}-\frac{(\sum{x})^{2})}{n} ; ; \\ l_{yy}=\sum{(y-\bar{y})^{2}}=\sum{y^{2}}-\frac{(\sum{y})^{2})}{n} ; ; \\ l_{xy}=\sum{(x-\bar{x})(y-\bar{y})}=\sum{xy}-\frac{(\sum{x})(\sum{y})}{n} ; ; \\ \end{matrix}\right. ⎩⎪⎨⎪⎧lxx=∑(x−xˉ)2=∑x2−n(∑x)2)lyy=∑(y−yˉ)2=∑y2−n(∑y)2)lxy=∑(x−xˉ)(y−yˉ)=∑xy−n(∑x)(∑y) r = S x y S x 2 ⋅ S y 2 = l x y l x x ⋅ l y y = ∑ ( x − x ˉ ) ( y − y ˉ ) ∑ ( x − x ˉ ) 2 ∑ ( y − y ˉ ) 2 r=\frac{S_{xy}}{\sqrt{S_{x}^{2}\cdot S_{y}^{2}}}=\frac{l_{xy}}{\sqrt{l_{xx} \cdot l_{yy}}}=\frac{\sum{(x-\bar x)(y-\bar y)}}{\sqrt{\sum{(x-\bar x)^2}\sum{(y-\bar y)^2}}} r=Sx2⋅Sy2 Sxy=lxx⋅lyy lxy=∑(x−xˉ)2∑(y−yˉ)2 ∑(x−xˉ)(y−yˉ) 4.建立一个离均差积和函数{ l x x = 556.9 l y y = 813 l x y = 645.5 \left\{ \begin{matrix} l_{xx}=556.9 ; ; \\ l_{yy}=813 ; ; \\ l_{xy}=645.5 ; ; \end{matrix} \right. ⎩⎨⎧lxx=556.9lyy=813lxy=645.5 r = l x x l x x l y y = 645.5 559.6 × 813 = 0.9593 r=\frac{l_{xx}}{\sqrt{l_{xx}l_{yy}}}=\frac{645.5}{\sqrt{559.6\times 813}}=0.9593 r=lxxlyy lxx=559.6×813 645.5=0.9593 5.R语言中计算相关系数函数 ***cor(x, y=NULL, method=c("pearson", "kendall", "spearman"))*** x: 数值向量、矩阵或数据框 y:空或数值向量、矩阵或数据框 method: 计算方法,默认:pearson计算pearson相关系数 cor(x, y) 6.建立假设检验H 0 : ρ = 0 , H 1 : ρ ≠ 0 , α = 0.05 H_ 0:\rho=0,H_ 1:\rho \neq 0,\alpha=0.05 H0:ρ=0,H1:ρ̸=0,α=0.05 假设检验思想 t r ( r − ρ ) S r ∼ f 分 布 t_ r\frac{(r-\rho)}{S_ r}\sim f分布 trSr(r−ρ)∼f分布 t r = r − 0 1 − r 2 n − 2 = 0.9593 12 − 2 1 − 0.959 3 2 = 10.74 t_ r=\frac{r - 0}{\sqrt{\frac{1-r^2}{n-2}}}=\frac{0.9593 \sqrt{12 - 2}}{\sqrt{1-0.9593^2}}=10.74 tr=n−21−r2 r−0=1−0.95932 0.959312−2 =10.74 n = length(x) tr = r/sqrt((1-r^2)/(n-2));tr 7.计算t值和p值,作结论 cor.test(x,y) Pearson's product-moment correlation data: x and y t = 10.743, df = 10, p-value = 8.21e-07 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.8574875 0.9888163 sample estimates: cor 0.9593031**分析: ** **p < 5 ** **95%区间估计为[0.8574875 0.9888163] ** 拒绝 H 0 H_ 0 H0 8. 一元线性回归模型的额参数估计直线方程的模型: y ^ = a + b x \hat y=a+bx y^=a+bx b = l x y l x x = ∑ i = 1 n ( x i − x ˉ ) ( y i − y ˉ ) ∑ i = 1 n ( x i − x ˉ ) 2 b=\frac{l_{xy}}{l_{xx}}=\frac{\sum_{i = 1}^{n}{(x_ i - \bar x)(y_ i - \bar y)}}{\sum_{i = 1}^{n}{(x_ i - \bar x)^2}} b=lxxlxy=∑i=1n(xi−xˉ)2∑i=1n(xi−xˉ)(yi−yˉ) a = y ˉ − b x ˉ a=\bar y - b \bar x a=yˉ−bxˉ @ l x y ( x , y ) = ∑ i = 1 n x i y i − ∑ i = 1 n x i ∑ i = 1 n y i n lxy(x,y) = \frac{\sum_{i = 1}^{n}{x_ i y_ i}-\sum_{i = 1}^{n}{x_ i}\sum_{i = 1}^{n}{y_ i}}{n} lxy(x,y)=n∑i=1nxiyi−∑i=1nxi∑i=1nyi b = lxy(x, y) / lxy(x, x) a = mean(y) - b*mean(x) c(a=a, b=b) #自定义函数 lxy F) x 1 712077 712077 27428 < 2.2e-16 *** Residuals 29 753 26 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1分析由于 P ; 0.05 P;0.05 P|t|) (Intercept) -1.19656 1.16125 -1.03 0.311 x 1.11623 0.00674 165.61 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |