Logit 模型及 Stata 操作步调
一、弁言Logit 模型是一种在社会科学、经济学和医学等范畴广泛应用的统计模型,用于分析二元或多元分类因变量与自变量之间的关系。在本文中,我们将深入探讨 Logit 模型,并通过 Stata 软件进行详细的操作演示。
https://i-blog.csdnimg.cn/blog_migrate/2515111b4f0252e36ce4a6d47079c779.png
二、Logit 模型的根本原理
https://i-blog.csdnimg.cn/blog_migrate/7ac9c69f37e42b590827b032f806a65a.png
三、数据预备
我们使用 Stata 自带的数据集 auto.dta 进行演示。该数据集包含了汽车的各种特征和代价信息。
use auto.dta
四、变量选择与定义
假设我们要研究汽车代价(price)是否高于平均值(作为因变量,高于平均值为 1,否则为 0)与汽车重量(weight)、里程数(mpg)和维修记载(rep78,分类变量)之间的关系。
gen high_price = (price > mean(price))
五、Logit 模型估计
logit high_price weight mpg rep78
上述代码中,logit 下令用于估计 Logit 模型,high_price 是因变量,weight、mpg 和 rep78 是自变量。
六、代码解释
[*]logit 下令:指定使用 Logit 模型进行估计。
[*]high_price:二元因变量。
[*]weight、mpg:一连型自变量。
[*]rep78:分类自变量。
七、模型结果解读
运行上述代码后,Stata 会输出模型的估计结果,包括系数估计值、尺度误、z 值和 p 值等。
例如:
Logistic regression Number of obs = 74
LR chi2(3) = 35.28
Prob > chi2 = 0.0000
Log likelihood = -35.678971 Pseudo R2 = 0.4217
------------------------------------------------------------------------------
high_price | Coef. Std. Err. z P>|z|
------------------+---------------------------------------------------------------
weight | .0028504 .0007281 3.91 0.000 .0014219.0042789
mpg |-.0853008 .0309849 -2.75 0.006 -.1456783 -.0249233
rep78 |
1 |.521308.187245 2.78 0.005 .152832 .889784
2 |.783005.231878 3.38 0.001 .328561 1.23745
3 | 1.056802.298712 3.54 0.000 .472878 1.640726
4 | 1.328509.387201 3.43 0.001 .568734 2.088284
_cons |-3.570085 1.288275 -2.77 0.006 -6.082728 -1.0574419
------------------------------------------------------------------------------
系数的解释:
[*]对于 weight 变量,系数为 0.0028504,表如今其他条件不变的环境下,汽车重量每增长一个单位,代价高于平均值的概率的对数增长 0.0028504。
[*]对于 mpg 变量,系数为 -0.0853008,表如今其他条件不变的环境下,每增长一单位的里程数,代价高于平均值的概率的对数减少 0.0853008。
[*]对于分类变量 rep78,每个类别与基准类别(假设为类别 0)相比,系数表现该类别对代价高于平均值的概率的对数的影响。
八、预测
我们可以使用 predict 下令进行预测。
predict phat
生成的 phat 变量是预测的概率值。
九、模型评估
可以通过计算精确率、混淆矩阵、AUC(Area Under the Curve)等指标来评估模型的性能。
// 生成预测结果
gen pred = (phat > 0.5)
// 计算准确率
mat confusion = r(table)
scalar accuracy = (confusion + confusion) / rowsof(confusion)
di "Accuracy: " accuracy
// 计算 AUC
roctab high_price phat
十、稳健性检验
为了验证模型的稳健性,可以进行以下操作:
[*] 改变样本:例如,随机抽取一部门样本重新估计模型,观察结果是否相似。
[*] 增长或减少自变量:实验参加或剔除一些自变量,看模型的结果是否有显著变革。
十一、结论
通过以上的 Stata 操作步调,我们成功地创建了 Logit 模型,并对其进行了估计、预测和评估。在实际应用中,您需要根据数据的特点和研究问题,选择合适的自变量和模型情势,并对结果进行合理的解释和分析。
【DCM-02】二元Logit模型和Probit模型及其Stata实现 - 知乎 (zhihu.com)
【DCM-11】有序Logit模型及其Stata实现 - 知乎 (zhihu.com)
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]