ToB企服应用市场:ToB评测及商务社交产业平台

标题: Logit 模型及 Stata 操作步调 [打印本页]

作者: 饭宝    时间: 2024-11-1 20:56
标题: Logit 模型及 Stata 操作步调
一、弁言


Logit 模型是一种在社会科学、经济学和医学等范畴广泛应用的统计模型,用于分析二元或多元分类因变量与自变量之间的关系。在本文中,我们将深入探讨 Logit 模型,并通过 Stata 软件进行详细的操作演示。

二、Logit 模型的根本原理




三、数据预备


我们使用 Stata 自带的数据集 auto.dta 进行演示。该数据集包含了汽车的各种特征和代价信息。


  1. use auto.dta
复制代码

四、变量选择与定义


假设我们要研究汽车代价(price)是否高于平均值(作为因变量,高于平均值为 1,否则为 0)与汽车重量(weight)、里程数(mpg)和维修记载(rep78,分类变量)之间的关系。


  1. gen high_price = (price > mean(price))
复制代码

五、Logit 模型估计



  1. logit high_price weight mpg rep78
复制代码

上述代码中,logit 下令用于估计 Logit 模型,high_price 是因变量,weight、mpg 和 rep78 是自变量。

六、代码解释




七、模型结果解读


运行上述代码后,Stata 会输出模型的估计结果,包括系数估计值、尺度误、z 值和 p 值等。

例如:

  1. Logistic regression                               Number of obs   =     74
  2.                                                 LR chi2(3)      =   35.28
  3.                                                 Prob > chi2     =    0.0000
  4. Log likelihood = -35.678971                     Pseudo R2       =    0.4217
  5. ------------------------------------------------------------------------------
  6.        high_price |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
  7. ------------------+---------------------------------------------------------------
  8.         weight    | .0028504 .0007281     3.91   0.000   .0014219  .0042789
  9.           mpg     |  -.0853008 .0309849    -2.75   0.006    -.1456783   -.0249233
  10.         rep78     |
  11.               1    |  .521308  .187245     2.78   0.005    .152832   .889784
  12.               2    |  .783005  .231878     3.38   0.001    .328561    1.23745
  13.               3    |   1.056802  .298712     3.54   0.000    .472878    1.640726
  14.               4    |   1.328509  .387201     3.43   0.001    .568734    2.088284
  15.        _cons     |  -3.570085   1.288275    -2.77   0.006    -6.082728   -1.0574419
  16. ------------------------------------------------------------------------------
复制代码

系数的解释:


八、预测


我们可以使用 predict 下令进行预测。

  1. predict phat
复制代码

生成的 phat 变量是预测的概率值。

九、模型评估


可以通过计算精确率、混淆矩阵、AUC(Area Under the Curve)等指标来评估模型的性能。

  1. // 生成预测结果
  2. gen pred = (phat > 0.5)
  3. // 计算准确率
  4. mat confusion = r(table)
  5. scalar accuracy = (confusion[1, 1] + confusion[2, 2]) / rowsof(confusion)
  6. di "Accuracy: " accuracy
  7. // 计算 AUC
  8. roctab high_price phat
复制代码

十、稳健性检验


为了验证模型的稳健性,可以进行以下操作:


十一、结论

通过以上的 Stata 操作步调,我们成功地创建了 Logit 模型,并对其进行了估计、预测和评估。在实际应用中,您需要根据数据的特点和研究问题,选择合适的自变量和模型情势,并对结果进行合理的解释和分析。
 
 【DCM-02】二元Logit模型和Probit模型及其Stata实现 - 知乎 (zhihu.com)
【DCM-11】有序Logit模型及其Stata实现 - 知乎 (zhihu.com) 

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4