论文部分内容阅读
离散选择模型(discrete choice model)是一类分析和研究二元选择变量的重要工具,它揭示一定条件下微观个体特定行为选择的概率与相关解释变量间的关系,在许多科学研究领域中得到了广泛的应用。此外,很多宏观经济问题也可以通过离散选择模型进行研究,因而此模型也成为了研究宏观经济问题的重要方法。人们不总是独立生存在社会中,当决策者做出决定时,往往会受到其他人的影响,这种个体与个体之间的相互影响就形成了复杂的社交网络结构。在社交网络结构中,若忽略其相关性,将会导致不准确的估计和预测。因此,将网络相关性引入离散选择模型中是非常必要的。多模型推断是近年来统计学家和计量经济学家广泛研究的问题。在带有网络相关性的离散选择模型上进行模型选择,可以避免构造过于简单或过于复杂的模型。本文研究了带有网络相关结构的二元离散选择模型的多模型推断问题,包括模型选择和预测。为简化计算,本文采用近似成对最大似然估计(approximated paired maximum likelihood,即APML)对未知参数进行估计,依托二次损失函数和Kullback-Leibler(KL)损失函数,分别导出了基于K-fold cross validation(K-fold CV)的两种模型选择准则,并证明了当所有备选模型设定存在偏误时,在某些正则条件下,两种模型选择准则均具有渐近最优性。通过模拟对所提方法在有限样本场合进行评估,发现当所有备选模型设定存在偏误时,随着样本量n的增加,Ln(s)/inf1≤s≤s Ln(s)和KLn((?))/inf≤s≤s KLn(s)的值均趋于最优值1,其中第(?)个模型和第(?)个模型分别是基于二次损失和KL损失的K-fold CV选出的模型;当真实数据生成过程(data generating process,即DGP)嵌套于备选模型集中时,两种方法均可以以较高的频率选择真实模型,且基于KL损失函数的K-fold CV选择的正确率略高于基于二次损失函数的K-fold CV。