论文部分内容阅读
在过去的几十年中,科学家们积极的研究了投资组合构建的问题,并被金融从业者们广泛的使用。为了在满足追求利润的投资过程中规避潜在损失风险的需要,一个强大的投资组合策略起着关键性的作用。Markowitz的均值-方差模型的发明已经超过60年,但至今它仍然被视为一个流行的投资组合优化方法。在本文中,我们考虑从中国三大股票市场选择股票构建投资组合的问题。构建投资组合的想法来自降维。一个大型的股票市场,可以利用高维的数据表示资产。直观的说,我们利用线性相关结构表示市场中数据结构,以及结构之间的关系。在论文中,通过线性关系构建相关结构,数据间的相关性结构进一步由社会网络描述。在社会网络中,单个资产看作他们的散射关联节点。更明确地,我们使用节点之间的距离衡量线性相关的依赖结构的强度。基于线性相关的社会网络模型奠定了股票选择的基础,因为它为我们提供了一个平台,应用一些专门设计的降维方法。在我们的论文中,我们选择使用数据聚类方法降维以便找到所有集群中心,作为选择的股票。考虑到数据量较大,我们学习并使用由Frey和Dueck在2007年提出的亲和传播聚类方法(AP),其在处理大的数据方面具有各种优点。我们小幅改进了 AP聚类的算法,以减少计算的复杂程度并在其中集成了 BWP算法,更好地控制集群结果。我们建立了一个完整的基于线性相关的社会网络选股模型。投资者需要评估投资组合的风险,以避免遭受惨重损失。为降低这些风险,分散化在投资组合中起着不可忽视的利用。为了解决这个问题,我们引入一个适当的措施来分散投资。许多流行的方法已经被提出作为分散化研究。我们使用均值—分散化模型(MD)来评估我们的投资组合的分散化程度。我们利用线性相关的依赖结构,投资组合的有效性是通过均值—方差模型评估。此外,我们学习并使用了 Meucci2009年提出的均值—分散化(MD)模型。组合构建和分析的数据采用的是上证A股、深证A股和沪深300从2006年1月4日至2014年12月31日每日收盘价。原始数据含有大量的无效值,我们也对原始数据进行了清理。为了更好的说明社会网络选股的结果,我们选择了排序选股与之对比。分析结果表明,社会网络选股投资组合本身的分散化程度较好而且也是优于排序选股的。