论文部分内容阅读
摘要:文章使用静态层次分析与动态马尔科夫链结合的方法对金融市场价格变量进行分析。以中国房地产上市公司为例,应用统计软件,通过对多变量主成分分析,得到少数综合因子;再由层次分析确定权重;结合:者获取综合得分,进行系统聚类分析决定状态分类;根据马尔科夫链的性质研究价格变化规律。
关键词:AHP 马尔科夫链 房地产 股票价格
中图分类号:F830.91 文献标识码:A
文章编号:1004-4914(2009)05-083-02
一、引言
金融市場的多种价格变量是受到各种因素影响的随机变量,在不同的假设条件下可作出不同的预测模型,比如计量经济模型、投入产出模型、随机时间序列模型在不同程度存在缺陷,在三个假设前提下:假定选取指标已经完全包含和反映了历史信息。假设人选股票永远存在,同时没有新股票进入。假定股票的变化过程为时间离散、状态离散的齐次马尔科夫过程。使用静态的层次分析法与动态的马尔科夫链结合的方法对金融市场几种价格变量进行评价分析。这不仅解决以往模型的缺陷;而且能得到具有实用价值的预测结论,拓广了AHP、马尔科夫链的应用范围。同时也为金融领域的套期保值者或者投资者提供辅助分析方法。
本文选取的数据来自于《中国上市公司业绩评价报告》中关于2005,2006,2007“房地产行业上市公司价值分析结果排序表”的数据。共计51支股票,11个指标。
二、模型的建立与求解
(一)主成分分析
本文研究是多指标问题,假若能选取尽可能少的指标,同时保留原始指标的绝大多数信息,那样既简化问题的复杂度,也能使得到的结果充分反映问题本质。所以本文选择主成分投影法,把多个指标简化为少数几个综合指标。
通过正交变换,将原有的指标转换为彼此正交的综合指标,消除了指标之间的重复信息。再选择特征根大于1的成分作为主成分,所以本文依此确定了四个主成分。三年数据的累积贡献率均达到了78%,说明前四个主成分已经包含了反映盈利能力78%的信息量;得到每一支股票在四个主成分上的得分,分别用F1,F2,F3,F4来表示。
(二)AHP层次分析法
通过主成分分析得到F1,F2,F3,F4方差贡献率;由于所提取因子的方差累计贡献率只是78%,并未达到100%。由AHP法获取权重,层次分析法是对定性问题进行定量分析的一种系统分析法。它的特点是根据对客观现实的主观判断,把复杂问题中的各种因素通过划分为相互联系的有序层次。较合理地把变量的当前状况按不同因素要求两两比较赋值,建立判断矩阵,通过特征向量求权重。
1 建立递阶层次的评价指标体系。依各主成分贡献率,选择主成分F1,F2,F3,F4来构建评价指标体系。
2 构造两两比较判断矩阵。以1-9标度法表示,1表示2个因素具有同样重要性;3表示1个因素比另1个因素稍重要;5表示1个因素比另1个因素明显重要;7表示1个因素比另1个因素强烈重要;9表示1个因素比另1个因素极端重要。2,4,6,8为上述相邻判断中值。
3 计算指标权重。计算判断矩阵A每一行元素的乘积N次方根vi(N为矩阵阶数)。将向量v归一化得到w,即为所求的各指标权重。
4 一致性检验。计算判断矩阵A的最大特征值λmax=∑(Awi/Nwi);计算一致性指标CI=(λmax-N)/(N-1);查同阶矩阵平均一致性指标RI;计算一致性比率CR=CI/RI;当CR=0时,A具有完全一致性;当CR<0.1时,A具有满意一致性;当CR>0.1,A具有非满意一致性。
5 确定综合评价模型,F=∑WiFi,依此本文采取1,3,5,7四级标度计算,最终结果为CR=0,043309<0,1;A具有满意一致性。F=0.5638I*F1+0.26338*F2+0.11779*F3+0.05502*F4。进而得到综合得分,并依此进行排序。
(三)聚类分析
采用SPSSl6.0统计软件系统聚类Between-groups linkage进行归类。为了更好的比对分析结果,选择了分为5类和6类的情况。并且将软件归类的序号,依据综合得分,重新为各类排序,但同一类中的元素归属并未做变动。以1-5或1-6代表公司综合得分由高到低,盈利能力由强到弱。5类或者6类的划分,可以为下面作马尔科夫分析奠定状态划分依据。
(四)马尔科夫链分析
实施方案:用AHP法确定初始阶段状态向量及一级转移矩阵;由齐次马尔科夫链性质确定出各阶的转移矩阵及各阶的状态向量;分析变化规律或近似预测未来。具体实施如下:
分为五类。假设马氏链的状态空间为I=(1,2,3,4,5分别表示股票所处的五种状态:优,良,平均,较低,较差。初始分布如下:
2005年(1/51,5/51,10/51,34/51,1/51)
2006年(4/51,8/51,11/51,27/51,1/51)
2007年(1/51,2/51,30/51,16/51,1/51)
1 分析2005到2006年数据,得到其一步转移矩阵。可以根据公式,求解经过k步转移后的概率分布。推算出当转移步数出现无限大时,转移概率矩阵为:P(∞)={1,0,0,0},1和0是5维列向量其中有一个吸收壁,状态1本身自成闭集,同时它与其他各状态并不是互通的,所以此马氏链是非不可约的。从多步转移概率矩阵知,该马氏过程也不是遍历的,因此不存在稳定状态。但可推断在竞争激烈的环境下,所有企业都努力高企业的竞争力,增强盈利力。在证券市场完善,信息对称情况下。一旦有企业进人状态1,也就是说企业盈利能力很强时,已受到广大股民的认可,它将永远保持好的发展势头,即优胜劣汰。
2 分析2006到2007的数据,推算出当转移步数趋于无限大时,状态空间I是一个闭集,且内部不含其他闭集,它的各状态也是互通的,所以此马氏链是不可约的。从多步转移概率矩阵可知,该马氏过程是非遍历的。系统都达到较平稳状态(0,0.0124,0.6390,0.3361,0.0124)。
从另一个角度看,假设它具有稳定的状态,用P1,P2,P3,P4,PS,P6分别表示股票处于1-6种状态下的概率,计算得到的稳定状态为(0,0.0124,0.6390,0.3361,0.0124)与当转移步数趋于无穷大时的概率分布相同。可见一半以上企业都维持在平均水平,最稳定的是状态是平均状态。这是符合现实的情况的;同时1/3的企业处于中等偏下的位置;没有任何一个企业可以高枕无忧的。假若某个企业位于平均状态上即最稳定的状态时,它并不会永久停留,在受到其他因素影响时也会偏移,只不过是滞留在平均状态上的时间长一些。同样的分类,不同的时间段最终结果却截然不同。为了进一步找出其中规律,分析分为6类情况。 假设马氏链的状态空间为I={1,2,3,4,5,6}分别表示股票所处的六种状态:优,良,中,一般,较低,较差。初始分布如下:
2005年(1/51,5/51,10/51,23/51,11/51,1/51)
2006年(2/51,2/51,8/51,11/51,27/51,1/51)
2007年(2/51,11/51,27/51,8/51,1/51,2/51)
1 分析2005到2006年數据,从一步转移矩阵来看,这与分为五类时2005到2006年一步转移矩阵无本质差异,其结果与之前也相符,即企业一旦进人状态1,就永远不再从该状态出来。
2 分析2006到2007年数据。分六类后却出现了很奇怪的现象;从状态传递图可知,在划分的6个状态中,除1以外的任何状态都是相通的,同样存在闭集{1}。可知马氏过程是不相通,非不可约,非遍历的。也就不存在稳定状态。状态1是与其他状态都处于完全隔离的,假设我们用极限的思维考虑,一种可能是只要P2到P6的任何一个状态中有一个企业到达状态P1,那么状态将永远维持在P1处;由于我们采用仅是一年数据,若从长远看,这种假设是具有现实意义的,是可实现的。这样就与2005到2006数据分析出来的结果吻合。另一种假设,只要状态P1落人P2到P6的任一状态中,那么就永远回不到P1。由于P1状态下的股票数量只占到3.9%,在假设忽略该状态时,最终存在稳定状态为(0.2,0.2,0.2,0.2,0.2),这与2006-2007分为五类的结果一样,都存在稳定状态。
(五)结论
首先明确:假若某个企业位于最稳定的状态时,并不是说它会永久停留,在受到其他因素影响时也会偏移,只不过是滞留在最稳定状态上的时间长一些。但整个行业的稳定状态是大致不变的。
综上分析,可以推断最终结果无非两种:第一种:最终的稳定状态永远会落入状态1上;即各个企业不断提高自身的能力,不断适应社会发展,最终留在这个行业长久发展的必然是优秀的。第二种:最终稳定状态必不在状态1上;即没有任何一个企业可以高枕无忧的。可能在某个时段而言他们有可能达到高收益,但不知道哪个时刻,局势就会发生突如其来的变故。或许说明因为存在竞争,永远没有最好,只有更好。如下表。
此时就很难抉择用哪一年的一步或多步转移矩阵来预测未来的股票发展趋势。需了解更多年份的资料,才能作出合理的推断。所以该模型需要进一步修正。
三、模型特点与局限性
本文采取动静结合的方法:将AHP和马尔科夫链相结合用AHP将参评对象排序,划分状态,再用马尔科夫状态转移概率来刻划系统的微观波动规律。充分应用统计学知识:采用主成分分析法降低了多变量问题分析复杂度,而聚类分析更客观地将样品分类,使得最终的数据更具科学性;
选取时间与选取指标没有统一规定,而是依据人为选定;那么选择期间不同可能得出不同结果。在选取股票时,本文假设人选股票永远存在,同时没有新股票进入;现实生活是不可能的。关于状态的划分和状态数目的确定无统一标准,需要根据资料或各问题的要求而定。假若状态划分不当,最后分析的结果可能就不具有指导性和参考性。
四、模型改进
从模型最终的结果分析和模型的局限性上,我们发现选取时间段是影响整个结果的关键因素。为了利用尽可能丰富的数据资料,为了研究结果尽可能不受季节或年度性影响,可以引人时间序列。可以先对要采用的数据进行平稳性和纯随机性检验。数据处理后的步骤都不变:主成分分析,层次分析(AHP),系统聚类,马尔科夫链性质分析,模型检验,预测未来。
[本文受到北京物资学院本科生科学研究与创业行动项目资助]
参考文献:
1 中国上市公司业绩评价报告(2006)中国经济出版社,2006。
2 中国上市公司业绩评价报告(2007),中国经济出版社,2007。
3 中国上市公司业绩评价报告(2008)中国经济出版社,2008。
4 路万忠:鲍康虎,上市公司盈利力生命周期研究,中国农业大学出版社,2008。
5 伍海华,杨德平,随机过程—金融资产定价之应用,中国金融出版社,2002。
6 何晓群,多元统计分析,中国人民大学出版社,2004。
7 朱建平应用多元统计分析,科学出版社,2006。
(作者单位:北京物资学院信息学院北京101149)
(责 编:贾 伟)
关键词:AHP 马尔科夫链 房地产 股票价格
中图分类号:F830.91 文献标识码:A
文章编号:1004-4914(2009)05-083-02
一、引言
金融市場的多种价格变量是受到各种因素影响的随机变量,在不同的假设条件下可作出不同的预测模型,比如计量经济模型、投入产出模型、随机时间序列模型在不同程度存在缺陷,在三个假设前提下:假定选取指标已经完全包含和反映了历史信息。假设人选股票永远存在,同时没有新股票进入。假定股票的变化过程为时间离散、状态离散的齐次马尔科夫过程。使用静态的层次分析法与动态的马尔科夫链结合的方法对金融市场几种价格变量进行评价分析。这不仅解决以往模型的缺陷;而且能得到具有实用价值的预测结论,拓广了AHP、马尔科夫链的应用范围。同时也为金融领域的套期保值者或者投资者提供辅助分析方法。
本文选取的数据来自于《中国上市公司业绩评价报告》中关于2005,2006,2007“房地产行业上市公司价值分析结果排序表”的数据。共计51支股票,11个指标。
二、模型的建立与求解
(一)主成分分析
本文研究是多指标问题,假若能选取尽可能少的指标,同时保留原始指标的绝大多数信息,那样既简化问题的复杂度,也能使得到的结果充分反映问题本质。所以本文选择主成分投影法,把多个指标简化为少数几个综合指标。
通过正交变换,将原有的指标转换为彼此正交的综合指标,消除了指标之间的重复信息。再选择特征根大于1的成分作为主成分,所以本文依此确定了四个主成分。三年数据的累积贡献率均达到了78%,说明前四个主成分已经包含了反映盈利能力78%的信息量;得到每一支股票在四个主成分上的得分,分别用F1,F2,F3,F4来表示。
(二)AHP层次分析法
通过主成分分析得到F1,F2,F3,F4方差贡献率;由于所提取因子的方差累计贡献率只是78%,并未达到100%。由AHP法获取权重,层次分析法是对定性问题进行定量分析的一种系统分析法。它的特点是根据对客观现实的主观判断,把复杂问题中的各种因素通过划分为相互联系的有序层次。较合理地把变量的当前状况按不同因素要求两两比较赋值,建立判断矩阵,通过特征向量求权重。
1 建立递阶层次的评价指标体系。依各主成分贡献率,选择主成分F1,F2,F3,F4来构建评价指标体系。
2 构造两两比较判断矩阵。以1-9标度法表示,1表示2个因素具有同样重要性;3表示1个因素比另1个因素稍重要;5表示1个因素比另1个因素明显重要;7表示1个因素比另1个因素强烈重要;9表示1个因素比另1个因素极端重要。2,4,6,8为上述相邻判断中值。
3 计算指标权重。计算判断矩阵A每一行元素的乘积N次方根vi(N为矩阵阶数)。将向量v归一化得到w,即为所求的各指标权重。
4 一致性检验。计算判断矩阵A的最大特征值λmax=∑(Awi/Nwi);计算一致性指标CI=(λmax-N)/(N-1);查同阶矩阵平均一致性指标RI;计算一致性比率CR=CI/RI;当CR=0时,A具有完全一致性;当CR<0.1时,A具有满意一致性;当CR>0.1,A具有非满意一致性。
5 确定综合评价模型,F=∑WiFi,依此本文采取1,3,5,7四级标度计算,最终结果为CR=0,043309<0,1;A具有满意一致性。F=0.5638I*F1+0.26338*F2+0.11779*F3+0.05502*F4。进而得到综合得分,并依此进行排序。
(三)聚类分析
采用SPSSl6.0统计软件系统聚类Between-groups linkage进行归类。为了更好的比对分析结果,选择了分为5类和6类的情况。并且将软件归类的序号,依据综合得分,重新为各类排序,但同一类中的元素归属并未做变动。以1-5或1-6代表公司综合得分由高到低,盈利能力由强到弱。5类或者6类的划分,可以为下面作马尔科夫分析奠定状态划分依据。
(四)马尔科夫链分析
实施方案:用AHP法确定初始阶段状态向量及一级转移矩阵;由齐次马尔科夫链性质确定出各阶的转移矩阵及各阶的状态向量;分析变化规律或近似预测未来。具体实施如下:
分为五类。假设马氏链的状态空间为I=(1,2,3,4,5分别表示股票所处的五种状态:优,良,平均,较低,较差。初始分布如下:
2005年(1/51,5/51,10/51,34/51,1/51)
2006年(4/51,8/51,11/51,27/51,1/51)
2007年(1/51,2/51,30/51,16/51,1/51)
1 分析2005到2006年数据,得到其一步转移矩阵。可以根据公式,求解经过k步转移后的概率分布。推算出当转移步数出现无限大时,转移概率矩阵为:P(∞)={1,0,0,0},1和0是5维列向量其中有一个吸收壁,状态1本身自成闭集,同时它与其他各状态并不是互通的,所以此马氏链是非不可约的。从多步转移概率矩阵知,该马氏过程也不是遍历的,因此不存在稳定状态。但可推断在竞争激烈的环境下,所有企业都努力高企业的竞争力,增强盈利力。在证券市场完善,信息对称情况下。一旦有企业进人状态1,也就是说企业盈利能力很强时,已受到广大股民的认可,它将永远保持好的发展势头,即优胜劣汰。
2 分析2006到2007的数据,推算出当转移步数趋于无限大时,状态空间I是一个闭集,且内部不含其他闭集,它的各状态也是互通的,所以此马氏链是不可约的。从多步转移概率矩阵可知,该马氏过程是非遍历的。系统都达到较平稳状态(0,0.0124,0.6390,0.3361,0.0124)。
从另一个角度看,假设它具有稳定的状态,用P1,P2,P3,P4,PS,P6分别表示股票处于1-6种状态下的概率,计算得到的稳定状态为(0,0.0124,0.6390,0.3361,0.0124)与当转移步数趋于无穷大时的概率分布相同。可见一半以上企业都维持在平均水平,最稳定的是状态是平均状态。这是符合现实的情况的;同时1/3的企业处于中等偏下的位置;没有任何一个企业可以高枕无忧的。假若某个企业位于平均状态上即最稳定的状态时,它并不会永久停留,在受到其他因素影响时也会偏移,只不过是滞留在平均状态上的时间长一些。同样的分类,不同的时间段最终结果却截然不同。为了进一步找出其中规律,分析分为6类情况。 假设马氏链的状态空间为I={1,2,3,4,5,6}分别表示股票所处的六种状态:优,良,中,一般,较低,较差。初始分布如下:
2005年(1/51,5/51,10/51,23/51,11/51,1/51)
2006年(2/51,2/51,8/51,11/51,27/51,1/51)
2007年(2/51,11/51,27/51,8/51,1/51,2/51)
1 分析2005到2006年數据,从一步转移矩阵来看,这与分为五类时2005到2006年一步转移矩阵无本质差异,其结果与之前也相符,即企业一旦进人状态1,就永远不再从该状态出来。
2 分析2006到2007年数据。分六类后却出现了很奇怪的现象;从状态传递图可知,在划分的6个状态中,除1以外的任何状态都是相通的,同样存在闭集{1}。可知马氏过程是不相通,非不可约,非遍历的。也就不存在稳定状态。状态1是与其他状态都处于完全隔离的,假设我们用极限的思维考虑,一种可能是只要P2到P6的任何一个状态中有一个企业到达状态P1,那么状态将永远维持在P1处;由于我们采用仅是一年数据,若从长远看,这种假设是具有现实意义的,是可实现的。这样就与2005到2006数据分析出来的结果吻合。另一种假设,只要状态P1落人P2到P6的任一状态中,那么就永远回不到P1。由于P1状态下的股票数量只占到3.9%,在假设忽略该状态时,最终存在稳定状态为(0.2,0.2,0.2,0.2,0.2),这与2006-2007分为五类的结果一样,都存在稳定状态。
(五)结论
首先明确:假若某个企业位于最稳定的状态时,并不是说它会永久停留,在受到其他因素影响时也会偏移,只不过是滞留在最稳定状态上的时间长一些。但整个行业的稳定状态是大致不变的。
综上分析,可以推断最终结果无非两种:第一种:最终的稳定状态永远会落入状态1上;即各个企业不断提高自身的能力,不断适应社会发展,最终留在这个行业长久发展的必然是优秀的。第二种:最终稳定状态必不在状态1上;即没有任何一个企业可以高枕无忧的。可能在某个时段而言他们有可能达到高收益,但不知道哪个时刻,局势就会发生突如其来的变故。或许说明因为存在竞争,永远没有最好,只有更好。如下表。
此时就很难抉择用哪一年的一步或多步转移矩阵来预测未来的股票发展趋势。需了解更多年份的资料,才能作出合理的推断。所以该模型需要进一步修正。
三、模型特点与局限性
本文采取动静结合的方法:将AHP和马尔科夫链相结合用AHP将参评对象排序,划分状态,再用马尔科夫状态转移概率来刻划系统的微观波动规律。充分应用统计学知识:采用主成分分析法降低了多变量问题分析复杂度,而聚类分析更客观地将样品分类,使得最终的数据更具科学性;
选取时间与选取指标没有统一规定,而是依据人为选定;那么选择期间不同可能得出不同结果。在选取股票时,本文假设人选股票永远存在,同时没有新股票进入;现实生活是不可能的。关于状态的划分和状态数目的确定无统一标准,需要根据资料或各问题的要求而定。假若状态划分不当,最后分析的结果可能就不具有指导性和参考性。
四、模型改进
从模型最终的结果分析和模型的局限性上,我们发现选取时间段是影响整个结果的关键因素。为了利用尽可能丰富的数据资料,为了研究结果尽可能不受季节或年度性影响,可以引人时间序列。可以先对要采用的数据进行平稳性和纯随机性检验。数据处理后的步骤都不变:主成分分析,层次分析(AHP),系统聚类,马尔科夫链性质分析,模型检验,预测未来。
[本文受到北京物资学院本科生科学研究与创业行动项目资助]
参考文献:
1 中国上市公司业绩评价报告(2006)中国经济出版社,2006。
2 中国上市公司业绩评价报告(2007),中国经济出版社,2007。
3 中国上市公司业绩评价报告(2008)中国经济出版社,2008。
4 路万忠:鲍康虎,上市公司盈利力生命周期研究,中国农业大学出版社,2008。
5 伍海华,杨德平,随机过程—金融资产定价之应用,中国金融出版社,2002。
6 何晓群,多元统计分析,中国人民大学出版社,2004。
7 朱建平应用多元统计分析,科学出版社,2006。
(作者单位:北京物资学院信息学院北京101149)
(责 编:贾 伟)