【摘 要】
:
传统潜在语义分析模型所得到的主题空间映射矩阵往往比较稠密,不仅存储代价比较高,而且各个主题含义不明确.针对该问题,提出一种新的稀疏主题模型,该模型通过对映射矩阵施加
论文部分内容阅读
传统潜在语义分析模型所得到的主题空间映射矩阵往往比较稠密,不仅存储代价比较高,而且各个主题含义不明确.针对该问题,提出一种新的稀疏主题模型,该模型通过对映射矩阵施加稀疏性约束,使得每个主题只与少数词项关联,来增加主题的可解释性;同时,通过对编码系数矩阵施加低秩约束,使得数据在主题空间中呈现出更好的聚类特性.实验结果表明,基于该模型得到的主题空间更有利于分类,映射矩阵的存储代价更低.
其他文献
随着社会主义市场经济的不断深入,标准资料管理工作者应随时掌握国内外先进的标准信息,为企业提供有用的标准资料信息资源,帮助企业摸清国际市场的脉络,进而引导企业开拓国际市场
一、高校图书馆信息化建设的现状1.服务意识相对淡薄,服务层次不高信息化建设和信息化服务工作的重要性,在理念上已得到普遍认同,但由于传统观念等方面的束缚,衡量一个图书馆信息
基于稀疏表示理论,提出了一种面向单张图片超分辨率的字典学习方法。通过对训练数据进行分类,期望在每一类训练数据训练字典的过程中,增强类内的上下文信息。与之前的面向图像分类的字典学习方法所不同的是,训练数据集由高分辨率图像块和对应的低分辨率图像块共同组成,这使训练得到的字典更适用于图像重构。利用有限的训练数据集,基于上下文的字典学习方法能够提高字典表示的拓展能力,消除由多重训练数据子集带来的冗余。
计算机安全系统与生物免疫系统具有很多的相似性,它们都需要在不断变化的环境中维持自身的稳定性.提出复合免疫算法,并应用到入侵检测系统中,以保护网络安全.针对经典的人工
微博已经成为获取用户兴趣的有效平台。在分析了用户发表微博的习惯及特点的基础上,提出了一种基于话题相关空间自动构建,同时融合位置信息的微博用户兴趣识别方法。该方法首先基于话题检测技术构建话题相关空间,提出了基于空间范围的TFIDF计算方法,然后融合位置信息计算微博词汇的兴趣表征值,最后采用3D标签云对兴趣识别结果进行了可视化。实验结果表明了所提方法的有效性。
随着经济全球化步伐的迅速加快,现代企业制度的建立和不断完善,科技档案管理工作能否适应新的形势,怎样为科技创新服务,已成为摆在科技档案管理者面前的一个新课题。笔者就新形势