一种基于潜在语义索引的谱聚类方法研究

来源 :中国民航大学学报 | 被引量 : 0次 | 上传用户:achm207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的文本聚类算法存在文本向量维度过高,算法易陷入局部最优问题。针对上述问题,提出了一种适用于文本的基于潜在语义索引的谱聚类方法,该方法应用了潜在语义索引和谱聚类方法的优点。不仅分析了词与词之间的语义关系,而且适用于任意形状分布的样拳数据聚类。针对航空安全报告的聚类实验表明,该方法取得了较好的聚类效果。
其他文献
分析了航班延误的恢复调度问题,并针对问题提出了一种机场大面积航班延误恢复模型,模型考虑了航班延误的延误时间,还考虑了不同机型对航班延误经济损失造成的影响。构造了基
工程指令是工程文件系统中最为复杂的,在分析了工程指令有效性、期限等组成因素与编制、反馈、延期等文件流程的基础上,提出了工程指令文件的监控流程设计方案,实现了对工程
提出一种Logistic模型、Gompertz模型、Mitscherlich模型和Bertallanffy模型的分布参数估计方法,这种方法以加权最小二乘法为基础,推导求解分布参数的方程组。利用这类曲线模型
采用CFD方法对一种锥形阀口滑阀内流场进行了数值仿真计算,分析了在固定条件下其阀口处流场分布情况,并从阀口开度及结构参数等方面对影响阀口处流场分布进行了分析比较。研究
在MTS810上采用-10℃低温劈裂试验来比较在水泥替代矿粉的比例(质量比)分别为0%、20%、40%、60%、80%、100%的情况下,SAC25沥青混合料低温抗裂性的变化情况。对试验结果采用不等重复试
提出了将半导体制冷制热技术用于航空电瓶温度传感器校验的新设想。采用单片机技术并通过运用模糊-PID控制方法实现校验过程中的恒温控制。实验结果表明,该校验仪能够全自动
数字设备硬件性能的提高和网络控制系统的发展使得量化问题成为目前研究的热点。由于网络控制系统具有带宽约束的特点,数据的传输和处理是零传输延迟和无限高精度的这一假定不
信息处理能力是管制员能力和工作负荷的重要组成部分。针对此方面缺乏系统研究的实际,详细分析了管制员信息处理能力的影响因素,给出了评价指标体系,建立了多级模糊评价模型,实现
针对国内航空公司运营特点,提出了分3步完成航空公司单日航班运营方案的编制:首先运用深度优先搜索算法生成可行航班串;然后以使用飞机数最少为目标,建立0—1整数规划模型对可行
针对飞机AMU自动测试系统中对音频信号失真度测量的要求,运用PC机和数据采集卡,采用加窗FFT、把整个主瓣的宽度作为基波值来计算基波分量有效值的算法实现了在计算机中对音频信号失真度的直接测量。实验验证,该方法可对组件维护手册(CMM)中所有频率的测试信号进行精确的失真度计算,具有频率范围广、精度高、简便易行等特点。