基于CW_UEOC社区检测算法的共词聚类研究

来源 :山西大学学报(自然科学版) | 被引量 : 0次 | 上传用户:seeya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于共词分析的聚类算法存在的不足:①聚类过程需要事先确定聚类数目;②关键词只能被划归一个聚类,文章采用复杂网络社区检测算法改进共词分析方法,提出改进的社区检测算法CW_UEOC(Co-occurrence weighting unfold and extract overlapping communities),并对来源于web of science的文献题录数据(以情报学和图书馆学(Information Science&Library Science)为例)构建共词网络进行聚类实验检验.研究结果表明:所提出的CW_UEOC社区检测算法对关键词的聚类结果有好的改进,能将多领域的相同关键词划分为不同研究主题,且CW_UEOC社区检测算法使用连通度(conductance)作为截断准则,为聚类数目提供客观判断依据.
其他文献
超图的边连通性与超网络的容错性密切相关,是一个判断超网络可靠性的经典指标.一个连通超图H的边连通度λ(H)是超图H的所有边割中最小边割的大小.用δ(H)表示超图H的最小度,称满足条件λ(H)=δ(H)的超图为最大边连通的.文章用最大度和直径给出了r-一致超图的边连通度的一个下界.进一步获得了r-一致超图是最大边连通的一个充分条件.
文章研究了带有外部干扰的二阶非匹配非线性多智能体系统的领导跟随滞后一致性问题.值得注意的是,在所考虑的系统中,非线性存在于所有状态的动态特性中.为了处理非匹配非线性项和干扰项,将自适应控制方法与反步控制方法相结合设计了新的分布式状态反馈控制器.与现有研究相比,文章所考虑的具有外部干扰的非匹配非线性多智能体系统模型能更好地刻画实际系统动态特性,滞后一致性问题更符合实际的网络通信环境.最后,通过一个仿真实例说明了所提结果的有效性.
在传统的文本情感分类中,通常假设数据是独立同分布的,但对于舆情时序数据,文本的情感分布处在一个不断变化的环境中,未必都服从独立同分布的假设,因此,仅在历史数据上训练的分类器无法在新到来的数据上取得令人满意的分类效果.针对这一问题,文章提出一个基于特征融合的时序文本情感分类模型.该模型在多段时间连续的数据上训练多个BERT模型,用于抽取各时段文本的源域特征、目标域特征和综合域特征,并将这些特征按时间顺序输入一个双向GRU网络中进行融合,从而得到更加准确的文本情感分类特征表示.通过在真实的舆情时序文本数据集上
为了寻找较优的铣削参数,利用改进的帝王蝶优化算法(monarch butterfly optimization,MBO)对铣削加工模型求解,得到优化后的铣削参数.通过建立铣削加工的数学模型,将实际加工时的约束条件引入到模型中.为了对模型求解,在传统的MBO算法中加入粒子群算法(particle swarm optimization,PSO)和差分进化算法的思想,并将其改进用于处理多目标优化问题.用改进后的MBO算法对铣削加工模型进行寻优求解.实验表明,经过优化计算得到的铣削参数值相比经验值可以显著降低生产
文章主要研究一类三种群反应扩散竞争系统最小波速线性决定的问题.首先,将系统转化为合作系统,再利用上下解方法建立了该系统最小波速线性决定的一般判别法则.其次,通过构造精确的上下解得到最小波速是线性决定的充分条件.文章的结果扩展了使得最小波速是线性决定的参数的范围,补充了已有的结果.
文章研究拒绝服务攻击(Denial-of-service,DoS)下含有负荷扰动的多区域互联电力系统的负荷频率控制(Load frequency control,LFC)问题.首先,将可再生能源与电动汽车充电系统引入电力系统中,有效补偿负荷扰动对电力系统稳定性的影响.考虑到经通讯网络传输的控制信号易遭受时延和DoS攻击的破坏,建立带有攻击切换的闭环LFC系统模型.利用Lyapunov-Krasovskii稳定性理论给出互联电力系统的稳定性判据以及切换控制器的设计方法.最后,通过三区域互联电力系统验证了所提
针对基本麻雀搜索算法抗局部最优能力弱的问题,提出一种混合正弦余弦算法和Lévy飞行的麻雀算法(ISSA).首先,在发现者位置更新方式中融合正弦余弦算法思想并引入非线性动态学习因子,平衡局部和全局的开掘能力,并加快收敛速度;然后,在跟随者位置更新方式中引进Lévy飞行策略,对当前最优解进行扰动变异,加强局部逃逸能力;最后,基于8个基准测试函数进行性能测验.实验结果表明ISSA与其余四种算法相比,寻优精度至少提升了49个数量级,求解效率得到较大提升.
由于真实世界中的复杂数据经常能够被表示成李群结构,文章设计了一个以李群特征作为输入的深度网络架构,以此利用深度学习强大的特征表示能力来进行模式识别等任务.在构建李群深度神经网络的过程中,为了保证在优化时李群特征能够被限定在微分流形的结构上,提出了适用于李群特征的深度学习算法.算法在特征学习的过程中不仅能够保证不损失数据流形结构的信息,同时也限定了参数优化的假设空间.基于李群特征的深度学习算法在CIFAR-BW和MNIST数据集上,通过为静态图像设计辐条模型的李群特征,实验结果表明算法在较少次数的迭代下就能
文章基于粒子数分辨的量子主方程,研究了串联耦合双量子点中,自旋轨道耦合依赖的电流有限频率噪声谱.研究发现,在电流有限频率噪声谱上,其峰、谷的存在起源于串联耦合双量子点的量子相干性,而峰、谷的位置取决于其约化密度矩阵非对角元相应的能量本征值之差.其中,谷对应于非对角元相应的能量本征值之差简并度为2的情形,而峰则对应于简并度为1的情形.因此,可以通过电流有限频率噪声谱在不同外加磁场情形下的峰和谷位置,来确定自旋轨道耦合场参数的大小和量子点之间自旋守恒的电子跳跃隧穿强度.
近些年随着太原经济的快速发展,城市规模逐渐扩大,人口增多,太原污水排放量逐年增加,沿岸的生活污水和工业废水排入河道导致汾河太原段的生态环境受到污染.为了探究汾河太原段沉积物中污染情况,在2018年对汾河太原段7个区域沉积物中不同形态氮、铜、铝含量以及脲酶、蛋白酶活性进行调查分析.结果表明,汾河太原段沉积物各季节总氮含量从上游到下游呈先升高后降低再升高的趋势.铵态氮和硝态氮含量无明显分布规律,三种形态的氮含量均在春季最高.脲酶、蛋白酶活性在汾河太原段中心区域较低,受温度影响,其活性高低在不同季节的变化不尽相