基于LightGBM的文本关键词提取方法

来源 :软件导刊 | 被引量 : 0次 | 上传用户:randygu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提升文本关键词提取准确率和效率,提出一种基于LightGBM的文本关键词提取方法。该方法通过TF-IDF提取候选关键词,利用Word2Vec计算词向量,并采用特征工程,对候选关键词进行特征提取,再经由LightGBM算法将关键词提取转换为二分类问题。通过实验对比TF-IDF算法、TextRank算法、LDA算法及LightGBM算法对文本关键词提取的准确率P、召回率R及F1。结果表明,当TopN取2~5时,F1平均值比最优方法提升4.8%。该方法抽取效果整体上均优于实验选取的对比方法,证明将特征工程与L
其他文献
在研究语音识别关键技术基础上,将深度神经网络模型应用于语音的关键词检索任务上,提出基于深度神经网络的语音关键词检测模型。与基线GMM-HMM模型进行对比实验,结果表明:LSTM模型的训练参数大小为436570,DNN的训练参数为698100,Gaussiam混合模型(GMM)的训练参数大小为1226760。基于LSTM-HMM和DNN-HMM模型的语音识别准确率分别为96.5%和91.6%,显著高于传统语音识别模型(GMM-HMM)的78.5%。基于LSTM-HMM模型的语音识别技术具有较高的准确率,更适
随着电力市场改革的不断深入,需求侧资源参与电力市场将促进高比例新能源接入并推动竞争型零售电力市场发展,为电力系统的经济可靠运行提供更有效的保障.首先分析了需求侧资