日期:2024年02月24日
编辑:ad201107111759308692
作者:无忧论文网
点击次数:398
论文价格:150元/篇
论文编号:lw202402191601062957
论文字数:45222
所属栏目:工程硕士论文
论文地区:中国
论文语种:中文
论文用途:硕士毕业论文 Master Thesis
生成n-gram语料库以提取关键字信息;然后提出利用统计学习中的LDA算法进行数据的聚类,利用关键字及频率等信息,从信息论和统计学的角度实现数据的分类;最后再利用改进的序列对齐算法,使用Needleman-Wunsch算法计算两个序列的最佳对齐结果,并使用多序列对比减少前序聚类错误带来的影响得到最佳的字段边界划分结果。
参考文献(略)