首页| JavaScript| HTML/CSS| Matlab| PHP| Python| Java| C/C++/VC++| C#| ASP| 其他|
购买积分 购买会员 激活码充值

您现在的位置是:虫虫源码 > Java > 文本关键词获取

文本关键词获取

资 源 简 介

java代码,实现在文章中提取文章的关键字,运用了TF-IDF算法,提取的关键字可以用余弦定理来计算两篇文本的相似度,亦可用作其他需求。本代码是先进行分词,然后给词出现的频率排个序,频率高的作为本文关键字。

文 件 列 表

work1
src
bin
.classpath
.project
.settings
org.eclipse.core.resources.prefs
brand_ext.dic
color_ext.dic
ext.dic
file1.txt
file3.txt
IKAnalyzer.cfg.xml
IKAnalyzer2012_u6.jar
main2015.dic
material_ext.dic
product.txt
product.xlsx
product_ext.dic
stopword.dic
style_ext.dic
.settings
VIP VIP
0.181274s