首页| JavaScript| HTML/CSS| Matlab| PHP| Python| Java| C/C++/VC++| C#| ASP| 其他|
购买积分 购买会员 激活码充值

您现在的位置是:虫虫源码 > 其他 > 问题重述:有一个内含有大约40万条常用词汇的词库。现给定一篇文章

问题重述:有一个内含有大约40万条常用词汇的词库。现给定一篇文章

  • 资源大小:900 K
  • 上传时间:2022-08-29
  • 下载次数:0次
  • 浏览次数:0次
  • 资源积分:1积分
  • 标      签:

资 源 简 介

问题重述:有一个内含有大约40万条常用词汇的词库。现给定一篇文章,使用这个词库分析出常用词汇的出现次数,并按出现次数由高到低排序这些词语。 改进算法的思路: 1. 通常一篇文章所包含的词语远少于词库中40万的数量; 2. 数据库建立索引之后,可采用“二分法”对词语进行快速定位; 3. 逐字缩小查询范围,如果查询到某个字符时范围已经为0,那么可以预测其后的词一定也不存在,(例如查询到forest时已经没有匹配的词了,就可以到此结束)。
VIP VIP
0.203868s