首页| JavaScript| HTML/CSS| Matlab| PHP| Python| Java| C/C++/VC++| C#| ASP| 其他|
购买积分 购买会员 激活码充值

您现在的位置是:虫虫源码 > Python > 基于正向最大匹配法原理的中文分词

基于正向最大匹配法原理的中文分词

  • 资源大小:791.91 kB
  • 上传时间:2021-06-30
  • 下载次数:0次
  • 浏览次数:0次
  • 资源积分:1积分
  • 标      签: 中文分词,python

资 源 简 介

分词方法总体上分为两类,一是非基于词典的分词,相当于人工智能领域计算。一般用于机器学习,特定领域等方法,这种在特定领域的分词可以让计算机在现有的规则模型中,推理如何分词,精确度较高,实现相对复杂。二是基于词典的分词,是最常见的分词方法,具体算法有正向最大匹配法(FMM)、逆向最大匹配法(RMM)和双向最大匹配法(BM)。本文在学习正向最大匹配算法的同时,用Python进行分词实现。本文使用的是 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报

文 件 列 表

test
results.txt
segmentationDic.TXT
stoplis.txt
wordsegmentation.py
代码使用说明.txt
VIP VIP
0.178758s