首页| JavaScript| HTML/CSS| Matlab| PHP| Python| Java| C/C++/VC++| C#| ASP| 其他|
购买积分 购买会员 激活码充值

您现在的位置是:虫虫源码 > Java > MeCabのJavaバインディング+Lucene/Solr用トークナイザ・フィルタ

MeCabのJavaバインディング+Lucene/Solr用トークナイザ・フィルタ

  • 资源大小:25.48 MB
  • 上传时间:2021-06-29
  • 下载次数:0次
  • 浏览次数:0次
  • 资源积分:1积分
  • 标      签: MeCabJavaLuceneSolr

资 源 简 介

http://github.com/takscape/cmecab-java に移転しました。 何ですかこれは MeCabをJavaから利用するためのライブラリです。以下のコンポーネントから構成されます。 MeCabのJavaバインディング SWIG不使用、辞書のエンコーディングとUnicodeの間で自動変換を行います。 MeCabを用いたLucene用Tokenizer、素性情報を用いてフィルタリングを行うTokenFilter、およびAnalyzer TinySegmenterのJava移植版およびTokenizer, TokenizerFactory サロゲートペアを正しく認識するCJKTokenizerクローン Solr用TokenizerFactory、TokenFilterFactory GroovyでSolrのTokenizer, TokenFilterを書くためのFactory類 ライセンス Public Domain (プロジェクト情報にはMIT licenseと書いてありますが、本当はPublic Domainです) ただし、TinySegmenterに関する部分のみは、修正BSDライセンスです。 ドキュメント類 インストール方法 使用方法 リリースノート

文 件 列 表

mecab
bin
dic
sdk
VIP VIP
0.166741s