作者:oschina 来源:开源中国 时间:2018-03-13 09:41:46 我要评论

FoolNLTK 是一款基于深度学习的中文文本处理工具,暂时包含分词,词性标注,实体识别。现发布 Java 版。


  me.midday
  JFoolNLTK
  1.0

Example

// 单文本 String text = "北京欢迎你"; 
LexicalAnalyzer lexicalAnalyzer = FoolNLTK.getLSTMLexicalAnalyzer(); // 分词 
List> words = lexicalAnalyzer.cut(text); 
for(List ws: words){
    ws.forEach(System.out::println); } // 词性标注 
List> posWords = lexicalAnalyzer.pos(text); 
for(List ws: posWords){
    ws.forEach(System.out::println); } // 实体识别 
List>  entities = lexicalAnalyzer.ner(text);  
for(List ents :entities){
    ents.forEach(System.out::println); } // 分词,词性,实体识别 
List  results = lexicalAnalyzer.analysis(text); results.forEach(System.out::println);   // 多文本  
System.out.println(); 
System.out.println("多文本:"); 
List docs = new ArrayList<>(); 
docs.add(text); docs.add(text); // 分词 
List> dWords = lexicalAnalyzer.cut(docs); 
for(List ws: dWords){
    ws.forEach(System.out::println); } // 
词性标注 List> dPosWords = lexicalAnalyzer.pos(docs); 
for(List ws: dPosWords){
    ws.forEach(System.out::println); }
List>  dEntities = lexicalAnalyzer.ner(docs);  
for(List ents :dEntities){
    ents.forEach(System.out::println); } // 分词, 词性标注,实体识别 
List  dResults = lexicalAnalyzer.analysis(docs); dResults.forEach(System.out::println);

GitHub  
码云

27阅读 | 0评论
你的回应
写文章

联系我们