LuceneSimpleAnalyzerText.java
上传用户:cctqzzy
上传日期:2022-03-14
资源大小:12198k
文件大小:2k
源码类别:

搜索引擎

开发平台:

Java

  1. package chapter8;
  2. import java.io.IOException;
  3. import org.apache.lucene.document.Field;
  4. import org.apache.lucene.document.Document;
  5. import org.apache.lucene.index.IndexWriter;
  6. import org.apache.lucene.analysis.Analyzer;
  7. import org.apache.lucene.analysis.SimpleAnalyzer;
  8. import org.apache.lucene.analysis.TokenStream;
  9. import org.apache.lucene.analysis.Token;
  10. import java.util.*;
  11. import java.io.*;
  12. public class LuceneSimpleAnalyzerText {
  13. private static String Dest_Index_Path = "D:\workshop\TextIndex";
  14. // static protected String textdetail = "Lucene works very well,it is very useful." ;
  15. static protected String textdetail = "Lucene是一个非常有效的开发工具,它可以实现全文检索功能。" ;
  16. public static void main(String[] args) {
  17. try {
  18. Analyzer TextAnalyzer = new SimpleAnalyzer();
  19. IndexWriter TextIndex = new IndexWriter(Dest_Index_Path,TextAnalyzer,true);
  20. Document document = new Document();
  21. Field field_content = new Field("content", textdetail, 
  22. Field.Store.YES,Field.Index.TOKENIZED);
  23. document.add(field_content);
  24. TextIndex.addDocument(document);
  25. ArrayList ItemList = new ArrayList();
  26. TokenStream stream = TextAnalyzer.tokenStream("content", new StringReader(textdetail));
  27. while(true)
  28. {
  29. Token item = stream.next();
  30. if(null == item ) break;
  31. System.out.print("{"+item.termText()+"} ");
  32. }
  33. TextIndex.optimize();
  34. TextIndex.close();
  35. } catch (IOException e) {
  36. e.printStackTrace();
  37. }
  38. System.out.println("");
  39. System.out.println("Index success");
  40. }
  41. }