KeywordTokenizer.cs
上传用户:zhangkuixh
上传日期:2013-09-30
资源大小:5473k
文件大小:2k
源码类别:

搜索引擎

开发平台:

C#

  1. /*
  2.  * Copyright 2004-2005 The Apache Software Foundation
  3.  * 
  4.  * Licensed under the Apache License, Version 2.0 (the "License");
  5.  * you may not use this file except in compliance with the License.
  6.  * You may obtain a copy of the License at
  7.  * 
  8.  * http://www.apache.org/licenses/LICENSE-2.0
  9.  * 
  10.  * Unless required by applicable law or agreed to in writing, software
  11.  * distributed under the License is distributed on an "AS IS" BASIS,
  12.  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  13.  * See the License for the specific language governing permissions and
  14.  * limitations under the License.
  15.  */
  16. using System;
  17. namespace Lucene.Net.Analysis
  18. {
  19. /// <summary> Emits the entire input as a single token.</summary>
  20. public class KeywordTokenizer : Tokenizer
  21. {
  22. private const int DEFAULT_BUFFER_SIZE = 256;
  23. private bool done;
  24. private char[] buffer;
  25. public KeywordTokenizer(System.IO.TextReader input) : this(input, DEFAULT_BUFFER_SIZE)
  26. {
  27. }
  28. public KeywordTokenizer(System.IO.TextReader input, int bufferSize) : base(input)
  29. {
  30. this.buffer = new char[bufferSize];
  31. this.done = false;
  32. }
  33. public override Token Next()
  34. {
  35. if (!done)
  36. {
  37. done = true;
  38. System.Text.StringBuilder buffer = new System.Text.StringBuilder();
  39. int length;
  40. while (true)
  41. {
  42. length = input.Read((System.Char[]) this.buffer, 0, this.buffer.Length);
  43. if (length == - 1)
  44. break;
  45. buffer.Append(this.buffer, 0, length);
  46. }
  47. System.String text = buffer.ToString();
  48. return new Token(text, 0, text.Length);
  49. }
  50. return null;
  51. }
  52. }
  53. }