Document.cs
上传用户:zhangkuixh
上传日期:2013-09-30
资源大小:5473k
文件大小:11k
源码类别:

搜索引擎

开发平台:

C#

  1. /*
  2.  * Copyright 2004 The Apache Software Foundation
  3.  * 
  4.  * Licensed under the Apache License, Version 2.0 (the "License");
  5.  * you may not use this file except in compliance with the License.
  6.  * You may obtain a copy of the License at
  7.  * 
  8.  * http://www.apache.org/licenses/LICENSE-2.0
  9.  * 
  10.  * Unless required by applicable law or agreed to in writing, software
  11.  * distributed under the License is distributed on an "AS IS" BASIS,
  12.  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  13.  * See the License for the specific language governing permissions and
  14.  * limitations under the License.
  15.  */
  16. using System;
  17. using IndexReader = Lucene.Net.Index.IndexReader;
  18. using Hits = Lucene.Net.Search.Hits;
  19. using Searcher = Lucene.Net.Search.Searcher;
  20. namespace Lucene.Net.Documents
  21. {
  22. /// <summary>Documents are the unit of indexing and search.
  23. /// 
  24. /// A Document is a set of fields.  Each field has a name and a textual value.
  25. /// A field may be {@link Field#IsStored() stored} with the document, in which
  26. /// case it is returned with search hits on the document.  Thus each document
  27. /// should typically contain one or more stored fields which uniquely identify
  28. /// it.
  29. /// 
  30. /// <p>Note that fields which are <i>not</i> {@link Field#IsStored() stored} are
  31. /// <i>not</i> available in documents retrieved from the index, e.g. with {@link
  32. /// Hits#Doc(int)}, {@link Searcher#Doc(int)} or {@link
  33. /// IndexReader#Document(int)}.
  34. /// </summary>
  35. [Serializable]
  36. public sealed class Document
  37. {
  38. internal System.Collections.IList fields = System.Collections.ArrayList.Synchronized(new System.Collections.ArrayList(10));
  39. private float boost = 1.0f;
  40. /// <summary>Constructs a new document with no fields. </summary>
  41. public Document()
  42. {
  43. }
  44. /// <summary>Sets a boost factor for hits on any field of this document.  This value
  45. /// will be multiplied into the score of all hits on this document.
  46. /// 
  47. /// <p>Values are multiplied into the value of {@link Field#GetBoost()} of
  48. /// each field in this document.  Thus, this method in effect sets a default
  49. /// boost for the fields of this document.
  50. /// 
  51. /// </summary>
  52. /// <seealso cref="Field.SetBoost(float)">
  53. /// </seealso>
  54. public void  SetBoost(float boost)
  55. {
  56. this.boost = boost;
  57. }
  58. /// <summary>Returns the boost factor for hits on any field of this document.
  59. /// 
  60. /// <p>The default value is 1.0.
  61. /// 
  62. /// <p>Note: This value is not stored directly with the document in the index.
  63. /// Documents returned from {@link IndexReader#Document(int)} and
  64. /// {@link Hits#Doc(int)} may thus not have the same value present as when
  65. /// this document was indexed.
  66. /// 
  67. /// </summary>
  68. /// <seealso cref="SetBoost(float)">
  69. /// </seealso>
  70. public float GetBoost()
  71. {
  72. return boost;
  73. }
  74. /// <summary> <p>Adds a field to a document.  Several fields may be added with
  75. /// the same name.  In this case, if the fields are indexed, their text is
  76. /// treated as though appended for the purposes of search.</p>
  77. /// <p> Note that add like the removeField(s) methods only makes sense 
  78. /// prior to adding a document to an index. These methods cannot
  79. /// be used to change the content of an existing index! In order to achieve this,
  80. /// a document has to be deleted from an index and a new changed version of that
  81. /// document has to be added.</p>
  82. /// </summary>
  83. public void  Add(Field field)
  84. {
  85. fields.Add(field);
  86. }
  87. /// <summary> <p>Removes field with the specified name from the document.
  88. /// If multiple fields exist with this name, this method removes the first field that has been added.
  89. /// If there is no field with the specified name, the document remains unchanged.</p>
  90. /// <p> Note that the removeField(s) methods like the add method only make sense 
  91. /// prior to adding a document to an index. These methods cannot
  92. /// be used to change the content of an existing index! In order to achieve this,
  93. /// a document has to be deleted from an index and a new changed version of that
  94. /// document has to be added.</p>
  95. /// </summary>
  96. public void  RemoveField(System.String name)
  97. {
  98. System.Collections.IEnumerator it = fields.GetEnumerator();
  99. while (it.MoveNext())
  100. {
  101. Field field = (Field) it.Current;
  102. if (field.Name().Equals(name))
  103. {
  104. fields.Remove(field);
  105. return ;
  106. }
  107. }
  108. }
  109. /// <summary> <p>Removes all fields with the given name from the document.
  110. /// If there is no field with the specified name, the document remains unchanged.</p>
  111. /// <p> Note that the removeField(s) methods like the add method only make sense 
  112. /// prior to adding a document to an index. These methods cannot
  113. /// be used to change the content of an existing index! In order to achieve this,
  114. /// a document has to be deleted from an index and a new changed version of that
  115. /// document has to be added.</p>
  116. /// </summary>
  117. public void  RemoveFields(System.String name)
  118. {
  119. System.Collections.IEnumerator it = fields.GetEnumerator();
  120. while (it.MoveNext())
  121. {
  122. Field field = (Field) it.Current;
  123. if (field.Name().Equals(name))
  124. {
  125. fields.Remove(field);
  126. }
  127. }
  128. }
  129. /// <summary>Returns a field with the given name if any exist in this document, or
  130. /// null.  If multiple fields exists with this name, this method returns the
  131. /// first value added.
  132. /// </summary>
  133. public Field GetField(System.String name)
  134. {
  135. for (int i = 0; i < fields.Count; i++)
  136. {
  137. Field field = (Field) fields[i];
  138. if (field.Name().Equals(name))
  139. return field;
  140. }
  141. return null;
  142. }
  143. /// <summary>Returns the string value of the field with the given name if any exist in
  144. /// this document, or null.  If multiple fields exist with this name, this
  145. /// method returns the first value added. If only binary fields with this name
  146. /// exist, returns null.
  147. /// </summary>
  148. public System.String Get(System.String name)
  149. {
  150. for (int i = 0; i < fields.Count; i++)
  151. {
  152. Field field = (Field) fields[i];
  153. if (field.Name().Equals(name) && (!field.IsBinary()))
  154. return field.StringValue();
  155. }
  156. return null;
  157. }
  158. /// <summary>Returns an Enumeration of all the fields in a document. </summary>
  159. public System.Collections.IEnumerator Fields()
  160. {
  161. return ((System.Collections.ArrayList) fields).GetEnumerator();
  162. }
  163. /// <summary> Returns an array of {@link Field}s with the given name.
  164. /// This method can return <code>null</code>.
  165. /// 
  166. /// </summary>
  167. /// <param name="name">the name of the field
  168. /// </param>
  169. /// <returns> a <code>Field[]</code> array
  170. /// </returns>
  171. public Field[] GetFields(System.String name)
  172. {
  173. System.Collections.ArrayList result = new System.Collections.ArrayList();
  174. for (int i = 0; i < fields.Count; i++)
  175. {
  176. Field field = (Field) fields[i];
  177. if (field.Name().Equals(name))
  178. {
  179. result.Add(field);
  180. }
  181. }
  182. if (result.Count == 0)
  183. return null;
  184. return (Field[]) result.ToArray(typeof(Field));
  185. }
  186. /// <summary> Returns an array of values of the field specified as the method parameter.
  187. /// This method can return <code>null</code>.
  188. /// 
  189. /// </summary>
  190. /// <param name="name">the name of the field
  191. /// </param>
  192. /// <returns> a <code>String[]</code> of field values
  193. /// </returns>
  194. public System.String[] GetValues(System.String name)
  195. {
  196. System.Collections.ArrayList result = new System.Collections.ArrayList();
  197. for (int i = 0; i < fields.Count; i++)
  198. {
  199. Field field = (Field) fields[i];
  200. if (field.Name().Equals(name) && (!field.IsBinary()))
  201. result.Add(field.StringValue());
  202. }
  203. if (result.Count == 0)
  204. return null;
  205. return (System.String[]) (result.ToArray(typeof(System.String)));
  206. }
  207. /// <summary> Returns an array of byte arrays for of the fields that have the name specified
  208. /// as the method parameter. This method will return <code>null</code> if no
  209. /// binary fields with the specified name are available.
  210. /// 
  211. /// </summary>
  212. /// <param name="name">the name of the field
  213. /// </param>
  214. /// <returns> a  <code>byte[][]</code> of binary field values.
  215. /// </returns>
  216. public byte[][] GetBinaryValues(System.String name)
  217. {
  218. System.Collections.IList result = new System.Collections.ArrayList();
  219. for (int i = 0; i < fields.Count; i++)
  220. {
  221. Field field = (Field) fields[i];
  222. if (field.Name().Equals(name) && (field.IsBinary()))
  223.                 {
  224.                     byte[] byteArray = field.BinaryValue();
  225.                     byte[] resultByteArray = new byte[byteArray.Length];
  226.                     for (int index = 0; index < byteArray.Length; index++)
  227.                         resultByteArray[index] = (byte) byteArray[index];
  228.                     result.Add(resultByteArray);
  229.                 }
  230.             }
  231. if (result.Count == 0)
  232. return null;
  233.             System.Collections.ICollection c = result;
  234.             System.Object[] objects = new byte[result.Count][];
  235.             System.Type type = objects.GetType().GetElementType();
  236.             System.Object[] objs = (System.Object[]) Array.CreateInstance(type, c.Count );
  237.             System.Collections.IEnumerator e = c.GetEnumerator();
  238.             int ii = 0;
  239.             while (e.MoveNext())
  240.                 objs[ii++] = e.Current;
  241.             // If objects is smaller than c then do not return the new array in the parameter
  242.             if (objects.Length >= c.Count)
  243.                 objs.CopyTo(objects, 0);
  244.             return (byte[][]) objs;
  245.         }
  246. /// <summary> Returns an array of bytes for the first (or only) field that has the name
  247. /// specified as the method parameter. This method will return <code>null</code>
  248. /// if no binary fields with the specified name are available.
  249. /// There may be non-binary fields with the same name.
  250. /// 
  251. /// </summary>
  252. /// <param name="name">the name of the field.
  253. /// </param>
  254. /// <returns> a <code>byte[]</code> containing the binary field value.
  255. /// </returns>
  256. public byte[] GetBinaryValue(System.String name)
  257. {
  258. for (int i = 0; i < fields.Count; i++)
  259. {
  260. Field field = (Field) fields[i];
  261. if (field.Name().Equals(name) && (field.IsBinary()))
  262. return field.BinaryValue();
  263. }
  264. return null;
  265. }
  266. /// <summary>Prints the fields of a document for human consumption. </summary>
  267. public override System.String ToString()
  268. {
  269. System.Text.StringBuilder buffer = new System.Text.StringBuilder();
  270. buffer.Append("Document<");
  271. for (int i = 0; i < fields.Count; i++)
  272. {
  273. Field field = (Field) fields[i];
  274. buffer.Append(field.ToString());
  275. if (i != fields.Count - 1)
  276. buffer.Append(" ");
  277. }
  278. buffer.Append(">");
  279. return buffer.ToString();
  280. }
  281. }
  282. }