UniqValueCount.java
上传用户:quxuerui
上传日期:2018-01-08
资源大小:41811k
文件大小:3k
源码类别:

网格计算

开发平台:

Java

  1. /**
  2.  * Licensed to the Apache Software Foundation (ASF) under one
  3.  * or more contributor license agreements.  See the NOTICE file
  4.  * distributed with this work for additional information
  5.  * regarding copyright ownership.  The ASF licenses this file
  6.  * to you under the Apache License, Version 2.0 (the
  7.  * "License"); you may not use this file except in compliance
  8.  * with the License.  You may obtain a copy of the License at
  9.  *
  10.  *     http://www.apache.org/licenses/LICENSE-2.0
  11.  *
  12.  * Unless required by applicable law or agreed to in writing, software
  13.  * distributed under the License is distributed on an "AS IS" BASIS,
  14.  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  15.  * See the License for the specific language governing permissions and
  16.  * limitations under the License.
  17.  */
  18. package org.apache.hadoop.mapred.lib.aggregate;
  19. import java.util.ArrayList;
  20. import java.util.Iterator;
  21. import java.util.Set;
  22. import java.util.TreeMap;
  23. /**
  24.  * This class implements a value aggregator that dedupes a sequence of objects.
  25.  * 
  26.  */
  27. public class UniqValueCount implements ValueAggregator {
  28.   private TreeMap<Object, Object> uniqItems = null;
  29.   private long numItems = 0;
  30.   
  31.   private long maxNumItems = Long.MAX_VALUE;
  32.   /**
  33.    * the default constructor
  34.    * 
  35.    */
  36.   public UniqValueCount() {
  37.     this(Long.MAX_VALUE);
  38.   }
  39.   
  40.   /**
  41.    * constructor
  42.    * @param maxNum the limit in the number of unique values to keep.
  43.    *  
  44.    */
  45.   public UniqValueCount(long maxNum) {
  46.     uniqItems = new TreeMap<Object, Object>();
  47.     this.numItems = 0;
  48.     maxNumItems = Long.MAX_VALUE;
  49.     if (maxNum > 0 ) {
  50.       this.maxNumItems = maxNum;
  51.     }
  52.   }
  53.   /**
  54.    * Set the limit on the number of unique values
  55.    * @param n the desired limit on the number of unique values
  56.    * @return the new limit on the number of unique values
  57.    */
  58.   public long setMaxItems(long n) {
  59.     if (n >= numItems) {
  60.       this.maxNumItems = n;
  61.     } else if (this.maxNumItems >= this.numItems) {
  62.       this.maxNumItems = this.numItems;
  63.     }
  64.     return this.maxNumItems;
  65.   }
  66.   
  67.   /**
  68.    * add a value to the aggregator
  69.    * 
  70.    * @param val
  71.    *          an object.
  72.    * 
  73.    */
  74.   public void addNextValue(Object val) {
  75.     if (this.numItems <= this.maxNumItems) {
  76.       uniqItems.put(val.toString(), "1");
  77.       this.numItems = this.uniqItems.size();
  78.     }
  79.   }
  80.   /**
  81.    * @return return the number of unique objects aggregated
  82.    */
  83.   public String getReport() {
  84.     return "" + uniqItems.size();
  85.   }
  86.   /**
  87.    * 
  88.    * @return the set of the unique objects
  89.    */
  90.   public Set getUniqueItems() {
  91.     return uniqItems.keySet();
  92.   }
  93.   /**
  94.    * reset the aggregator
  95.    */
  96.   public void reset() {
  97.     uniqItems = new TreeMap<Object, Object>();
  98.   }
  99.   /**
  100.    * @return return an array of the unique objects. The return value is
  101.    *         expected to be used by the a combiner.
  102.    */
  103.   public ArrayList getCombinerOutput() {
  104.     Object key = null;
  105.     Iterator iter = uniqItems.keySet().iterator();
  106.     ArrayList<Object> retv = new ArrayList<Object>();
  107.     while (iter.hasNext()) {
  108.       key = iter.next();
  109.       retv.add(key);
  110.     }
  111.     return retv;
  112.   }
  113. }