KeyValueLineRecordReader.java
上传用户:quxuerui
上传日期:2018-01-08
资源大小:41811k
文件大小:3k
源码类别:

网格计算

开发平台:

Java

  1. /**
  2.  * Licensed to the Apache Software Foundation (ASF) under one
  3.  * or more contributor license agreements.  See the NOTICE file
  4.  * distributed with this work for additional information
  5.  * regarding copyright ownership.  The ASF licenses this file
  6.  * to you under the Apache License, Version 2.0 (the
  7.  * "License"); you may not use this file except in compliance
  8.  * with the License.  You may obtain a copy of the License at
  9.  *
  10.  *     http://www.apache.org/licenses/LICENSE-2.0
  11.  *
  12.  * Unless required by applicable law or agreed to in writing, software
  13.  * distributed under the License is distributed on an "AS IS" BASIS,
  14.  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  15.  * See the License for the specific language governing permissions and
  16.  * limitations under the License.
  17.  */
  18. package org.apache.hadoop.mapred;
  19. import java.io.IOException;
  20. import org.apache.hadoop.conf.Configuration;
  21. import org.apache.hadoop.io.LongWritable;
  22. import org.apache.hadoop.io.Text;
  23. /**
  24.  * This class treats a line in the input as a key/value pair separated by a 
  25.  * separator character. The separator can be specified in config file 
  26.  * under the attribute name key.value.separator.in.input.line. The default
  27.  * separator is the tab character ('t').
  28.  */
  29. public class KeyValueLineRecordReader implements RecordReader<Text, Text> {
  30.   
  31.   private final LineRecordReader lineRecordReader;
  32.   private byte separator = (byte) 't';
  33.   private LongWritable dummyKey;
  34.   private Text innerValue;
  35.   public Class getKeyClass() { return Text.class; }
  36.   
  37.   public Text createKey() {
  38.     return new Text();
  39.   }
  40.   
  41.   public Text createValue() {
  42.     return new Text();
  43.   }
  44.   public KeyValueLineRecordReader(Configuration job, FileSplit split)
  45.     throws IOException {
  46.     
  47.     lineRecordReader = new LineRecordReader(job, split);
  48.     dummyKey = lineRecordReader.createKey();
  49.     innerValue = lineRecordReader.createValue();
  50.     String sepStr = job.get("key.value.separator.in.input.line", "t");
  51.     this.separator = (byte) sepStr.charAt(0);
  52.   }
  53.   public static int findSeparator(byte[] utf, int start, int length, byte sep) {
  54.     for (int i = start; i < (start + length); i++) {
  55.       if (utf[i] == sep) {
  56.         return i;
  57.       }
  58.     }
  59.     return -1;
  60.   }
  61.   /** Read key/value pair in a line. */
  62.   public synchronized boolean next(Text key, Text value)
  63.     throws IOException {
  64.     Text tKey = key;
  65.     Text tValue = value;
  66.     byte[] line = null;
  67.     int lineLen = -1;
  68.     if (lineRecordReader.next(dummyKey, innerValue)) {
  69.       line = innerValue.getBytes();
  70.       lineLen = innerValue.getLength();
  71.     } else {
  72.       return false;
  73.     }
  74.     if (line == null)
  75.       return false;
  76.     int pos = findSeparator(line, 0, lineLen, this.separator);
  77.     if (pos == -1) {
  78.       tKey.set(line, 0, lineLen);
  79.       tValue.set("");
  80.     } else {
  81.       int keyLen = pos;
  82.       byte[] keyBytes = new byte[keyLen];
  83.       System.arraycopy(line, 0, keyBytes, 0, keyLen);
  84.       int valLen = lineLen - keyLen - 1;
  85.       byte[] valBytes = new byte[valLen];
  86.       System.arraycopy(line, pos + 1, valBytes, 0, valLen);
  87.       tKey.set(keyBytes);
  88.       tValue.set(valBytes);
  89.     }
  90.     return true;
  91.   }
  92.   
  93.   public float getProgress() {
  94.     return lineRecordReader.getProgress();
  95.   }
  96.   
  97.   public synchronized long getPos() throws IOException {
  98.     return lineRecordReader.getPos();
  99.   }
  100.   public synchronized void close() throws IOException { 
  101.     lineRecordReader.close();
  102.   }
  103. }