TestLineInputFormat.java
上传用户:quxuerui
上传日期:2018-01-08
资源大小:41811k
文件大小:4k
源码类别:

网格计算

开发平台:

Java

  1. /**
  2.  * Licensed to the Apache Software Foundation (ASF) under one
  3.  * or more contributor license agreements.  See the NOTICE file
  4.  * distributed with this work for additional information
  5.  * regarding copyright ownership.  The ASF licenses this file
  6.  * to you under the Apache License, Version 2.0 (the
  7.  * "License"); you may not use this file except in compliance
  8.  * with the License.  You may obtain a copy of the License at
  9.  *
  10.  *     http://www.apache.org/licenses/LICENSE-2.0
  11.  *
  12.  * Unless required by applicable law or agreed to in writing, software
  13.  * distributed under the License is distributed on an "AS IS" BASIS,
  14.  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  15.  * See the License for the specific language governing permissions and
  16.  * limitations under the License.
  17.  */
  18. package org.apache.hadoop.mapred.lib;
  19. import java.io.*;
  20. import java.util.*;
  21. import junit.framework.TestCase;
  22. import org.apache.hadoop.fs.*;
  23. import org.apache.hadoop.io.*;
  24. import org.apache.hadoop.mapred.*;
  25. public class TestLineInputFormat extends TestCase {
  26.   private static int MAX_LENGTH = 200;
  27.   
  28.   private static JobConf defaultConf = new JobConf();
  29.   private static FileSystem localFs = null; 
  30.   static {
  31.     try {
  32.       localFs = FileSystem.getLocal(defaultConf);
  33.     } catch (IOException e) {
  34.       throw new RuntimeException("init failure", e);
  35.     }
  36.   }
  37.   private static Path workDir = 
  38.     new Path(new Path(System.getProperty("test.build.data", "."), "data"),
  39.              "TestLineInputFormat");
  40.   
  41.   public void testFormat() throws Exception {
  42.     JobConf job = new JobConf();
  43.     Path file = new Path(workDir, "test.txt");
  44.     int seed = new Random().nextInt();
  45.     Random random = new Random(seed);
  46.     localFs.delete(workDir, true);
  47.     FileInputFormat.setInputPaths(job, workDir);
  48.     int numLinesPerMap = 5;
  49.     job.setInt("mapred.line.input.format.linespermap", numLinesPerMap);
  50.     // for a variety of lengths
  51.     for (int length = 0; length < MAX_LENGTH;
  52.          length += random.nextInt(MAX_LENGTH/10) + 1) {
  53.       // create a file with length entries
  54.       Writer writer = new OutputStreamWriter(localFs.create(file));
  55.       try {
  56.         for (int i = 0; i < length; i++) {
  57.           writer.write(Integer.toString(i));
  58.           writer.write("n");
  59.         }
  60.       } finally {
  61.         writer.close();
  62.       }
  63.       checkFormat(job, numLinesPerMap);
  64.     }
  65.   }
  66.   // A reporter that does nothing
  67.   private static final Reporter voidReporter = Reporter.NULL;
  68.   
  69.   void checkFormat(JobConf job, int expectedN) throws IOException{
  70.     NLineInputFormat format = new NLineInputFormat();
  71.     format.configure(job);
  72.     int ignoredNumSplits = 1;
  73.     InputSplit[] splits = format.getSplits(job, ignoredNumSplits);
  74.     // check all splits except last one
  75.     int count = 0;
  76.     for (int j = 0; j < splits.length -1; j++) {
  77.       assertEquals("There are no split locations", 0,
  78.                    splits[j].getLocations().length);
  79.       RecordReader<LongWritable, Text> reader =
  80.         format.getRecordReader(splits[j], job, voidReporter);
  81.       Class readerClass = reader.getClass();
  82.       assertEquals("reader class is LineRecordReader.",
  83.                    LineRecordReader.class, readerClass);        
  84.       LongWritable key = reader.createKey();
  85.       Class keyClass = key.getClass();
  86.       assertEquals("Key class is LongWritable.", LongWritable.class, keyClass);
  87.       Text value = reader.createValue();
  88.       Class valueClass = value.getClass();
  89.       assertEquals("Value class is Text.", Text.class, valueClass);
  90.          
  91.       try {
  92.         count = 0;
  93.         while (reader.next(key, value)) {
  94.           count++;
  95.         }
  96.       } finally {
  97.         reader.close();
  98.       }
  99.       assertEquals("number of lines in split is " + expectedN ,
  100.                    expectedN, count);
  101.     }
  102.   }
  103.   
  104.   public static void main(String[] args) throws Exception {
  105.     new TestLineInputFormat().testFormat();
  106.   }
  107. }