TestSequenceFileAsTextInputFormat.java
上传用户:quxuerui
上传日期:2018-01-08
资源大小:41811k
文件大小:4k
源码类别:

网格计算

开发平台:

Java

  1. /**
  2.  * Licensed to the Apache Software Foundation (ASF) under one
  3.  * or more contributor license agreements.  See the NOTICE file
  4.  * distributed with this work for additional information
  5.  * regarding copyright ownership.  The ASF licenses this file
  6.  * to you under the Apache License, Version 2.0 (the
  7.  * "License"); you may not use this file except in compliance
  8.  * with the License.  You may obtain a copy of the License at
  9.  *
  10.  *     http://www.apache.org/licenses/LICENSE-2.0
  11.  *
  12.  * Unless required by applicable law or agreed to in writing, software
  13.  * distributed under the License is distributed on an "AS IS" BASIS,
  14.  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  15.  * See the License for the specific language governing permissions and
  16.  * limitations under the License.
  17.  */
  18. package org.apache.hadoop.mapred;
  19. import java.io.*;
  20. import java.util.*;
  21. import junit.framework.TestCase;
  22. import org.apache.commons.logging.*;
  23. import org.apache.hadoop.fs.*;
  24. import org.apache.hadoop.io.*;
  25. import org.apache.hadoop.conf.*;
  26. public class TestSequenceFileAsTextInputFormat extends TestCase {
  27.   private static final Log LOG = FileInputFormat.LOG;
  28.   private static int MAX_LENGTH = 10000;
  29.   private static Configuration conf = new Configuration();
  30.   public void testFormat() throws Exception {
  31.     JobConf job = new JobConf(conf);
  32.     FileSystem fs = FileSystem.getLocal(conf);
  33.     Path dir = new Path(System.getProperty("test.build.data",".") + "/mapred");
  34.     Path file = new Path(dir, "test.seq");
  35.     
  36.     Reporter reporter = Reporter.NULL;
  37.     
  38.     int seed = new Random().nextInt();
  39.     //LOG.info("seed = "+seed);
  40.     Random random = new Random(seed);
  41.     fs.delete(dir, true);
  42.     FileInputFormat.setInputPaths(job, dir);
  43.     // for a variety of lengths
  44.     for (int length = 0; length < MAX_LENGTH;
  45.          length+= random.nextInt(MAX_LENGTH/10)+1) {
  46.       //LOG.info("creating; entries = " + length);
  47.       // create a file with length entries
  48.       SequenceFile.Writer writer =
  49.         SequenceFile.createWriter(fs, conf, file,
  50.                                   IntWritable.class, LongWritable.class);
  51.       try {
  52.         for (int i = 0; i < length; i++) {
  53.           IntWritable key = new IntWritable(i);
  54.           LongWritable value = new LongWritable(10 * i);
  55.           writer.append(key, value);
  56.         }
  57.       } finally {
  58.         writer.close();
  59.       }
  60.       // try splitting the file in a variety of sizes
  61.       InputFormat<Text, Text> format =
  62.         new SequenceFileAsTextInputFormat();
  63.       
  64.       for (int i = 0; i < 3; i++) {
  65.         int numSplits =
  66.           random.nextInt(MAX_LENGTH/(SequenceFile.SYNC_INTERVAL/20))+1;
  67.         //LOG.info("splitting: requesting = " + numSplits);
  68.         InputSplit[] splits = format.getSplits(job, numSplits);
  69.         //LOG.info("splitting: got =        " + splits.length);
  70.         // check each split
  71.         BitSet bits = new BitSet(length);
  72.         for (int j = 0; j < splits.length; j++) {
  73.           RecordReader<Text, Text> reader =
  74.             format.getRecordReader(splits[j], job, reporter);
  75.           Class readerClass = reader.getClass();
  76.           assertEquals("reader class is SequenceFileAsTextRecordReader.", SequenceFileAsTextRecordReader.class, readerClass);        
  77.           Text value = reader.createValue();
  78.           Text key = reader.createKey();
  79.           try {
  80.             int count = 0;
  81.             while (reader.next(key, value)) {
  82.               // if (bits.get(key.get())) {
  83.               // LOG.info("splits["+j+"]="+splits[j]+" : " + key.get());
  84.               // LOG.info("@"+reader.getPos());
  85.               // }
  86.               int keyInt = Integer.parseInt(key.toString());
  87.               assertFalse("Key in multiple partitions.", bits.get(keyInt));
  88.               bits.set(keyInt);
  89.               count++;
  90.             }
  91.             //LOG.info("splits["+j+"]="+splits[j]+" count=" + count);
  92.           } finally {
  93.             reader.close();
  94.           }
  95.         }
  96.         assertEquals("Some keys in no partition.", length, bits.cardinality());
  97.       }
  98.     }
  99.   }
  100.   public static void main(String[] args) throws Exception {
  101.     new TestSequenceFileAsTextInputFormat().testFormat();
  102.   }
  103. }