TestSequenceFileInputFormat.java
上传用户:quxuerui
上传日期:2018-01-08
资源大小:41811k
文件大小:4k
源码类别:

网格计算

开发平台:

Java

  1. /**
  2.  * Licensed to the Apache Software Foundation (ASF) under one
  3.  * or more contributor license agreements.  See the NOTICE file
  4.  * distributed with this work for additional information
  5.  * regarding copyright ownership.  The ASF licenses this file
  6.  * to you under the Apache License, Version 2.0 (the
  7.  * "License"); you may not use this file except in compliance
  8.  * with the License.  You may obtain a copy of the License at
  9.  *
  10.  *     http://www.apache.org/licenses/LICENSE-2.0
  11.  *
  12.  * Unless required by applicable law or agreed to in writing, software
  13.  * distributed under the License is distributed on an "AS IS" BASIS,
  14.  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  15.  * See the License for the specific language governing permissions and
  16.  * limitations under the License.
  17.  */
  18. package org.apache.hadoop.mapred;
  19. import java.io.*;
  20. import java.util.*;
  21. import junit.framework.TestCase;
  22. import org.apache.commons.logging.*;
  23. import org.apache.hadoop.fs.*;
  24. import org.apache.hadoop.io.*;
  25. import org.apache.hadoop.conf.*;
  26. public class TestSequenceFileInputFormat extends TestCase {
  27.   private static final Log LOG = FileInputFormat.LOG;
  28.   private static int MAX_LENGTH = 10000;
  29.   private static Configuration conf = new Configuration();
  30.   public void testFormat() throws Exception {
  31.     JobConf job = new JobConf(conf);
  32.     FileSystem fs = FileSystem.getLocal(conf);
  33.     Path dir = new Path(System.getProperty("test.build.data",".") + "/mapred");
  34.     Path file = new Path(dir, "test.seq");
  35.     
  36.     Reporter reporter = Reporter.NULL;
  37.     
  38.     int seed = new Random().nextInt();
  39.     //LOG.info("seed = "+seed);
  40.     Random random = new Random(seed);
  41.     fs.delete(dir, true);
  42.     FileInputFormat.setInputPaths(job, dir);
  43.     // for a variety of lengths
  44.     for (int length = 0; length < MAX_LENGTH;
  45.          length+= random.nextInt(MAX_LENGTH/10)+1) {
  46.       //LOG.info("creating; entries = " + length);
  47.       // create a file with length entries
  48.       SequenceFile.Writer writer =
  49.         SequenceFile.createWriter(fs, conf, file,
  50.                                   IntWritable.class, BytesWritable.class);
  51.       try {
  52.         for (int i = 0; i < length; i++) {
  53.           IntWritable key = new IntWritable(i);
  54.           byte[] data = new byte[random.nextInt(10)];
  55.           random.nextBytes(data);
  56.           BytesWritable value = new BytesWritable(data);
  57.           writer.append(key, value);
  58.         }
  59.       } finally {
  60.         writer.close();
  61.       }
  62.       // try splitting the file in a variety of sizes
  63.       InputFormat<IntWritable, BytesWritable> format =
  64.         new SequenceFileInputFormat<IntWritable, BytesWritable>();
  65.       IntWritable key = new IntWritable();
  66.       BytesWritable value = new BytesWritable();
  67.       for (int i = 0; i < 3; i++) {
  68.         int numSplits =
  69.           random.nextInt(MAX_LENGTH/(SequenceFile.SYNC_INTERVAL/20))+1;
  70.         //LOG.info("splitting: requesting = " + numSplits);
  71.         InputSplit[] splits = format.getSplits(job, numSplits);
  72.         //LOG.info("splitting: got =        " + splits.length);
  73.         // check each split
  74.         BitSet bits = new BitSet(length);
  75.         for (int j = 0; j < splits.length; j++) {
  76.           RecordReader<IntWritable, BytesWritable> reader =
  77.             format.getRecordReader(splits[j], job, reporter);
  78.           try {
  79.             int count = 0;
  80.             while (reader.next(key, value)) {
  81.               // if (bits.get(key.get())) {
  82.               // LOG.info("splits["+j+"]="+splits[j]+" : " + key.get());
  83.               // LOG.info("@"+reader.getPos());
  84.               // }
  85.               assertFalse("Key in multiple partitions.", bits.get(key.get()));
  86.               bits.set(key.get());
  87.               count++;
  88.             }
  89.             //LOG.info("splits["+j+"]="+splits[j]+" count=" + count);
  90.           } finally {
  91.             reader.close();
  92.           }
  93.         }
  94.         assertEquals("Some keys in no partition.", length, bits.cardinality());
  95.       }
  96.     }
  97.   }
  98.   public static void main(String[] args) throws Exception {
  99.     new TestSequenceFileInputFormat().testFormat();
  100.   }
  101. }