MapFileOutputFormat.java
上传用户:quxuerui
上传日期:2018-01-08
资源大小:41811k
文件大小:4k
源码类别:

网格计算

开发平台:

Java

  1. /**
  2.  * Licensed to the Apache Software Foundation (ASF) under one
  3.  * or more contributor license agreements.  See the NOTICE file
  4.  * distributed with this work for additional information
  5.  * regarding copyright ownership.  The ASF licenses this file
  6.  * to you under the Apache License, Version 2.0 (the
  7.  * "License"); you may not use this file except in compliance
  8.  * with the License.  You may obtain a copy of the License at
  9.  *
  10.  *     http://www.apache.org/licenses/LICENSE-2.0
  11.  *
  12.  * Unless required by applicable law or agreed to in writing, software
  13.  * distributed under the License is distributed on an "AS IS" BASIS,
  14.  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  15.  * See the License for the specific language governing permissions and
  16.  * limitations under the License.
  17.  */
  18. package org.apache.hadoop.mapred;
  19. import java.io.IOException;
  20. import java.util.Arrays;
  21. import org.apache.hadoop.fs.FileSystem;
  22. import org.apache.hadoop.fs.Path;
  23. import org.apache.hadoop.fs.FileUtil;
  24. import org.apache.hadoop.io.MapFile;
  25. import org.apache.hadoop.io.WritableComparable;
  26. import org.apache.hadoop.io.Writable;
  27. import org.apache.hadoop.io.SequenceFile.CompressionType;
  28. import org.apache.hadoop.io.compress.CompressionCodec;
  29. import org.apache.hadoop.io.compress.DefaultCodec;
  30. import org.apache.hadoop.conf.Configuration;
  31. import org.apache.hadoop.util.Progressable;
  32. import org.apache.hadoop.util.ReflectionUtils;
  33. /** An {@link OutputFormat} that writes {@link MapFile}s. */
  34. public class MapFileOutputFormat 
  35. extends FileOutputFormat<WritableComparable, Writable> {
  36.   public RecordWriter<WritableComparable, Writable> getRecordWriter(FileSystem ignored, JobConf job,
  37.                                       String name, Progressable progress)
  38.     throws IOException {
  39.     // get the path of the temporary output file 
  40.     Path file = FileOutputFormat.getTaskOutputPath(job, name);
  41.     
  42.     FileSystem fs = file.getFileSystem(job);
  43.     CompressionCodec codec = null;
  44.     CompressionType compressionType = CompressionType.NONE;
  45.     if (getCompressOutput(job)) {
  46.       // find the kind of compression to do
  47.       compressionType = SequenceFileOutputFormat.getOutputCompressionType(job);
  48.       // find the right codec
  49.       Class<? extends CompressionCodec> codecClass = getOutputCompressorClass(job,
  50.   DefaultCodec.class);
  51.       codec = ReflectionUtils.newInstance(codecClass, job);
  52.     }
  53.     
  54.     // ignore the progress parameter, since MapFile is local
  55.     final MapFile.Writer out =
  56.       new MapFile.Writer(job, fs, file.toString(),
  57.                          job.getOutputKeyClass().asSubclass(WritableComparable.class),
  58.                          job.getOutputValueClass().asSubclass(Writable.class),
  59.                          compressionType, codec,
  60.                          progress);
  61.     return new RecordWriter<WritableComparable, Writable>() {
  62.         public void write(WritableComparable key, Writable value)
  63.           throws IOException {
  64.           out.append(key, value);
  65.         }
  66.         public void close(Reporter reporter) throws IOException { out.close();}
  67.       };
  68.   }
  69.   /** Open the output generated by this format. */
  70.   public static MapFile.Reader[] getReaders(FileSystem ignored, Path dir,
  71.                                             Configuration conf)
  72.     throws IOException {
  73.     FileSystem fs = dir.getFileSystem(conf);
  74.     Path[] names = FileUtil.stat2Paths(fs.listStatus(dir));
  75.     // sort names, so that hash partitioning works
  76.     Arrays.sort(names);
  77.     
  78.     MapFile.Reader[] parts = new MapFile.Reader[names.length];
  79.     for (int i = 0; i < names.length; i++) {
  80.       parts[i] = new MapFile.Reader(fs, names[i].toString(), conf);
  81.     }
  82.     return parts;
  83.   }
  84.     
  85.   /** Get an entry from output generated by this class. */
  86.   public static <K extends WritableComparable, V extends Writable>
  87.   Writable getEntry(MapFile.Reader[] readers,
  88.                                   Partitioner<K, V> partitioner,
  89.                                   K key,
  90.                                   V value) throws IOException {
  91.     int part = partitioner.getPartition(key, value, readers.length);
  92.     return readers[part].get(key, value);
  93.   }
  94. }