TestJobSysDirWithDFS.java
上传用户:quxuerui
上传日期:2018-01-08
资源大小:41811k
文件大小:5k
源码类别:

网格计算

开发平台:

Java

  1. /**
  2.  * Licensed to the Apache Software Foundation (ASF) under one
  3.  * or more contributor license agreements.  See the NOTICE file
  4.  * distributed with this work for additional information
  5.  * regarding copyright ownership.  The ASF licenses this file
  6.  * to you under the Apache License, Version 2.0 (the
  7.  * "License"); you may not use this file except in compliance
  8.  * with the License.  You may obtain a copy of the License at
  9.  *
  10.  *     http://www.apache.org/licenses/LICENSE-2.0
  11.  *
  12.  * Unless required by applicable law or agreed to in writing, software
  13.  * distributed under the License is distributed on an "AS IS" BASIS,
  14.  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  15.  * See the License for the specific language governing permissions and
  16.  * limitations under the License.
  17.  */
  18. package org.apache.hadoop.mapred;
  19. import java.io.DataOutputStream;
  20. import java.io.IOException;
  21. import junit.framework.TestCase;
  22. import org.apache.commons.logging.Log;
  23. import org.apache.commons.logging.LogFactory;
  24. import org.apache.hadoop.hdfs.MiniDFSCluster;
  25. import org.apache.hadoop.fs.FileSystem;
  26. import org.apache.hadoop.fs.Path;
  27. import org.apache.hadoop.io.IntWritable;
  28. import org.apache.hadoop.io.Text;
  29. /**
  30.  * A JUnit test to test Job System Directory with Mini-DFS.
  31.  */
  32. public class TestJobSysDirWithDFS extends TestCase {
  33.   private static final Log LOG =
  34.     LogFactory.getLog(TestJobSysDirWithDFS.class.getName());
  35.   
  36.   static final int NUM_MAPS = 10;
  37.   static final int NUM_SAMPLES = 100000;
  38.   
  39.   public static class TestResult {
  40.     public String output;
  41.     public RunningJob job;
  42.     TestResult(RunningJob job, String output) {
  43.       this.job = job;
  44.       this.output = output;
  45.     }
  46.   }
  47.   public static TestResult launchWordCount(JobConf conf,
  48.                                            Path inDir,
  49.                                            Path outDir,
  50.                                            String input,
  51.                                            int numMaps,
  52.                                            int numReduces) throws IOException {
  53.     FileSystem inFs = inDir.getFileSystem(conf);
  54.     FileSystem outFs = outDir.getFileSystem(conf);
  55.     outFs.delete(outDir, true);
  56.     if (!inFs.mkdirs(inDir)) {
  57.       throw new IOException("Mkdirs failed to create " + inDir.toString());
  58.     }
  59.     {
  60.       DataOutputStream file = inFs.create(new Path(inDir, "part-0"));
  61.       file.writeBytes(input);
  62.       file.close();
  63.     }
  64.     conf.setJobName("wordcount");
  65.     conf.setInputFormat(TextInputFormat.class);
  66.     
  67.     // the keys are words (strings)
  68.     conf.setOutputKeyClass(Text.class);
  69.     // the values are counts (ints)
  70.     conf.setOutputValueClass(IntWritable.class);
  71.     
  72.     conf.setMapperClass(WordCount.MapClass.class);        
  73.     conf.setCombinerClass(WordCount.Reduce.class);
  74.     conf.setReducerClass(WordCount.Reduce.class);
  75.     FileInputFormat.setInputPaths(conf, inDir);
  76.     FileOutputFormat.setOutputPath(conf, outDir);
  77.     conf.setNumMapTasks(numMaps);
  78.     conf.setNumReduceTasks(numReduces);
  79.     conf.set("mapred.system.dir", "/tmp/subru/mapred/system");
  80.     JobClient jobClient = new JobClient(conf);
  81.     RunningJob job = jobClient.runJob(conf);
  82.     // Checking that the Job Client system dir is not used
  83.     assertFalse(FileSystem.get(conf).exists(new Path(conf.get("mapred.system.dir")))); 
  84.     // Check if the Job Tracker system dir is propogated to client
  85.     String sysDir = jobClient.getSystemDir().toString();
  86.     System.out.println("Job sys dir -->" + sysDir);
  87.     assertFalse(sysDir.contains("/tmp/subru/mapred/system"));
  88.     assertTrue(sysDir.contains("custom"));
  89.     return new TestResult(job, TestMiniMRWithDFS.readOutput(outDir, conf));
  90.   }
  91.  static void runWordCount(MiniMRCluster mr, JobConf jobConf) throws IOException {
  92.     LOG.info("runWordCount");
  93.     // Run a word count example
  94.     // Keeping tasks that match this pattern
  95.     TestResult result;
  96.     final Path inDir = new Path("./wc/input");
  97.     final Path outDir = new Path("./wc/output");
  98.     result = launchWordCount(jobConf, inDir, outDir,
  99.                              "The quick brown foxnhas many sillyn" + 
  100.                              "red fox soxn",
  101.                              3, 1);
  102.     assertEquals("Thet1nbrownt1nfoxt2nhast1nmanyt1n" +
  103.                  "quickt1nredt1nsillyt1nsoxt1n", result.output);
  104.     // Checking if the Job ran successfully in spite of different system dir config
  105.     //  between Job Client & Job Tracker
  106.     assertTrue(result.job.isSuccessful());
  107.   }
  108.   public void testWithDFS() throws IOException {
  109.     MiniDFSCluster dfs = null;
  110.     MiniMRCluster mr = null;
  111.     FileSystem fileSys = null;
  112.     try {
  113.       final int taskTrackers = 4;
  114.       JobConf conf = new JobConf();
  115.       conf.set("mapred.system.dir", "/tmp/custom/mapred/system");
  116.       dfs = new MiniDFSCluster(conf, 4, true, null);
  117.       fileSys = dfs.getFileSystem();
  118.       mr = new MiniMRCluster(taskTrackers, fileSys.getUri().toString(), 1, null, null, conf);
  119.       runWordCount(mr, mr.createJobConf());
  120.     } finally {
  121.       if (dfs != null) { dfs.shutdown(); }
  122.       if (mr != null) { mr.shutdown();
  123.       }
  124.     }
  125.   }
  126.   
  127. }