TestMultipleArchiveFiles.java
上传用户:quxuerui
上传日期:2018-01-08
资源大小:41811k
文件大小:5k
源码类别:

网格计算

开发平台:

Java

  1. /**
  2.  * Licensed to the Apache Software Foundation (ASF) under one
  3.  * or more contributor license agreements.  See the NOTICE file
  4.  * distributed with this work for additional information
  5.  * regarding copyright ownership.  The ASF licenses this file
  6.  * to you under the Apache License, Version 2.0 (the
  7.  * "License"); you may not use this file except in compliance
  8.  * with the License.  You may obtain a copy of the License at
  9.  *
  10.  *     http://www.apache.org/licenses/LICENSE-2.0
  11.  *
  12.  * Unless required by applicable law or agreed to in writing, software
  13.  * distributed under the License is distributed on an "AS IS" BASIS,
  14.  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  15.  * See the License for the specific language governing permissions and
  16.  * limitations under the License.
  17.  */
  18. package org.apache.hadoop.streaming;
  19. import java.io.File;
  20. import java.io.FileOutputStream;
  21. import java.io.IOException;
  22. import java.io.DataOutputStream;
  23. import java.io.InputStreamReader;
  24. import java.io.BufferedReader;
  25. import java.util.zip.ZipEntry;
  26. import java.util.jar.JarOutputStream;
  27. import java.util.zip.ZipOutputStream;
  28. import org.apache.hadoop.conf.Configuration;
  29. import org.apache.hadoop.fs.FileSystem;
  30. import org.apache.hadoop.fs.FileUtil;
  31. import org.apache.hadoop.fs.Path;
  32. import org.apache.hadoop.mapred.*;
  33. import org.apache.hadoop.hdfs.MiniDFSCluster;
  34. /**
  35.  * This class tests cacheArchive option of streaming 
  36.  * The test case creates 2 archive files, ships it with hadoop
  37.  * streaming and compares the output with expected output
  38.  */
  39. public class TestMultipleArchiveFiles extends TestStreaming
  40. {
  41.   private StreamJob job;
  42.   private String INPUT_FILE = "input.txt";
  43.   private String CACHE_ARCHIVE_1 = "cacheArchive1.zip";
  44.   private File CACHE_FILE_1 = null;
  45.   private String CACHE_ARCHIVE_2 = "cacheArchive2.zip";
  46.   private File CACHE_FILE_2 = null;
  47.   private String expectedOutput = null;
  48.   private String OUTPUT_DIR = "out";
  49.   private Configuration conf = null;
  50.   private MiniDFSCluster dfs = null;
  51.   private MiniMRCluster mr = null;
  52.   private FileSystem fileSys = null;
  53.   private String strJobTracker = null;
  54.   private String strNamenode = null;
  55.   private String namenode = null;
  56.   public TestMultipleArchiveFiles() throws IOException {
  57.     CACHE_FILE_1 = new File("cacheArchive1");
  58.     CACHE_FILE_2 = new File("cacheArchive2");
  59.     input = "HADOOP";
  60.     expectedOutput = "HADOOPtnHADOOPtn";
  61.     try {
  62.       conf = new Configuration();      
  63.       dfs = new MiniDFSCluster(conf, 1, true, null);      
  64.       fileSys = dfs.getFileSystem();
  65.       namenode = fileSys.getUri().getAuthority();
  66.       mr  = new MiniMRCluster(1, namenode, 3);
  67.       strJobTracker = "mapred.job.tracker=" + "localhost:" + mr.getJobTrackerPort();
  68.       strNamenode = "fs.default.name=" + namenode;
  69.     } catch (Exception e) {
  70.       e.printStackTrace();
  71.     }
  72.   }
  73.   
  74.   protected void createInput() throws IOException
  75.   {
  76.     DataOutputStream dos = fileSys.create(new Path(INPUT_FILE));
  77.     String inputFileString = "symlink1/cacheArchive1nsymlink2/cacheArchive2";
  78.     dos.write(inputFileString.getBytes("UTF-8"));
  79.     dos.close();
  80.     
  81.     DataOutputStream out = fileSys.create(new Path(CACHE_ARCHIVE_1.toString()));
  82.     ZipOutputStream zos = new ZipOutputStream(out);
  83.     ZipEntry ze = new ZipEntry(CACHE_FILE_1.toString());
  84.     zos.putNextEntry(ze);
  85.     zos.write(input.getBytes("UTF-8"));
  86.     zos.closeEntry();
  87.     zos.close();
  88.     out = fileSys.create(new Path(CACHE_ARCHIVE_2.toString()));
  89.     zos = new ZipOutputStream(out);
  90.     ze = new ZipEntry(CACHE_FILE_2.toString());
  91.     zos.putNextEntry(ze);
  92.     zos.write(input.getBytes("UTF-8"));
  93.     zos.closeEntry();
  94.     zos.close();
  95.   }
  96.   protected String[] genArgs() {
  97.     String cacheArchiveString1 = null;
  98.     String cacheArchiveString2 = null;
  99.     try {
  100.       cacheArchiveString1 = fileSys.getUri().toString()+fileSys.getWorkingDirectory().toString()+"/"+CACHE_ARCHIVE_1+"#symlink1";
  101.       cacheArchiveString2 = fileSys.getUri().toString()+fileSys.getWorkingDirectory().toString()+"/"+CACHE_ARCHIVE_2+"#symlink2";
  102.     } catch (Exception e) {
  103.       e.printStackTrace();
  104.     }
  105.     return new String[] {
  106.       "-input", INPUT_FILE.toString(),
  107.       "-output", OUTPUT_DIR,
  108.       "-mapper", "xargs cat", 
  109.       "-reducer", "cat",
  110.       "-jobconf", "mapred.reduce.tasks=1",
  111.       "-cacheArchive", cacheArchiveString1, 
  112.       "-cacheArchive", cacheArchiveString2,
  113.       "-jobconf", strNamenode,
  114.       "-jobconf", strJobTracker,
  115.       "-jobconf", "stream.tmpdir=" + System.getProperty("test.build.data","/tmp")
  116.     };
  117.   }
  118.   public void testCommandLine() {
  119.     try {
  120.       createInput();
  121.       job = new StreamJob(genArgs(), true);
  122.       if(job.go() != 0) {
  123.         throw new Exception("Job Failed");
  124.       }
  125.       StringBuffer output = new StringBuffer(256);
  126.       Path[] fileList = FileUtil.stat2Paths(fileSys.listStatus(
  127.                                             new Path(OUTPUT_DIR)));
  128.       for (int i = 0; i < fileList.length; i++){
  129.         BufferedReader bread =
  130.           new BufferedReader(new InputStreamReader(fileSys.open(fileList[i])));
  131.         output.append(bread.readLine());
  132.         output.append("n");
  133.         output.append(bread.readLine());
  134.         output.append("n");
  135.       }
  136.       assertEquals(expectedOutput, output.toString());
  137.     } catch (Exception e) {
  138.       e.printStackTrace();
  139.     } finally {
  140.       CACHE_FILE_1.delete();
  141.       CACHE_FILE_2.delete();
  142.     }
  143.   }
  144.   public static void main(String[]args) throws Exception
  145.   {
  146.     new TestMultipleArchiveFiles().testCommandLine();
  147.   }
  148. }