Base64.cpp
上传用户:huihehuasu
上传日期:2007-01-10
资源大小:6948k
文件大小:14k
源码类别:

xml/soap/webservice

开发平台:

C/C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  * 
  4.  * Copyright (c) 2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  * 
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  * 
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer. 
  13.  * 
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  * 
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:  
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  * 
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written 
  29.  *    permission, please contact apache@apache.org.
  30.  * 
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  * 
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  * 
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 2001, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: Base64.cpp,v $
  58.  * Revision 1.6  2001/10/15 19:42:16  knoaman
  59.  * Null-terminate base64Alphabet.
  60.  *
  61.  * Revision 1.5  2001/10/10 19:14:08  peiyongz
  62.  * Patch from Petr Gotthard : encode() provided and some other changes
  63.  *
  64.  * Revision 1.4  2001/06/07 20:55:20  tng
  65.  * Fix no newline at the end warning.  By Pei Yong Zhang.
  66.  *
  67.  * Revision 1.3  2001/05/28 21:11:16  tng
  68.  * Schema: Various DatatypeValidator fix.  By Pei Yong Zhang
  69.  *
  70.  * Revision 1.2  2001/05/16 19:01:04  tng
  71.  * Schema: Typo fix in Base64
  72.  *
  73.  * Revision 1.1  2001/05/16 15:25:36  tng
  74.  * Schema: Add Base64 and HexBin.  By Pei Yong Zhang.
  75.  *
  76.  */
  77. // ---------------------------------------------------------------------------
  78. //  Includes
  79. // ---------------------------------------------------------------------------
  80. #include <util/Base64.hpp>
  81. #include <util/XMLString.hpp>
  82. #include <util/Janitor.hpp>
  83. #include <util/PlatformUtils.hpp>
  84. #include <util/TransService.hpp>
  85. // ---------------------------------------------------------------------------
  86. //  constants
  87. // ---------------------------------------------------------------------------
  88. static const int BASELENGTH = 255;       
  89. static const int FOURBYTE   = 4;
  90. // ---------------------------------------------------------------------------
  91. //  class data member
  92. // ---------------------------------------------------------------------------
  93. // the base64 alphabet according to definition in RFC 2045
  94. const XMLCh Base64::base64Alphabet[] = {
  95.     chLatin_A, chLatin_B, chLatin_C, chLatin_D, chLatin_E,
  96.     chLatin_F, chLatin_G, chLatin_H, chLatin_I, chLatin_J,
  97.     chLatin_K, chLatin_L, chLatin_M, chLatin_N, chLatin_O,
  98.     chLatin_P, chLatin_Q, chLatin_R, chLatin_S, chLatin_T,
  99.     chLatin_U, chLatin_V, chLatin_W, chLatin_X, chLatin_Y,
  100.     chLatin_Z, chLatin_a, chLatin_b, chLatin_c, chLatin_d,
  101.     chLatin_e, chLatin_f, chLatin_g, chLatin_h, chLatin_i,
  102.     chLatin_j, chLatin_k, chLatin_l, chLatin_m, chLatin_n,
  103.     chLatin_o, chLatin_p, chLatin_q, chLatin_r, chLatin_s,
  104.     chLatin_t, chLatin_u, chLatin_v, chLatin_w, chLatin_x,
  105.     chLatin_y, chLatin_z, chDigit_0, chDigit_1, chDigit_2,
  106.     chDigit_3, chDigit_4, chDigit_5, chDigit_6, chDigit_7,
  107.     chDigit_8, chDigit_9, chPlus, chForwardSlash, chNull
  108. };
  109. const XMLCh Base64::base64Padding = chEqual;
  110. XMLCh Base64::base64Inverse[ BASELENGTH ];
  111. bool Base64::isInitialized = false;
  112. // number of quadruplets per one line ( must be >1 and <19 )
  113. const unsigned int Base64::quadsPerLine = 15;
  114. XMLCh* Base64::encode( 
  115.     const XMLCh* const inputData,
  116.     const int inputLength,
  117.     int *outputLength )
  118. {
  119.     if (!isInitialized)
  120.         init();
  121.     if ( inputData == 0 )
  122.         return 0;
  123.     int quadrupletCount = ( inputLength + 2 ) / 3;
  124.     if (quadrupletCount == 0)
  125.         return 0;
  126.     // number of rows in encoded stream ( including the last one )
  127.     int lineCount = ( quadrupletCount + quadsPerLine-1 ) / quadsPerLine;
  128.     //
  129.     // convert the triplet(s) to quadruplet(s)
  130.     //
  131.     XMLCh  b1, b2, b3, b4;  // base64 binary codes ( 0..63 )
  132.     int inputIndex = 0;
  133.     int outputIndex = 0;
  134.     XMLCh *encodedData = 
  135.         new XMLCh[ quadrupletCount*FOURBYTE + lineCount + 1 ];
  136.     //
  137.     // Process all quadruplet(s) except the last
  138.     //
  139.     int quad = 1;
  140.     for (; quad <= quadrupletCount-1; quad++ )
  141.     {
  142.         // read triplet from the input stream
  143.         split1stOctet( inputData[ inputIndex++ ], b1, b2 );
  144.         split2ndOctet( inputData[ inputIndex++ ], b2, b3 );
  145.         split3rdOctet( inputData[ inputIndex++ ], b3, b4 );
  146.         // write quadruplet to the output stream
  147.         encodedData[ outputIndex++ ] = base64Alphabet[ b1 ];
  148.         encodedData[ outputIndex++ ] = base64Alphabet[ b2 ];
  149.         encodedData[ outputIndex++ ] = base64Alphabet[ b3 ];
  150.         encodedData[ outputIndex++ ] = base64Alphabet[ b4 ];
  151.         if (( quad % quadsPerLine ) == 0 )
  152.             encodedData[ outputIndex++ ] = chLF;
  153.     }
  154.     //
  155.     // process the last Quadruplet
  156.     //
  157.     // first octet is present always, process it
  158.     split1stOctet( inputData[ inputIndex++ ], b1, b2 );
  159.     encodedData[ outputIndex++ ] = base64Alphabet[ b1 ];
  160.     if( inputIndex < inputLength )
  161.     {
  162.         // second octet is present, process it
  163.         split2ndOctet( inputData[ inputIndex++ ], b2, b3 );
  164.         encodedData[ outputIndex++ ] = base64Alphabet[ b2 ];
  165.         if( inputIndex < inputLength )
  166.         {
  167.             // third octet present, process it
  168.             // no PAD e.g. 3cQl
  169.             split3rdOctet( inputData[ inputIndex++ ], b3, b4 );
  170.             encodedData[ outputIndex++ ] = base64Alphabet[ b3 ];
  171.             encodedData[ outputIndex++ ] = base64Alphabet[ b4 ];
  172.         }
  173.         else
  174.         {
  175.             // third octet not present
  176.             // one PAD e.g. 3cQ=
  177.             encodedData[ outputIndex++ ] = base64Alphabet[ b3 ];
  178.             encodedData[ outputIndex++ ] = base64Padding;
  179.         }
  180.     }
  181.     else
  182.     {
  183.         // second octet not present
  184.         // two PADs e.g. 3c==
  185.         encodedData[ outputIndex++ ] = base64Padding;
  186.         encodedData[ outputIndex++ ] = base64Padding;
  187.     }
  188.     // write out end of the last line
  189.     encodedData[ outputIndex++ ] = chLF;
  190.     // write out end of string
  191.     encodedData[ outputIndex ] = 0;
  192.     if( outputLength != 0 )
  193.       (*outputLength) = outputIndex;
  194.     return encodedData;
  195. }
  196. //
  197. // delete the buffer allocated by decode() if
  198. // decoding is successfully done.
  199. //
  200. // In previous version, we use XMLString::strLen(decodedData)
  201. // to get the length, this will fail for test case containing
  202. // consequtive "A", such "AAFF", or "ab56AA56". Instead of 
  203. // returning 3/6, we have 0 and 3, indicating that "AA", after
  204. // decoded, is interpreted as <null> by the strLen().
  205. //
  206. // Since decode() has track of length of the decoded data, we
  207. // will get this length from decode(), instead of strLen().
  208. //
  209. int Base64::getDataLength( const XMLCh* const inputData )
  210. {
  211.     int    retLen = 0;
  212.     XMLCh* decodedData = decode( inputData, retLen );
  213.     if ( !decodedData )
  214.         return -1;
  215.     else
  216.     {
  217.         delete[] decodedData;
  218.         return retLen;
  219.     }
  220. }
  221. //
  222. // return 0(null) if invalid data found.
  223. // return the buffer containning decoded data otherwise
  224. // the caller is responsible for the de-allocation of the
  225. // buffer returned. 
  226. //
  227. // temporary data, rawInputData, is ALWAYS released by this function.
  228. //
  229. XMLCh* Base64::decode( const XMLCh* const inputData, int& outputLength )
  230. {
  231.     if (!isInitialized)
  232.         init();
  233.     if (( inputData == 0 ) || ( *inputData == 0 ))
  234.         return 0;
  235.     //
  236.     // remove all whitespaces from the base64Data
  237.     //
  238.     int inputLength = XMLString::stringLen( inputData );
  239.     XMLCh* rawInputData = new XMLCh[ inputLength + 1 ];
  240.     ArrayJanitor<XMLCh> jan(rawInputData);
  241.     int inputIndex = 0;
  242.     int rawInputLength = 0;
  243.     while ( inputIndex < inputLength )
  244.     {
  245. //        if( !isspace( inputData[ inputIndex ] ))
  246.         if (!XMLPlatformUtils::fgTransService->isSpace(inputData[inputIndex]))
  247.             rawInputData[ rawInputLength++ ] = inputData[ inputIndex ];
  248.         inputIndex++;
  249.     }
  250.     rawInputData[ rawInputLength ] = 0;
  251.     // the length of raw data should be divisible by four
  252.     if (( rawInputLength % FOURBYTE ) != 0 ) 
  253.         return 0;  
  254.     int quadrupletCount = rawInputLength / FOURBYTE;
  255.     if ( quadrupletCount == 0 )
  256.         return 0;
  257.     //
  258.     // convert the quadruplet(s) to triplet(s)
  259.     //
  260.     XMLCh  d1, d2, d3, d4;  // base64 characters
  261.     XMLCh  b1, b2, b3, b4;  // base64 binary codes ( 0..64 )
  262.     int rawInputIndex  = 0;
  263.     int outputIndex    = 0;
  264.     XMLCh *decodedData = new XMLCh[ quadrupletCount*3 + 1 ];
  265.     //
  266.     // Process all quadruplet(s) except the last
  267.     //
  268.     int quad = 1;
  269.     for (; quad <= quadrupletCount-1; quad++ )
  270.     {
  271.         // read quadruplet from the input stream
  272.         if (!isData( (d1 = rawInputData[ rawInputIndex++ ]) ) ||
  273.             !isData( (d2 = rawInputData[ rawInputIndex++ ]) ) ||
  274.             !isData( (d3 = rawInputData[ rawInputIndex++ ]) ) ||
  275.             !isData( (d4 = rawInputData[ rawInputIndex++ ]) ))
  276.         {
  277.             // if found "no data" just return NULL
  278.             delete[] decodedData;
  279.             return 0;
  280.         }
  281.         b1 = base64Inverse[ d1 ];
  282.         b2 = base64Inverse[ d2 ];
  283.         b3 = base64Inverse[ d3 ];
  284.         b4 = base64Inverse[ d4 ];
  285.         // write triplet to the output stream
  286.         decodedData[ outputIndex++ ] = set1stOctet(b1, b2);
  287.         decodedData[ outputIndex++ ] = set2ndOctet(b2, b3);
  288.         decodedData[ outputIndex++ ] = set3rdOctet(b3, b4);
  289.     }
  290.     //
  291.     // process the last Quadruplet
  292.     //
  293.     // first two octets are present always, process them
  294.     if (!isData( (d1 = rawInputData[ rawInputIndex++ ]) ) ||
  295.         !isData( (d2 = rawInputData[ rawInputIndex++ ]) ))
  296.     {
  297.         // if found "no data" just return NULL
  298.         delete[] decodedData;
  299.         return 0;
  300.     }
  301.     b1 = base64Inverse[ d1 ]; 
  302.     b2 = base64Inverse[ d2 ];
  303.     // try to process last two octets
  304.     d3 = rawInputData[ rawInputIndex++ ];
  305.     d4 = rawInputData[ rawInputIndex++ ];
  306.     if (!isData( d3 ) || !isData( d4 )) 
  307.     {
  308.         // check if last two are PAD characters
  309.         if (isPad( d3 ) && isPad( d4 )) 
  310.         {
  311.             // two PAD e.g. 3c==
  312.             if ((b2 & 0xf) != 0) // last 4 bits should be zero
  313.             {
  314.                 delete[] decodedData;
  315.                 return 0;
  316.             }
  317.             decodedData[ outputIndex++ ] = set1stOctet(b1, b2);
  318.         }
  319.         else if (!isPad( d3 ) && isPad( d4 )) 
  320.         {               
  321.             // one PAD e.g. 3cQ=
  322.             b3 = base64Inverse[ d3 ];
  323.             if (( b3 & 0x3 ) != 0 ) // last 2 bits should be zero
  324.             {
  325.                 delete[] decodedData;
  326.                 return 0;
  327.             }
  328.             decodedData[ outputIndex++ ] = set1stOctet( b1, b2 );
  329.             decodedData[ outputIndex++ ] = set2ndOctet( b2, b3 );
  330.         } 
  331.         else 
  332.         {
  333.             // an error like "3c[Pad]r", "3cdX", "3cXd", "3cXX" where X is non data 
  334.             delete[] decodedData;
  335.             return 0;
  336.         }       
  337.     } 
  338.     else 
  339.     { 
  340.         // no PAD e.g 3cQl
  341.         b3 = base64Inverse[ d3 ];
  342.         b4 = base64Inverse[ d4 ];
  343.         decodedData[ outputIndex++ ] = set1stOctet( b1, b2 );
  344.         decodedData[ outputIndex++ ] = set2ndOctet( b2, b3 );
  345.         decodedData[ outputIndex++ ] = set3rdOctet( b3, b4 );
  346.     }
  347.     // write out the end of string
  348.     decodedData[ outputIndex ] = 0; 
  349.     outputLength = outputIndex;
  350.     return decodedData;
  351. }
  352. // -----------------------------------------------------------------------
  353. //  Helper methods
  354. // -----------------------------------------------------------------------
  355. void Base64::init()
  356. {
  357.     if (isInitialized)
  358.         return;
  359.     isInitialized = true;
  360.     // create inverse table for base64 decoding
  361.     // if base64Alphabet[ 17 ] = 'R', then base64Inverse[ 'R' ] = 17
  362.     // for characters not in base64Alphabet the base64Inverse[] = -1
  363.     int i;
  364.     // set all fields to -1
  365.     for ( i = 0; i < BASELENGTH; i++ ) 
  366.         base64Inverse[i] = (XMLCh)-1; 
  367.     // compute inverse table
  368.     for ( i = 0; i < 64; i++ ) 
  369.         base64Inverse[ base64Alphabet[i] ] = (XMLCh)i;
  370. }
  371. bool Base64::isData(const XMLCh& octet) 
  372. {
  373.     // sanity check to avoid out-of-bound index
  374.     if (( octet >= BASELENGTH ) || ( octet < 0 ))
  375.         return false;
  376.     return( base64Inverse[octet] != (XMLCh) -1);
  377. }