XMLUCSTranscoder.cpp
上传用户:huihehuasu
上传日期:2007-01-10
资源大小:6948k
文件大小:10k
源码类别:

xml/soap/webservice

开发平台:

C/C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. // ---------------------------------------------------------------------------
  57. //  Includes
  58. // ---------------------------------------------------------------------------
  59. #include <util/BitOps.hpp>
  60. #include <util/XMLUCS4Transcoder.hpp>
  61. #include <util/TranscodingException.hpp>
  62. #include <string.h>
  63. // ---------------------------------------------------------------------------
  64. //  XMLUCS4Transcoder: Constructors and Destructor
  65. // ---------------------------------------------------------------------------
  66. XMLUCS4Transcoder::XMLUCS4Transcoder(const  XMLCh* const    encodingName
  67.                                     , const unsigned int    blockSize
  68.                                     , const bool            swapped) :
  69.     XMLTranscoder(encodingName, blockSize)
  70.     , fSwapped(swapped)
  71. {
  72. }
  73. XMLUCS4Transcoder::~XMLUCS4Transcoder()
  74. {
  75. }
  76. // ---------------------------------------------------------------------------
  77. //  XMLUCS4Transcoder: Implementation of the transcoder API
  78. // ---------------------------------------------------------------------------
  79. unsigned int
  80. XMLUCS4Transcoder::transcodeFrom(const  XMLByte* const          srcData
  81.                                 , const unsigned int            srcCount
  82.                                 ,       XMLCh* const            toFill
  83.                                 , const unsigned int            maxChars
  84.                                 ,       unsigned int&           bytesEaten
  85.                                 ,       unsigned char* const    charSizes)
  86. {
  87.     // If debugging, make sure that the block size is legal
  88.     #if defined(XERCES_DEBUG)
  89.     checkBlockSize(maxChars);
  90.     #endif
  91.     //
  92.     //  Get pointers to the start and end of the source buffer in terms of
  93.     //  UCS-4 characters.
  94.     //
  95.     const UCS4Ch*   srcPtr = (const UCS4Ch*)srcData;
  96.     const UCS4Ch*   srcEnd = srcPtr + (srcCount / sizeof(UCS4Ch));
  97.     //
  98.     //  Get pointers to the start and end of the target buffer, which is
  99.     //  in terms of the XMLCh chars we output.
  100.     //
  101.     XMLCh*  outPtr = toFill;
  102.     XMLCh*  outEnd = toFill + maxChars;
  103.     //
  104.     //  And get a pointer into the char sizes buffer. We will run this
  105.     //  up as we put chars into the output buffer.
  106.     //
  107.     unsigned char* sizePtr = charSizes;
  108.     //
  109.     //  Now process chars until we either use up all our source or all of
  110.     //  our output space.
  111.     //
  112.     while ((outPtr < outEnd) && (srcPtr < srcEnd))
  113.     {
  114.         //
  115.         //  Get the next UCS char out of the buffer. Don't bump the ptr
  116.         //  yet since we might not have enough storage for it in the target
  117.         //  (if its causes a surrogate pair to be created.
  118.         //
  119.         UCS4Ch nextVal = *srcPtr;
  120.         // If it needs to be swapped, then do it
  121.         if (fSwapped)
  122.             nextVal = BitOps::swapBytes(nextVal);
  123.         // Handle a surrogate pair if needed
  124.         if (nextVal & 0xFFFF0000)
  125.         {
  126.             //
  127.             //  If we don't have room for both of the chars, then we
  128.             //  bail out now.
  129.             //
  130.             if (outPtr + 1 == outEnd)
  131.                 break;
  132.             const XMLCh ch1 = XMLCh(((nextVal - 0x10000) >> 10) + 0xD800);
  133.             const XMLCh ch2 = XMLCh(((nextVal - 0x10000) & 0x3FF) + 0xDC00);
  134.             //
  135.             //  We have room so store them both. But note that the
  136.             //  second one took up no source bytes!
  137.             //
  138.             *sizePtr++ = sizeof(UCS4Ch);
  139.             *outPtr++ = ch1;
  140.             *sizePtr++ = 0;
  141.             *outPtr++ = ch2;
  142.         }
  143.          else
  144.         {
  145.             //
  146.             //  No surrogate, so just store it and bump the count of chars
  147.             //  read. Update the char sizes buffer for this char's entry.
  148.             //
  149.             *sizePtr++ = sizeof(UCS4Ch);
  150.             *outPtr++ = XMLCh(nextVal);
  151.         }
  152.         // Indicate that we ate another UCS char's worth of bytes
  153.         srcPtr++;
  154.     }
  155.     // Set the bytes eaten parameter
  156.     bytesEaten = ((const XMLByte*)srcPtr) - srcData;
  157.     // And return the chars written into the output buffer
  158.     return outPtr - toFill;
  159. }
  160. unsigned int
  161. XMLUCS4Transcoder::transcodeTo( const   XMLCh* const    srcData
  162.                                 , const unsigned int    srcCount
  163.                                 ,       XMLByte* const  toFill
  164.                                 , const unsigned int    maxBytes
  165.                                 ,       unsigned int&   charsEaten
  166.                                 , const UnRepOpts       options)
  167. {
  168.     // If debugging, make sure that the block size is legal
  169.     #if defined(XERCES_DEBUG)
  170.     checkBlockSize(maxBytes);
  171.     #endif
  172.     //
  173.     //  Get pointers to the start and end of the source buffer, which
  174.     //  is in terms of XMLCh chars.
  175.     //
  176.     const XMLCh*  srcPtr = srcData;
  177.     const XMLCh*  srcEnd = srcData + srcCount;
  178.     //
  179.     //  Get pointers to the start and end of the target buffer, in terms
  180.     //  of UCS-4 chars.
  181.     //
  182.     UCS4Ch*   outPtr = (UCS4Ch*)toFill;
  183.     UCS4Ch*   outEnd = outPtr + (maxBytes / sizeof(UCS4Ch));
  184.     //
  185.     //  Now loop until we either run out of source characters or we
  186.     //  fill up our output buffer.
  187.     //
  188.     XMLCh trailCh;
  189.     while ((outPtr < outEnd) && (srcPtr < srcEnd))
  190.     {
  191.         //
  192.         //  Get out an XMLCh char from the source. Don't bump up the
  193.         //  pointer yet, since it might be a leading for which we don't
  194.         //  have the trailing.
  195.         //
  196.         const XMLCh curCh = *srcPtr;
  197.         //
  198.         //  If its a leading char of a surrogate pair handle it one way,
  199.         //  else just cast it over into the target.
  200.         //
  201.         if ((curCh >= 0xD800) && (curCh <= 0xDBFF))
  202.         {
  203.             //
  204.             //  Ok, we have to have another source char available or we
  205.             //  just give up without eating the leading char.
  206.             //
  207.             if (srcPtr + 1 == srcEnd)
  208.                 break;
  209.             //
  210.             //  We have the trailing char, so eat the first char and the
  211.             //  trailing char from the source.
  212.             //
  213.             srcPtr++;
  214.             trailCh = *srcPtr++;
  215.             //
  216.             //  Then make sure its a legal trailing char. If not, throw
  217.             //  an exception.
  218.             //
  219.             if ( !( (trailCh >= 0xDC00) && (trailCh <= 0xDFFF) ) )
  220.             ThrowXML(TranscodingException, XMLExcepts::Trans_BadTrailingSurrogate);
  221.             // And now combine the two into a single output char
  222.             *outPtr++ = ((curCh - 0xD800) << 10)
  223.                         + (trailCh - 0xDC00) + 0x10000;
  224.         }
  225.          else
  226.         {
  227.             //
  228.             //  Its just a char, so we can take it as is. If we need to
  229.             //  swap it, then swap it. Because of flakey compilers, use
  230.             //  a temp first.
  231.             //
  232.             const UCS4Ch tmpCh = UCS4Ch(curCh);
  233.             if (fSwapped)
  234.                 *outPtr++ = BitOps::swapBytes(tmpCh);
  235.             else
  236.                 *outPtr++ = tmpCh;
  237.             // Bump the source pointer
  238.             srcPtr++;
  239.         }
  240.     }
  241.     // Set the chars we ate from the source
  242.     charsEaten = srcPtr - srcData;
  243.     // Return the bytes we wrote to the output
  244.     return ((XMLByte*)outPtr) - toFill;
  245. }
  246. bool XMLUCS4Transcoder::canTranscodeTo(const unsigned int toCheck) const
  247. {
  248.     // We can handle anything
  249.     return true;
  250. }