XMLUTF16Transcoder.cpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:9k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2000 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. // ---------------------------------------------------------------------------
  57. //  Includes
  58. // ---------------------------------------------------------------------------
  59. #include <xercesc/util/BitOps.hpp>
  60. #include <xercesc/util/XMLUTF16Transcoder.hpp>
  61. #include <xercesc/util/TranscodingException.hpp>
  62. #include <string.h>
  63. XERCES_CPP_NAMESPACE_BEGIN
  64. // ---------------------------------------------------------------------------
  65. //  XMLUTF16Transcoder: Constructors and Destructor
  66. // ---------------------------------------------------------------------------
  67. XMLUTF16Transcoder::XMLUTF16Transcoder( const   XMLCh* const    encodingName
  68.                                         , const unsigned int    blockSize
  69.                                         , const bool            swapped) :
  70.     XMLTranscoder(encodingName, blockSize)
  71.     , fSwapped(swapped)
  72. {
  73. }
  74. XMLUTF16Transcoder::~XMLUTF16Transcoder()
  75. {
  76. }
  77. // ---------------------------------------------------------------------------
  78. //  XMLUTF16Transcoder: Implementation of the transcoder API
  79. // ---------------------------------------------------------------------------
  80. unsigned int
  81. XMLUTF16Transcoder::transcodeFrom(  const   XMLByte* const       srcData
  82.                                     , const unsigned int         srcCount
  83.                                     ,       XMLCh* const         toFill
  84.                                     , const unsigned int         maxChars
  85.                                     ,       unsigned int&        bytesEaten
  86.                                     ,       unsigned char* const charSizes)
  87. {
  88.     // If debugging, make sure that the block size is legal
  89.     #if defined(XERCES_DEBUG)
  90.     checkBlockSize(maxChars);
  91.     #endif
  92.     //
  93.     //  Calculate the max chars we can do here. Its the lesser of the
  94.     //  max output chars and the number of chars in the source.
  95.     //
  96.     const unsigned int srcChars = srcCount / sizeof(UTF16Ch);
  97.     const unsigned int countToDo = srcChars < maxChars ? srcChars : maxChars;
  98.     // Look at the source data as UTF16 chars
  99.     const UTF16Ch* asUTF16 = (const UTF16Ch*)srcData;
  100.     // And get a mutable pointer to the output
  101.     XMLCh* outPtr = toFill;
  102.     //
  103.     //  If its swapped, we have to do a char by char swap and cast. Else
  104.     //  we have to check whether our XMLCh and UTF16Ch types are the same
  105.     //  size or not. If so, we can optimize by just doing a buffer copy.
  106.     //
  107.     if (fSwapped)
  108.     {
  109.         //
  110.         //  And then do the swapping loop for the count we precalculated. Note
  111.         //  that this also handles size conversion as well if XMLCh is not the
  112.         //  same size as UTF16Ch.
  113.         //
  114.         for (unsigned int index = 0; index < countToDo; index++)
  115.             *outPtr++ = BitOps::swapBytes(*asUTF16++);
  116.     }
  117.      else
  118.     {
  119.         //
  120.         //  If the XMLCh type is the same size as a UTF16 value on this
  121.         //  platform, then we can do just a buffer copy straight to the target
  122.         //  buffer since our source chars are UTF-16 chars. If its not, then
  123.         //  we still have to do a loop and assign each one, in order to
  124.         //  implicitly convert.
  125.         //
  126.         if (sizeof(XMLCh) == sizeof(UTF16Ch))
  127.         {
  128.             //  Notice we convert char count to byte count here!!!
  129.             memcpy(toFill, srcData, countToDo * sizeof(UTF16Ch));
  130.         }
  131.          else
  132.         {
  133.             for (unsigned int index = 0; index < countToDo; index++)
  134.                 *outPtr++ = XMLCh(*asUTF16++);
  135.         }
  136.     }
  137.     // Set the bytes eaten
  138.     bytesEaten = countToDo * sizeof(UTF16Ch);
  139.     // Set the character sizes to the fixed size
  140.     memset(charSizes, sizeof(UTF16Ch), countToDo);
  141.     // Return the chars we transcoded
  142.     return countToDo;
  143. }
  144. unsigned int
  145. XMLUTF16Transcoder::transcodeTo(const   XMLCh* const    srcData
  146.                                 , const unsigned int    srcCount
  147.                                 ,       XMLByte* const  toFill
  148.                                 , const unsigned int    maxBytes
  149.                                 ,       unsigned int&   charsEaten
  150.                                 , const UnRepOpts       options)
  151. {
  152.     // If debugging, make sure that the block size is legal
  153.     #if defined(XERCES_DEBUG)
  154.     checkBlockSize(maxBytes);
  155.     #endif
  156.     //
  157.     //  Calculate the max chars we can do here. Its the lesser of the
  158.     //  chars that we can fit into the output buffer, and the source
  159.     //  chars available.
  160.     //
  161.     const unsigned int maxOutChars = maxBytes / sizeof(UTF16Ch);
  162.     const unsigned int countToDo = srcCount < maxOutChars ? srcCount : maxOutChars;
  163.     //
  164.     //  Get a pointer tot he output buffer in the UTF-16 character format
  165.     //  that we need to work with. And get a mutable pointer to the source
  166.     //  character buffer.
  167.     //
  168.     UTF16Ch*        outPtr = (UTF16Ch*)toFill;
  169.     const XMLCh*    srcPtr = srcData;
  170.     //
  171.     //  If the target format is swapped from our native format, then handle
  172.     //  it one way, else handle it another.
  173.     //
  174.     if (fSwapped)
  175.     {
  176.         //
  177.         //  And then do the swapping loop for the count we precalculated. Note
  178.         //  that this also handles size conversion as well if XMLCh is not the
  179.         //  same size as UTF16Ch.
  180.         //
  181.         for (unsigned int index = 0; index < countToDo; index++)
  182.         {
  183.             // To avoid flakey compilers, use a temp
  184.             const UTF16Ch tmpCh = UTF16Ch(*srcPtr++);
  185.             *outPtr++ = BitOps::swapBytes(tmpCh);
  186.         }
  187.     }
  188.      else
  189.     {
  190.         //
  191.         //  If XMLCh and UTF16Ch are the same size, we can just do a fast
  192.         //  memory copy. Otherwise, we have to do a loop and downcast each
  193.         //  character into its new 16 bit storage.
  194.         //
  195.         if (sizeof(XMLCh) == sizeof(UTF16Ch))
  196.         {
  197.             //  Notice we convert char count to byte count here!!!
  198.             memcpy(toFill, srcData, countToDo * sizeof(UTF16Ch));
  199.         }
  200.          else
  201.         {
  202.             for (unsigned int index = 0; index < countToDo; index++)
  203.                 *outPtr++ = UTF16Ch(*srcPtr++);
  204.         }
  205.     }
  206.     // Set the chars eaten to the calculated number we ate
  207.     charsEaten = countToDo;
  208.     //Return the bytes we ate. Note we convert to a byte count here!
  209.     return countToDo * sizeof(UTF16Ch);
  210. }
  211. bool XMLUTF16Transcoder::canTranscodeTo(const unsigned int toCheck) const
  212. {
  213.     // We can handle anything
  214.     return true;
  215. }
  216. XERCES_CPP_NAMESPACE_END