XML256TableTranscoder.cpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:9k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2000 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. // ---------------------------------------------------------------------------
  57. //  Includes
  58. // ---------------------------------------------------------------------------
  59. #include <xercesc/util/BitOps.hpp>
  60. #include <xercesc/util/TranscodingException.hpp>
  61. #include <xercesc/util/XML256TableTranscoder.hpp>
  62. #include <xercesc/util/XMLString.hpp>
  63. #include <string.h>
  64. XERCES_CPP_NAMESPACE_BEGIN
  65. // ---------------------------------------------------------------------------
  66. //  XML256TableTranscoder: Public Destructor
  67. // ---------------------------------------------------------------------------
  68. XML256TableTranscoder::~XML256TableTranscoder()
  69. {
  70.     // We don't own the tables, we just reference them
  71. }
  72. // ---------------------------------------------------------------------------
  73. //  XML256TableTranscoder: Implementation of the transcoder API
  74. // ---------------------------------------------------------------------------
  75. unsigned int
  76. XML256TableTranscoder::transcodeFrom(const  XMLByte* const       srcData
  77.                                     , const unsigned int         srcCount
  78.                                     ,       XMLCh* const         toFill
  79.                                     , const unsigned int         maxChars
  80.                                     ,       unsigned int&        bytesEaten
  81.                                     ,       unsigned char* const charSizes)
  82. {
  83.     // If debugging, make sure that the block size is legal
  84.     #if defined(XERCES_DEBUG)
  85.     checkBlockSize(maxChars);
  86.     #endif
  87.     //
  88.     //  Calculate the max chars we can do here. Its the lesser of the
  89.     //  max output chars and the number of chars in the source.
  90.     //
  91.     const unsigned int countToDo = srcCount < maxChars ? srcCount : maxChars;
  92.     //
  93.     //  Loop through the count we have to do and map each char via the
  94.     //  lookup table.
  95.     //
  96.     const XMLByte*  srcPtr = srcData;
  97.     const XMLByte*  endPtr = (srcPtr + countToDo);
  98.     XMLCh*          outPtr = toFill;
  99.     while (srcPtr < endPtr)
  100.     {
  101.         const XMLCh uniCh = fFromTable[*srcPtr++];
  102.         if (uniCh != 0xFFFF)
  103.         {
  104.             *outPtr++ = uniCh;
  105.             continue;
  106.         }
  107.     }
  108.     // Set the bytes eaten
  109.     bytesEaten = countToDo;
  110.     // Set the character sizes to the fixed size
  111.     memset(charSizes, 1, countToDo);
  112.     // Return the chars we transcoded
  113.     return countToDo;
  114. }
  115. unsigned int
  116. XML256TableTranscoder::transcodeTo( const   XMLCh* const    srcData
  117.                                     , const unsigned int    srcCount
  118.                                     ,       XMLByte* const  toFill
  119.                                     , const unsigned int    maxBytes
  120.                                     ,       unsigned int&   charsEaten
  121.                                     , const UnRepOpts       options)
  122. {
  123.     // If debugging, make sure that the block size is legal
  124.     #if defined(XERCES_DEBUG)
  125.     checkBlockSize(maxBytes);
  126.     #endif
  127.     //
  128.     //  Calculate the max chars we can do here. Its the lesser of the
  129.     //  max output chars and the number of chars in the source.
  130.     //
  131.     const unsigned int countToDo = srcCount < maxBytes ? srcCount : maxBytes;
  132.     //
  133.     //  Loop through the count we have to do and map each char via the
  134.     //  lookup table.
  135.     //
  136.     const XMLCh*    srcPtr = srcData;
  137.     const XMLCh*    endPtr = (srcPtr + countToDo);
  138.     XMLByte*        outPtr = toFill;
  139.     XMLByte         nextOut;
  140.     while (srcPtr < endPtr)
  141.     {
  142.         //
  143.         //  Get the next src char out to a temp, then do a binary search
  144.         //  of the 'to' table for this entry.
  145.         //
  146.         if ((nextOut = xlatOneTo(*srcPtr)))
  147.         {
  148.             *outPtr++ = nextOut;
  149.             srcPtr++;
  150.             continue;
  151.         }
  152.         //
  153.         //  Its not representable so, according to the options, either
  154.         //  throw or use the replacement.
  155.         //
  156.         if (options == UnRep_Throw)
  157.         {
  158.             XMLCh tmpBuf[16];
  159.             XMLString::binToText((unsigned int)*srcPtr, tmpBuf, 16, 16);
  160.             ThrowXML2
  161.             (
  162.                 TranscodingException
  163.                 , XMLExcepts::Trans_Unrepresentable
  164.                 , tmpBuf
  165.                 , getEncodingName()
  166.             );
  167.         }
  168.         // Eat the source char and use the replacement char
  169.         srcPtr++;
  170.         *outPtr++ = 0x3F;
  171.     }
  172.     // Set the chars eaten
  173.     charsEaten = countToDo;
  174.     // Return the bytes we transcoded
  175.     return countToDo;
  176. }
  177. bool XML256TableTranscoder::canTranscodeTo(const unsigned int toCheck) const
  178. {
  179.     return (xlatOneTo(toCheck) != 0);
  180. }
  181. // ---------------------------------------------------------------------------
  182. //  XML256TableTranscoder: Hidden constructor
  183. // ---------------------------------------------------------------------------
  184. XML256TableTranscoder::
  185. XML256TableTranscoder(  const   XMLCh* const                     encodingName
  186.                         , const unsigned int                     blockSize
  187.                         , const XMLCh* const                     fromTable
  188.                         , const XMLTransService::TransRec* const toTable
  189.                         , const unsigned int                     toTableSize) :
  190.     XMLTranscoder(encodingName, blockSize)
  191.     , fFromTable(fromTable)
  192.     , fToSize(toTableSize)
  193.     , fToTable(toTable)
  194. {
  195. }
  196. // ---------------------------------------------------------------------------
  197. //  XML256TableTranscoder: Private helper methods
  198. // ---------------------------------------------------------------------------
  199. XMLByte XML256TableTranscoder::xlatOneTo(const XMLCh toXlat) const
  200. {
  201.     unsigned int    lowOfs = 0;
  202.     unsigned int    hiOfs = fToSize - 1;
  203.     XMLByte         curByte = 0;
  204.     do
  205.     {
  206.         // Calc the mid point of the low and high offset.
  207.         const unsigned int midOfs = ((hiOfs - lowOfs) / 2) + lowOfs;
  208.         //
  209.         //  If our test char is greater than the mid point char, then
  210.         //  we move up to the upper half. Else we move to the lower
  211.         //  half. If its equal, then its our guy.
  212.         //
  213.         if (toXlat > fToTable[midOfs].intCh)
  214.         {
  215.             lowOfs = midOfs;
  216.         }
  217.          else if (toXlat < fToTable[midOfs].intCh)
  218.         {
  219.             hiOfs = midOfs;
  220.         }
  221.          else
  222.         {
  223.             return fToTable[midOfs].extCh;
  224.         }
  225.     }   while (lowOfs + 1 < hiOfs);
  226.     // Check the high end of the range otherwise the
  227.     // last item in the table may never be found.
  228.         if (toXlat == fToTable[hiOfs].intCh)
  229.         {
  230.             return fToTable[hiOfs].extCh;
  231.         }
  232.     return 0;
  233. }
  234. XERCES_CPP_NAMESPACE_END