XMLRecognizer.hpp
上传用户:huihehuasu
上传日期:2007-01-10
资源大小:6948k
文件大小:7k
源码类别:

xml/soap/webservice

开发平台:

C/C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  * 
  4.  * Copyright (c) 1999-2000 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  * 
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  * 
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer. 
  13.  * 
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  * 
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:  
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  * 
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written 
  29.  *    permission, please contact apache@apache.org.
  30.  * 
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  * 
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  * 
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  *  $Id: XMLRecognizer.hpp,v 1.8 2000/08/30 22:21:28 andyh Exp $
  58.  */
  59. #if !defined(XMLRECOGNIZER_HPP)
  60. #define XMLRECOGNIZER_HPP
  61. /**
  62.  *  This class provides some simple code to recognize the encodings of
  63.  *  XML files. This recognition only does very basic sensing of the encoding
  64.  *  in a broad sense. Basically its just enough to let us get started and
  65.  *  read the XMLDecl line. The scanner, once it reads the XMLDecl, will
  66.  *  tell the reader any actual encoding string it found and the reader can
  67.  *  update itself to be more specific at that point.
  68.  */
  69. class XMLPARSER_EXPORT XMLRecognizer
  70. {
  71. public :
  72.     // -----------------------------------------------------------------------
  73.     //  Class types
  74.     //
  75.     //  This enum represents the various encoding families that we have to
  76.     //  deal with individually at the scanner level. This does not indicate
  77.     //  the exact encoding, just the rough family that would let us scan
  78.     //  the XML/TextDecl to find the encoding string.
  79.     //
  80.     //  The 'L's and 'B's stand for little or big endian. We conditionally
  81.     //  create versions that will automatically map to the local UTF-16 and
  82.     //  UCS-4 endian modes.
  83.     //
  84.     //  OtherEncoding means that its some transcoder based encoding, i.e. not
  85.     //  one of the ones that we do internally. Its a special case and should
  86.     //  never be used directly outside of the reader.
  87.     //
  88.     //  NOTE: Keep this in sync with the name map array in the Cpp file!!
  89.     // -----------------------------------------------------------------------
  90.     enum Encodings
  91.     {
  92.         EBCDIC          = 0
  93.         , UCS_4B        = 1
  94.         , UCS_4L        = 2
  95.         , US_ASCII      = 3
  96.         , UTF_8         = 4
  97.         , UTF_16B       = 5
  98.         , UTF_16L       = 6
  99.         , Encodings_Count
  100.         , Encodings_Min = EBCDIC
  101.         , Encodings_Max = UTF_16L
  102.         , OtherEncoding = 999
  103.         #if defined(ENDIANMODE_BIG)
  104.         , Def_UTF16     = UTF_16B
  105.         , Def_UCS4      = UCS_4B
  106.         #else
  107.         , Def_UTF16     = UTF_16L
  108.         , Def_UCS4      = UCS_4L
  109.         #endif
  110.     };
  111.     // -----------------------------------------------------------------------
  112.     //  Public, const static data
  113.     //
  114.     //  These are the byte sequences for each of the encodings that we can
  115.     //  auto sense, and their lengths.
  116.     // -----------------------------------------------------------------------
  117.     static const char           fgASCIIPre[];
  118.     static const unsigned int   fgASCIIPreLen;
  119.     static const XMLByte        fgEBCDICPre[];
  120.     static const unsigned int   fgEBCDICPreLen;
  121.     static const XMLByte        fgUTF16BPre[];
  122.     static const XMLByte        fgUTF16LPre[];
  123.     static const unsigned int   fgUTF16PreLen;
  124.     static const XMLByte        fgUCS4BPre[];
  125.     static const XMLByte        fgUCS4LPre[];
  126.     static const unsigned int   fgUCS4PreLen;
  127.     static const char           fgUTF8BOM[];
  128.     static const unsigned int   fgUTF8BOMLen;
  129.     // -----------------------------------------------------------------------
  130.     //  Encoding recognition methods
  131.     // -----------------------------------------------------------------------
  132.     static Encodings basicEncodingProbe
  133.     (
  134.         const   XMLByte* const      rawBuffer
  135.         , const unsigned int        rawByteCount
  136.     );
  137.     static Encodings encodingForName
  138.     (
  139.         const   XMLCh* const    theEncName
  140.     );
  141.     static const XMLCh* nameForEncoding(const Encodings theEncoding);
  142. protected :
  143.     // -----------------------------------------------------------------------
  144.     //  Unimplemented constructors, operators, and destructor
  145.     //
  146.     //  This class is effectively being used as a namespace for some static
  147.     //  methods.
  148.     //
  149.     //   (these functions are protected rather than private only to get rid of
  150.     //    some annoying compiler warnings.)
  151.     //
  152.     // -----------------------------------------------------------------------
  153.     XMLRecognizer();
  154.     ~XMLRecognizer();
  155.     void operator=(const XMLRecognizer&);
  156. };
  157. #endif