SAXPrint.cpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:13k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: SAXPrint.cpp,v $
  58.  * Revision 1.20  2002/04/17 20:18:08  tng
  59.  * [Bug 7493] The word "occured" is misspelled and it is a global error.
  60.  *
  61.  * Revision 1.19  2002/02/01 22:41:17  peiyongz
  62.  * sane_include
  63.  *
  64.  * Revision 1.18  2001/10/29 17:02:57  tng
  65.  * Fix typo in samples.
  66.  *
  67.  * Revision 1.17  2001/10/25 15:18:33  tng
  68.  * delete the parser before XMLPlatformUtils::Terminate.
  69.  *
  70.  * Revision 1.16  2001/10/19 19:02:43  tng
  71.  * [Bug 3909] return non-zero an exit code when error was encounted.
  72.  * And other modification for consistent help display and return code across samples.
  73.  *
  74.  * Revision 1.15  2001/08/01 19:11:01  tng
  75.  * Add full schema constraint checking flag to the samples and the parser.
  76.  *
  77.  * Revision 1.14  2001/05/11 13:24:58  tng
  78.  * Copyright update.
  79.  *
  80.  * Revision 1.13  2001/05/03 16:00:21  tng
  81.  * Schema: samples update with schema
  82.  *
  83.  * Revision 1.12  2000/06/16 20:25:43  rahulj
  84.  * Add the -v=always option to force validation checking. Need this
  85.  * option for running the conformance tests.
  86.  *
  87.  * Revision 1.11  2000/05/31 18:36:26  rahulj
  88.  * Matched the command line options supported by DOMPrint.
  89.  *
  90.  * Revision 1.10  2000/04/12 22:58:27  roddey
  91.  * Added support for 'auto validate' mode.
  92.  *
  93.  * Revision 1.9  2000/04/06 19:09:51  roddey
  94.  * Some more improvements to output formatting. Now it will correctly
  95.  * handle doing the 'replacement char' style of dealing with chars
  96.  * that are unrepresentable.
  97.  *
  98.  * Revision 1.8  2000/04/05 00:20:32  roddey
  99.  * More updates for the low level formatted output support
  100.  *
  101.  * Revision 1.7  2000/03/28 19:43:11  roddey
  102.  * Fixes for signed/unsigned warnings. New work for two way transcoding
  103.  * stuff.
  104.  *
  105.  * Revision 1.6  2000/03/03 01:29:31  roddey
  106.  * Added a scanReset()/parseReset() method to the scanner and
  107.  * parsers, to allow for reset after early exit from a progressive parse.
  108.  * Added calls to new Terminate() call to all of the samples. Improved
  109.  * documentation in SAX and DOM parsers.
  110.  *
  111.  * Revision 1.5  2000/03/02 19:53:49  roddey
  112.  * This checkin includes many changes done while waiting for the
  113.  * 1.1.0 code to be finished. I can't list them all here, but a list is
  114.  * available elsewhere.
  115.  *
  116.  * Revision 1.4  2000/02/11 02:39:43  abagchi
  117.  * Removed StrX::transcode
  118.  *
  119.  * Revision 1.3  2000/02/06 07:47:24  rahulj
  120.  * Year 2K copyright swat.
  121.  *
  122.  * Revision 1.2  2000/01/12 00:27:01  roddey
  123.  * Updates to work with the new URL and input source scheme.
  124.  *
  125.  * Revision 1.1.1.1  1999/11/09 01:09:28  twl
  126.  * Initial checkin
  127.  *
  128.  * Revision 1.7  1999/11/08 20:43:41  rahul
  129.  * Swat for adding in Product name and CVS comment log variable.
  130.  *
  131.  */
  132. // ---------------------------------------------------------------------------
  133. //  Includes
  134. // ---------------------------------------------------------------------------
  135. #include <xercesc/util/PlatformUtils.hpp>
  136. #include <xercesc/util/TransService.hpp>
  137. #include <xercesc/parsers/SAXParser.hpp>
  138. #include "SAXPrint.hpp"
  139. // ---------------------------------------------------------------------------
  140. //  Local data
  141. //
  142. //  doNamespaces
  143. //      Indicates whether namespace processing should be enabled or not.
  144. //      Defaults to disabled.
  145. //
  146. //  doSchema
  147. //      Indicates whether schema processing should be enabled or not.
  148. //      Defaults to disabled.
  149. //
  150. //  schemaFullChecking
  151. //      Indicates whether full schema constraint checking should be enabled or not.
  152. //      Defaults to disabled.
  153. //
  154. //  encodingName
  155. //      The encoding we are to output in. If not set on the command line,
  156. //      then it is defaulted to LATIN1.
  157. //
  158. //  xmlFile
  159. //      The path to the file to parser. Set via command line.
  160. //
  161. //  valScheme
  162. //      Indicates what validation scheme to use. It defaults to 'auto', but
  163. //      can be set via the -v= command.
  164. // ---------------------------------------------------------------------------
  165. static bool                     doNamespaces        = false;
  166. static bool                     doSchema            = false;
  167. static bool                     schemaFullChecking  = false;
  168. static const char*              encodingName    = "LATIN1";
  169. static XMLFormatter::UnRepFlags unRepFlags      = XMLFormatter::UnRep_CharRef;
  170. static char*                    xmlFile         = 0;
  171. static SAXParser::ValSchemes    valScheme       = SAXParser::Val_Auto;
  172. // ---------------------------------------------------------------------------
  173. //  Local helper methods
  174. // ---------------------------------------------------------------------------
  175. static void usage()
  176. {
  177.     cout << "nUsage:n"
  178.             "    SAXPrint [options] <XML file>nn"
  179.             "This program invokes the SAX Parser, and then prints then"
  180.             "data returned by the various SAX handlers for the specifiedn"
  181.             "XML file.nn"
  182.             "Options:n"
  183.              "    -u=xxx      Handle unrepresentable chars [fail | rep | ref*].n"
  184.              "    -v=xxx      Validation scheme [always | never | auto*].n"
  185.              "    -n          Enable namespace processing.n"
  186.              "    -s          Enable schema processing.n"
  187.              "    -f          Enable full schema constraint checking.n"
  188.              "    -x=XXX      Use a particular encoding for output (LATIN1*).n"
  189.              "    -?          Show this help.nn"
  190.              "  * = Default if not provided explicitly.nn"
  191.              "The parser has intrinsic support for the following encodings:n"
  192.              "    UTF-8, USASCII, ISO8859-1, UTF-16[BL]E, UCS-4[BL]E,n"
  193.              "    WINDOWS-1252, IBM1140, IBM037.n"
  194.          <<  endl;
  195. }
  196. // ---------------------------------------------------------------------------
  197. //  Program entry point
  198. // ---------------------------------------------------------------------------
  199. int main(int argC, char* argV[])
  200. {
  201.     // Initialize the XML4C2 system
  202.     try
  203.     {
  204.          XMLPlatformUtils::Initialize();
  205.     }
  206.     catch (const XMLException& toCatch)
  207.     {
  208.          cerr << "Error during initialization! :n"
  209.               << StrX(toCatch.getMessage()) << endl;
  210.          return 1;
  211.     }
  212.     // Check command line and extract arguments.
  213.     if (argC < 2)
  214.     {
  215.         usage();
  216.         XMLPlatformUtils::Terminate();
  217.         return 1;
  218.     }
  219.     int parmInd;
  220.     for (parmInd = 1; parmInd < argC; parmInd++)
  221.     {
  222.         // Break out on first parm not starting with a dash
  223.         if (argV[parmInd][0] != '-')
  224.             break;
  225.         // Watch for special case help request
  226.         if (!strcmp(argV[parmInd], "-?"))
  227.         {
  228.             usage();
  229.             XMLPlatformUtils::Terminate();
  230.             return 2;
  231.         }
  232.          else if (!strncmp(argV[parmInd], "-v=", 3)
  233.               ||  !strncmp(argV[parmInd], "-V=", 3))
  234.         {
  235.             const char* const parm = &argV[parmInd][3];
  236.             if (!strcmp(parm, "never"))
  237.                 valScheme = SAXParser::Val_Never;
  238.             else if (!strcmp(parm, "auto"))
  239.                 valScheme = SAXParser::Val_Auto;
  240.             else if (!strcmp(parm, "always"))
  241.                 valScheme = SAXParser::Val_Always;
  242.             else
  243.             {
  244.                 cerr << "Unknown -v= value: " << parm << endl;
  245.                 XMLPlatformUtils::Terminate();
  246.                 return 2;
  247.             }
  248.         }
  249.          else if (!strcmp(argV[parmInd], "-n")
  250.               ||  !strcmp(argV[parmInd], "-N"))
  251.         {
  252.             doNamespaces = true;
  253.         }
  254.          else if (!strcmp(argV[parmInd], "-s")
  255.               ||  !strcmp(argV[parmInd], "-S"))
  256.         {
  257.             doSchema = true;
  258.         }
  259.          else if (!strcmp(argV[parmInd], "-f")
  260.               ||  !strcmp(argV[parmInd], "-F"))
  261.         {
  262.             schemaFullChecking = true;
  263.         }
  264.          else if (!strncmp(argV[parmInd], "-x=", 3)
  265.               ||  !strncmp(argV[parmInd], "-X=", 3))
  266.         {
  267.             // Get out the encoding name
  268.             encodingName = &argV[parmInd][3];
  269.         }
  270.          else if (!strncmp(argV[parmInd], "-u=", 3)
  271.               ||  !strncmp(argV[parmInd], "-U=", 3))
  272.         {
  273.             const char* const parm = &argV[parmInd][3];
  274.             if (!strcmp(parm, "fail"))
  275.                 unRepFlags = XMLFormatter::UnRep_Fail;
  276.             else if (!strcmp(parm, "rep"))
  277.                 unRepFlags = XMLFormatter::UnRep_Replace;
  278.             else if (!strcmp(parm, "ref"))
  279.                 unRepFlags = XMLFormatter::UnRep_CharRef;
  280.             else
  281.             {
  282.                 cerr << "Unknown -u= value: " << parm << endl;
  283.                 XMLPlatformUtils::Terminate();
  284.                 return 2;
  285.             }
  286.         }
  287.          else
  288.         {
  289.             cerr << "Unknown option '" << argV[parmInd]
  290.                  << "', ignoring itn" << endl;
  291.         }
  292.     }
  293.     //
  294.     //  And now we have to have only one parameter left and it must be
  295.     //  the file name.
  296.     //
  297.     if (parmInd + 1 != argC)
  298.     {
  299.         usage();
  300.         XMLPlatformUtils::Terminate();
  301.         return 1;
  302.     }
  303.     xmlFile = argV[parmInd];
  304.     int errorCount = 0;
  305.     //
  306.     //  Create a SAX parser object. Then, according to what we were told on
  307.     //  the command line, set it to validate or not.
  308.     //
  309.     SAXParser* parser = new SAXParser;
  310.     parser->setValidationScheme(valScheme);
  311.     parser->setDoNamespaces(doNamespaces);
  312.     parser->setDoSchema(doSchema);
  313.     parser->setValidationSchemaFullChecking(schemaFullChecking);
  314.     //
  315.     //  Create the handler object and install it as the document and error
  316.     //  handler for the parser-> Then parse the file and catch any exceptions
  317.     //  that propogate out
  318.     //
  319.     try
  320.     {
  321.         SAXPrintHandlers handler(encodingName, unRepFlags);
  322.         parser->setDocumentHandler(&handler);
  323.         parser->setErrorHandler(&handler);
  324.         parser->parse(xmlFile);
  325.         errorCount = parser->getErrorCount();
  326.     }
  327.     catch (const XMLException& toCatch)
  328.     {
  329.         cerr << "nAn error occurredn  Error: "
  330.              << StrX(toCatch.getMessage())
  331.              << "n" << endl;
  332.         XMLPlatformUtils::Terminate();
  333.         return -1;
  334.     }
  335.     //
  336.     //  Delete the parser itself.  Must be done prior to calling Terminate, below.
  337.     //
  338.     delete parser;
  339.     // And call the termination method
  340.     XMLPlatformUtils::Terminate();
  341.     if (errorCount > 0)
  342.         return 4;
  343.     else
  344.         return 0;
  345. }