SAX2Print.cpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:13k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: SAX2Print.cpp,v $
  58.  * Revision 1.12  2002/06/17 15:33:00  tng
  59.  * Name Xerces features as XMLUni::fgXercesXXXX instead of XMLUni::fgSAX2XercesXXXX so that they can be shared with DOM parser.
  60.  *
  61.  * Revision 1.11  2002/05/28 20:20:26  tng
  62.  * Add option '-n' to SAX2Print.
  63.  *
  64.  * Revision 1.10  2002/04/17 20:18:08  tng
  65.  * [Bug 7493] The word "occured" is misspelled and it is a global error.
  66.  *
  67.  * Revision 1.9  2002/02/13 16:11:06  knoaman
  68.  * Update samples to use SAX2 features/properties constants from XMLUni.
  69.  *
  70.  * Revision 1.8  2002/02/06 16:36:51  knoaman
  71.  * Added a new flag '-p' to SAX2 samples to set the 'namespace-prefixes' feature.
  72.  *
  73.  * Revision 1.7  2002/02/01 22:40:44  peiyongz
  74.  * sane_include
  75.  *
  76.  * Revision 1.6  2001/10/25 15:18:33  tng
  77.  * delete the parser before XMLPlatformUtils::Terminate.
  78.  *
  79.  * Revision 1.5  2001/10/19 19:02:43  tng
  80.  * [Bug 3909] return non-zero an exit code when error was encounted.
  81.  * And other modification for consistent help display and return code across samples.
  82.  *
  83.  * Revision 1.4  2001/08/02 17:10:29  tng
  84.  * Allow DOMCount/SAXCount/IDOMCount/SAX2Count to take a file that has a list of xml file as input.
  85.  *
  86.  * Revision 1.3  2001/08/01 19:11:01  tng
  87.  * Add full schema constraint checking flag to the samples and the parser.
  88.  *
  89.  * Revision 1.2  2000/08/09 22:20:38  jpolast
  90.  * updates for changes to sax2 core functionality.
  91.  *
  92.  * Revision 1.1  2000/08/02 19:16:14  jpolast
  93.  * initial checkin of SAX2Print
  94.  *
  95.  *
  96.  */
  97. // ---------------------------------------------------------------------------
  98. //  Includes
  99. // ---------------------------------------------------------------------------
  100. #include <xercesc/util/PlatformUtils.hpp>
  101. #include <xercesc/util/TransService.hpp>
  102. #include <xercesc/sax2/SAX2XMLReader.hpp>
  103. #include <xercesc/sax2/XMLReaderFactory.hpp>
  104. #include "SAX2Print.hpp"
  105. // ---------------------------------------------------------------------------
  106. //  Local data
  107. //
  108. //  encodingName
  109. //      The encoding we are to output in. If not set on the command line,
  110. //      then it is defaulted to LATIN1.
  111. //
  112. //  xmlFile
  113. //      The path to the file to parser. Set via command line.
  114. //
  115. //  valScheme
  116. //      Indicates what validation scheme to use. It defaults to 'auto', but
  117. //      can be set via the -v= command.
  118. //
  119. // expandNamespaces
  120. // Indicates if the output should expand the namespaces Alias with
  121. // their URI's, defaults to false, can be set via the command line -e
  122. // ---------------------------------------------------------------------------
  123. static const char*              encodingName    = "LATIN1";
  124. static XMLFormatter::UnRepFlags unRepFlags      = XMLFormatter::UnRep_CharRef;
  125. static char*                    xmlFile         = 0;
  126. static SAX2XMLReader::ValSchemes valScheme      = SAX2XMLReader::Val_Auto;
  127. static bool         expandNamespaces= false ;
  128. static bool                     doNamespaces    = true;
  129. static bool                     doSchema        = true;
  130. static bool                     schemaFullChecking = false;
  131. static bool                     namespacePrefixes = false;
  132. // ---------------------------------------------------------------------------
  133. //  Local helper methods
  134. // ---------------------------------------------------------------------------
  135. static void usage()
  136. {
  137.     cout << "nUsage:n"
  138.             "    SAX2Print [options] <XML file>nn"
  139.             "This program invokes the SAX2XMLReader, and then prints then"
  140.             "data returned by the various SAX2 handlers for the specifiedn"
  141.             "XML file.nn"
  142.             "Options:n"
  143.              "    -u=xxx      Handle unrepresentable chars [fail | rep | ref*].n"
  144.              "    -v=xxx      Validation scheme [always | never | auto*].n"
  145.              "    -e          Expand Namespace Alias with URI's. Defaults to off.n"
  146.              "    -x=XXX      Use a particular encoding for output (LATIN1*).n"
  147.              "    -f          Enable full schema constraint checking processing. Defaults to off.n"
  148.              "    -p          Enable namespace-prefixes feature. Defaults to off.n"
  149.              "    -n          Disable namespace processing. Defaults to on.n"
  150.              "                NOTE: THIS IS OPPOSITE FROM OTHER SAMPLES.n"
  151.              "    -s          Disable schema processing. Defaults to on.n"
  152.              "                NOTE: THIS IS OPPOSITE FROM OTHER SAMPLES.n"
  153.              "    -?          Show this help.nn"
  154.              "  * = Default if not provided explicitly.nn"
  155.              "The parser has intrinsic support for the following encodings:n"
  156.              "    UTF-8, USASCII, ISO8859-1, UTF-16[BL]E, UCS-4[BL]E,n"
  157.              "    WINDOWS-1252, IBM1140, IBM037.n"
  158.          <<  endl;
  159. }
  160. // ---------------------------------------------------------------------------
  161. //  Program entry point
  162. // ---------------------------------------------------------------------------
  163. int main(int argC, char* argV[])
  164. {
  165.     // Initialize the XML4C2 system
  166.     try
  167.     {
  168.          XMLPlatformUtils::Initialize();
  169.     }
  170.     catch (const XMLException& toCatch)
  171.     {
  172.          cerr << "Error during initialization! :n"
  173.               << StrX(toCatch.getMessage()) << endl;
  174.          return 1;
  175.     }
  176.     // Check command line and extract arguments.
  177.     if (argC < 2)
  178.     {
  179.         usage();
  180.         XMLPlatformUtils::Terminate();
  181.         return 1;
  182.     }
  183.     int parmInd;
  184.     for (parmInd = 1; parmInd < argC; parmInd++)
  185.     {
  186.         // Break out on first parm not starting with a dash
  187.         if (argV[parmInd][0] != '-')
  188.             break;
  189.         // Watch for special case help request
  190.         if (!strcmp(argV[parmInd], "-?"))
  191.         {
  192.             usage();
  193.             XMLPlatformUtils::Terminate();
  194.             return 2;
  195.         }
  196.          else if (!strncmp(argV[parmInd], "-v=", 3)
  197.               ||  !strncmp(argV[parmInd], "-V=", 3))
  198.         {
  199.             const char* const parm = &argV[parmInd][3];
  200.             if (!strcmp(parm, "never"))
  201.                 valScheme = SAX2XMLReader::Val_Never;
  202.             else if (!strcmp(parm, "auto"))
  203.                 valScheme = SAX2XMLReader::Val_Auto;
  204.             else if (!strcmp(parm, "always"))
  205.                 valScheme = SAX2XMLReader::Val_Always;
  206.             else
  207.             {
  208.                 cerr << "Unknown -v= value: " << parm << endl;
  209.                 XMLPlatformUtils::Terminate();
  210.                 return 2;
  211.             }
  212.         }
  213.          else if (!strcmp(argV[parmInd], "-e")
  214.               ||  !strcmp(argV[parmInd], "-E"))
  215.         {
  216.             expandNamespaces = true;
  217.         }
  218.          else if (!strncmp(argV[parmInd], "-x=", 3)
  219.               ||  !strncmp(argV[parmInd], "-X=", 3))
  220.         {
  221.             // Get out the encoding name
  222.             encodingName = &argV[parmInd][3];
  223.         }
  224.          else if (!strncmp(argV[parmInd], "-u=", 3)
  225.               ||  !strncmp(argV[parmInd], "-U=", 3))
  226.         {
  227.             const char* const parm = &argV[parmInd][3];
  228.             if (!strcmp(parm, "fail"))
  229.                 unRepFlags = XMLFormatter::UnRep_Fail;
  230.             else if (!strcmp(parm, "rep"))
  231.                 unRepFlags = XMLFormatter::UnRep_Replace;
  232.             else if (!strcmp(parm, "ref"))
  233.                 unRepFlags = XMLFormatter::UnRep_CharRef;
  234.             else
  235.             {
  236.                 cerr << "Unknown -u= value: " << parm << endl;
  237.                 XMLPlatformUtils::Terminate();
  238.                 return 2;
  239.             }
  240.         }
  241.          else if (!strcmp(argV[parmInd], "-n")
  242.               ||  !strcmp(argV[parmInd], "-N"))
  243.         {
  244.             doNamespaces = false;
  245.         }
  246.          else if (!strcmp(argV[parmInd], "-s")
  247.               ||  !strcmp(argV[parmInd], "-S"))
  248.         {
  249.             doSchema = false;
  250.         }
  251.          else if (!strcmp(argV[parmInd], "-f")
  252.               ||  !strcmp(argV[parmInd], "-F"))
  253.         {
  254.             schemaFullChecking = true;
  255.         }
  256.          else if (!strcmp(argV[parmInd], "-p")
  257.               ||  !strcmp(argV[parmInd], "-P"))
  258.         {
  259.             namespacePrefixes = true;
  260.         }
  261.          else
  262.         {
  263.             cerr << "Unknown option '" << argV[parmInd]
  264.                  << "', ignoring itn" << endl;
  265.         }
  266.     }
  267.     //
  268.     //  And now we have to have only one parameter left and it must be
  269.     //  the file name.
  270.     //
  271.     if (parmInd + 1 != argC)
  272.     {
  273.         usage();
  274.         XMLPlatformUtils::Terminate();
  275.         return 1;
  276.     }
  277.     xmlFile = argV[parmInd];
  278.     //
  279.     //  Create a SAX parser object. Then, according to what we were told on
  280.     //  the command line, set it to validate or not.
  281.     //
  282.     SAX2XMLReader* parser = XMLReaderFactory::createXMLReader();
  283.     //
  284.     //  Then, according to what we were told on
  285.     //  the command line, set it to validate or not.
  286.     //
  287.     if (valScheme == SAX2XMLReader::Val_Auto)
  288.     {
  289.         parser->setFeature(XMLUni::fgSAX2CoreValidation, true);
  290.         parser->setFeature(XMLUni::fgXercesDynamic, true);
  291.     }
  292.     if (valScheme == SAX2XMLReader::Val_Never)
  293.     {
  294.         parser->setFeature(XMLUni::fgSAX2CoreValidation, false);
  295.     }
  296.     if (valScheme == SAX2XMLReader::Val_Always)
  297.     {
  298.         parser->setFeature(XMLUni::fgSAX2CoreValidation, true);
  299.         parser->setFeature(XMLUni::fgXercesDynamic, false);
  300.     }
  301.     parser->setFeature(XMLUni::fgSAX2CoreNameSpaces, doNamespaces);
  302.     parser->setFeature(XMLUni::fgXercesSchema, doSchema);
  303.     parser->setFeature(XMLUni::fgXercesSchemaFullChecking, schemaFullChecking);
  304.     parser->setFeature(XMLUni::fgSAX2CoreNameSpacePrefixes, namespacePrefixes);
  305.     //
  306.     //  Create the handler object and install it as the document and error
  307.     //  handler for the parser. Then parse the file and catch any exceptions
  308.     //  that propogate out
  309.     //
  310.     int errorCount = 0;
  311.     try
  312.     {
  313.         SAX2PrintHandlers handler(encodingName, unRepFlags, expandNamespaces);
  314.         parser->setContentHandler(&handler);
  315.         parser->setErrorHandler(&handler);
  316.         parser->parse(xmlFile);
  317.         errorCount = parser->getErrorCount();
  318.     }
  319.     catch (const XMLException& toCatch)
  320.     {
  321.         cerr << "nAn error occurredn  Error: "
  322.              << StrX(toCatch.getMessage())
  323.              << "n" << endl;
  324.         XMLPlatformUtils::Terminate();
  325.         return 4;
  326.     }
  327.     //
  328.     //  Delete the parser itself.  Must be done prior to calling Terminate, below.
  329.     //
  330.     delete parser;
  331.     // And call the termination method
  332.     XMLPlatformUtils::Terminate();
  333.     if (errorCount > 0)
  334.         return 4;
  335.     else
  336.         return 0;
  337. }