DeprecatedDOMCount.cpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:13k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Id: DeprecatedDOMCount.cpp,v 1.5 2002/11/04 14:09:27 tng Exp $
  58.  */
  59. // ---------------------------------------------------------------------------
  60. //  Includes
  61. // ---------------------------------------------------------------------------
  62. #include <xercesc/util/PlatformUtils.hpp>
  63. #include <xercesc/sax/SAXException.hpp>
  64. #include <xercesc/sax/SAXParseException.hpp>
  65. #include <xercesc/dom/deprecated/DOMParser.hpp>
  66. #include <xercesc/dom/deprecated/DOM_DOMException.hpp>
  67. #include "DeprecatedDOMCount.hpp"
  68. #include <string.h>
  69. #include <stdlib.h>
  70. #include <fstream.h>
  71. // ---------------------------------------------------------------------------
  72. //  This is a simple program which invokes the DOMParser to build a DOM
  73. //  tree for the specified input file. It then walks the tree and counts
  74. //  the number of elements. The element count is then printed.
  75. // ---------------------------------------------------------------------------
  76. void usage()
  77. {
  78.     cout << "nUsage:n"
  79.             "    DeprecatedDOMCount [options] <XML file | List file>nn"
  80.             "This program invokes the DOM parser, builds the DOM tree,n"
  81.             "and then prints the number of elements found in each XML file.nn"
  82.             "Options:n"
  83.             "    -l          Indicate the input file is a List File that has a list of xml files.n"
  84.             "                Default to off (Input file is an XML file).n"
  85.             "    -v=xxx      Validation scheme [always | never | auto*].n"
  86.             "    -n          Enable namespace processing. Defaults to off.n"
  87.             "    -s          Enable schema processing. Defaults to off.n"
  88.             "    -f          Enable full schema constraint checking. Defaults to off.n"
  89.       "    -?          Show this help.nn"
  90.             "  * = Default if not provided explicitly.n"
  91.          << endl;
  92. }
  93. int main(int argC, char* argV[])
  94. {
  95.     // Initialize the XML4C system
  96.     try
  97.     {
  98.         XMLPlatformUtils::Initialize();
  99.     }
  100.     catch (const XMLException& toCatch)
  101.     {
  102.          cerr << "Error during initialization! :n"
  103.               << StrX(toCatch.getMessage()) << endl;
  104.          return 1;
  105.     }
  106.     // Check command line and extract arguments.
  107.     if (argC < 2)
  108.     {
  109.         usage();
  110.         XMLPlatformUtils::Terminate();
  111.         return 1;
  112.     }
  113.     const char*              xmlFile = 0;
  114.     DOMParser::ValSchemes    valScheme = DOMParser::Val_Auto;
  115.     bool                     doNamespaces       = false;
  116.     bool                     doSchema           = false;
  117.     bool                     schemaFullChecking = false;
  118.     bool                     doList = false;
  119.     bool                     errorOccurred = false;
  120.     int argInd;
  121.     for (argInd = 1; argInd < argC; argInd++)
  122.     {
  123.         // Break out on first parm not starting with a dash
  124.         if (argV[argInd][0] != '-')
  125.             break;
  126.         // Watch for special case help request
  127.         if (!strcmp(argV[argInd], "-?"))
  128.         {
  129.             usage();
  130.             XMLPlatformUtils::Terminate();
  131.             return 2;
  132.         }
  133.          else if (!strncmp(argV[argInd], "-v=", 3)
  134.               ||  !strncmp(argV[argInd], "-V=", 3))
  135.         {
  136.             const char* const parm = &argV[argInd][3];
  137.             if (!strcmp(parm, "never"))
  138.                 valScheme = DOMParser::Val_Never;
  139.             else if (!strcmp(parm, "auto"))
  140.                 valScheme = DOMParser::Val_Auto;
  141.             else if (!strcmp(parm, "always"))
  142.                 valScheme = DOMParser::Val_Always;
  143.             else
  144.             {
  145.                 cerr << "Unknown -v= value: " << parm << endl;
  146.                 return 2;
  147.             }
  148.         }
  149.          else if (!strcmp(argV[argInd], "-n")
  150.               ||  !strcmp(argV[argInd], "-N"))
  151.         {
  152.             doNamespaces = true;
  153.         }
  154.          else if (!strcmp(argV[argInd], "-s")
  155.               ||  !strcmp(argV[argInd], "-S"))
  156.         {
  157.             doSchema = true;
  158.         }
  159.          else if (!strcmp(argV[argInd], "-f")
  160.               ||  !strcmp(argV[argInd], "-F"))
  161.         {
  162.             schemaFullChecking = true;
  163.         }
  164.          else if (!strcmp(argV[argInd], "-l")
  165.               ||  !strcmp(argV[argInd], "-L"))
  166.         {
  167.             doList = true;
  168.         }
  169.          else if (!strcmp(argV[argInd], "-special:nel"))
  170.         {
  171.             // turning this on will lead to non-standard compliance behaviour
  172.             // it will recognize the unicode character 0x85 as new line character
  173.             // instead of regular character as specified in XML 1.0
  174.             // do not turn this on unless really necessary
  175.             XMLPlatformUtils::recognizeNEL(true);
  176.         }
  177.          else
  178.         {
  179.             cerr << "Unknown option '" << argV[argInd]
  180.                  << "', ignoring itn" << endl;
  181.         }
  182.     }
  183.     //
  184.     //  There should be only one and only one parameter left, and that
  185.     //  should be the file name.
  186.     //
  187.     if (argInd != argC - 1)
  188.     {
  189.         usage();
  190.         return 1;
  191.     }
  192.     // Instantiate the DOM parser.
  193.     DOMParser* parser = new DOMParser;
  194.     parser->setValidationScheme(valScheme);
  195.     parser->setDoNamespaces(doNamespaces);
  196.     parser->setDoSchema(doSchema);
  197.     parser->setValidationSchemaFullChecking(schemaFullChecking);
  198.     // And create our error handler and install it
  199.     DeprecatedDOMCountErrorHandler errorHandler;
  200.     parser->setErrorHandler(&errorHandler);
  201.     //
  202.     //  Get the starting time and kick off the parse of the indicated
  203.     //  file. Catch any exceptions that might propogate out of it.
  204.     //
  205.     unsigned long duration;
  206.     bool more = true;
  207.     ifstream fin;
  208.     // the input is a list file
  209.     if (doList)
  210.         fin.open(argV[argInd]);
  211.     if (fin.fail()) {
  212.         cerr <<"Cannot open the list file: " << argV[argInd] << endl;
  213.         return 2;
  214.     }
  215.     while (more)
  216.     {
  217.         char fURI[1000];
  218.         //initialize the array to zeros
  219.         memset(fURI,0,sizeof(fURI));
  220.         if (doList) {
  221.             if (! fin.eof() ) {
  222.                 fin.getline (fURI, sizeof(fURI));
  223.                 if (!*fURI)
  224.                     continue;
  225.                 else {
  226.                     xmlFile = fURI;
  227.                     cerr << "==Parsing== " << xmlFile << endl;
  228.                 }
  229.             }
  230.             else
  231.                 break;
  232.         }
  233.         else {
  234.             xmlFile = argV[argInd];
  235.             more = false;
  236.         }
  237.         //reset error count first
  238.         errorHandler.resetErrors();
  239.         try
  240.         {
  241.             const unsigned long startMillis = XMLPlatformUtils::getCurrentMillis();
  242.             parser->parse(xmlFile);
  243.             const unsigned long endMillis = XMLPlatformUtils::getCurrentMillis();
  244.             duration = endMillis - startMillis;
  245.         }
  246.         catch (const XMLException& toCatch)
  247.         {
  248.             cerr << "nError during parsing: '" << xmlFile << "'n"
  249.                  << "Exception message is:  n"
  250.                  << StrX(toCatch.getMessage()) << "n" << endl;
  251.             errorOccurred = true;
  252.             continue;
  253.         }
  254.         catch (const DOM_DOMException& toCatch)
  255.         {
  256.             cerr << "nDOM Error during parsing: '" << xmlFile << "'n"
  257.                  << "DOMException code is:  n"
  258.                  << toCatch.code << "n" << endl;
  259.             errorOccurred = true;
  260.             continue;
  261.         }
  262.         catch (...)
  263.         {
  264.             cerr << "nUnexpected exception during parsing: '" << xmlFile << "'n";
  265.             errorOccurred = true;
  266.             continue;
  267.         }
  268.         //
  269.         //  Extract the DOM tree, get the list of all the elements and report the
  270.         //  length as the count of elements.
  271.         //
  272.         if (errorHandler.getSawErrors())
  273.         {
  274.             cout << "nErrors occurred, no output availablen" << endl;
  275.             errorOccurred = true;
  276.         }
  277.          else
  278.         {
  279.             DOM_Document doc = parser->getDocument();
  280.             unsigned int elementCount = doc.getElementsByTagName("*").getLength();
  281.             // Print out the stats that we collected and time taken.
  282.             cout << xmlFile << ": " << duration << " ms ("
  283.                  << elementCount << " elems)." << endl;
  284.         }
  285.     }
  286.     if (doList)
  287.         fin.close();
  288.     //
  289.     //  Delete the parser itself.  Must be done prior to calling Terminate, below.
  290.     //
  291.     delete parser;
  292.     // And call the termination method
  293.     XMLPlatformUtils::Terminate();
  294.     if (errorOccurred)
  295.         return 4;
  296.     else
  297.         return 0;
  298. }
  299. DeprecatedDOMCountErrorHandler::DeprecatedDOMCountErrorHandler() :
  300.     fSawErrors(false)
  301. {
  302. }
  303. DeprecatedDOMCountErrorHandler::~DeprecatedDOMCountErrorHandler()
  304. {
  305. }
  306. // ---------------------------------------------------------------------------
  307. //  DeprecatedDOMCountHandlers: Overrides of the SAX ErrorHandler interface
  308. // ---------------------------------------------------------------------------
  309. void DeprecatedDOMCountErrorHandler::error(const SAXParseException& e)
  310. {
  311.     fSawErrors = true;
  312.     cerr << "nError at file " << StrX(e.getSystemId())
  313.          << ", line " << e.getLineNumber()
  314.          << ", char " << e.getColumnNumber()
  315.          << "n  Message: " << StrX(e.getMessage()) << endl;
  316. }
  317. void DeprecatedDOMCountErrorHandler::fatalError(const SAXParseException& e)
  318. {
  319.     fSawErrors = true;
  320.     cerr << "nFatal Error at file " << StrX(e.getSystemId())
  321.          << ", line " << e.getLineNumber()
  322.          << ", char " << e.getColumnNumber()
  323.          << "n  Message: " << StrX(e.getMessage()) << endl;
  324. }
  325. void DeprecatedDOMCountErrorHandler::warning(const SAXParseException& e)
  326. {
  327.     cerr << "nWarning at file " << StrX(e.getSystemId())
  328.          << ", line " << e.getLineNumber()
  329.          << ", char " << e.getColumnNumber()
  330.          << "n  Message: " << StrX(e.getMessage()) << endl;
  331. }
  332. void DeprecatedDOMCountErrorHandler::resetErrors()
  333. {
  334.     fSawErrors = false;
  335. }