DOMCount.cpp
上传用户:huihehuasu
上传日期:2007-01-10
资源大小:6948k
文件大小:12k
源码类别:

xml/soap/webservice

开发平台:

C/C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Id: DOMCount.cpp,v 1.21 2001/10/29 17:02:57 tng Exp $
  58.  */
  59. // ---------------------------------------------------------------------------
  60. //  Includes
  61. // ---------------------------------------------------------------------------
  62. #include <util/PlatformUtils.hpp>
  63. #include <sax/SAXException.hpp>
  64. #include <sax/SAXParseException.hpp>
  65. #include <parsers/DOMParser.hpp>
  66. #include <dom/DOM_DOMException.hpp>
  67. #include "DOMCount.hpp"
  68. #include <string.h>
  69. #include <stdlib.h>
  70. #include <fstream.h>
  71. // ---------------------------------------------------------------------------
  72. //  This is a simple program which invokes the DOMParser to build a DOM
  73. //  tree for the specified input file. It then walks the tree and counts
  74. //  the number of elements. The element count is then printed.
  75. // ---------------------------------------------------------------------------
  76. void usage()
  77. {
  78.     cout << "nUsage:n"
  79.             "    DOMCount [options] <XML file | List file>nn"
  80.             "This program invokes the DOM parser, builds the DOM tree,n"
  81.             "and then prints the number of elements found in each XML file.nn"
  82.             "Options:n"
  83.             "    -l          Indicate the input file is a List File that has a list of xml files.n"
  84.             "                Default to off (Input file is an XML file).n"
  85.             "    -v=xxx      Validation scheme [always | never | auto*].n"
  86.             "    -n          Enable namespace processing. Defaults to off.n"
  87.             "    -s          Enable schema processing. Defaults to off.n"
  88.             "    -f          Enable full schema constraint checking. Defaults to off.n"
  89.       "    -?          Show this help.nn"
  90.             "  * = Default if not provided explicitly.n"
  91.          << endl;
  92. }
  93. int main(int argC, char* argV[])
  94. {
  95.     // Initialize the XML4C system
  96.     try
  97.     {
  98.         XMLPlatformUtils::Initialize();
  99.     }
  100.     catch (const XMLException& toCatch)
  101.     {
  102.          cerr << "Error during initialization! :n"
  103.               << StrX(toCatch.getMessage()) << endl;
  104.          return 1;
  105.     }
  106.     // Check command line and extract arguments.
  107.     if (argC < 2)
  108.     {
  109.         usage();
  110.         XMLPlatformUtils::Terminate();
  111.         return 1;
  112.     }
  113.     const char*              xmlFile = 0;
  114.     DOMParser::ValSchemes    valScheme = DOMParser::Val_Auto;
  115.     bool                     doNamespaces       = false;
  116.     bool                     doSchema           = false;
  117.     bool                     schemaFullChecking = false;
  118.     bool                     doList = false;
  119.     bool                     errorOccurred = false;
  120.     int argInd;
  121.     for (argInd = 1; argInd < argC; argInd++)
  122.     {
  123.         // Break out on first parm not starting with a dash
  124.         if (argV[argInd][0] != '-')
  125.             break;
  126.         // Watch for special case help request
  127.         if (!strcmp(argV[argInd], "-?"))
  128.         {
  129.             usage();
  130.             XMLPlatformUtils::Terminate();
  131.             return 2;
  132.         }
  133.          else if (!strncmp(argV[argInd], "-v=", 3)
  134.               ||  !strncmp(argV[argInd], "-V=", 3))
  135.         {
  136.             const char* const parm = &argV[argInd][3];
  137.             if (!strcmp(parm, "never"))
  138.                 valScheme = DOMParser::Val_Never;
  139.             else if (!strcmp(parm, "auto"))
  140.                 valScheme = DOMParser::Val_Auto;
  141.             else if (!strcmp(parm, "always"))
  142.                 valScheme = DOMParser::Val_Always;
  143.             else
  144.             {
  145.                 cerr << "Unknown -v= value: " << parm << endl;
  146.                 return 2;
  147.             }
  148.         }
  149.          else if (!strcmp(argV[argInd], "-n")
  150.               ||  !strcmp(argV[argInd], "-N"))
  151.         {
  152.             doNamespaces = true;
  153.         }
  154.          else if (!strcmp(argV[argInd], "-s")
  155.               ||  !strcmp(argV[argInd], "-S"))
  156.         {
  157.             doSchema = true;
  158.         }
  159.          else if (!strcmp(argV[argInd], "-f")
  160.               ||  !strcmp(argV[argInd], "-F"))
  161.         {
  162.             schemaFullChecking = true;
  163.         }
  164.          else if (!strcmp(argV[argInd], "-l")
  165.               ||  !strcmp(argV[argInd], "-L"))
  166.         {
  167.             doList = true;
  168.         }
  169.          else
  170.         {
  171.             cerr << "Unknown option '" << argV[argInd]
  172.                  << "', ignoring itn" << endl;
  173.         }
  174.     }
  175.     //
  176.     //  There should be only one and only one parameter left, and that
  177.     //  should be the file name.
  178.     //
  179.     if (argInd != argC - 1)
  180.     {
  181.         usage();
  182.         return 1;
  183.     }
  184.     // Instantiate the DOM parser.
  185.     DOMParser* parser = new DOMParser;
  186.     parser->setValidationScheme(valScheme);
  187.     parser->setDoNamespaces(doNamespaces);
  188.     parser->setDoSchema(doSchema);
  189.     parser->setValidationSchemaFullChecking(schemaFullChecking);
  190.     // And create our error handler and install it
  191.     DOMCountErrorHandler errorHandler;
  192.     parser->setErrorHandler(&errorHandler);
  193.     //
  194.     //  Get the starting time and kick off the parse of the indicated
  195.     //  file. Catch any exceptions that might propogate out of it.
  196.     //
  197.     unsigned long duration;
  198.     bool more = true;
  199.     ifstream fin;
  200.     // the input is a list file
  201.     if (doList)
  202.         fin.open(argV[argInd]);
  203.     while (more)
  204.     {
  205.         char fURI[1000];
  206.         //initialize the array to zeros
  207.         memset(fURI,0,sizeof(fURI));
  208.         if (doList) {
  209.             if (! fin.eof() ) {
  210.                 fin.getline (fURI, sizeof(fURI));
  211.                 if (!*fURI)
  212.                     continue;
  213.                 else {
  214.                     xmlFile = fURI;
  215.                     cerr << "==Parsing== " << xmlFile << endl;
  216.                 }
  217.             }
  218.             else
  219.                 break;
  220.         }
  221.         else {
  222.             xmlFile = argV[argInd];
  223.             more = false;
  224.         }
  225.         //reset error count first
  226.         errorHandler.resetErrors();
  227.         try
  228.         {
  229.             const unsigned long startMillis = XMLPlatformUtils::getCurrentMillis();
  230.             parser->parse(xmlFile);
  231.             const unsigned long endMillis = XMLPlatformUtils::getCurrentMillis();
  232.             duration = endMillis - startMillis;
  233.         }
  234.         catch (const XMLException& toCatch)
  235.         {
  236.             cerr << "nError during parsing: '" << xmlFile << "'n"
  237.                  << "Exception message is:  n"
  238.                  << StrX(toCatch.getMessage()) << "n" << endl;
  239.             errorOccurred = true;
  240.             continue;
  241.         }
  242.         catch (const DOM_DOMException& toCatch)
  243.         {
  244.             cerr << "nDOM Error during parsing: '" << xmlFile << "'n"
  245.                  << "DOMException code is:  n"
  246.                  << toCatch.code << "n" << endl;
  247.             errorOccurred = true;
  248.             continue;
  249.         }
  250.         catch (...)
  251.         {
  252.             cerr << "nUnexpected exception during parsing: '" << xmlFile << "'n";
  253.             errorOccurred = true;
  254.             continue;
  255.         }
  256.         //
  257.         //  Extract the DOM tree, get the list of all the elements and report the
  258.         //  length as the count of elements.
  259.         //
  260.         if (errorHandler.getSawErrors())
  261.         {
  262.             cout << "nErrors occured, no output availablen" << endl;
  263.             errorOccurred = true;
  264.         }
  265.          else
  266.         {
  267.             DOM_Document doc = parser->getDocument();
  268.             unsigned int elementCount = doc.getElementsByTagName("*").getLength();
  269.             // Print out the stats that we collected and time taken.
  270.             cout << xmlFile << ": " << duration << " ms ("
  271.                  << elementCount << " elems)." << endl;
  272.         }
  273.     }
  274.     if (doList)
  275.         fin.close();
  276.     //
  277.     //  Delete the parser itself.  Must be done prior to calling Terminate, below.
  278.     //
  279.     delete parser;
  280.     // And call the termination method
  281.     XMLPlatformUtils::Terminate();
  282.     if (errorOccurred)
  283.         return 4;
  284.     else
  285.         return 0;
  286. }
  287. DOMCountErrorHandler::DOMCountErrorHandler() :
  288.     fSawErrors(false)
  289. {
  290. }
  291. DOMCountErrorHandler::~DOMCountErrorHandler()
  292. {
  293. }
  294. // ---------------------------------------------------------------------------
  295. //  DOMCountHandlers: Overrides of the SAX ErrorHandler interface
  296. // ---------------------------------------------------------------------------
  297. void DOMCountErrorHandler::error(const SAXParseException& e)
  298. {
  299.     fSawErrors = true;
  300.     cerr << "nError at file " << StrX(e.getSystemId())
  301.          << ", line " << e.getLineNumber()
  302.          << ", char " << e.getColumnNumber()
  303.          << "n  Message: " << StrX(e.getMessage()) << endl;
  304. }
  305. void DOMCountErrorHandler::fatalError(const SAXParseException& e)
  306. {
  307.     fSawErrors = true;
  308.     cerr << "nFatal Error at file " << StrX(e.getSystemId())
  309.          << ", line " << e.getLineNumber()
  310.          << ", char " << e.getColumnNumber()
  311.          << "n  Message: " << StrX(e.getMessage()) << endl;
  312. }
  313. void DOMCountErrorHandler::warning(const SAXParseException& e)
  314. {
  315.     cerr << "nWarning at file " << StrX(e.getSystemId())
  316.          << ", line " << e.getLineNumber()
  317.          << ", char " << e.getColumnNumber()
  318.          << "n  Message: " << StrX(e.getMessage()) << endl;
  319. }
  320. void DOMCountErrorHandler::resetErrors()
  321. {
  322.     fSawErrors = false;
  323. }