PParse.cpp
上传用户:huihehuasu
上传日期:2007-01-10
资源大小:6948k
文件大小:13k
源码类别:

xml/soap/webservice

开发平台:

C/C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: PParse.cpp,v $
  58.  * Revision 1.12  2001/10/25 15:18:33  tng
  59.  * delete the parser before XMLPlatformUtils::Terminate.
  60.  *
  61.  * Revision 1.11  2001/10/19 18:52:04  tng
  62.  * Since PParse can take any XML file as input file, it shouldn't hardcode to expect 16 elements.
  63.  * Change it to work similar to SAXCount which just prints the number of elements, characters, attributes ... etc.
  64.  * And other modification for consistent help display and return code across samples.
  65.  *
  66.  * Revision 1.10  2001/08/01 19:11:01  tng
  67.  * Add full schema constraint checking flag to the samples and the parser.
  68.  *
  69.  * Revision 1.9  2001/05/11 13:24:55  tng
  70.  * Copyright update.
  71.  *
  72.  * Revision 1.8  2001/05/03 15:59:48  tng
  73.  * Schema: samples update with schema
  74.  *
  75.  * Revision 1.7  2000/06/20 02:23:08  rahulj
  76.  * Help message added by Joe Polastre.
  77.  *
  78.  * Revision 1.6  2000/03/03 01:29:31  roddey
  79.  * Added a scanReset()/parseReset() method to the scanner and
  80.  * parsers, to allow for reset after early exit from a progressive parse.
  81.  * Added calls to new Terminate() call to all of the samples. Improved
  82.  * documentation in SAX and DOM parsers.
  83.  *
  84.  * Revision 1.5  2000/03/02 19:53:44  roddey
  85.  * This checkin includes many changes done while waiting for the
  86.  * 1.1.0 code to be finished. I can't list them all here, but a list is
  87.  * available elsewhere.
  88.  *
  89.  * Revision 1.4  2000/02/11 02:37:48  abagchi
  90.  * Removed StrX::transcode
  91.  *
  92.  * Revision 1.3  2000/02/06 07:47:20  rahulj
  93.  * Year 2K copyright swat.
  94.  *
  95.  * Revision 1.2  2000/01/12 00:27:00  roddey
  96.  * Updates to work with the new URL and input source scheme.
  97.  *
  98.  * Revision 1.1.1.1  1999/11/09 01:09:45  twl
  99.  * Initial checkin
  100.  *
  101.  * Revision 1.5  1999/11/08 20:43:38  rahul
  102.  * Swat for adding in Product name and CVS comment log variable.
  103.  *
  104.  */
  105. // ---------------------------------------------------------------------------
  106. //  This sample program demonstrates the progressive parse capabilities of
  107. //  the parser system. It allows you to do a scanFirst() call followed by
  108. //  a loop which calls scanNext(). You can drop out when you've found what
  109. //  ever it is you want. In our little test, our event handler looks for
  110. //  16 new elements then sets a flag to indicate its found what it wants.
  111. //  At that point, our progressive parse loop below exits.
  112. //
  113. //  The parameters are:
  114. //
  115. //      [-?]            - Show usage and exit
  116. //      [-v=xxx]        - Validation scheme [always | never | auto*]
  117. //      [-n]            - Enable namespace processing
  118. //      [-s]            - Enable schema processing
  119. //      [-f]            - Enable full schema constraint checking
  120. //      filename        - The path to the XML file to parse
  121. //
  122. //  * = Default if not provided explicitly
  123. //  These are non-case sensitive
  124. // ---------------------------------------------------------------------------
  125. // ---------------------------------------------------------------------------
  126. //  Includes
  127. // ---------------------------------------------------------------------------
  128. #include <util/PlatformUtils.hpp>
  129. #include <framework/XMLPScanToken.hpp>
  130. #include <parsers/SAXParser.hpp>
  131. #include "PParse.hpp"
  132. // ---------------------------------------------------------------------------
  133. //  Local data
  134. //
  135. //  xmlFile
  136. //      The path to the file to parser. Set via command line.
  137. //
  138. //  doNamespaces
  139. //      Indicates whether namespace processing should be done.
  140. //
  141. //  doSchema
  142. //      Indicates whether schema processing should be done.
  143. //
  144. //  schemaFullChecking
  145. //      Indicates whether full schema constraint checking should be done.
  146. //
  147. //  valScheme
  148. //      Indicates what validation scheme to use. It defaults to 'auto', but
  149. //      can be set via the -v= command.
  150. // ---------------------------------------------------------------------------
  151. static char*  xmlFile         = 0;
  152. static bool     doNamespaces       = false;
  153. static bool     doSchema           = false;
  154. static bool     schemaFullChecking = false;
  155. static SAXParser::ValSchemes    valScheme       = SAXParser::Val_Auto;
  156. // ---------------------------------------------------------------------------
  157. //  Local helper methods
  158. // ---------------------------------------------------------------------------
  159. static void usage()
  160. {
  161.     cout << "nUsage:n"
  162.             "    PParse [options] <XML file>nn"
  163.             "This program demonstrates the progressive parse capabilities ofn"
  164.          "the parser system. It allows you to do a scanFirst() call followed byn"
  165.             "a loop which calls scanNext(). You can drop out when you've found whatn"
  166.             "ever it is you want. In our little test, our event handler looks forn"
  167.             "16 new elements then sets a flag to indicate its found what it wants.n"
  168.             "At that point, our progressive parse loop exits.nn"
  169.             "Options:n"
  170.             "      -v=xxx        - Validation scheme [always | never | auto*].n"
  171.             "      -n            - Enable namespace processing [default is off].n"
  172.             "      -s            - Enable schema processing [default is off].n"
  173.             "      -f            - Enable full schema constraint checking [default is off].n"
  174.             "      -?            - Show this help.nn"
  175.             "  * = Default if not provided explicitly.n"
  176.          <<  endl;
  177. }
  178. // ---------------------------------------------------------------------------
  179. //  Program entry point
  180. // ---------------------------------------------------------------------------
  181. int main(int argC, char* argV[])
  182. {
  183.     // Initialize the XML4C system
  184.     try
  185.     {
  186.          XMLPlatformUtils::Initialize();
  187.     }
  188.     catch (const XMLException& toCatch)
  189.     {
  190.          cerr << "Error during initialization! :n"
  191.               << StrX(toCatch.getMessage()) << endl;
  192.          return 1;
  193.     }
  194.     // Check command line and extract arguments.
  195.     if (argC < 2)
  196.     {
  197.         usage();
  198.         XMLPlatformUtils::Terminate();
  199.         return 1;
  200.     }
  201.     // See if non validating dom parser configuration is requested.
  202.     int parmInd;
  203.     for (parmInd = 1; parmInd < argC; parmInd++)
  204.     {
  205.         // Break out on first parm not starting with a dash
  206.         if (argV[parmInd][0] != '-')
  207.             break;
  208.         // Watch for special case help request
  209.         if (!strcmp(argV[parmInd], "-?"))
  210.         {
  211.             usage();
  212.             XMLPlatformUtils::Terminate();
  213.             return 2;
  214.         }
  215.          else if (!strncmp(argV[parmInd], "-v=", 3)
  216.               ||  !strncmp(argV[parmInd], "-V=", 3))
  217.         {
  218.             const char* const parm = &argV[parmInd][3];
  219.             if (!strcmp(parm, "never"))
  220.                 valScheme = SAXParser::Val_Never;
  221.             else if (!strcmp(parm, "auto"))
  222.                 valScheme = SAXParser::Val_Auto;
  223.             else if (!strcmp(parm, "always"))
  224.                 valScheme = SAXParser::Val_Always;
  225.             else
  226.             {
  227.                 cerr << "Unknown -v= value: " << parm << endl;
  228.                 XMLPlatformUtils::Terminate();
  229.                 return 2;
  230.             }
  231.         }
  232.          else if (!strcmp(argV[parmInd], "-n")
  233.               ||  !strcmp(argV[parmInd], "-N"))
  234.         {
  235.             doNamespaces = true;
  236.         }
  237.          else if (!strcmp(argV[parmInd], "-s")
  238.               ||  !strcmp(argV[parmInd], "-S"))
  239.         {
  240.             doSchema = true;
  241.         }
  242.          else if (!strcmp(argV[parmInd], "-f")
  243.               ||  !strcmp(argV[parmInd], "-F"))
  244.         {
  245.             schemaFullChecking = true;
  246.         }
  247.         else
  248.         {
  249.             cerr << "Unknown option '" << argV[parmInd]
  250.                 << "', ignoring itn" << endl;
  251.         }
  252.     }
  253.     //
  254.     //  And now we have to have only one parameter left and it must be
  255.     //  the file name.
  256.     //
  257.     if (parmInd + 1 != argC)
  258.     {
  259.         usage();
  260.         XMLPlatformUtils::Terminate();
  261.         return 1;
  262.     }
  263.     xmlFile = argV[parmInd];
  264.     int errorCount = 0;
  265.     //
  266.     //  Create a SAX parser object to use and create our SAX event handlers
  267.     //  and plug them in.
  268.     //
  269.     SAXParser* parser = new SAXParser;
  270.     PParseHandlers handler;
  271.     parser->setDocumentHandler(&handler);
  272.     parser->setErrorHandler(&handler);
  273.     parser->setValidationScheme(valScheme);
  274.     parser->setDoNamespaces(doNamespaces);
  275.     parser->setDoSchema(doSchema);
  276.     parser->setValidationSchemaFullChecking(schemaFullChecking);
  277.     //
  278.     //  Ok, lets do the progressive parse loop. On each time around the
  279.     //  loop, we look and see if the handler has found what its looking
  280.     //  for. When it does, we fall out then.
  281.     //
  282.     unsigned long duration;
  283.     try
  284.     {
  285.         // Create a progressive scan token
  286.         XMLPScanToken token;
  287.         const unsigned long startMillis = XMLPlatformUtils::getCurrentMillis();
  288.         if (!parser->parseFirst(xmlFile, token))
  289.         {
  290.             cerr << "scanFirst() failedn" << endl;
  291.             XMLPlatformUtils::Terminate();
  292.             return 1;
  293.         }
  294.         //
  295.         //  We started ok, so lets call scanNext() until we find what we want
  296.         //  or hit the end.
  297.         //
  298.         bool gotMore = true;
  299.         while (gotMore && !parser->getErrorCount())
  300.             gotMore = parser->parseNext(token);
  301.         const unsigned long endMillis = XMLPlatformUtils::getCurrentMillis();
  302.         duration = endMillis - startMillis;
  303.         errorCount = parser->getErrorCount();
  304.         //
  305.         //  Reset the parser-> In this simple progrma, since we just exit
  306.         //  now, its not technically required. But, in programs which
  307.         //  would remain open, you should reset after a progressive parse
  308.         //  in case you broke out before the end of the file. This insures
  309.         //  that all opened files, sockets, etc... are closed.
  310.         //
  311.         parser->parseReset(token);
  312.     }
  313.     catch (const XMLException& toCatch)
  314.     {
  315.         cerr << "nAn error occured: '" << xmlFile << "'n"
  316.              << "Exception message is: n"
  317.              << StrX(toCatch.getMessage())
  318.              << "n" << endl;
  319.         XMLPlatformUtils::Terminate();
  320.         return 4;
  321.     }
  322.     if (!errorCount) {
  323.         cout << xmlFile << ": " << duration << " ms ("
  324.             << handler.getElementCount() << " elems, "
  325.             << handler.getAttrCount() << " attrs, "
  326.             << handler.getSpaceCount() << " spaces, "
  327.             << handler.getCharacterCount() << " chars)" << endl;
  328.     }
  329.     //
  330.     //  Delete the parser itself.  Must be done prior to calling Terminate, below.
  331.     //
  332.     delete parser;
  333.     // And call the termination method
  334.     XMLPlatformUtils::Terminate();
  335.     if (errorCount > 0)
  336.         return 4;
  337.     else
  338.         return 0;
  339. }