MixedContentModel.cpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:19k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: MixedContentModel.cpp,v $
  58.  * Revision 1.6  2003/05/18 14:02:06  knoaman
  59.  * Memory manager implementation: pass per instance manager.
  60.  *
  61.  * Revision 1.5  2003/05/16 21:43:20  knoaman
  62.  * Memory manager implementation: Modify constructors to pass in the memory manager.
  63.  *
  64.  * Revision 1.4  2003/05/15 18:48:27  knoaman
  65.  * Partial implementation of the configurable memory manager.
  66.  *
  67.  * Revision 1.3  2002/11/04 14:54:58  tng
  68.  * C++ Namespace Support.
  69.  *
  70.  * Revision 1.2  2002/09/24 19:48:39  tng
  71.  * Performance: use XMLString::equals instead of XMLString::compareString
  72.  *
  73.  * Revision 1.1.1.1  2002/02/01 22:22:39  peiyongz
  74.  * sane_include
  75.  *
  76.  * Revision 1.13  2001/08/24 12:48:48  tng
  77.  * Schema: AllContentModel
  78.  *
  79.  * Revision 1.12  2001/08/21 16:06:11  tng
  80.  * Schema: Unique Particle Attribution Constraint Checking.
  81.  *
  82.  * Revision 1.11  2001/07/09 15:22:37  knoaman
  83.  * complete <any> declaration.
  84.  *
  85.  * Revision 1.10  2001/06/12 22:13:33  peiyongz
  86.  * validateContentSpecial() : apply SubstitutionGroupComparator.isEquivalentTo()
  87.  *
  88.  * Revision 1.9  2001/05/11 13:27:19  tng
  89.  * Copyright update.
  90.  *
  91.  * Revision 1.8  2001/05/03 21:02:30  tng
  92.  * Schema: Add SubstitutionGroupComparator and update exception messages.  By Pei Yong Zhang.
  93.  *
  94.  * Revision 1.7  2001/04/19 18:17:32  tng
  95.  * Schema: SchemaValidator update, and use QName in Content Model
  96.  *
  97.  * Revision 1.6  2001/03/21 21:56:28  tng
  98.  * Schema: Add Schema Grammar, Schema Validator, and split the DTDValidator into DTDValidator, DTDScanner, and DTDGrammar.
  99.  *
  100.  * Revision 1.5  2001/03/21 19:29:57  tng
  101.  * Schema: Content Model Updates, by Pei Yong Zhang.
  102.  *
  103.  * Revision 1.4  2001/02/27 18:32:32  tng
  104.  * Schema: Use XMLElementDecl instead of DTDElementDecl in Content Model.
  105.  *
  106.  * Revision 1.3  2001/02/27 14:48:54  tng
  107.  * Schema: Add CMAny and ContentLeafNameTypeVector, by Pei Yong Zhang
  108.  *
  109.  * Revision 1.2  2001/02/16 14:58:57  tng
  110.  * Schema: Update Makefile, configure files, project files, and include path in
  111.  * certain cpp files because of the move of the common Content Model files.  By Pei Yong Zhang.
  112.  *
  113.  * Revision 1.1  2001/02/16 14:17:29  tng
  114.  * Schema: Move the common Content Model files that are shared by DTD
  115.  * and schema from 'DTD' folder to 'common' folder.  By Pei Yong Zhang.
  116.  *
  117.  * Revision 1.5  2000/05/15 22:31:32  andyh
  118.  * Replace #include<memory.h> with <string.h> everywhere.
  119.  *
  120.  * Revision 1.4  2000/03/18 00:00:05  roddey
  121.  * Initial updates for two way transcoding support
  122.  *
  123.  * Revision 1.3  2000/03/02 19:55:39  roddey
  124.  * This checkin includes many changes done while waiting for the
  125.  * 1.1.0 code to be finished. I can't list them all here, but a list is
  126.  * available elsewhere.
  127.  *
  128.  * Revision 1.2  2000/02/09 21:42:39  abagchi
  129.  * Copyright swatswat
  130.  *
  131.  * Revision 1.1.1.1  1999/11/09 01:03:43  twl
  132.  * Initial checkin
  133.  *
  134.  * Revision 1.3  1999/11/08 20:45:43  rahul
  135.  * Swat for adding in Product name and CVS comment log variable.
  136.  *
  137.  */
  138. // ---------------------------------------------------------------------------
  139. //  Includes
  140. // ---------------------------------------------------------------------------
  141. #include <string.h>
  142. #include <xercesc/util/RuntimeException.hpp>
  143. #include <xercesc/framework/XMLElementDecl.hpp>
  144. #include <xercesc/validators/common/ContentSpecNode.hpp>
  145. #include <xercesc/validators/common/MixedContentModel.hpp>
  146. #include <xercesc/validators/common/CMStateSet.hpp>
  147. #include <xercesc/validators/common/Grammar.hpp>
  148. #include <xercesc/validators/schema/SubstitutionGroupComparator.hpp>
  149. XERCES_CPP_NAMESPACE_BEGIN
  150. // ---------------------------------------------------------------------------
  151. //  MixedContentModel: Constructors and Destructor
  152. // ---------------------------------------------------------------------------
  153. MixedContentModel::MixedContentModel(const bool             dtd
  154.                                    , ContentSpecNode* const parentContentSpec
  155.                                    , const bool             ordered
  156.                                    , MemoryManager* const   manager) :
  157.    fCount(0)
  158.  , fChildren(0)
  159.  , fChildTypes(0)
  160.  , fOrdered(ordered)
  161.  , fDTD(dtd)
  162.  , fMemoryManager(manager)
  163. {
  164.     //
  165.     //  Create a vector of unsigned ints that will be filled in with the
  166.     //  ids of the child nodes. It will be expanded as needed but we give
  167.     //  it an initial capacity of 64 which should be more than enough for
  168.     //  99% of the scenarios.
  169.     //
  170.     ValueVectorOf<QName*> children(64, fMemoryManager);
  171.     ValueVectorOf<ContentSpecNode::NodeTypes> childTypes(64, fMemoryManager);
  172.     //
  173.     //  Get the parent element's content spec. This is the head of the tree
  174.     //  of nodes that describes the content model. We will iterate this
  175.     //  tree.
  176.     //
  177.     ContentSpecNode* curNode = parentContentSpec;
  178.     if (!curNode)
  179.         ThrowXML(RuntimeException, XMLExcepts::CM_NoParentCSN);
  180.     // And now call the private recursive method that iterates the tree
  181.     buildChildList(curNode, children, childTypes);
  182.     //
  183.     //  And now we know how many elements we need in our member list. So
  184.     //  fill them in.
  185.     //
  186.     fCount = children.size();
  187.     fChildren = (QName**) fMemoryManager->allocate(fCount * sizeof(QName*)); //new QName*[fCount];
  188.     fChildTypes = (ContentSpecNode::NodeTypes*) fMemoryManager->allocate
  189.     (
  190.         fCount * sizeof(ContentSpecNode::NodeTypes)
  191.     ); //new ContentSpecNode::NodeTypes[fCount];
  192.     for (unsigned int index = 0; index < fCount; index++) {
  193.         fChildren[index] = children.elementAt(index);
  194.         fChildTypes[index] = childTypes.elementAt(index);
  195.     }
  196. }
  197. MixedContentModel::~MixedContentModel()
  198. {
  199.     fMemoryManager->deallocate(fChildren); //delete [] fChildren;
  200.     fMemoryManager->deallocate(fChildTypes); //delete [] fChildTypes;
  201. }
  202. // ---------------------------------------------------------------------------
  203. //  MixedContentModel: Getter methods
  204. // ---------------------------------------------------------------------------
  205. bool MixedContentModel::hasDups() const
  206. {
  207.     // Can't have dups if only one child
  208.     if (fCount == 1)
  209.         return false;
  210.     for (unsigned int index = 0; index < fCount; index++)
  211.     {
  212.         const QName* curVal = fChildren[index];
  213.         for (unsigned int iIndex = 0; iIndex < fCount; iIndex++)
  214.         {
  215.             if (iIndex == index)
  216.                 continue;
  217.             if (fDTD) {
  218.                 if (XMLString::equals(curVal->getRawName(), fChildren[iIndex]->getRawName())) {
  219.                     return true;
  220.                 }
  221.             }
  222.             else {
  223.                 if ((curVal->getURI() == fChildren[iIndex]->getURI()) &&
  224.                     (XMLString::equals(curVal->getLocalPart(), fChildren[iIndex]->getLocalPart()))) {
  225.                     return true;
  226.                 }
  227.             }
  228.         }
  229.     }
  230.     return false;
  231. }
  232. // ---------------------------------------------------------------------------
  233. //  MixedContentModel: Implementation of the ContentModel virtual interface
  234. // ---------------------------------------------------------------------------
  235. //
  236. //Under the XML Schema mixed model,
  237. //the order and number of child elements appearing in an instance
  238. //must agree with
  239. //the order and number of child elements specified in the model.
  240. //
  241. int
  242. MixedContentModel::validateContent( QName** const         children
  243.                                   , const unsigned int    childCount
  244.                                   , const unsigned int    emptyNamespaceId) const
  245. {
  246.     // must match order
  247.     if (fOrdered) {
  248.         unsigned int inIndex = 0;
  249.         for (unsigned int outIndex = 0; outIndex < childCount; outIndex++) {
  250.             // Get the current child out of the source index
  251.             const QName* curChild = children[outIndex];
  252.             // If its PCDATA, then we just accept that
  253.             if (curChild->getURI() == XMLElementDecl::fgPCDataElemId)
  254.                 continue;
  255.             ContentSpecNode::NodeTypes type = fChildTypes[inIndex];
  256.             const QName* inChild = fChildren[inIndex];
  257.             if (type == ContentSpecNode::Leaf) {
  258.                 if (fDTD) {
  259.                     if (!XMLString::equals(inChild->getRawName(), curChild->getRawName())) {
  260.                         return outIndex;
  261.                     }
  262.                 }
  263.                 else {
  264.                     if ((inChild->getURI() != curChild->getURI()) ||
  265.                         (!XMLString::equals(inChild->getLocalPart(), curChild->getLocalPart()))) {
  266.                         return outIndex;
  267.                     }
  268.                 }
  269.             }
  270.             else if (type == ContentSpecNode::Any) {
  271.             }
  272.             else if (type == ContentSpecNode::Any_NS) {
  273.                 if (inChild->getURI() != curChild->getURI())
  274.                     return outIndex;
  275.             }
  276.             else if (type == ContentSpecNode::Any_Other) {
  277.                 if (inChild->getURI() == curChild->getURI())
  278.                     return outIndex;
  279.             }
  280.             // advance index
  281.             inIndex++;
  282.         }
  283.     }
  284.     // can appear in any order
  285.     else {
  286.         for (unsigned int outIndex = 0; outIndex < childCount; outIndex++) {
  287.             // Get the current child out of the source index
  288.             const QName* curChild = children[outIndex];
  289.             // If its PCDATA, then we just accept that
  290.             if (curChild->getURI() == XMLElementDecl::fgPCDataElemId)
  291.                 continue;
  292.             // And try to find it in our list
  293.             unsigned int inIndex = 0;
  294.             for (; inIndex < fCount; inIndex++)
  295.             {
  296.                 ContentSpecNode::NodeTypes type = fChildTypes[inIndex];
  297.                 const QName* inChild = fChildren[inIndex];
  298.                 if (type == ContentSpecNode::Leaf) {
  299.                     if (fDTD) {
  300.                         if (XMLString::equals(inChild->getRawName(), curChild->getRawName())) {
  301.                             break;
  302.                         }
  303.                     }
  304.                     else {
  305.                         if ((inChild->getURI() == curChild->getURI()) &&
  306.                             (XMLString::equals(inChild->getLocalPart(), curChild->getLocalPart()))) {
  307.                             break;
  308.                         }
  309.                     }
  310.                 }
  311.                 else if (type == ContentSpecNode::Any) {
  312.                     break;
  313.                 }
  314.                 else if (type == ContentSpecNode::Any_NS) {
  315.                     if (inChild->getURI() == curChild->getURI())
  316.                         break;
  317.                 }
  318.                 else if (type == ContentSpecNode::Any_Other) {
  319.                     if (inChild->getURI() != curChild->getURI())
  320.                         break;
  321.                 }
  322.                 // REVISIT: What about checking for multiple ANY matches?
  323.                 //          The content model ambiguity *could* be checked
  324.                 //          by the caller before constructing the mixed
  325.                 //          content model.
  326.             }
  327.             // We did not find this one, so the validation failed
  328.             if (inIndex == fCount)
  329.                 return outIndex;
  330.         }
  331.     }
  332.     // Everything seems to be in order, so return success
  333.     // success
  334.     return -1;
  335. }
  336. int MixedContentModel::validateContentSpecial(QName** const           children
  337.                                             , const unsigned int      childCount
  338.                                             , const unsigned int      emptyNamespaceId
  339.                                             , GrammarResolver*  const pGrammarResolver
  340.                                             , XMLStringPool*    const pStringPool) const
  341. {
  342.     SubstitutionGroupComparator comparator(pGrammarResolver, pStringPool);
  343.     // must match order
  344.     if (fOrdered) {
  345.         unsigned int inIndex = 0;
  346.         for (unsigned int outIndex = 0; outIndex < childCount; outIndex++) {
  347.             // Get the current child out of the source index
  348.             QName* curChild = children[outIndex];
  349.             // If its PCDATA, then we just accept that
  350.             if (curChild->getURI() == XMLElementDecl::fgPCDataElemId)
  351.                 continue;
  352.             ContentSpecNode::NodeTypes type = fChildTypes[inIndex];
  353.             QName* inChild = fChildren[inIndex];
  354.             if (type == ContentSpecNode::Leaf) {
  355.                 if ( !comparator.isEquivalentTo(curChild, inChild))
  356.                     return outIndex;
  357.             }
  358.             else if (type == ContentSpecNode::Any) {
  359.             }
  360.             else if (type == ContentSpecNode::Any_NS) {
  361.                 if (inChild->getURI() != curChild->getURI())
  362.                     return outIndex;
  363.             }
  364.             else if (type == ContentSpecNode::Any_Other) {
  365.                 if (inChild->getURI() == curChild->getURI())
  366.                     return outIndex;
  367.             }
  368.             // advance index
  369.             inIndex++;
  370.         }
  371.     }
  372.     // can appear in any order
  373.     else {
  374.         for (unsigned int outIndex = 0; outIndex < childCount; outIndex++) {
  375.             // Get the current child out of the source index
  376.             QName* curChild = children[outIndex];
  377.             // If its PCDATA, then we just accept that
  378.             if (curChild->getURI() == XMLElementDecl::fgPCDataElemId)
  379.                 continue;
  380.             // And try to find it in our list
  381.             unsigned int inIndex = 0;
  382.             for (; inIndex < fCount; inIndex++)
  383.             {
  384.                 ContentSpecNode::NodeTypes type = fChildTypes[inIndex];
  385.                 QName* inChild = fChildren[inIndex];
  386.                 if (type == ContentSpecNode::Leaf) {
  387.                     if ( comparator.isEquivalentTo(curChild, inChild))
  388.                         break;
  389.                 }
  390.                 else if (type == ContentSpecNode::Any) {
  391.                     break;
  392.                 }
  393.                 else if (type == ContentSpecNode::Any_NS) {
  394.                     if (inChild->getURI() == curChild->getURI())
  395.                         break;
  396.                 }
  397.                 else if (type == ContentSpecNode::Any_Other) {
  398.                     if (inChild->getURI() != curChild->getURI())
  399.                         break;
  400.                 }
  401.                 // REVISIT: What about checking for multiple ANY matches?
  402.                 //          The content model ambiguity *could* be checked
  403.                 //          by the caller before constructing the mixed
  404.                 //          content model.
  405.             }
  406.             // We did not find this one, so the validation failed
  407.             if (inIndex == fCount)
  408.                 return outIndex;
  409.         }
  410.     }
  411.     // Everything seems to be in order, so return success
  412.     // success
  413.     return -1;
  414. }
  415. // ---------------------------------------------------------------------------
  416. //  MixedContentModel: Private helper methods
  417. // ---------------------------------------------------------------------------
  418. void
  419. MixedContentModel::buildChildList(  ContentSpecNode* const       curNode
  420.                                   , ValueVectorOf<QName*>&       toFill
  421.                                   , ValueVectorOf<ContentSpecNode::NodeTypes>& toType)
  422. {
  423.     // Get the type of spec node our current node is
  424.     const ContentSpecNode::NodeTypes curType = curNode->getType();
  425.     // If its a leaf, then store its id in the target list
  426.     if ((curType == ContentSpecNode::Leaf)      ||
  427.         (curType == ContentSpecNode::Any)       ||
  428.         (curType == ContentSpecNode::Any_Other) ||
  429.         (curType == ContentSpecNode::Any_NS)   )
  430.     {
  431.         toFill.addElement(curNode->getElement());
  432.         toType.addElement(curType);
  433.         return;
  434.     }
  435.     // Get both the child node pointers
  436.     ContentSpecNode* leftNode = curNode->getFirst();
  437.     ContentSpecNode* rightNode = curNode->getSecond();
  438.     // And recurse according to the type of node
  439.     if ((curType == ContentSpecNode::Choice)
  440.     ||  (curType == ContentSpecNode::Sequence))
  441.     {
  442.         // Recurse on the left and right nodes
  443.         buildChildList(leftNode, toFill, toType);
  444.         // The last node of a choice or sequence has a null right
  445.         if (rightNode)
  446.             buildChildList(rightNode, toFill, toType);
  447.     }
  448.     else if ((curType == ContentSpecNode::OneOrMore)
  449.          ||  (curType == ContentSpecNode::ZeroOrOne)
  450.          ||  (curType == ContentSpecNode::ZeroOrMore))
  451.     {
  452.         // Just do the left node on this one
  453.         buildChildList(leftNode, toFill, toType);
  454.     }
  455. }
  456. XERCES_CPP_NAMESPACE_END