MixedContentModel.cpp
上传用户:huihehuasu
上传日期:2007-01-10
资源大小:6948k
文件大小:18k
源码类别:

xml/soap/webservice

开发平台:

C/C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: MixedContentModel.cpp,v $
  58.  * Revision 1.13  2001/08/24 12:48:48  tng
  59.  * Schema: AllContentModel
  60.  *
  61.  * Revision 1.12  2001/08/21 16:06:11  tng
  62.  * Schema: Unique Particle Attribution Constraint Checking.
  63.  *
  64.  * Revision 1.11  2001/07/09 15:22:37  knoaman
  65.  * complete <any> declaration.
  66.  *
  67.  * Revision 1.10  2001/06/12 22:13:33  peiyongz
  68.  * validateContentSpecial() : apply SubstitutionGroupComparator.isEquivalentTo()
  69.  *
  70.  * Revision 1.9  2001/05/11 13:27:19  tng
  71.  * Copyright update.
  72.  *
  73.  * Revision 1.8  2001/05/03 21:02:30  tng
  74.  * Schema: Add SubstitutionGroupComparator and update exception messages.  By Pei Yong Zhang.
  75.  *
  76.  * Revision 1.7  2001/04/19 18:17:32  tng
  77.  * Schema: SchemaValidator update, and use QName in Content Model
  78.  *
  79.  * Revision 1.6  2001/03/21 21:56:28  tng
  80.  * Schema: Add Schema Grammar, Schema Validator, and split the DTDValidator into DTDValidator, DTDScanner, and DTDGrammar.
  81.  *
  82.  * Revision 1.5  2001/03/21 19:29:57  tng
  83.  * Schema: Content Model Updates, by Pei Yong Zhang.
  84.  *
  85.  * Revision 1.4  2001/02/27 18:32:32  tng
  86.  * Schema: Use XMLElementDecl instead of DTDElementDecl in Content Model.
  87.  *
  88.  * Revision 1.3  2001/02/27 14:48:54  tng
  89.  * Schema: Add CMAny and ContentLeafNameTypeVector, by Pei Yong Zhang
  90.  *
  91.  * Revision 1.2  2001/02/16 14:58:57  tng
  92.  * Schema: Update Makefile, configure files, project files, and include path in
  93.  * certain cpp files because of the move of the common Content Model files.  By Pei Yong Zhang.
  94.  *
  95.  * Revision 1.1  2001/02/16 14:17:29  tng
  96.  * Schema: Move the common Content Model files that are shared by DTD
  97.  * and schema from 'DTD' folder to 'common' folder.  By Pei Yong Zhang.
  98.  *
  99.  * Revision 1.5  2000/05/15 22:31:32  andyh
  100.  * Replace #include<memory.h> with <string.h> everywhere.
  101.  *
  102.  * Revision 1.4  2000/03/18 00:00:05  roddey
  103.  * Initial updates for two way transcoding support
  104.  *
  105.  * Revision 1.3  2000/03/02 19:55:39  roddey
  106.  * This checkin includes many changes done while waiting for the
  107.  * 1.1.0 code to be finished. I can't list them all here, but a list is
  108.  * available elsewhere.
  109.  *
  110.  * Revision 1.2  2000/02/09 21:42:39  abagchi
  111.  * Copyright swatswat
  112.  *
  113.  * Revision 1.1.1.1  1999/11/09 01:03:43  twl
  114.  * Initial checkin
  115.  *
  116.  * Revision 1.3  1999/11/08 20:45:43  rahul
  117.  * Swat for adding in Product name and CVS comment log variable.
  118.  *
  119.  */
  120. // ---------------------------------------------------------------------------
  121. //  Includes
  122. // ---------------------------------------------------------------------------
  123. #include <string.h>
  124. #include <util/RuntimeException.hpp>
  125. #include <framework/XMLElementDecl.hpp>
  126. #include <validators/common/ContentSpecNode.hpp>
  127. #include <validators/common/MixedContentModel.hpp>
  128. #include <validators/common/CMStateSet.hpp>
  129. #include <validators/common/Grammar.hpp>
  130. #include <validators/schema/SubstitutionGroupComparator.hpp>
  131. // ---------------------------------------------------------------------------
  132. //  MixedContentModel: Constructors and Destructor
  133. // ---------------------------------------------------------------------------
  134. MixedContentModel::MixedContentModel(const bool             dtd
  135.                                    , ContentSpecNode* const parentContentSpec
  136.                                    , const bool             ordered) :
  137.    fCount(0)
  138.  , fChildren(0)
  139.  , fChildTypes(0)
  140.  , fOrdered(ordered)
  141.  , fDTD(dtd)
  142. {
  143.     //
  144.     //  Create a vector of unsigned ints that will be filled in with the
  145.     //  ids of the child nodes. It will be expanded as needed but we give
  146.     //  it an initial capacity of 64 which should be more than enough for
  147.     //  99% of the scenarios.
  148.     //
  149.     ValueVectorOf<QName*> children(64);
  150.     ValueVectorOf<ContentSpecNode::NodeTypes> childTypes(64);
  151.     //
  152.     //  Get the parent element's content spec. This is the head of the tree
  153.     //  of nodes that describes the content model. We will iterate this
  154.     //  tree.
  155.     //
  156.     ContentSpecNode* curNode = parentContentSpec;
  157.     if (!curNode)
  158.         ThrowXML(RuntimeException, XMLExcepts::CM_NoParentCSN);
  159.     // And now call the private recursive method that iterates the tree
  160.     buildChildList(curNode, children, childTypes);
  161.     //
  162.     //  And now we know how many elements we need in our member list. So
  163.     //  fill them in.
  164.     //
  165.     fCount = children.size();
  166.     fChildren = new QName*[fCount];
  167.     fChildTypes = new ContentSpecNode::NodeTypes[fCount];
  168.     for (unsigned int index = 0; index < fCount; index++) {
  169.         fChildren[index] = children.elementAt(index);
  170.         fChildTypes[index] = childTypes.elementAt(index);
  171.     }
  172. }
  173. MixedContentModel::~MixedContentModel()
  174. {
  175.     delete [] fChildren;
  176.     delete [] fChildTypes;
  177. }
  178. // ---------------------------------------------------------------------------
  179. //  MixedContentModel: Getter methods
  180. // ---------------------------------------------------------------------------
  181. bool MixedContentModel::hasDups() const
  182. {
  183.     // Can't have dups if only one child
  184.     if (fCount == 1)
  185.         return false;
  186.     for (unsigned int index = 0; index < fCount; index++)
  187.     {
  188.         const QName* curVal = fChildren[index];
  189.         for (unsigned int iIndex = 0; iIndex < fCount; iIndex++)
  190.         {
  191.             if (iIndex == index)
  192.                 continue;
  193.             if (fDTD) {
  194.                 if (!XMLString::compareString(curVal->getRawName(), fChildren[iIndex]->getRawName())) {
  195.                     return true;
  196.                 }
  197.             }
  198.             else {
  199.                 if ((curVal->getURI() == fChildren[iIndex]->getURI()) &&
  200.                     (!XMLString::compareString(curVal->getLocalPart(), fChildren[iIndex]->getLocalPart()))) {
  201.                     return true;
  202.                 }
  203.             }
  204.         }
  205.     }
  206.     return false;
  207. }
  208. // ---------------------------------------------------------------------------
  209. //  MixedContentModel: Implementation of the ContentModel virtual interface
  210. // ---------------------------------------------------------------------------
  211. //
  212. //Under the XML Schema mixed model,
  213. //the order and number of child elements appearing in an instance
  214. //must agree with
  215. //the order and number of child elements specified in the model.
  216. //
  217. int
  218. MixedContentModel::validateContent( QName** const         children
  219.                                   , const unsigned int    childCount
  220.                                   , const unsigned int    emptyNamespaceId) const
  221. {
  222.     // must match order
  223.     if (fOrdered) {
  224.         unsigned int inIndex = 0;
  225.         for (unsigned int outIndex = 0; outIndex < childCount; outIndex++) {
  226.             // Get the current child out of the source index
  227.             const QName* curChild = children[outIndex];
  228.             // If its PCDATA, then we just accept that
  229.             if (curChild->getURI() == XMLElementDecl::fgPCDataElemId)
  230.                 continue;
  231.             ContentSpecNode::NodeTypes type = fChildTypes[inIndex];
  232.             const QName* inChild = fChildren[inIndex];
  233.             if (type == ContentSpecNode::Leaf) {
  234.                 if (fDTD) {
  235.                     if (XMLString::compareString(inChild->getRawName(), curChild->getRawName())) {
  236.                         return outIndex;
  237.                     }
  238.                 }
  239.                 else {
  240.                     if ((inChild->getURI() != curChild->getURI()) ||
  241.                         (XMLString::compareString(inChild->getLocalPart(), curChild->getLocalPart()))) {
  242.                         return outIndex;
  243.                     }
  244.                 }
  245.             }
  246.             else if (type == ContentSpecNode::Any) {
  247.             }
  248.             else if (type == ContentSpecNode::Any_NS) {
  249.                 if (inChild->getURI() != curChild->getURI())
  250.                     return outIndex;
  251.             }
  252.             else if (type == ContentSpecNode::Any_Other) {
  253.                 if (inChild->getURI() == curChild->getURI())
  254.                     return outIndex;
  255.             }
  256.             // advance index
  257.             inIndex++;
  258.         }
  259.     }
  260.     // can appear in any order
  261.     else {
  262.         for (unsigned int outIndex = 0; outIndex < childCount; outIndex++) {
  263.             // Get the current child out of the source index
  264.             const QName* curChild = children[outIndex];
  265.             // If its PCDATA, then we just accept that
  266.             if (curChild->getURI() == XMLElementDecl::fgPCDataElemId)
  267.                 continue;
  268.             // And try to find it in our list
  269.             unsigned int inIndex = 0;
  270.             for (; inIndex < fCount; inIndex++)
  271.             {
  272.                 ContentSpecNode::NodeTypes type = fChildTypes[inIndex];
  273.                 const QName* inChild = fChildren[inIndex];
  274.                 if (type == ContentSpecNode::Leaf) {
  275.                     if (fDTD) {
  276.                         if (!XMLString::compareString(inChild->getRawName(), curChild->getRawName())) {
  277.                             break;
  278.                         }
  279.                     }
  280.                     else {
  281.                         if ((inChild->getURI() == curChild->getURI()) &&
  282.                             (!XMLString::compareString(inChild->getLocalPart(), curChild->getLocalPart()))) {
  283.                             break;
  284.                         }
  285.                     }
  286.                 }
  287.                 else if (type == ContentSpecNode::Any) {
  288.                     break;
  289.                 }
  290.                 else if (type == ContentSpecNode::Any_NS) {
  291.                     if (inChild->getURI() == curChild->getURI())
  292.                         break;
  293.                 }
  294.                 else if (type == ContentSpecNode::Any_Other) {
  295.                     if (inChild->getURI() != curChild->getURI())
  296.                         break;
  297.                 }
  298.                 // REVISIT: What about checking for multiple ANY matches?
  299.                 //          The content model ambiguity *could* be checked
  300.                 //          by the caller before constructing the mixed
  301.                 //          content model.
  302.             }
  303.             // We did not find this one, so the validation failed
  304.             if (inIndex == fCount)
  305.                 return outIndex;
  306.         }
  307.     }
  308.     // Everything seems to be in order, so return success
  309.     // success
  310.     return -1;
  311. }
  312. int MixedContentModel::validateContentSpecial(QName** const           children
  313.                                             , const unsigned int      childCount
  314.                                             , const unsigned int      emptyNamespaceId
  315.                                             , GrammarResolver*  const pGrammarResolver
  316.                                             , XMLStringPool*    const pStringPool) const
  317. {
  318.     SubstitutionGroupComparator comparator(pGrammarResolver, pStringPool);
  319.     // must match order
  320.     if (fOrdered) {
  321.         unsigned int inIndex = 0;
  322.         for (unsigned int outIndex = 0; outIndex < childCount; outIndex++) {
  323.             // Get the current child out of the source index
  324.             QName* curChild = children[outIndex];
  325.             // If its PCDATA, then we just accept that
  326.             if (curChild->getURI() == XMLElementDecl::fgPCDataElemId)
  327.                 continue;
  328.             ContentSpecNode::NodeTypes type = fChildTypes[inIndex];
  329.             QName* inChild = fChildren[inIndex];
  330.             if (type == ContentSpecNode::Leaf) {
  331.                 if ( !comparator.isEquivalentTo(curChild, inChild))
  332.                     return outIndex;
  333.             }
  334.             else if (type == ContentSpecNode::Any) {
  335.             }
  336.             else if (type == ContentSpecNode::Any_NS) {
  337.                 if (inChild->getURI() != curChild->getURI())
  338.                     return outIndex;
  339.             }
  340.             else if (type == ContentSpecNode::Any_Other) {
  341.                 if (inChild->getURI() == curChild->getURI())
  342.                     return outIndex;
  343.             }
  344.             // advance index
  345.             inIndex++;
  346.         }
  347.     }
  348.     // can appear in any order
  349.     else {
  350.         for (unsigned int outIndex = 0; outIndex < childCount; outIndex++) {
  351.             // Get the current child out of the source index
  352.             QName* curChild = children[outIndex];
  353.             // If its PCDATA, then we just accept that
  354.             if (curChild->getURI() == XMLElementDecl::fgPCDataElemId)
  355.                 continue;
  356.             // And try to find it in our list
  357.             unsigned int inIndex = 0;
  358.             for (; inIndex < fCount; inIndex++)
  359.             {
  360.                 ContentSpecNode::NodeTypes type = fChildTypes[inIndex];
  361.                 QName* inChild = fChildren[inIndex];
  362.                 if (type == ContentSpecNode::Leaf) {
  363.                     if ( comparator.isEquivalentTo(curChild, inChild))
  364.                         break;
  365.                 }
  366.                 else if (type == ContentSpecNode::Any) {
  367.                     break;
  368.                 }
  369.                 else if (type == ContentSpecNode::Any_NS) {
  370.                     if (inChild->getURI() == curChild->getURI())
  371.                         break;
  372.                 }
  373.                 else if (type == ContentSpecNode::Any_Other) {
  374.                     if (inChild->getURI() != curChild->getURI())
  375.                         break;
  376.                 }
  377.                 // REVISIT: What about checking for multiple ANY matches?
  378.                 //          The content model ambiguity *could* be checked
  379.                 //          by the caller before constructing the mixed
  380.                 //          content model.
  381.             }
  382.             // We did not find this one, so the validation failed
  383.             if (inIndex == fCount)
  384.                 return outIndex;
  385.         }
  386.     }
  387.     // Everything seems to be in order, so return success
  388.     // success
  389.     return -1;
  390. }
  391. // ---------------------------------------------------------------------------
  392. //  MixedContentModel: Private helper methods
  393. // ---------------------------------------------------------------------------
  394. void
  395. MixedContentModel::buildChildList(  ContentSpecNode* const       curNode
  396.                                   , ValueVectorOf<QName*>&       toFill
  397.                                   , ValueVectorOf<ContentSpecNode::NodeTypes>& toType)
  398. {
  399.     // Get the type of spec node our current node is
  400.     const ContentSpecNode::NodeTypes curType = curNode->getType();
  401.     // If its a leaf, then store its id in the target list
  402.     if ((curType == ContentSpecNode::Leaf)      ||
  403.         (curType == ContentSpecNode::Any)       ||
  404.         (curType == ContentSpecNode::Any_Other) ||
  405.         (curType == ContentSpecNode::Any_NS)   )
  406.     {
  407.         toFill.addElement(curNode->getElement());
  408.         toType.addElement(curType);
  409.         return;
  410.     }
  411.     // Get both the child node pointers
  412.     ContentSpecNode* leftNode = curNode->getFirst();
  413.     ContentSpecNode* rightNode = curNode->getSecond();
  414.     // And recurse according to the type of node
  415.     if ((curType == ContentSpecNode::Choice)
  416.     ||  (curType == ContentSpecNode::Sequence))
  417.     {
  418.         // Recurse on the left and right nodes
  419.         buildChildList(leftNode, toFill, toType);
  420.         // The last node of a choice or sequence has a null right
  421.         if (rightNode)
  422.             buildChildList(rightNode, toFill, toType);
  423.     }
  424.     else if ((curType == ContentSpecNode::OneOrMore)
  425.          ||  (curType == ContentSpecNode::ZeroOrOne)
  426.          ||  (curType == ContentSpecNode::ZeroOrMore))
  427.     {
  428.         // Just do the left node on this one
  429.         buildChildList(leftNode, toFill, toType);
  430.     }
  431. }