XMLRangeFactory.cpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:11k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 2001-2002 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 2001, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: XMLRangeFactory.cpp,v $
  58.  * Revision 1.5  2003/05/18 14:02:06  knoaman
  59.  * Memory manager implementation: pass per instance manager.
  60.  *
  61.  * Revision 1.4  2002/11/04 15:17:01  tng
  62.  * C++ Namespace Support.
  63.  *
  64.  * Revision 1.3  2002/05/24 16:42:20  knoaman
  65.  * Performance fixes: eliminate mulitple calls to addRange and sort.
  66.  *
  67.  * Revision 1.2  2002/02/05 13:20:06  tng
  68.  * [Bug 5716] Can't parse with Validation more than one file.
  69.  *
  70.  * Revision 1.1.1.1  2002/02/01 22:22:34  peiyongz
  71.  * sane_include
  72.  *
  73.  * Revision 1.4  2001/10/15 20:18:32  knoaman
  74.  * Fix for bug 4177.
  75.  *
  76.  * Revision 1.3  2001/05/11 13:26:52  tng
  77.  * Copyright update.
  78.  *
  79.  * Revision 1.2  2001/05/03 18:18:02  knoaman
  80.  * Some design changes:
  81.  * o Changed the TokenFactory from a single static instance, to a
  82.  *    normal class. Each RegularExpression object will have its own
  83.  *    instance of TokenFactory, and that instance will be passed to
  84.  *    other classes that need to use a TokenFactory to create Token
  85.  *    objects (with the exception of RangeTokenMap).
  86.  * o Added a new class RangeTokenMap to map a the different ranges
  87.  *    in a given category to a specific RangeFactory object. In the old
  88.  *    design RangeFactory had dual functionality (act as a Map, and as
  89.  *    a factory for creating RangeToken(s)). The RangeTokenMap will
  90.  *    have its own copy of the TokenFactory. There will be only one
  91.  *    instance of the RangeTokenMap class, and that instance will be
  92.  *    lazily deleted when XPlatformUtils::Terminate is called.
  93.  *
  94.  * Revision 1.1  2001/03/02 19:26:50  knoaman
  95.  * Schema: Regular expression handling part II
  96.  *
  97.  */
  98. // ---------------------------------------------------------------------------
  99. //  Includes
  100. // ---------------------------------------------------------------------------
  101. #include <xercesc/util/regx/XMLRangeFactory.hpp>
  102. #include <xercesc/internal/CharTypeTables.hpp>
  103. #include <xercesc/util/regx/RegxDefs.hpp>
  104. #include <xercesc/util/regx/TokenFactory.hpp>
  105. #include <xercesc/util/regx/RangeToken.hpp>
  106. #include <xercesc/util/regx/RangeTokenMap.hpp>
  107. #include <xercesc/util/Janitor.hpp>
  108. #include <string.h>
  109. XERCES_CPP_NAMESPACE_BEGIN
  110. // ---------------------------------------------------------------------------
  111. //  Local static functions
  112. // ---------------------------------------------------------------------------
  113. static void setupRange(XMLInt32* const rangeMap,
  114.                        const XMLCh* const theTable,
  115.                        unsigned int startingIndex) {
  116.     const XMLCh* pchCur = theTable;
  117.     // Do the ranges first
  118.     while (*pchCur)
  119.     {
  120.         rangeMap[startingIndex++] = *pchCur++;
  121.     }
  122.     // Skip the range terminator
  123.     pchCur++;
  124.     // And then the singles until we hit its terminator
  125.     while (*pchCur) {
  126.         const XMLCh chSingle = *pchCur++;
  127.         rangeMap[startingIndex++] = chSingle;
  128.         rangeMap[startingIndex++] = chSingle;
  129.     }
  130. }
  131. static unsigned int getTableLen(const XMLCh* const theTable) {
  132.     unsigned int rangeLen = XMLString::stringLen(theTable);
  133.     return rangeLen + 2*XMLString::stringLen(theTable + rangeLen + 1);
  134. }
  135. // ---------------------------------------------------------------------------
  136. //  XMLRangeFactory: Constructors and Destructor
  137. // ---------------------------------------------------------------------------
  138. XMLRangeFactory::XMLRangeFactory() :
  139.    fRangesCreated(false)
  140.  , fKeywordsInitialized(false)
  141. {
  142. }
  143. XMLRangeFactory::~XMLRangeFactory() {
  144. }
  145. // ---------------------------------------------------------------------------
  146. //  XMLRangeFactory: Range creation methods
  147. // ---------------------------------------------------------------------------
  148. void XMLRangeFactory::buildRanges() {
  149.     if (fRangesCreated)
  150.         return;
  151.     if (!fKeywordsInitialized) {
  152.         initializeKeywordMap();
  153.     }
  154.     RangeTokenMap* rangeTokMap = RangeTokenMap::instance();
  155.     TokenFactory* tokFactory = rangeTokMap->getTokenFactory();
  156.     // Create space ranges
  157.     unsigned int wsTblLen = getTableLen(gWhitespaceChars);
  158.     RangeToken* tok = tokFactory->createRange();
  159.     XMLInt32* wsRange = (XMLInt32*) XMLPlatformUtils::fgMemoryManager->allocate
  160.     (
  161.         wsTblLen * sizeof(XMLInt32)
  162.     );//new XMLInt32[wsTblLen];
  163.     tok->setRangeValues(wsRange, wsTblLen);
  164.     setupRange(wsRange, gWhitespaceChars, 0);
  165.     rangeTokMap->setRangeToken(fgXMLSpace, tok);
  166.     // Create digits ranges
  167.     tok = tokFactory->createRange();
  168.     unsigned int digitTblLen = getTableLen(gDigitChars);
  169.     XMLInt32* digitRange = (XMLInt32*) XMLPlatformUtils::fgMemoryManager->allocate
  170.     (
  171.         digitTblLen * sizeof(XMLInt32)
  172.     );//new XMLInt32[digitTblLen];
  173.     tok->setRangeValues(digitRange, digitTblLen);
  174.     setupRange(digitRange, gDigitChars, 0);
  175.     rangeTokMap->setRangeToken(fgXMLDigit, tok);
  176.     // Build word ranges
  177.     unsigned int baseTblLen = getTableLen(gBaseChars);
  178.     unsigned int ideoTblLen = getTableLen(gIdeographicChars);
  179.     unsigned int wordRangeLen = baseTblLen + ideoTblLen + digitTblLen;
  180.     XMLInt32* wordRange = (XMLInt32*) XMLPlatformUtils::fgMemoryManager->allocate
  181.     (
  182.         wordRangeLen * sizeof(XMLInt32)
  183.     );//new XMLInt32[wordRangeLen];
  184.     ArrayJanitor<XMLInt32> janWordRange(wordRange, XMLPlatformUtils::fgMemoryManager);
  185.     setupRange(wordRange, gBaseChars, 0);
  186.     setupRange(wordRange, gIdeographicChars, baseTblLen);
  187.     memcpy(wordRange + baseTblLen + ideoTblLen, digitRange, digitTblLen * sizeof(XMLInt32));
  188.     // Create NameChar ranges
  189.     tok = tokFactory->createRange();
  190.     unsigned int combTblLen = getTableLen(gCombiningChars);
  191.     unsigned int extTblLen = getTableLen(gExtenderChars);
  192.     unsigned int nameTblLen = wordRangeLen + combTblLen + extTblLen;
  193.     XMLInt32* nameRange = (XMLInt32*) XMLPlatformUtils::fgMemoryManager->allocate
  194.     (
  195.         (nameTblLen + 8) * sizeof(XMLInt32)
  196.     );//new XMLInt32[nameTblLen + 8];
  197.     tok->setRangeValues(nameRange, nameTblLen + 8);
  198.     memcpy(nameRange, wordRange, wordRangeLen * sizeof(XMLInt32));
  199.     setupRange(nameRange, gCombiningChars, wordRangeLen);
  200.     setupRange(nameRange, gExtenderChars, wordRangeLen + combTblLen);
  201.     nameRange[nameTblLen++] = chDash;
  202.     nameRange[nameTblLen++] = chDash;
  203.     nameRange[nameTblLen++] = chColon;
  204.     nameRange[nameTblLen++] = chColon;
  205.     nameRange[nameTblLen++] = chPeriod;
  206.     nameRange[nameTblLen++] = chPeriod;
  207.     nameRange[nameTblLen++] = chUnderscore;
  208.     nameRange[nameTblLen++] = chUnderscore;
  209.     tok->sortRanges();
  210.     tok->compactRanges();
  211.     rangeTokMap->setRangeToken(fgXMLNameChar, tok);
  212.     // Create initialNameChar ranges
  213.     tok = tokFactory->createRange();
  214.     unsigned int initialNameTblLen = baseTblLen + ideoTblLen;
  215.     XMLInt32* initialNameRange = (XMLInt32*) XMLPlatformUtils::fgMemoryManager->allocate
  216.     (
  217.         (initialNameTblLen + 4) * sizeof(XMLInt32)
  218.     );//new XMLInt32[initialNameTblLen + 4];
  219.     tok->setRangeValues(initialNameRange, initialNameTblLen + 4);
  220.     memcpy(initialNameRange, wordRange, initialNameTblLen * sizeof(XMLInt32));
  221.     initialNameRange[initialNameTblLen++] = chColon;
  222.     initialNameRange[initialNameTblLen++] = chColon;
  223.     initialNameRange[initialNameTblLen++] = chUnderscore;
  224.     initialNameRange[initialNameTblLen++] = chUnderscore;
  225.     tok->sortRanges();
  226.     tok->compactRanges();
  227.     rangeTokMap->setRangeToken(fgXMLInitialNameChar, tok);
  228.     // Create word range
  229.     tok = tokFactory->createRange();
  230.     tok->setRangeValues(wordRange, wordRangeLen);
  231.     janWordRange.orphan();
  232.     tok->sortRanges();
  233.     tok->compactRanges();
  234.     rangeTokMap->setRangeToken(fgXMLWord, tok);
  235.     fRangesCreated = true;
  236. }
  237. // ---------------------------------------------------------------------------
  238. //  XMLRangeFactory: Range creation methods
  239. // ---------------------------------------------------------------------------
  240. void XMLRangeFactory::initializeKeywordMap() {
  241.     if (fKeywordsInitialized)
  242.         return;
  243.     RangeTokenMap* rangeTokMap = RangeTokenMap::instance();
  244.     rangeTokMap->addKeywordMap(fgXMLSpace, fgXMLCategory);
  245.     rangeTokMap->addKeywordMap(fgXMLDigit, fgXMLCategory);
  246.     rangeTokMap->addKeywordMap(fgXMLWord, fgXMLCategory);
  247.     rangeTokMap->addKeywordMap(fgXMLNameChar, fgXMLCategory);
  248.     rangeTokMap->addKeywordMap(fgXMLInitialNameChar, fgXMLCategory);
  249.     fKeywordsInitialized = true;
  250. }
  251. XERCES_CPP_NAMESPACE_END
  252. /**
  253.   * End of file XMLRangeFactory.cpp
  254.   */