XMLUri.cpp
上传用户:huihehuasu
上传日期:2007-01-10
资源大小:6948k
文件大小:35k
源码类别:

xml/soap/webservice

开发平台:

C/C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Id: XMLUri.cpp,v 1.10 2001/10/15 15:47:37 tng Exp $
  58.  */
  59. // ---------------------------------------------------------------------------
  60. //  Includes
  61. // ---------------------------------------------------------------------------
  62. #include <util/PlatformUtils.hpp>
  63. #include <util/Janitor.hpp>
  64. #include <util/NumberFormatException.hpp>
  65. #include <util/XMLUri.hpp>
  66. #include <util/XMLString.hpp>
  67. #include <util/XMLUniDefs.hpp>
  68. #include <util/XMLUni.hpp>
  69. // ---------------------------------------------------------------------------
  70. //  XMLUri: static data
  71. // ---------------------------------------------------------------------------
  72. //      Amended by RFC2732
  73. //      reserved      = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" |
  74. //                      "$" | "," | "[" | "]"
  75. //
  76. const XMLCh XMLUri::RESERVED_CHARACTERS[] =
  77. {
  78.     chSemiColon, chForwardSlash, chQuestion, chColon, chAt,
  79.     chAmpersand, chEqual, chPlus, chDollarSign, chComma, chNull
  80. };
  81. //
  82. //      mark          = "-" | "_" | "." | "!" | "~" | "*" | "'" |
  83. //                      "(" | ")"
  84. //
  85. const XMLCh XMLUri::MARK_CHARACTERS[] =
  86. {
  87.     chDash, chUnderscore, chPeriod, chBang, chTilde,
  88.     chAsterisk, chSingleQuote, chOpenParen, chCloseParen, chNull
  89. };
  90. //
  91. //      scheme        = alpha *( alpha | digit | "+" | "-" | "." )
  92. //
  93. const XMLCh XMLUri::SCHEME_CHARACTERS[] =
  94. {
  95.     chPlus, chDash, chPeriod, chNull
  96. };
  97. //
  98. //      userinfo      = *( unreserved | escaped |
  99. //                         ";" | ":" | "&" | "=" | "+" | "$" | "," )
  100. //
  101. const XMLCh XMLUri::USERINFO_CHARACTERS[] =
  102. {
  103.     chSemiColon, chColon, chAmpersand, chEqual, chPlus,
  104.     chDollarSign, chPeriod, chNull
  105. };
  106. // ---------------------------------------------------------------------------
  107. //  Local methods and data
  108. // ---------------------------------------------------------------------------
  109. static const int BUF_LEN = 64;
  110. static XMLCh value1[BUF_LEN+1];
  111. //
  112. // "Scheme"
  113. // "SchemeSpecificPart"
  114. // "Parameters"
  115. // "UserInfo"
  116. // "Host"
  117. // "Port"
  118. // "Path"
  119. // "Query"
  120. // "Fragment"
  121. //
  122. static const XMLCh errMsg_SCHEME[] =
  123. {
  124.     chLatin_S, chLatin_c, chLatin_h, chLatin_e,
  125.     chLatin_m, chLatin_e, chNull
  126. };
  127. static const XMLCh errMsg_SCHEMESPART[] =
  128. {
  129.     chLatin_S, chLatin_c, chLatin_h, chLatin_e, chLatin_m, chLatin_e,
  130.     chLatin_S, chLatin_p, chLatin_e, chLatin_c, chLatin_i, chLatin_f,
  131.     chLatin_i, chLatin_c, chLatin_P, chLatin_a, chLatin_r, chLatin_t,
  132.     chNull
  133. };
  134. static const XMLCh errMsg_PARAMS[] =
  135. {
  136.     chLatin_P, chLatin_a, chLatin_r, chLatin_a, chLatin_m,
  137.     chLatin_e, chLatin_t, chLatin_e, chLatin_r, chLatin_s, chNull
  138. };
  139. static const XMLCh errMsg_USERINFO[] =
  140. {
  141.     chLatin_U, chLatin_s, chLatin_e, chLatin_r,
  142.     chLatin_i, chLatin_n, chLatin_f, chLatin_o, chNull
  143. };
  144. static const XMLCh errMsg_HOST[] =
  145. {
  146.     chLatin_H, chLatin_o, chLatin_s, chLatin_t, chNull
  147. };
  148. static const XMLCh errMsg_PORT[] =
  149. {
  150.     chLatin_P, chLatin_o, chLatin_r, chLatin_t, chNull
  151. };
  152. static const XMLCh errMsg_PATH[] =
  153. {
  154.     chLatin_P, chLatin_a, chLatin_t, chLatin_h, chNull
  155. };
  156. static const XMLCh errMsg_QUERY[] =
  157. {
  158.     chLatin_Q, chLatin_u, chLatin_e, chLatin_r, chLatin_y, chNull
  159. };
  160. static const XMLCh errMsg_FRAGMENT[] =
  161. {
  162.     chLatin_F, chLatin_r, chLatin_a, chLatin_g,
  163.     chLatin_m, chLatin_e, chLatin_n, chLatin_t, chNull
  164. };
  165. //
  166. //  "//"
  167. //  "/"
  168. //  "./"
  169. //  "/."
  170. //  "/../"
  171. //  "/.."
  172. //
  173. static const XMLCh DOUBLE_SLASH[] =
  174. {
  175.     chForwardSlash, chForwardSlash, chNull
  176. };
  177. static const XMLCh SINGLE_SLASH[] =
  178. {
  179.     chForwardSlash, chNull
  180. };
  181. static const XMLCh DOT_SLASH[] =
  182. {
  183.     chPeriod, chForwardSlash, chNull
  184. };
  185. static const XMLCh SLASH_DOT[] =
  186. {
  187.     chForwardSlash, chPeriod, chNull
  188. };
  189. static const XMLCh SLASH_DOTDOT_SLASH[] =
  190. {
  191.     chForwardSlash, chPeriod, chPeriod, chForwardSlash, chNull
  192. };
  193. static const XMLCh SLASH_DOTDOT[] =
  194. {
  195.     chForwardSlash, chPeriod, chPeriod, chNull
  196. };
  197. //
  198. //  ":/?#"
  199. //
  200. // REVISIT: why?
  201. static const XMLCh SCHEME_SEPARATORS[] =
  202. {
  203.     chColon, chForwardSlash, chQuestion, chPound, chNull
  204. };
  205. //
  206. //  "?#"
  207. //
  208. static const XMLCh PATH_SEPARATORS[] =
  209. {
  210.     chQuestion, chPound, chNull
  211. };
  212. // ---------------------------------------------------------------------------
  213. //  XMLUri: Constructors and initialization methods
  214. // ---------------------------------------------------------------------------
  215. XMLUri::~XMLUri()
  216. {
  217.     if (getScheme())
  218.         delete[] fScheme;
  219.     if (getUserInfo())
  220.         delete[] fUserInfo;
  221.     if (getHost())
  222.         delete[] fHost;
  223.     if (getPath())
  224.         delete[] fPath;
  225.     if (getQueryString())
  226.         delete[] fQueryString;
  227.     if (getFragment())
  228.         delete[] fFragment;
  229. }
  230. void XMLUri::initialize(const XMLUri& toCopy)
  231. {
  232.     //
  233.     // assuming that all fields from the toCopy are valid,
  234.     // therefore need NOT to go through various setXXX() methods
  235.     //
  236.     fScheme = XMLString::replicate(toCopy.getScheme());
  237. fUserInfo = XMLString::replicate(toCopy.getUserInfo());
  238. fHost = XMLString::replicate(toCopy.getHost());
  239. fPort = toCopy.getPort();
  240. fPath = XMLString::replicate(toCopy.getPath());
  241. fQueryString = XMLString::replicate(toCopy.getQueryString());
  242. fFragment = XMLString::replicate(toCopy.getFragment());
  243.     }
  244. void XMLUri::initialize(const XMLUri* const baseURI
  245.                       , const XMLCh*  const uriSpec)
  246. {
  247.     // get a trimmed version of uriSpec
  248.     // uriSpec will NO LONGER be used in this function.
  249.     //
  250.     XMLCh* const trimedUriSpec = XMLString::replicate(uriSpec);
  251.     XMLString::trim(trimedUriSpec);
  252.     ArrayJanitor<XMLCh> janName(trimedUriSpec);
  253.     int trimedUriSpecLen = XMLString::stringLen(trimedUriSpec);
  254.     if ( !baseURI &&
  255.         (!trimedUriSpec || trimedUriSpecLen == 0))
  256.     {
  257.         ThrowXML1(NumberFormatException
  258.                , XMLExcepts::XMLNUM_URI_Component_Empty
  259.                , errMsg_PARAMS);
  260.     }
  261. // just make a copy of the base if spec is empty
  262. if (!trimedUriSpec || trimedUriSpecLen == 0)
  263.     {
  264.         initialize(*baseURI);
  265.         return;
  266. }
  267. int index = 0;
  268. // Check for scheme, which must be before `/'. Also handle names with
  269. // DOS drive letters ('D:'), so 1-character schemes are not allowed.
  270.     int colonIdx = XMLString::indexOf(trimedUriSpec, chColon);
  271.     int slashIdx = XMLString::indexOf(trimedUriSpec, chForwardSlash);
  272. if ((colonIdx < 2)                         ||
  273.         (colonIdx > slashIdx && slashIdx != -1) )
  274.     {
  275.         int fragmentIdx = XMLString::indexOf(trimedUriSpec, chPound);  //'#'
  276.         // A standalone base is a valid URI according to spec
  277.         if ( !baseURI && fragmentIdx != 0 )
  278.         {
  279.             ThrowXML(NumberFormatException, XMLExcepts::XMLNUM_URI_No_Scheme);
  280.         }
  281.     }
  282. else
  283.     {
  284.         initializeScheme(trimedUriSpec);
  285.         index = XMLString::stringLen(fScheme)+1;
  286.     }
  287. // two slashes means generic URI syntax, so we get the authority
  288.     XMLCh* authUriSpec = new XMLCh[trimedUriSpecLen+1];
  289.     ArrayJanitor<XMLCh> authName(authUriSpec);
  290.     XMLString::subString(authUriSpec, trimedUriSpec, index, trimedUriSpecLen);
  291.     if (((index+1) < trimedUriSpecLen) &&
  292.         XMLString::startsWith(authUriSpec, DOUBLE_SLASH))
  293.     {
  294.         index += 2;
  295.         int startPos = index;
  296.         // get authority - everything up to path, query or fragment
  297.         XMLCh testChar;
  298.         while (index < trimedUriSpecLen)
  299.         {
  300.             testChar = trimedUriSpec[index];
  301.             if (testChar == chForwardSlash ||
  302.                 testChar == chQuestion     ||
  303.                 testChar == chPound         )
  304.             {
  305.                 break;
  306.             }
  307.             index++;
  308.         }
  309.         // if we found authority, parse it out, otherwise we set the
  310.         // host to empty string
  311.         if (index > startPos)
  312.         {
  313.             XMLString::subString(authUriSpec, trimedUriSpec, startPos, index);
  314.             initializeAuthority(authUriSpec);
  315.         }
  316.         else
  317.         {
  318.             //fHost = 0;
  319.             setHost(0);
  320.         }
  321.     }
  322.     // we need to check if index has exceed the lenght or not
  323.     if (index >= trimedUriSpecLen)
  324.         return;
  325.     XMLCh* pathUriSpec = new XMLCh[trimedUriSpecLen+1];
  326.     ArrayJanitor<XMLCh> pathUriSpecName(pathUriSpec);
  327.     XMLString::subString(pathUriSpec, trimedUriSpec, index, trimedUriSpecLen);
  328. initializePath(pathUriSpec);
  329. // Resolve relative URI to base URI - see RFC 2396 Section 5.2
  330. // In some cases, it might make more sense to throw an exception
  331. // (when scheme is specified is the string spec and the base URI
  332. // is also specified, for example), but we're just following the
  333. // RFC specifications
  334. if ( baseURI )
  335.     {
  336.         // check to see if this is the current doc - RFC 2396 5.2 #2
  337.         // note that this is slightly different from the RFC spec in that
  338.         // we don't include the check for query string being null
  339.         // - this handles cases where the urispec is just a query
  340.         // string or a fragment (e.g. "?y" or "#s") -
  341.         // see <http://www.ics.uci.edu/~fielding/url/test1.html> which
  342.         // identified this as a bug in the RFC
  343.         if ((!fPath || XMLString::stringLen(fPath) == 0) &&
  344.             fScheme == 0 &&
  345.             fHost == 0)
  346.         {
  347.             fScheme = XMLString::replicate(baseURI->getScheme());
  348.             delete [] fUserInfo;
  349.             fUserInfo = XMLString::replicate(baseURI->getUserInfo());
  350.             fHost = XMLString::replicate(baseURI->getHost());
  351.             fPort = baseURI->getPort();
  352.             delete [] fPath;
  353.             fPath = XMLString::replicate(baseURI->getPath());
  354.             if ( !fQueryString )
  355.             {
  356.                 fQueryString = XMLString::replicate(baseURI->getQueryString());
  357.             }
  358.             return;
  359.         }
  360.         // check for scheme - RFC 2396 5.2 #3
  361.         // if we found a scheme, it means absolute URI, so we're done
  362.         if (fScheme == 0)
  363.         {
  364.             fScheme = XMLString::replicate(baseURI->getScheme());
  365.         }
  366.         else
  367.         {
  368.             return;
  369.         }
  370.         // check for authority - RFC 2396 5.2 #4
  371.         // if we found a host, then we've got a network path, so we're done
  372.         if (fHost == 0)
  373.         {
  374.             delete [] fUserInfo;
  375.             fUserInfo = XMLString::replicate(baseURI->getUserInfo());
  376.             fHost = XMLString::replicate(baseURI->getHost());
  377.             fPort = baseURI->getPort();
  378.         }
  379.         else
  380.         {
  381.             return;
  382.         }
  383.         // check for absolute path - RFC 2396 5.2 #5
  384.         if (XMLString::stringLen(fPath) > 0 &&
  385.             XMLString::startsWith(fPath, SINGLE_SLASH))
  386.         {
  387.             return;
  388.         }
  389.         // if we get to this point, we need to resolve relative path
  390.         // RFC 2396 5.2 #6
  391.         XMLCh* basePath = XMLString::replicate(baseURI->getPath());
  392.         ArrayJanitor<XMLCh> basePathName(basePath);
  393.         int bufLen = trimedUriSpecLen+XMLString::stringLen(fPath)+XMLString::stringLen(basePath)+1;
  394.         XMLCh* path = new XMLCh[bufLen];
  395.         ArrayJanitor<XMLCh> pathName(path);
  396.         path[0] = 0;
  397.         XMLCh* tmp1 = new XMLCh[bufLen];
  398.         ArrayJanitor<XMLCh> tmp1Name(tmp1);
  399.         XMLCh* tmp2 = new XMLCh[bufLen];
  400.         ArrayJanitor<XMLCh> tmp2Name(tmp2);
  401.         // 6a - get all but the last segment of the base URI path
  402.         if (basePath)
  403.         {
  404.             int lastSlash = XMLString::lastIndexOf(basePath, chForwardSlash);
  405.             if (lastSlash != -1)
  406.             {
  407.                 XMLString::subString(path, basePath, 0, lastSlash+1);
  408.             }
  409.         }
  410.         // 6b - append the relative URI path
  411.         XMLString::catString(path, fPath);
  412.         // 6c - remove all "./" where "." is a complete path segment
  413.         index = -1;
  414.         while ((index = XMLString::patternMatch(path, DOT_SLASH)) != -1)
  415.         {
  416.             XMLString::subString(tmp1, path, 0, index);
  417.             XMLString::subString(tmp2, path, index+2, XMLString::stringLen(path));
  418.             path[0] = 0;
  419.             XMLString::catString(path, tmp1);
  420.             XMLString::catString(path, tmp2);
  421.         }
  422.         // 6d - remove "." if path ends with "." as a complete path segment
  423.         if (XMLString::endsWith(path, SLASH_DOT))
  424.         {
  425.             path[XMLString::stringLen(path) - 1] = chNull;
  426.         }
  427.         // 6e - remove all "<segment>/../" where "<segment>" is a complete
  428.         // path segment not equal to ".."
  429.         index = 1;
  430.         int segIndex = -1;
  431.         while ((index = XMLString::patternMatch(&(path[1]), SLASH_DOTDOT_SLASH)) != -1)
  432.         {
  433.             segIndex = XMLString::lastIndexOf(&(path[index-1]), chForwardSlash);
  434.             if (segIndex != -1                &&
  435.                 (path[segIndex+1] != chPeriod ||
  436.                  path[index] != chPeriod))
  437.             {
  438.                 XMLString::subString(tmp1, path, 0, segIndex);
  439.                 XMLString::subString(tmp2, path, index+3, XMLString::stringLen(path));
  440.                 path[0] = 0;
  441.                 XMLString::catString(path, tmp1);
  442.                 XMLString::catString(path, tmp2);
  443.                 index = segIndex;
  444.             }
  445.             else
  446.             {
  447.                 index += 4;
  448.             }
  449.         }// while
  450.         // 6f - remove ending "<segment>/.." where "<segment>" is a
  451.         // complete path segment
  452.         if (XMLString::endsWith(path, SLASH_DOTDOT))
  453.         {
  454.             index = XMLString::stringLen(path) - 3;
  455.             segIndex = XMLString::lastIndexOf(&(path[index-1]), chForwardSlash);
  456.             if (segIndex != -1                &&
  457.                 (path[segIndex+1] != chPeriod ||
  458.                  path[index] != chPeriod))
  459.             {
  460.                 path[segIndex+1] = chNull;
  461.             }
  462.         }
  463.         if (getPath())
  464.             delete [] fPath;
  465.         fPath = XMLString::replicate(path);
  466.     }
  467. }
  468. // ---------------------------------------------------------------------------
  469. //  Components initialization
  470. // ---------------------------------------------------------------------------
  471. //
  472. // authority     = server | reg_name
  473. // server        = [ [ userinfo "@" ] hostport ]
  474. // hostport      = host [ ":" port ]
  475. //
  476. // reg_name      = 1*( unreserved | escaped | "$" | "," |
  477. //                    ";" | ":" | "@" | "&" | "=" | "+" )
  478. //
  479. // userinfo      = *( unreserved | escaped |
  480. //                 ";" | ":" | "&" | "=" | "+" | "$" | "," )
  481. //
  482. void XMLUri::initializeAuthority(const XMLCh* const uriSpec)
  483. {
  484.     int index = 0;
  485. int start = 0;
  486.     int end = XMLString::stringLen(uriSpec);
  487.     //
  488.     // server = [ [ userinfo "@" ] hostport ]
  489. // userinfo is everything up @,
  490.     //
  491.     XMLCh* userinfo = new XMLCh[end+1];
  492.     ArrayJanitor<XMLCh> userName(userinfo);
  493.     index = XMLString::indexOf(uriSpec, chAt);
  494.     if ( index != -1)
  495.     {
  496.         XMLString::subString(userinfo, uriSpec, 0, index);
  497.         index++; // skip the @
  498.     }
  499.     else
  500.     {
  501.         XMLString::copyString(userinfo, XMLUni::fgZeroLenString);
  502.         index = 0;
  503.     }
  504.     //
  505.     // hostport = host [ ":" port ]
  506. // host is everything up to ':'
  507.     //
  508. XMLCh* host = new XMLCh[end+1];
  509.     ArrayJanitor<XMLCh> hostName(host);
  510. start = index;
  511.     index = XMLString::indexOf(&(uriSpec[start]), chColon);
  512.     if ( index != -1)
  513.     {
  514.         XMLString::subString(host, uriSpec, start, index);
  515.         index++;  // skip the :
  516.     }
  517.     else
  518.     {
  519.         XMLString::subString(host, uriSpec, start, end);
  520.     }
  521.     // port is everything after ":"
  522.     XMLCh* portStr = new XMLCh[end+1];
  523.     ArrayJanitor<XMLCh> portName(portStr);
  524.     start = index;
  525.     int port = -1;
  526.     if ((XMLString::stringLen(host) > 0) &&   // non empty host
  527.         (start != -1)                    &&   // ":" found
  528.         (start < end)                     )   // ":" is not the last
  529.     {
  530.         XMLString::subString(portStr, uriSpec, start, end);
  531.         if (XMLString::stringLen(portStr) > 0)
  532.         {
  533.             try
  534.             {
  535.                 port = XMLString::parseInt(portStr);
  536.             }
  537.             catch (...)
  538.             {
  539.                 throw;
  540.             }
  541.         }
  542.     } // if > 0
  543.     // The order is important, do not change
  544.     //
  545.     setHost(host);
  546.     setPort(port);
  547. setUserInfo(userinfo);
  548. }
  549. // scheme = alpha *( alpha | digit | "+" | "-" | "." )
  550. void XMLUri::initializeScheme(const XMLCh* const uriSpec)
  551. {
  552.     const XMLCh* tmpPtr = XMLString::findAny(uriSpec, SCHEME_SEPARATORS);
  553.     if ( !tmpPtr )
  554.     {
  555.         ThrowXML(NumberFormatException, XMLExcepts::XMLNUM_URI_No_Scheme);
  556.     }
  557. else
  558.     {
  559.         XMLCh* scheme = new XMLCh[XMLString::stringLen(uriSpec)+1];
  560.         ArrayJanitor<XMLCh> tmpName(scheme);
  561.         XMLString::subString(scheme, uriSpec, 0, (tmpPtr - uriSpec));
  562.         setScheme(scheme);
  563. }
  564. }
  565. void XMLUri::initializePath(const XMLCh* const uriSpec)
  566. {
  567. if ( !uriSpec )
  568.     {
  569.         ThrowXML1(NumberFormatException
  570.                 , XMLExcepts::XMLNUM_URI_Component_Empty
  571.                 , errMsg_PATH);
  572. }
  573. int index = 0;
  574. int start = 0;
  575.     int end = XMLString::stringLen(uriSpec);
  576. XMLCh testChar;
  577. // path - everything up to query string or fragment
  578. while (index < end)
  579.     {
  580.         testChar = uriSpec[index];
  581.         if (testChar == chQuestion || testChar == chPound)
  582.         {
  583.             break;
  584.         }
  585.         // check for valid escape sequence
  586.         if (testChar == chPercent)
  587.         {
  588.             if (index+2 >= end ||
  589.                 !XMLString::isHex(uriSpec[index+1]) ||
  590.                 !XMLString::isHex(uriSpec[index+2]))
  591.             {
  592.                 XMLString::moveChars(value1, &(uriSpec[index]), 3);
  593.                 value1[3] = chNull;
  594.                 ThrowXML2(NumberFormatException
  595.                         , XMLExcepts::XMLNUM_URI_Component_Invalid_EscapeSequence
  596.                         , errMsg_PATH
  597.                         , value1);
  598.             }
  599.         }
  600.         else if (!isReservedCharacter(testChar) &&
  601.                  !isUnreservedCharacter(testChar))
  602.         {
  603.             value1[0] = testChar;
  604.             value1[1] = chNull;
  605.             ThrowXML2(NumberFormatException
  606.                     , XMLExcepts::XMLNUM_URI_Component_Invalid_Char
  607.                     , errMsg_PATH
  608.                     , value1);
  609.         }
  610.         index++;
  611.     }//while (index < end)
  612.     if (getPath())
  613.     {
  614.         delete [] fPath;
  615.     }
  616.     fPath = new XMLCh[index+1];
  617.     XMLString::subString(fPath, uriSpec, start, index);
  618. // query - starts with ? and up to fragment or end
  619. if (testChar == chQuestion)
  620.     {
  621.         index++;
  622.         start = index;
  623.         while (index < end)
  624.         {
  625.             testChar = uriSpec[index];
  626.             if (testChar == chPound)
  627.             {
  628.                 break;
  629.             }
  630.             if (testChar == chPercent)
  631.             {
  632.                 if (index+2 >= end ||
  633.                     !XMLString::isHex(uriSpec[index+1]) ||
  634.                     !XMLString::isHex(uriSpec[index+2]))
  635.                 {
  636.                     XMLString::moveChars(value1, &(uriSpec[index]), 3);
  637.                     value1[3] = chNull;
  638.                     ThrowXML2(NumberFormatException
  639.                             , XMLExcepts::XMLNUM_URI_Component_Invalid_EscapeSequence
  640.                             , errMsg_QUERY
  641.                             , value1);
  642.                 }
  643.             }
  644.             else if (!isReservedCharacter(testChar) &&
  645.                      !isUnreservedCharacter(testChar))
  646.             {
  647.                 value1[0] = testChar;
  648.                 value1[1] = chNull;
  649.                 ThrowXML2(NumberFormatException
  650.                         , XMLExcepts::XMLNUM_URI_Component_Invalid_Char
  651.                         , errMsg_QUERY
  652.                         , value1);
  653.             }
  654.             index++;
  655.         }
  656.         if (getQueryString())
  657.         {
  658.             delete [] fQueryString;
  659.         }
  660.         fQueryString = new XMLCh[index - start + 1];
  661.         XMLString::subString(fQueryString, uriSpec, start, index);
  662.     }
  663. // fragment - starts with #
  664. if (testChar == chPound)
  665.     {
  666.         index++;
  667.         start = index;
  668.         while (index < end)
  669.         {
  670.             testChar = uriSpec[index];
  671.             if (testChar == chPercent)
  672.             {
  673.                 if (index+2 >= end ||
  674.                     !XMLString::isHex(uriSpec[index+1]) ||
  675.                     !XMLString::isHex(uriSpec[index+2]))
  676.                 {
  677.                     XMLString::moveChars(value1, &(uriSpec[index]), 3);
  678.                     value1[3] = chNull;
  679.                     ThrowXML2(NumberFormatException
  680.                             , XMLExcepts::XMLNUM_URI_Component_Invalid_EscapeSequence
  681.                             , errMsg_FRAGMENT
  682.                             , value1);
  683.                 }
  684.             }
  685.             else if (!isReservedCharacter(testChar) &&
  686.                      !isUnreservedCharacter(testChar))
  687.             {
  688.                 value1[0] = testChar;
  689.                 value1[1] = chNull;
  690.                 ThrowXML2(NumberFormatException
  691.                         , XMLExcepts::XMLNUM_URI_Component_Invalid_Char
  692.                         , errMsg_FRAGMENT
  693.                         , value1);
  694.             }
  695.             index++;
  696.         }
  697.         if (getFragment())
  698.         {
  699.             delete [] fFragment;
  700.         }
  701.         fFragment = new XMLCh[index - start + 1];
  702.         XMLString::subString(fFragment, uriSpec, start, index);
  703.     }
  704. }
  705. // ---------------------------------------------------------------------------
  706. //  Setter
  707. // ---------------------------------------------------------------------------
  708. void XMLUri::setScheme(const XMLCh* const newScheme)
  709. {
  710.     if ( !newScheme )
  711.     {
  712.         ThrowXML1(NumberFormatException
  713.                 , XMLExcepts::XMLNUM_URI_Component_Set_Null
  714.                 , errMsg_SCHEME);
  715.     }
  716.     if (!isConformantSchemeName(newScheme))
  717.     {
  718.         ThrowXML2(NumberFormatException
  719.                 , XMLExcepts::XMLNUM_URI_Component_Not_Conformant
  720.                 , errMsg_SCHEME
  721.                 , newScheme);
  722.     }
  723.     if (getScheme())
  724.     {
  725.         delete [] fScheme;
  726.     }
  727.     fScheme = XMLString::replicate(newScheme);
  728.     XMLString::lowerCase(fScheme);
  729. }
  730. //
  731. // server = [ [ userinfo "@" ] hostport ]
  732. // hostport = host [":" port]
  733. //
  734. // setUserInfo(), setHost() and setPort() are closely related
  735. // three methods, in a word, userinfo and port has dependency
  736. // on host.
  737. //
  738. // if host is not present, userinfo must be null and port = -1
  739. //
  740. void XMLUri::setUserInfo(const XMLCh* const newUserInfo)
  741. {
  742.     if ( newUserInfo &&
  743.          !getHost()    )
  744.     {
  745.         ThrowXML2(NumberFormatException
  746.                 , XMLExcepts::XMLNUM_URI_NullHost
  747.                 , errMsg_USERINFO
  748.                 , newUserInfo);
  749.     }
  750.     try
  751.     {
  752.         isConformantUserInfo(newUserInfo);
  753.     }
  754.     catch (...)
  755.     {
  756.         throw;
  757.     }
  758.     if (getUserInfo())
  759.     {
  760.         delete [] fUserInfo;
  761.     }
  762.     fUserInfo = XMLString::replicate(newUserInfo);
  763. }
  764. void XMLUri::setHost(const XMLCh* const newHost)
  765. {
  766.     if ( !newHost ||
  767.         XMLString::isAllWhiteSpace(newHost))
  768.     {
  769.         if (getHost())
  770.             delete [] fHost;
  771.         fHost = 0;
  772.         setUserInfo(0);
  773.         setPort(-1);
  774.         return;
  775.     }
  776.     if (!isWellFormedAddress(newHost))
  777.     {
  778.         ThrowXML2(NumberFormatException
  779.                 , XMLExcepts::XMLNUM_URI_Component_Not_Conformant
  780.                 , errMsg_HOST
  781.                 , newHost);
  782.     }
  783.     if (getHost())
  784.     {
  785.         delete [] fHost;
  786.     }
  787.     fHost = XMLString::replicate(newHost);
  788. }
  789. void XMLUri::setPort(int newPort)
  790. {
  791.     if (newPort >= 0 && newPort <= 65535)
  792.     {
  793.         if (!getHost())
  794.         {
  795.             XMLString::binToText(newPort, value1, BUF_LEN, 10);
  796.             ThrowXML2(NumberFormatException
  797.                     , XMLExcepts::XMLNUM_URI_NullHost
  798.                     , errMsg_PORT
  799.                     , value1);
  800.         }
  801.     }
  802.     else if (newPort != -1)
  803.     {
  804.         XMLString::binToText(newPort, value1, BUF_LEN, 10);
  805.         ThrowXML1(NumberFormatException
  806.                 , XMLExcepts::XMLNUM_URI_PortNo_Invalid
  807.                 , value1);
  808.     }
  809.     fPort = newPort;
  810. }
  811. //
  812. // setPath(), setQueryString() and setFragment() are closely
  813. // related three methods as well.
  814. //
  815. void XMLUri::setPath(const XMLCh* const newPath)
  816. {
  817.     if (!newPath)
  818.     {
  819.         if (getPath())
  820.             delete [] fPath;
  821.         fPath = 0;
  822.         setQueryString(0);
  823.         setFragment(0);
  824.     }
  825.     else
  826.     {
  827.       initializePath(newPath);
  828.     }
  829.   }
  830. //
  831. // fragment = *uric
  832. //
  833. void XMLUri::setFragment(const XMLCh* const newFragment)
  834. {
  835. if ( !newFragment )
  836.     {
  837.         if (getFragment())
  838.             delete [] fFragment;
  839.         fFragment = 0;
  840. }
  841. else if (!isGenericURI())
  842.     {
  843.         ThrowXML2(NumberFormatException
  844.                 , XMLExcepts::XMLNUM_URI_Component_for_GenURI_Only
  845.                 , errMsg_FRAGMENT
  846.                 , newFragment);
  847. }
  848. else if ( !getPath() )
  849.     {
  850.         ThrowXML2(NumberFormatException
  851.                , XMLExcepts::XMLNUM_URI_NullPath
  852.                , errMsg_FRAGMENT
  853.                , newFragment);
  854. }
  855. else if (!isURIString(newFragment))
  856.     {
  857.         ThrowXML1(NumberFormatException
  858.                 , XMLExcepts::XMLNUM_URI_Component_Invalid_Char
  859.                 , errMsg_FRAGMENT);
  860. }
  861. else
  862.     {
  863.         if (getFragment())
  864.         {
  865.             delete [] fFragment;
  866.         }
  867.         fFragment = XMLString::replicate(newFragment);
  868. }
  869. }
  870. //
  871. // query = *uric
  872. //
  873. void XMLUri::setQueryString(const XMLCh* const newQueryString)
  874. {
  875. if ( !newQueryString )
  876.     {
  877.         if (getQueryString())
  878.             delete [] fQueryString;
  879.         fQueryString = 0;
  880. }
  881. else if (!isGenericURI())
  882.     {
  883.         ThrowXML2(NumberFormatException
  884.                 , XMLExcepts::XMLNUM_URI_Component_for_GenURI_Only
  885.                 , errMsg_QUERY
  886.                 , newQueryString);
  887. }
  888. else if ( !getPath() )
  889.     {
  890.         ThrowXML2(NumberFormatException
  891.                 , XMLExcepts::XMLNUM_URI_NullPath
  892.                 , errMsg_QUERY
  893.                 , newQueryString);
  894. }
  895. else if (!isURIString(newQueryString))
  896.     {
  897.         ThrowXML2(NumberFormatException
  898.                , XMLExcepts::XMLNUM_URI_Component_Invalid_Char
  899.                , errMsg_QUERY
  900.                , newQueryString);
  901. }
  902. else
  903.     {
  904.         if (getQueryString())
  905.         {
  906.             delete [] fQueryString;
  907.         }
  908.         fQueryString = XMLString::replicate(newQueryString);
  909. }
  910. }
  911. // ---------------------------------------------------------------------------
  912. //  XMLUri: Public, static methods
  913. // ---------------------------------------------------------------------------
  914. //
  915. //  scheme = alpha *( alpha | digit | "+" | "-" | "." )
  916. //  alphanum = alpha | digit
  917. //
  918. bool XMLUri::isConformantSchemeName(const XMLCh* const scheme)
  919. {
  920. if ( !scheme )
  921.         return false;
  922.     const XMLCh* tmpStr = scheme;
  923.     if (!XMLString::isAlpha(*tmpStr))     // first: alpha
  924.         return false;
  925.     // second onwards: ( alpha | digit | "+" | "-" | "." )
  926.     tmpStr++;
  927.     while (*tmpStr)
  928.     {
  929.         if ( !XMLString::isAlphaNum(*tmpStr) &&
  930.              (XMLString::indexOf(SCHEME_CHARACTERS, *tmpStr) == -1))
  931.             return false;
  932.         tmpStr++;
  933.     }
  934.     return true;
  935. }
  936. //
  937. // userinfo = *( unreserved | escaped |
  938. //              ";" | ":" | "&" | "=" | "+" | "$" | "," )
  939. //
  940. void XMLUri::isConformantUserInfo(const XMLCh* const userInfo)
  941. {
  942. if ( !userInfo )
  943.         return;
  944.     const XMLCh* tmpStr = userInfo;
  945.     while (*tmpStr)
  946.     {
  947.         if ( isUnreservedCharacter(*tmpStr) ||
  948.             (XMLString::indexOf(USERINFO_CHARACTERS, *tmpStr) != -1))
  949.         {
  950.             tmpStr++;
  951.         }
  952.         else if (*tmpStr == chPercent)               // '%'
  953.         {
  954.             if (XMLString::isHex(*(tmpStr+1)) &&     // 1st hex
  955.                 XMLString::isHex(*(tmpStr+2))  )     // 2nd hex
  956.             {
  957.                 tmpStr+=3;
  958.             }
  959.             else
  960.             {
  961.                 value1[0] = chPercent;
  962.                 value1[1] = *(tmpStr+1);
  963.                 value1[2] = *(tmpStr+2);
  964.                 value1[3] = chNull;
  965.                 ThrowXML2(NumberFormatException
  966.                         , XMLExcepts::XMLNUM_URI_Component_Invalid_EscapeSequence
  967.                         , errMsg_USERINFO
  968.                         , value1);
  969.             }
  970.         }
  971.         else
  972.         {
  973.             ThrowXML2(NumberFormatException
  974.                     , XMLExcepts::XMLNUM_URI_Component_Invalid_Char
  975.                     , errMsg_USERINFO
  976.                     , userInfo);
  977.         }
  978.     } //while
  979.     return;
  980. }
  981. //
  982. // uric     = reserved | unreserved | escaped
  983. // escaped  = "%" hex hex
  984. // hex      = digit | "A" | "B" | "C" | "D" | "E" | "F" |
  985. //                    "a" | "b" | "c" | "d" | "e" | "f"
  986. //
  987. bool XMLUri::isURIString(const XMLCh* const uricString)
  988. {
  989. if (!uricString || !*uricString)
  990.         return false;
  991.     const XMLCh* tmpStr = uricString;
  992.     while (*tmpStr)
  993.     {
  994.         if (isReservedCharacter(*tmpStr)    ||
  995.             isUnreservedCharacter(*tmpStr)   )
  996.         {
  997.             tmpStr++;
  998.         }
  999.         else if (*tmpStr == chPercent)               // '%'
  1000.         {
  1001.             if (XMLString::isHex(*(tmpStr+1)) &&     // 1st hex
  1002.                 XMLString::isHex(*(tmpStr+2))  )     // 2nd hex
  1003.             {
  1004.                 tmpStr+=3;
  1005.             }
  1006.             else
  1007.             {
  1008.                 return false;
  1009.             }
  1010.         }
  1011.         else
  1012.         {
  1013.             return false;
  1014.         }
  1015.     }
  1016.     return true;
  1017. }
  1018. //
  1019. //  host          = hostname | IPv4address
  1020. //
  1021. //  hostname      = *( domainlabel "." ) toplabel [ "." ]
  1022. //  domainlabel   = alphanum | alphanum *( alphanum | "-" ) alphanum
  1023. //  toplabel      = alpha | alpha *( alphanum | "-" ) alphanum
  1024. //
  1025. //  IPv4address   = 1*digit "." 1*digit "." 1*digit "." 1*digit
  1026. //
  1027. bool XMLUri::isWellFormedAddress(const XMLCh* const addrString)
  1028. {
  1029. if (!addrString)
  1030.         return false;
  1031.     //
  1032.     // check length
  1033.     //
  1034.     XMLCh* tmpAddr = XMLString::replicate(addrString);
  1035.     ArrayJanitor<XMLCh>  janName(tmpAddr);
  1036.     XMLString::trim(tmpAddr);
  1037.     if ((XMLString::stringLen(tmpAddr) == 0) ||
  1038.         (XMLString::stringLen(tmpAddr) > 255) )
  1039.         return false;
  1040.     //
  1041.     // the frist letter shall NOT be "." or "-"
  1042.     //
  1043. if (*addrString == chPeriod ||
  1044.         *addrString == chDash    )
  1045.         return false;
  1046. // rightmost domain label starting with digit indicates IP address
  1047. // since top level domain label can only start with an alpha
  1048. // see RFC 2396 Section 3.2.2
  1049.     int lastPeriodPos = XMLString::lastIndexOf(addrString, chPeriod);
  1050.     if (lastPeriodPos == -1)
  1051.         return false;
  1052.     int addrStrLen = XMLString::stringLen(addrString);
  1053.     // if the string ends with "."
  1054.     // get the second last "."
  1055.     if (lastPeriodPos == addrStrLen - 1)
  1056.     {
  1057.         XMLCh* tmp2 = new XMLCh[addrStrLen];
  1058.         XMLString::subString(tmp2, addrString, 0, lastPeriodPos);
  1059.         lastPeriodPos = XMLString::lastIndexOf(tmp2, chPeriod);
  1060.         delete [] tmp2;
  1061.         if (lastPeriodPos == -1)
  1062.             return false;
  1063.     }
  1064. if (XMLString::isDigit(addrString[lastPeriodPos + 1]))
  1065.     {
  1066.         //
  1067.         // IPv4address   = 1*digit "." 1*digit "." 1*digit "." 1*digit
  1068.         //
  1069.         // make sure that
  1070.         // 1) we see only digits and dot separators,
  1071.         // 2) that any dot separator is preceded and followed by a digit
  1072.         // 3) that we find 3 dots
  1073.         int numDots = 0;
  1074.         for (int i = 0; i < addrStrLen; i++)
  1075.         {
  1076.             if (addrString[i] == chPeriod)
  1077.             {
  1078.                 if (((i > 0)  &&
  1079.                     (!XMLString::isDigit(addrString[i-1]))) ||
  1080.                     ((i + 1 < addrStrLen) &&
  1081.                     (!XMLString::isDigit(addrString[i+1])))  )
  1082.                 {
  1083.                     return false;
  1084.                 }
  1085.                 numDots++;
  1086.             }
  1087.             else if (!XMLString::isDigit(addrString[i]))
  1088.             {
  1089.                 return false;
  1090.             }
  1091.         } //for
  1092.         if (numDots != 3)
  1093.         {
  1094.             return false;
  1095.         }
  1096.     } // end of IPv4address
  1097. else
  1098.     {
  1099.         //
  1100.         //  hostname      = *( domainlabel "." ) toplabel [ "." ]
  1101.         //  domainlabel   = alphanum | alphanum *( alphanum | "-" ) alphanum
  1102.         //  toplabel      = alpha | alpha *( alphanum | "-" ) alphanum
  1103.         //
  1104.         // domain labels can contain alphanumerics and '-"
  1105.         // but must start and end with an alphanumeric
  1106.         for (int i = 0; i < addrStrLen; i++)
  1107.         {
  1108.             if (addrString[i] == chPeriod)
  1109.             {
  1110.               if (((i > 0)  &&
  1111.                    (!XMLString::isAlphaNum(addrString[i-1]))) ||
  1112.                   ((i + 1 < addrStrLen) &&
  1113.                    (!XMLString::isAlphaNum(addrString[i+1])))  )
  1114.                 {
  1115.                     return false;
  1116.                 }
  1117.             }
  1118.             else if (!XMLString::isAlphaNum(addrString[i]) &&
  1119.                       addrString[i] != chDash)
  1120.             {
  1121.                 return false;
  1122.             }
  1123.         } //for
  1124.     }
  1125.     return true;
  1126. }
  1127. bool XMLUri::isGenericURI()
  1128. {
  1129.     return (getHost() != 0);
  1130. }