UnixHTTPURLInputStream.cpp
上传用户:huihehuasu
上传日期:2007-01-10
资源大小:6948k
文件大小:10k
源码类别:

xml/soap/webservice

开发平台:

C/C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: UnixHTTPURLInputStream.cpp,v $
  58.  * Revision 1.7  2001/09/04 17:53:09  peiyongz
  59.  * Bugzilla# 3170: patch from Kevin Philips to handle Query in XMLURL.
  60.  *
  61.  * Revision 1.6  2001/06/25 16:27:04  tng
  62.  * AS400 changes by Linda Swan.
  63.  *
  64.  * Revision 1.5  2000/07/21 03:31:41  andyh
  65.  * Improved (but still weak) http access by the parser.
  66.  *
  67.  * Revision 1.4  2000/05/15 22:31:28  andyh
  68.  * Replace #include<memory.h> with <string.h> everywhere.
  69.  *
  70.  * Revision 1.3  2000/03/24 01:30:32  rahulj
  71.  * Connect to the port specified in the URL, rather than the default
  72.  * one.
  73.  *
  74.  * Revision 1.2  2000/03/22 00:58:11  rahulj
  75.  * Now we throw exceptions when errors occur.
  76.  * Simplified code based on assumption that calling
  77.  * function will allocate enough storage to store the
  78.  * incoming data.
  79.  *
  80.  * Revision 1.1  2000/03/20 23:48:51  rahulj
  81.  * Added Socket based NetAccessor. This will enable one to
  82.  * use HTTP URL's for system id's. Default build options do
  83.  * not use this NetAccessor. Specify the '-n socket' option
  84.  * to 'runConfigure' to configure Xerces-C to use this new
  85.  * feature. The code works under Solaris 2.6, Linux, AIX
  86.  * and HPUX 11 with aCC.
  87.  * Todo's: enable proper error handling.
  88.  *
  89.  */
  90. #include <stdio.h>
  91. #include <stdlib.h>
  92. #include <string.h>
  93. #include <iostream.h>
  94. #include <unistd.h>
  95. #include <sys/types.h>
  96. #include <sys/socket.h>
  97. #include <netinet/in.h>
  98. #include <arpa/inet.h>
  99. #include <netdb.h>
  100. #include <errno.h>
  101. #include <util/XMLNetAccessor.hpp>
  102. #include <util/NetAccessors/Socket/UnixHTTPURLInputStream.hpp>
  103. #include <util/XMLString.hpp>
  104. #include <util/XMLExceptMsgs.hpp>
  105. #include <util/Janitor.hpp>
  106. #include <util/XMLUniDefs.hpp>
  107. UnixHTTPURLInputStream::UnixHTTPURLInputStream(const XMLURL& urlSource)
  108.       : fSocket(0)
  109.       , fBytesProcessed(0)
  110. {
  111.     //
  112.     // Pull all of the parts of the URL out of th urlSource object, and transcode them
  113.     //   and transcode them back to ASCII.
  114.     //
  115.     const XMLCh*        hostName = urlSource.getHost();
  116.     char*               hostNameAsCharStar = XMLString::transcode(hostName);
  117.     ArrayJanitor<char>  janBuf1(hostNameAsCharStar);
  118.     const XMLCh*        path = urlSource.getPath();
  119.     char*               pathAsCharStar = XMLString::transcode(path);
  120.     ArrayJanitor<char>  janBuf2(pathAsCharStar);
  121.     const XMLCh*        fragment = urlSource.getFragment();
  122.     char*               fragmentAsCharStar = 0;
  123.     if (fragment)
  124.         fragmentAsCharStar = XMLString::transcode(fragment);
  125.     ArrayJanitor<char>  janBuf3(fragmentAsCharStar);
  126.     const XMLCh*        query = urlSource.getQuery();
  127.     char*               queryAsCharStar = 0;
  128.     if (query)
  129.         queryAsCharStar = XMLString::transcode(query);
  130.     ArrayJanitor<char>  janBuf4(queryAsCharStar);
  131.     unsigned short      portNumber = (unsigned short) urlSource.getPortNum();
  132.     //
  133.     // Set up a socket.
  134.     //
  135.     struct hostent*     hostEntPtr = 0;
  136.     struct sockaddr_in  sa;
  137.     if ((hostEntPtr = gethostbyname(hostNameAsCharStar)) == NULL)
  138.     {
  139.         unsigned long  numAddress = inet_addr(hostNameAsCharStar);
  140.         if (numAddress < 0)
  141.         {
  142.             ThrowXML(NetAccessorException,
  143.                      XMLExcepts::NetAcc_TargetResolution);
  144.         }
  145.         if ((hostEntPtr =
  146.                 gethostbyaddr((char *) &numAddress,
  147.                               sizeof(unsigned long), AF_INET)) == NULL)
  148.         {
  149.             ThrowXML(NetAccessorException,
  150.                      XMLExcepts::NetAcc_TargetResolution);
  151.         }
  152.     }
  153.     memcpy((void *) &sa.sin_addr,
  154.            (const void *) hostEntPtr->h_addr, hostEntPtr->h_length);
  155.     sa.sin_family = hostEntPtr->h_addrtype;
  156.     sa.sin_port = htons(portNumber);
  157.     int s = socket(hostEntPtr->h_addrtype, SOCK_STREAM, 0);
  158.     if (s < 0)
  159.     {
  160.         ThrowXML(NetAccessorException,
  161.                  XMLExcepts::NetAcc_CreateSocket);
  162.     }
  163.     if (connect(s, (struct sockaddr *) &sa, sizeof(sa)) < 0)
  164.     {
  165.         ThrowXML(NetAccessorException,
  166.                  XMLExcepts::NetAcc_ConnSocket);
  167.     }
  168.     // The port is open and ready to go.
  169.     // Build up the http GET command to send to the server.
  170.     // To do:  We should really support http 1.1.  This implementation
  171.     //         is weak.
  172.     strcpy(fBuffer, "GET ");
  173.     strcat(fBuffer, pathAsCharStar);
  174.     if (queryAsCharStar != 0)
  175.     {
  176. fBuffer[strlen(fBuffer)] = chQuestion;
  177.         strcat(fBuffer, queryAsCharStar);
  178.     }
  179.     if (fragmentAsCharStar != 0)
  180.     {
  181.         strcat(fBuffer, fragmentAsCharStar);
  182.     }
  183.     strcat(fBuffer, " HTTP/1.0rn");
  184.     strcat(fBuffer, "Host: ");
  185.     strcat(fBuffer, hostNameAsCharStar);
  186.     if (portNumber != 80)
  187.     {
  188.         int i = strlen(fBuffer);
  189. sprintf(fBuffer+i, "%d", portNumber);
  190.         // _itoa(portNumber, fBuffer+i, 10);
  191.     }
  192.     strcat(fBuffer, "rnrn");
  193.     // Send the http request
  194.     int lent = strlen(fBuffer);
  195.     int  aLent = 0;
  196.     if ((aLent = write(s, (void *) fBuffer, lent)) != lent)
  197.     {
  198.         ThrowXML(NetAccessorException,
  199.                  XMLExcepts::NetAcc_WriteSocket);
  200.     }
  201.     //
  202.     // get the response, check the http header for errors from the server.
  203.     //
  204.     aLent = read(s, (void *)fBuffer, sizeof(fBuffer)-1);
  205.     if (aLent <= 0)
  206.     {
  207.         ThrowXML(NetAccessorException, XMLExcepts::NetAcc_ReadSocket);
  208.     }
  209.     fBufferEnd = fBuffer+aLent;
  210.     *fBufferEnd = 0;
  211.     // Find the break between the returned http header and any data.
  212.     //  (Delimited by a blank line)
  213.     // Hang on to any data for use by the first read from this BinHTTPURLInputStream.
  214.     //
  215.     fBufferPos = strstr(fBuffer, "rnrn");
  216.     if (fBufferPos != 0)
  217.     {
  218.         fBufferPos += 4;
  219.         *(fBufferPos-2) = 0;
  220.     }
  221.     else
  222.     {
  223.         fBufferPos = strstr(fBuffer, "nn");
  224.         if (fBufferPos != 0)
  225.         {
  226.             fBufferPos += 2;
  227.             *(fBufferPos-1) = 0;
  228.         }
  229.         else
  230.             fBufferPos = fBufferEnd;
  231.     }
  232.     // Make sure the header includes an HTTP 200 OK response.
  233.     //
  234.     char *p = strstr(fBuffer, "HTTP");
  235.     if (p == 0)
  236.     {
  237.         ThrowXML(NetAccessorException, XMLExcepts::NetAcc_ReadSocket);
  238.     }
  239.     p = strchr(p, ' ');
  240.     if (p == 0)
  241.     {
  242.         ThrowXML(NetAccessorException, XMLExcepts::NetAcc_ReadSocket);
  243.     }
  244.     int httpResponse = atoi(p);
  245.     if (httpResponse != 200)
  246.     {
  247.         // Most likely a 404 Not Found error.
  248.         //   Should recognize and handle the forwarding responses.
  249.         //
  250.         ThrowXML(NetAccessorException, XMLExcepts::File_CouldNotOpenFile);
  251.     }
  252.     fSocket = s;
  253. }
  254. UnixHTTPURLInputStream::~UnixHTTPURLInputStream()
  255. {
  256.     shutdown(fSocket, 2);
  257.     close(fSocket);
  258. }
  259. unsigned int UnixHTTPURLInputStream::readBytes(XMLByte* const    toFill
  260.                                       , const unsigned int    maxToRead)
  261. {
  262.     unsigned int len = fBufferEnd - fBufferPos;
  263.     if (len > 0)
  264.     {
  265.         // If there's any data left over in the buffer into which we first
  266.         //   read from the server (to get the http header), return that.
  267.         if (len > maxToRead)
  268.             len = maxToRead;
  269.         memcpy(toFill, fBufferPos, len);
  270.         fBufferPos += len;
  271.     }
  272.     else
  273.     {
  274.         // There was no data in the local buffer.
  275.         // Read some from the socket, straight into our caller's buffer.
  276.         //
  277.         len = read(fSocket, (void *) toFill, maxToRead);
  278.         if (len == -1)
  279.         {
  280.             ThrowXML(NetAccessorException, XMLExcepts::NetAcc_ReadSocket);
  281.         }
  282.     }
  283.     fBytesProcessed += len;
  284.     return len;
  285. }