README.htdig
上传用户:seven77cht
上传日期:2007-01-04
资源大小:486k
文件大小:6k
源码类别:

浏览器

开发平台:

Unix_Linux

  1.           WWWOFFLE - World Wide Web Offline Explorer - Version 2.4c
  2.           =========================================================
  3. The progam ht://Dig is a free (GPL) internet indexing and search program.  The
  4. ht://Dig documentation describes itself as follows:
  5.         The ht://Dig system is a complete world wide web indexing and
  6.         searching system for a small domain or intranet. This system
  7.         is *not* meant to replace the need for powerful internet-wide
  8.         search systems like Lycos, Infoseek, Webcrawler and AltaVista.
  9.         Instead it is meant to cover the search needs for a single
  10.         company, campus, or even a particular sub section of a web site.
  11.         As opposed to some WAIS-based or web-server based search
  12.         engines, ht://Dig can span several web servers at a site.  The
  13.         type of these different web servers doesn't matter as long as
  14.         they understand the HTTP 1.0 protocol.
  15.         ht://Dig was developed at San Diego State University as a way
  16.         to search the various web servers on the campus network.
  17. I have configured ht://Dig so that it can be used with WWWOFFLE so that the
  18. entire cache of pages can be indexed.  There are three stages to using the
  19. program that are described in this document; installation, digging and
  20. searching.
  21. Installing ht://Dig
  22. -------------------
  23. Note: If you already have version 3.1.0b3 or later of htdig installed and
  24.       working then you can skip this section.
  25. To be able to use this program it must be installed.  The instructions below
  26. give a step-by-step guide to this process.
  27. 1) Get the ht://Dig source code
  28. Download the source for version 3.1.0b4 of the program
  29.         http://www.htdig.org/files/htdig-3.1.0b4.tar.gz 
  30. 2) Unpack the source code
  31. Use
  32.         tar -xvzf htdig-3.1.0b4.tar.gz
  33. to create the directory htdig-3.1.0b4 with the program source files in.
  34. 3) Configure the ht://Dig program
  35. Move to the htdig-3.1.0b4 directory and run the configuration program
  36.         cd htdig-3.1.0b4
  37.         ./configure
  38. 4) Compile ht://Dig
  39. Run make to compile htdig
  40.         make
  41.         make install
  42. This will compile and install it.  Any problems at this stage will require the
  43. use of the ht://Dig documentation to solve.
  44. Configure WWWOFFLE to run with ht://Dig
  45. ---------------------------------------
  46. The configuration files for the htdig programs as used with WWWOFFLE will have
  47. been installed in /var/spool/wwwoffle/html/htdig/conf when WWWOFFLE was
  48. installed.  The scripts used to run the htdig programs will have been installed
  49. in /var/spool/wwwoffle/html/htdig/scripts when WWWOFFLE was installed.
  50. These files should be correct if the information in the WWWOFFLE Makefile
  51. (LOCALHOST and SPOOLDIR) was set correctly.  Check them, they should have the
  52. spool directory and the proxy hostname and port set correctly.
  53. Also they should be checked to ensure that the ht://Dig programs are on the path
  54. (you can edit the PATH variable here if they are not in /usr/local/bin).  The
  55. merging process can use a lot of disk space when the sort program is run, you
  56. can change the location of the temporary directory used for this with the TMPDIR
  57. variable.
  58. The Fuzzy Database
  59. ------------------
  60. The ht://Dig programs use a database of fuzzy word endings and synonyms.  This
  61. needs to be created just once, there is a script provided with WWWOFFLE that
  62. does this.
  63.         /var/spool/wwwoffle/html/htdig/scripts/wwwoffle-htfuzzy
  64. If you have an existing ht://Dig installation then this step will probably have
  65. already been performed and is not required again.
  66. Note: When you do this will take a *long* time since it produces two databases
  67.       that htsearch uses to help in matching words.
  68. Digging and Merging
  69. -------------------
  70. Digging is the name that is given to the process of searching through the
  71. web-pages to make the list of words.  Merging is the process of converting the
  72. raw list of words into a database that can be searched.
  73. The ht://Dig installation will include a script called 'rundig' that
  74. demonstrates how digging and merging is supposed to work.  To work with WWWOFFLE
  75. I have produced my own scripts that should be used instead.
  76.         /var/spool/wwwoffle/html/htdig/scripts/wwwoffle-htdig-full
  77.         /var/spool/wwwoffle/html/htdig/scripts/wwwoffle-htdig-incr
  78.         /var/spool/wwwoffle/html/htdig/scripts/wwwoffle-htdig-lasttime
  79. The first of these scripts will do a full search and index all of the URLs in
  80. the cache.  The second one will do an incremental search and will only index
  81. those that have changed since the last full search was done.  The third will add
  82. in the files in the lasttime index into the database.
  83. Note: The lastime index requires the use of htdig version 3.1.0 or later.
  84. Unfortunately due to the way that the htmerge program works, it will take almost
  85. as long to do an incremental search or a lasttime search as to do a full search.
  86. The only differnce is that for the incremental search and lasttime search the
  87. WWWOFFLE cache is only accessed for the files that have changed.
  88. Searching
  89. ---------
  90. The search page for ht://Dig is located at http://localhost:8080/htdig/ and is
  91. linked to from the "Welcome Page".  The word or words that you want to search
  92. for should be entered here.
  93. This form actually calls the script
  94.         /var/spool/wwwoffle/html/htdig/scripts/wwwoffle-htsearch
  95. to do the searching so it is possible to edit this to modify it if required.
  96. Thanks to
  97. ---------
  98. I would like to thank the htdig maintainer (Geoffrey.R.Hutchison@williams.edu)
  99. for the help that he has provided to get me started with htdig and the patches
  100. and comments that he has accepted from me into the htdig program.
  101. Andrew Bishop
  102. 10th Jan 1999