README.CONF
上传用户:seven77cht
上传日期:2007-01-04
资源大小:486k
文件大小:25k
源码类别:

浏览器

开发平台:

Unix_Linux

  1.           WWWOFFLE - World Wide Web Offline Explorer - Version 2.5
  2.           ========================================================
  3. If you are upgrading from version 1.x to version 2.x then you should read the
  4. file CHANGES.CONF which explains how to convert the sections in your existing
  5. wwwoffle.conf file to the new format.
  6. If you are upgrading from version 2.x to this version then the file CHANGES.CONF
  7. shows the new options.
  8. The configuration file (wwwoffle.conf) specifies all of the parameters that
  9. control the operation of the proxy server.  The file is split into sections each
  10. containing a series of parameters as described below.
  11. The file is split into sections, each of which can be empty or contain one or
  12. more lines of configuration information.  The sections are named and the order
  13. that they appear in the file is not important.
  14. The general format of each of the sections is the same.  The name of the section
  15. is on a line by itself to mark the start.  The contents of the section are
  16. enclosed between a pair of lines containing the '{' and '}' characters or '['
  17. and ']' characters.  When the '{' and '}' characters are used the lines between
  18. contain configuration information.  When the '[' and ']' characters are used the
  19. there must only be a single non-empty line between them that contains the name
  20. of a file (in the same directory) containing the configuration information.
  21. Comments are marked by a '#' character at the start of the line and blank lines
  22. are also allowed, both are ignored.
  23. StartUp
  24. -------
  25. This contains the parameters that are used when the program starts, changes to
  26. these are ignored if the configuration file is re-read while the program is
  27. running.
  28. http-port         = <port>          ; An integer specifying the port for the
  29.                                       HTTP proxy (default=8080).
  30. wwwoffle-port     = <port>          ; An integer specifying the port for
  31.                                       WWWOFFLE control connections
  32.                                       (default=8081).
  33. spool-dir         = <dir>           ; The name of the spool directory
  34.                                       (default=/var/spool/wwwoffle).
  35. run-uid           = <user> | <uid>  ; The username or numeric uid to run the
  36.                                       wwwoffled server as (default=none).
  37. run-gid           = <group> | <gid> ; The groupname or numeric gid to run the
  38.                                       wwwoffled server as (default=none).
  39. use-syslog        = yes | no        ; Whether to use the syslog facility for
  40.                                       messages (default=yes).
  41. password          = <word>          ; The password used for authentication of
  42.                                       the control message (default=none).
  43. max-servers       = <integer>       ; The maximum number of server processes
  44.                                       that are started (default=8).
  45. max-fetch-servers = <integer>       ; The maximum number of server processes
  46.                                       that are started to fetch pages that
  47.                                       were marked in offline mode (default=4).
  48. dir-perm          = <octal int>     ; The permissions to use when creating
  49.                                       spool directories (default=0755).
  50. file-perm         = <octal int>     ; The permissions to use when creating
  51.                                       spool files (default=0644).
  52. run-online        = <filename>      ; The name of a program to run when switched
  53.                                       to online mode (default=none).
  54. run-offline       = <filename>      ; The name of a program to run when switched
  55.                                       to offline mode (default=none).
  56. run-autodial      = <filename>      ; The name of a program to run when switched
  57.                                       to autodial mode (default=none).
  58. Notes: For the password to work the configuration file must be set so that only
  59.        authorised users can read it.
  60.      : The run-uid/run-gid options are not applicable to win32 (Win95/98).
  61.      : To use the run-uid/run-gid options the server must be started as root.
  62.      : The max-fetch-servers value must be less than max-servers or you will
  63.        not be able to use WWWOFFLE interactively online while fetching.
  64.      : The dir-perm and file-perm options override the umask settings and must
  65.        be in octal starting with a '0' character.
  66.      : The programs run using the run-online, run-offline and run-autodial
  67.        options are started with a single parameter set to the current mode.
  68. Options
  69. -------
  70. Options that control how the program works.
  71. log-level           = debug | info | important | warning | fatal
  72.                                ; Log messages with this or higher priority
  73.                                  (default=important).
  74. index-latest-days   = <age>    ; The number of days to display in the index of
  75.                                  the latest pages (default=7 days).
  76. request-changed     = <time>   ; While online pages will only be fetched if the
  77.                                  cached version is older than this specified
  78.                                  time in seconds (default=600).
  79. request-changed-once= yes | no ; While online pages will only be fetched if the
  80.                                  cached version has not already been fetched
  81.                                  once this session (default=yes).
  82. request-expired     = yes | no ; While online pages that have expired will
  83.                                  always be requested again (default=no). 
  84. request-no-cache    = yes | no ; While online pages that ask not to be cached
  85.                                  will always be requested again (default=no).
  86. pragma-no-cache     = yes | no ; Whether to request a new copy of a page if the
  87.                                  request from the browser has 'Pragma: no-cache'
  88.                                  (default=yes).
  89. confirm-requests    = yes | no ; Whether to return a page requiring user
  90.                                  confirmation instead of automatically recording
  91.                                  requests made while offline (default=no).
  92. connect-timeout     = <time>   ; The time in seconds that WWWOFFLE will wait for
  93.                                  the socket connection to be made (default=30).
  94. socket-timeout      = <time>   ; The time in seconds that WWWOFFLE will wait for
  95.                                  data before giving up on a socket connection
  96.                                  (default=120).
  97. connect-retry       = yes | no ; If a connection cannot be made to a remote
  98.                                  server then try again after a short delay
  99.                                  (default=no).
  100. ssl-allow-port      = <integer>; A port number that can be used for Secure
  101.                                  Socket Layer (SSL) connections, e.g. https.
  102. no-lasttime-index   = yes | no;  Disables creation of the lasttime/prevtime
  103.                                  indexes (default=no).
  104. intr-download-keep   = yes | no; If the browser closes the connection while
  105.                                  online the currently downloaded partial page
  106.                                  should be kept (default=no).
  107. intr-download-size   =<integer>; If the browser closes the connection while
  108.                                  online the page should continue to download if
  109.                                  smaller than this size in kB (default=1).
  110. intr-download-percent=<integer>; If the browser closes the connection while
  111.                                  online the page should continue to download if
  112.                                  more than this amount complete (default=80).
  113. timeout-download-keep= yes | no; If the server connection timeouts while reading
  114.                                  then the currently downloaded partial page
  115.                                  should be kept (default=no).
  116. Notes: The request-changed option can be set negative to indicate that cached
  117.        pages are always used while online.
  118.      : The request-changed-once option takes precedence over the
  119.        request-changed option.
  120.      : The request-expired and request-no-cache options takes precedence over
  121.        the request-changed-once and request-changed options.
  122.      : The pragma-no-cache option should be set to 'no' if when browsing
  123.        offline all pages are re-requested by a 'broken' browser.
  124.      : The ssl-allow-port should be set to 443 to allow https, there can be more
  125.        than one ssl-port entry for other ports as required.
  126. FetchOptions
  127. ------------
  128. Options that control what is downloaded when fetching pages that were requested
  129. while offline.
  130. stylesheets = yes | no ; If style sheets are to be fetched.
  131. images      = yes | no ; If images are to be fetched.
  132. frames      = yes | no ; If frames are to be fetched.
  133. scripts     = yes | no ; If scripts (e.g. Javascript) are to be fetched.
  134. objects     = yes | no ; If objects (e.g. Java class files) are to be fetched.
  135. Notes: These options all default to 'no' if nothing is specified.
  136. ModifyHTML
  137. ----------
  138. Options that control how the HTML that is provided from the cache is modified.
  139. enable-modify-html      = yes | no  ; Enable the HTML modifications in this
  140.                                       section (has a speed penalty)
  141.                                       (default=no).
  142. add-cache-info          = yes | no  ; At the bottom of all of the spooled pages
  143.                                       the date that the page was cached and some
  144.                                       buttons are to be added (default=no).
  145. anchor-cached-begin     =<HTML code>; Anchors (links) that are cached are to
  146.                                       have the specified HTML inserted at the
  147.                                       beginning (default="").
  148. anchor-cached-end       =<HTML code>; Anchors (links) that are cached are to
  149.                                       have the specified HTML inserted at the
  150.                                       end (default="").
  151. anchor-requested-begin  =<HTML code>; Anchors (links) that have been requested
  152.                                       are to have the specified HTML inserted at
  153.                                       the beginning (default="").
  154. anchor-requested-end    =<HTML code>; Anchors (links) that have been requested
  155.                                       are to have the specified HTML inserted at
  156.                                       the end (default="").
  157. anchor-not-cached-begin =<HTML code>; Anchors (links) that are not cached or
  158.                                       requested are to have the specified HTML
  159.                                       inserted at the beginning (default="").
  160. anchor-not-cached-end   =<HTML code>; Anchors (links) that are not cached or
  161.                                       requested are to have the specified HTML
  162.                                       inserted at the end (default="").
  163. disable-script          = yes | no;   Removes all scripts and scripted events
  164.                                       (default=no).
  165. disable-blink           = yes | no;   Removes the <blink> tag (default=no).
  166. disable-animated-gif    = yes | no;   Disables the animation of GIF files
  167.                                       (default=no).
  168. Notes: These options all rely on the HTML being syntactically correct, if it is
  169.        not then the result is undefined.
  170. LocalHost
  171. ---------
  172. A list of hosts that the host running the wwwoffled server may be known by.
  173. This is so that the proxy does not need to contact itself to get the server
  174. local pages.
  175. <host> ; A hostname or IP address that in connection with the port number (in
  176.          the StartUp section) specifies the WWWOFFLE proxy HTTP server.
  177. Notes: The host names must match exactly, no wildcard matches.
  178.      : All of these hosts are also used the same way as those in the
  179.        LocalNet and AllowedConnectHosts sections.
  180.      : The first named host is used as the server name for several features
  181.        so must be a name that will work from any client host on the network.
  182.      : None of the entries here or in LocalNet are fetched via a proxy.
  183. LocalNet
  184. --------
  185. A list of hosts that are not to be cached by wwwoffled because they are on a
  186. local network.
  187. <host> ; A hostname or IP address that is not to be cached by the server.
  188. Notes: The host name matching uses wildcards (see the WILDCARD section).
  189.      : A host can be excluded by appending a '!' to the start of the name, all
  190.        possible aliases and IP addresses for the host are also required.
  191.      : All entries here are assumed to be reachable even when offline.
  192.      : All of the hosts in LocalHost are also not cached.
  193.      : None of the entries here or in LocalHost are fetched via a proxy.
  194. AllowedConnectHosts
  195. -------------------
  196. A list of client hosts that are allowed to connect to the server.
  197. <host> ; A hostname or IP address that is allowed to connect to the server.
  198. Notes: The host name matching uses wildcards (see the WILDCARD section).
  199.      : A host can be excluded by appending a '!' to the start of the name, all
  200.        possible aliases and IP addresses for the host are also required.
  201.      : All of the hosts in LocalHost are also allowed to connect.
  202. AllowedConnectUsers
  203. -------------------
  204. A list of the users that are allowed to connect to the server.
  205. <username>:<password> ; The username and password of the users that are allowed
  206.                         to connect to the server.
  207. Notes: If this section is left empty then no user authentication is done.
  208.      : The username and password are both stored in plaintext format.
  209.      : This requires the use of browsers that handle the HTTP/1.1 standard.
  210. DontCache
  211. ---------
  212. A list of URLs that are not to be cached by wwwoffled.
  213. URL-SPECIFICATION   ; Do not cache any URLs that match this.
  214. Notes: See the bottom of this file for the description of URL-SPECIFICATION.
  215.      : The URL-SPECIFICATION can be negated, see URL-SPECIFICATION description.
  216.      : The files will still be cached if fetched non-interactively.
  217. DontGet
  218. -------
  219. A list of URLs that are not to be got by wwwoffled (because they contain only
  220. junk adverts for example).
  221. URL-SPECIFICATION [ = <URL> ] ; Do not get any URLs that match this [ with
  222.                                 the option to specify a replacement URL ].
  223. replacement = <URL>           ; The default URL to replace any URLs that match
  224.                                 the URL-SPECIFICATIONs instead of using the
  225.                                 standard error message (default=none).
  226. Notes: See the bottom of this file for the description of URL-SPECIFICATION.
  227.      : The URL-SPECIFICATION can be negated, see URL-SPECIFICATION description.
  228.      : The URL /local/images/trans-1x1.gif is a suggested replacement
  229.        (a 1x1 pixel transparent gif).
  230. DontGetRecursive
  231. ----------------
  232. A list of URLs that are not to be got by wwwoffled when fetching recursively.
  233. URL-SPECIFICATION   ; Do not recursively get any URLs that match this.
  234. Notes: See the bottom of this file for the description of URL-SPECIFICATION.
  235.      : The URL-SPECIFICATION can be negated, see URL-SPECIFICATION description.
  236. DontRequestOffline
  237. ------------------
  238. A list of URLs that cannot be requested by users when offline.
  239. URL-SPECIFICATION   ; Do not request any URLs that match this.
  240. Notes: See the bottom of this file for the description of URL-SPECIFICATION.
  241.      : The URL-SPECIFICATION can be negated, see URL-SPECIFICATION description.
  242. CensorHeader
  243. ------------
  244. A list of HTTP header lines that are to be removed from the requests sent to web
  245. servers and the replies that come back from them.
  246. <header>         = <string> ; A header field name (e.g. From, Cookie, Set-Cookie
  247.                               User-Agent) and the string to replace the header
  248.                               value with.
  249. referer-self     = yes | no ; Sets the Referer header to the same as the URL
  250.                               (default = no).
  251. referer-self-dir = yes | no ; Sets the Referer header to the URL directory name
  252.                               (default = no).
  253. Notes: The header is case sensitive, and does not have a ':' at the end.
  254.      : The value of none or no string can be used to remove the header.
  255.      : This only replaces headers it finds, it does not add any new ones.
  256.      : The referer-self-dir option takes precedence over referer-self.
  257. FTPOptions
  258. ----------
  259. Options to use when fetching files using ftp.
  260. anon-username = <string>      ; The username to use for anonymous ftp
  261.                                 (default=anonymous).
  262. anon-password = <string>      ; The password to use for anonymous ftp
  263.                                 (default=<user>@<host>, determined at run time).
  264. auth-hostname = <host[:port]> ; A host to use a different username and password.
  265. auth-username = <string>      ; The username to use on the above host.
  266. auth-password = <string>      ; The password to use on the above host.
  267. Notes: The anon-password should be set to a sensible value especially if you
  268.        are behind a firewall.
  269.      : The auth-hostname, auth-username and auth-password options must come
  270.        together as a triplet.
  271.      : The auth-hostname must be exact, it is not used as a WILDCARD match.
  272. MIMETypes
  273. ---------
  274. MIME Types to use when fetching files not using HTTP.
  275. default     = <mime-type>/<subtype> ; The default MIME type
  276.                                       (default=text/plain).
  277. .<file-ext> = <mime-type>/<subtype> ; The MIME type to associate with a file
  278.                                       extension.
  279. Notes: You must include the '.' in the file extension.
  280.      : If more than one of the extensions match then the longest is used.
  281. Proxy
  282. -----
  283. This contains the names of the HTTP (or other) proxies to use external to the
  284. local machine.
  285. default             = <host[:port]> ; The hostname and port on it to use as the
  286.                                       default proxy.
  287. URL-SPECIFICATION   = <host[:port]> ; The hostname and port on it to use as the
  288.                                       proxy when getting URLs that match the
  289.                                       URL-SPECIFICATION.
  290. auth-hostname = <host[:port]>  ; A proxy server that uses proxy authentication,
  291.                                  this is where the user must enter a username
  292.                                  and password in the browser to use the proxy.
  293. auth-username = <string>       ; The username to use on the above host.
  294. auth-password = <string>       ; The password to use on the above host.
  295. ssl           = <host[:port]>  ; A proxy server that should be used for Secure
  296.                                  Socket Layer (SSL) connections e.g. https.
  297. Notes: See the bottom of this file for the description of URL-SPECIFICATION.
  298.      : A hostname that matches more than one entry here uses the proxy of the
  299.        longest matching one (protocol is included in assessing length).
  300.      : You can use none or no hostname to indicate that a default or particular
  301.        protocol or host is not to use a proxy.
  302.      : None of the hosts in LocalNet/LocalHost will be fetched via a proxy.
  303.      : The auth-hostname, auth-username and auth-password options must come
  304.        together as a triplet.
  305.      : The auth-hostname must be exact, it is not used as a wildcard match.
  306. DontIndex
  307. ---------
  308. A list of URLs that are not to be cached by wwwoffled.
  309. outgoing = URL-SPECIFICATION  ; Do not index and URLs that match this in the
  310.                                 outgoing index.
  311. latest   = URL-SPECIFICATION  ; Do not index and URLs that match this in the
  312.                                 lasttime/prevtime/latest indexes.
  313. monitor  = URL-SPECIFICATION  ; Do not index and URLs that match this in the
  314.                                 monitor index.
  315. host     = URL-SPECIFICATION  ; Do not index and URLs that match this in the
  316.                                 host indexes.
  317. URL-SPECIFICATION             ; Do not index any URLs that match this in any
  318.                                 of the indexes.
  319. Notes: See the bottom of this file for the description of URL-SPECIFICATION
  320.      : The URL-SPECIFICATION can be negated, see URL-SPECIFICATION description.
  321. Alias
  322. -----
  323. A list of aliases that are used to replace the server name and path with another
  324. server name and path.  Also for servers known by two names.
  325. URL-SPECIFICATION = URL-SPECIFICATION ; Any requests for the first URL-SPEC
  326.                                         are replaced by the second URL-SPEC.
  327. Notes: See the bottom of this file for the description of URL-SPECIFICATION
  328.      : The URL-SPECIFICATIONs must match exactly, no WILDCARDs are used and the
  329.        URL arguments are ignored.
  330. Purge
  331. -----
  332. The method to determine which pages to purge, the default age the host specific
  333. maximum age of the pages in days, and the maximum cache size.
  334. use-mtime           = yes | no ; The method to use to decide which files to
  335.                                  purge, last access time (atime) or last
  336.                                  modification time (mtime) (default=no).
  337. max-size            = <size>   ; The maximum size for the cache in MB after
  338.                                  purging (default=0).
  339. min-free            = <size>   ; The minimum amount of free disk space in MB
  340.                                  after purging (default=0).
  341. use-url             = yes | no ; If true then use the URL to decide on the purge
  342.                                  age, otherwise use the protocol and host only
  343.                                  (default=no).
  344. del-dontget         = yes | no ; If true then delete the files from hosts that
  345.                                  are in the DontGet section (default=no).
  346. del-dontcache       = yes | no ; If true then delete the files from hosts that
  347.                                  are in the DontCache section (default=no).
  348. default             = <age>    ; The default maximum age of pages in days
  349.                                  (default=14).
  350. URL-SPECIFICATION   = <age>    ; The maximum age of pages that match the
  351.                                  URL-SPECIFICATION
  352. Notes: See the bottom of this file for the description of URL-SPECIFICATION
  353.      : A hostname that matches more than one entry here uses the age of the
  354.        longest matching one (protocol is included in assessing length).
  355.      : An age of zero means not to keep, negative not to delete.
  356.      : A maximum cache size of 0 means there is no limit to the size.
  357.      : A minimum disk free of 0 means there is no limit to the free space.
  358.      : If the max-size and min-free options are both used the smaller cache size
  359.        is chosen.
  360.      : The max-size and min-free options take into account the hosts that
  361.        are never purged when measuring the cache size but do not purge them.
  362.      : The URL-SPECIFICATION matches only the protocol and host unless use-url
  363.        is set to true.
  364. --------------------------------------------------------------------------------
  365. WILDCARD
  366. --------
  367. A wildcard match is one that uses the '*' character to represent any group of
  368. characters.
  369. This is basically the same as the command line file matching expressions in DOS
  370. or the UNIX shell, except that the '*' can match the '/' character.  A maximum
  371. of 2 '*' characters can be used in any wildcard.
  372. For example
  373. *.gif      matches  foo.gif and bar.gif
  374. *.foo.com  matches  www.foo.com and ftp.foo.com
  375. /foo/*     matches  /foo/bar.html and /foo/bar/foobar.html
  376. --------------------------------------------------------------------------------
  377. URL-SPECIFICATION
  378. -----------------
  379. When specifying a host and protocol and pathname in many of the sections a
  380. URL-SPECIFICATION can be used, this is a way of recognising a URL.
  381. For the purposes of this explanation a URL is considered to be made up of five
  382. parts.
  383. proto          The protocol that is used (e.g. 'http', 'ftp')
  384. host           The server hostname (e.g. 'www.gedanken.demon.co.uk').
  385. port           The port number on the host (e.g. default of 80 for HTTP).
  386. path           The pathname on the host (e.g. '/bar.html') or a directory name
  387.                (e.g. '/foo/').
  388. args           Optional arguments with the URL used for CGI scripts etc.
  389.                (e.g. 'search=foo').
  390. For example the WWWOFFLE homepage: http://www.gedanken.demon.co.uk/wwwoffle/
  391. The protocol is 'http', the host is 'www.gedanken.demon.co.uk', the port is
  392. the default (in this case 80), and the pathname is '/wwwoffle/'.
  393. In general this is written as <proto>://<host>[:<port>]/<path>[?<args>]
  394. Where [] indicates an optional feature, and <> indicate a user supplied name
  395. or number.
  396. Some example URL-SPECIFICATION options are the following:
  397. *://*              Any protocol, Any host, Any port, Any path, Any args
  398.                    (This is that same as saying 'default').
  399. *://*/<path>       Any protocol, Any host, Any port, Named path, Any args
  400. *://*/*.<ext>      Any protocol, Any host, Any port, Named path, Any args
  401. *://*/*?           Any protocol, Any host, Any port, Any path, No args
  402. *://<path>?*       Any protocol, Any host, Any port, Named path, Any args
  403. *://<host>         Any protocol, Named host, Any port, Any path, Any args
  404. <proto>://         Named protocol, Any host, Any port, Any path, Any args
  405. <proto>://<host>   Named protocol, Named host, Any port, Any path, Any args
  406. <proto>://<host>:  Named protocol, Named host, Default port, Any path Any args
  407. *://<host>:<port>  Any protocol, Named host, Named port, Any path, Any args
  408. The matching of the host, the path and the args use the wildcard matching that
  409. is described above.
  410. In some sections that accept URL-SPECIFICATIONs they can be negated by appending
  411. the '!' character to the start.  This will mean that the comparison of a URL
  412. with the URL-SPECIFICATION will return the logically opposite value to what
  413. would be returned without the '!'.  If all of the URL-SPECIFICATIONs in a
  414. section are negated and '*://*/*' is added to the end then the sense of the
  415. whole section is negated.