webalizer.conf
上传用户:gzpyjq
上传日期:2013-01-31
资源大小:1852k
文件大小:23k
源码类别:

手机WAP编程

开发平台:

WINDOWS

  1. #
  2. # Sample Webalizer configuration file
  3. # Copyright 1997-2000 by Bradford L. Barrett (brad@mrunix.net)
  4. #
  5. # Distributed under the GNU General Public License.  See the
  6. # files "Copyright" and "COPYING" provided with the webalizer
  7. # distribution for additional information.
  8. #
  9. # This is a sample configuration file for the Webalizer (ver 2.01)
  10. # Lines starting with pound signs '#' are comment lines and are
  11. # ignored.  Blank lines are skipped as well.  Other lines are considered
  12. # as configuration lines, and have the form "ConfigOption  Value" where
  13. # ConfigOption is a valid configuration keyword, and Value is the value
  14. # to assign that configuration option.  Invalid keyword/values are
  15. # ignored, with appropriate warnings being displayed.  There must be
  16. # at least one space or tab between the keyword and its value.
  17. #
  18. # As of version 0.98, The Webalizer will look for a 'default' configuration
  19. # file named "webalizer.conf" in the current directory, and if not found
  20. # there, will look for "/etc/webalizer.conf".
  21. # LogFile defines the web server log file to use.  If not specified
  22. # here or on on the command line, input will default to STDIN.  If
  23. # the log filename ends in '.gz' (ie: a gzip compressed file), it will
  24. # be decompressed on the fly as it is being read.
  25. #LogFile        /var/lib/httpd/logs/access_log
  26. # LogType defines the log type being processed.  Normally, the Webalizer
  27. # expects a CLF or Combined web server log as input.  Using this option,
  28. # you can process ftp logs as well (xferlog as produced by wu-ftp and
  29. # others), or Squid native logs.  Values can be 'clf', 'ftp' or 'squid',
  30. # with 'clf' the default.
  31. #LogType clf
  32. # OutputDir is where you want to put the output files.  This should
  33. # should be a full path name, however relative ones might work as well.
  34. # If no output directory is specified, the current directory will be used.
  35. #OutputDir      /var/lib/httpd/htdocs/usage
  36. # HistoryName allows you to specify the name of the history file produced
  37. # by the Webalizer.  The history file keeps the data for up to 12 months
  38. # worth of logs, used for generating the main HTML page (index.html).
  39. # The default is a file named "webalizer.hist", stored in the specified
  40. # output directory.  If you specify just the filename (without a path),
  41. # it will be kept in the specified output directory.  Otherwise, the path
  42. # is relative to the output directory, unless absolute (leading /).
  43. HistoryName webalizer.hist
  44. # Incremental processing allows multiple partial log files to be used
  45. # instead of one huge one.  Useful for large sites that have to rotate
  46. # their log files more than once a month.  The Webalizer will save its
  47. # internal state before exiting, and restore it the next time run, in
  48. # order to continue processing where it left off.  This mode also causes
  49. # The Webalizer to scan for and ignore duplicate records (records already
  50. # processed by a previous run).  See the README file for additional
  51. # information.  The value may be 'yes' or 'no', with a default of 'no'.
  52. # The file 'webalizer.current' is used to store the current state data,
  53. # and is located in the output directory of the program (unless changed
  54. # with the IncrementalName option below).  Please read at least the section
  55. # on Incremental processing in the README file before you enable this option.
  56. Incremental yes
  57. # IncrementalName allows you to specify the filename for saving the
  58. # incremental data in.  It is similar to the HistoryName option where the
  59. # name is relative to the specified output directory, unless an absolute
  60. # filename is specified.  The default is a file named "webalizer.current"
  61. # kept in the normal output directory.  If you don't specify "Incremental"
  62. # as 'yes' then this option has no meaning.
  63. IncrementalName webalizer.current
  64. # ReportTitle is the text to display as the title.  The hostname
  65. # (unless blank) is appended to the end of this string (seperated with
  66. # a space) to generate the final full title string.
  67. # Default is (for english) "Usage Statistics for".
  68. #ReportTitle    Usage Statistics for
  69. # HostName defines the hostname for the report.  This is used in
  70. # the title, and is prepended to the URL table items.  This allows
  71. # clicking on URL's in the report to go to the proper location in
  72. # the event you are running the report on a 'virtual' web server,
  73. # or for a server different than the one the report resides on.
  74. # If not specified here, or on the command line, webalizer will
  75. # try to get the hostname via a uname system call.  If that fails,
  76. # it will default to "localhost".
  77. #HostName       localhost
  78. # HTMLExtension allows you to specify the filename extension to use
  79. # for generated HTML pages.  Normally, this defaults to "html", but
  80. # can be changed for sites who need it (like for PHP embeded pages).
  81. #HTMLExtension  html
  82. # PageType lets you tell the Webalizer what types of URL's you
  83. # consider a 'page'.  Most people consider html and cgi documents
  84. # as pages, while not images and audio files.  If no types are
  85. # specified, defaults will be used ('htm*', 'cgi' and HTMLExtension
  86. # if different for web logs, 'txt' for ftp logs).
  87. PageType *
  88. #PageType htm*
  89. #PageType cgi
  90. #PageType phtml
  91. #PageType php3
  92. #PageType pl
  93. # UseHTTPS should be used if the analysis is being run on a
  94. # secure server, and links to urls should use 'https://' instead
  95. # of the default 'http://'.  If you need this, set it to 'yes'.
  96. # Default is 'no'.  This only changes the behaviour of the 'Top
  97. # URL's' table.
  98. #UseHTTPS       no
  99. # DNSCache specifies the DNS cache filename to use for reverse DNS lookups.
  100. # This file must be specified if you wish to perform name lookups on any IP
  101. # addresses found in the log file.  If an absolute path is not given as
  102. # part of the filename (ie: starts with a leading '/'), then the name is
  103. # relative to the default output directory.  See the DNS.README file for
  104. # additional information.
  105. #DNSCache dns_cache.db
  106. # DNSChildren allows you to specify how many "children" processes are
  107. # run to perform DNS lookups to create or update the DNS cache file.
  108. # If a number is specified, the DNS cache file will be created/updated
  109. # each time the Webalizer is run, immediately prior to normal processing,
  110. # by running the specified number of "children" processes to perform
  111. # DNS lookups.  If used, the DNS cache filename MUST be specified as
  112. # well.  The default value is zero (0), which disables DNS cache file
  113. # creation/updates at run time.  The number of children processes to
  114. # run may be anywhere from 1 to 100, however a large number may effect
  115. # normal system operations.  Reasonable values should be between 5 and
  116. # 20.  See the DNS.README file for additional information.
  117. #DNSChildren 0
  118. # HTMLPre defines HTML code to insert at the very beginning of the
  119. # file.  Default is the DOCTYPE line shown below.  Max line length
  120. # is 80 characters, so use multiple HTMLPre lines if you need more.
  121. #HTMLPre <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
  122. # HTMLHead defines HTML code to insert within the <HEAD></HEAD>
  123. # block, immediately after the <TITLE> line.  Maximum line length
  124. # is 80 characters, so use multiple lines if needed.
  125. #HTMLHead <META NAME="author" CONTENT="The Webalizer">
  126. # HTMLBody defined the HTML code to be inserted, starting with the
  127. # <BODY> tag.  If not specified, the default is shown below.  If
  128. # used, you MUST include your own <BODY> tag as the first line.
  129. # Maximum line length is 80 char, use multiple lines if needed.
  130. HTMLBody <BODY BGCOLOR="#FFFFFF" TEXT="#000000" LINK="#FF0000" VLINK="#A00000">
  131. # HTMLPost defines the HTML code to insert immediately before the
  132. # first <HR> on the document, which is just after the title and
  133. # "summary period"-"Generated on:" lines.  If anything, this should
  134. # be used to clean up in case an image was inserted with HTMLBody.
  135. # As with HTMLHead, you can define as many of these as you want and
  136. # they will be inserted in the output stream in order of apperance.
  137. # Max string size is 80 characters.  Use multiple lines if you need to.
  138. #HTMLPost  <BR CLEAR="all">
  139. # HTMLTail defines the HTML code to insert at the bottom of each
  140. # HTML document, usually to include a link back to your home
  141. # page or insert a small graphic.  It is inserted as a table
  142. # data element (ie: <TD> your code here </TD>) and is right
  143. # alligned with the page.  Max string size is 80 characters.
  144. #HTMLTail <IMG SRC="msfree.png" ALT="100% Micro$oft free!">
  145. # HTMLEnd defines the HTML code to add at the very end of the
  146. # generated files.  It defaults to what is shown below.  If
  147. # used, you MUST specify the </BODY> and </HTML> closing tags
  148. # as the last lines.  Max string length is 80 characters.
  149. #HTMLEnd </BODY></HTML>
  150. # The Quiet option suppresses output messages... Useful when run
  151. # as a cron job to prevent bogus e-mails.  Values can be either
  152. # "yes" or "no".  Default is "no".  Note: this does not suppress
  153. # warnings and errors (which are printed to stderr).
  154. #Quiet no
  155. # ReallyQuiet will supress all messages including errors and
  156. # warnings.  Values can be 'yes' or 'no' with 'no' being the
  157. # default.  If 'yes' is used here, it cannot be overriden from
  158. # the command line, so use with caution.  A value of 'no' has
  159. # no effect.
  160. #ReallyQuiet no
  161. # TimeMe allows you to force the display of timing information
  162. # at the end of processing.  A value of 'yes' will force the
  163. # timing information to be displayed.  A value of 'no' has no
  164. # effect.
  165. #TimeMe no
  166. # GMTTime allows reports to show GMT (UTC) time instead of local
  167. # time.  Default is to display the time the report was generated
  168. # in the timezone of the local machine, such as EDT or PST.  This
  169. # keyword allows you to have times displayed in UTC instead.  Use
  170. # only if you really have a good reason, since it will probably
  171. # screw up the reporting periods by however many hours your local
  172. # time zone is off of GMT.
  173. #GMTTime no
  174. # Debug prints additional information for error messages.  This
  175. # will cause webalizer to dump bad records/fields instead of just
  176. # telling you it found a bad one.   As usual, the value can be
  177. # either "yes" or "no".  The default is "no".  It shouldn't be
  178. # needed unless you start getting a lot of Warning or Error
  179. # messages and want to see why.  (Note: warning and error messages
  180. # are printed to stderr, not stdout like normal messages).
  181. #Debug no
  182. # FoldSeqErr forces the Webalizer to ignore sequence errors.
  183. # This is useful for Netscape and other web servers that cache
  184. # the writing of log records and do not guarentee that they
  185. # will be in chronological order.  The use of the FoldSeqErr
  186. # option will cause out of sequence log records to be treated
  187. # as if they had the same time stamp as the last valid record.
  188. # Default is to ignore out of sequence log records.
  189. FoldSeqErr yes
  190. # VisitTimeout allows you to set the default timeout for a visit
  191. # (sometimes called a 'session').  The default is 30 minutes,
  192. # which should be fine for most sites.
  193. # Visits are determined by looking at the time of the current
  194. # request, and the time of the last request from the site.  If
  195. # the time difference is greater than the VisitTimeout value, it
  196. # is considered a new visit, and visit totals are incremented.
  197. # Value is the number of seconds to timeout (default=1800=30min)
  198. #VisitTimeout 1800
  199. # IgnoreHist shouldn't be used in a config file, but it is here
  200. # just because it might be usefull in certain situations.  If the
  201. # history file is ignored, the main "index.html" file will only
  202. # report on the current log files contents.  Usefull only when you
  203. # want to reproduce the reports from scratch.  USE WITH CAUTION!
  204. # Valid values are "yes" or "no".  Default is "no".
  205. #IgnoreHist no
  206. # Country Graph allows the usage by country graph to be disabled.
  207. # Values can be 'yes' or 'no', default is 'yes'.
  208. #CountryGraph yes
  209. # DailyGraph and DailyStats allows the daily statistics graph
  210. # and statistics table to be disabled (not displayed).  Values
  211. # may be "yes" or "no". Default is "yes".
  212. #DailyGraph yes
  213. #DailyStats yes
  214. # HourlyGraph and HourlyStats allows the hourly statistics graph
  215. # and statistics table to be disabled (not displayed).  Values
  216. # may be "yes" or "no". Default is "yes".
  217. #HourlyGraph yes
  218. #HourlyStats yes
  219. # GraphLegend allows the color coded legends to be turned on or off
  220. # in the graphs.  The default is for them to be displayed.  This only
  221. # toggles the color coded legends, the other legends are not changed.
  222. # If you think they are hideous and ugly, say 'no' here :)
  223. #GraphLegend yes
  224. # GraphLines allows you to have index lines drawn behind the graphs.
  225. # I personally am not crazy about them, but a lot of people requested
  226. # them and they weren't a big deal to add.  The number represents the
  227. # number of lines you want displayed.  Default is 2, you can disable
  228. # the lines by using a value of zero ('0').  [max is 20]
  229. # Note, due to rounding errors, some values don't work quite right.
  230. # The lower the better, with 1,2,3,4,6 and 10 producing nice results.
  231. #GraphLines 2 #DAVI
  232. # The "Top" options below define the number of entries for each table.
  233. # Defaults are Sites=30, URL's=30, Referrers=30 and Agents=15, and
  234. # Countries=30. TopKSites and TopKURLs (by KByte tables) both default
  235. # to 10, as do the top entry/exit tables (TopEntry/TopExit).  The top
  236. # search strings and usernames default to 20.  Tables may be disabled
  237. # by using zero (0) for the value.
  238. TopSites        10
  239. TopKSites       10
  240. TopURLs         10
  241. TopKURLs        10
  242. TopReferrers    10
  243. TopAgents       10
  244. TopCountries    10
  245. TopEntry        0
  246. TopExit         0
  247. TopSearch       10
  248. TopUsers        10
  249. # The All* keywords allow the display of all URL's, Sites, Referrers
  250. # User Agents, Search Strings and Usernames.  If enabled, a seperate
  251. # HTML page will be created, and a link will be added to the bottom
  252. # of the appropriate "Top" table.  There are a couple of conditions
  253. # for this to occur..  First, there must be more items than will fit
  254. # in the "Top" table (otherwise it would just be duplicating what is
  255. # already displayed).  Second, the listing will only show those items
  256. # that are normally visable, which means it will not show any hidden
  257. # items.  Grouped entries will be listed first, followed by individual
  258. # items.  The value for these keywords can be either 'yes' or 'no',
  259. # with the default being 'no'.  Please be aware that these pages can
  260. # be quite large in size, particularly the sites page,  and seperate
  261. # pages are generated for each month, which can consume quite a lot
  262. # of disk space depending on the traffic to your site.
  263. AllSites yes
  264. AllURLs yes
  265. AllReferrers yes
  266. AllAgents yes
  267. AllSearchStr yes
  268. AllUsers        yes
  269. # The Webalizer normally strips the string 'index.' off the end of
  270. # URL's in order to consolidate URL totals.  For example, the URL
  271. # /somedir/index.html is turned into /somedir/ which is really the
  272. # same URL.  This option allows you to specify additional strings
  273. # to treat in the same way.  You don't need to specify 'index.' as
  274. # it is always scanned for by The Webalizer, this option is just to
  275. # specify _additional_ strings if needed.  If you don't need any,
  276. # don't specify any as each string will be scanned for in EVERY
  277. # log record... A bunch of them will degrade performance.  Also,
  278. # the string is scanned for anywhere in the URL, so a string of
  279. # 'home' would turn the URL /somedir/homepages/brad/home.html into
  280. # just /somedir/ which is probably not what was intended.
  281. #IndexAlias     home.htm
  282. #IndexAlias homepage.htm
  283. # The Hide*, Group* and Ignore* and Include* keywords allow you to
  284. # change the way Sites, URL's, Referrers, User Agents and Usernames
  285. # are manipulated.  The Ignore* keywords will cause The Webalizer to
  286. # completely ignore records as if they didn't exist (and thus not
  287. # counted in the main site totals).  The Hide* keywords will prevent
  288. # things from being displayed in the 'Top' tables, but will still be
  289. # counted in the main totals.  The Group* keywords allow grouping
  290. # similar objects as if they were one.  Grouped records are displayed
  291. # in the 'Top' tables and can optionally be displayed in BOLD and/or
  292. # shaded. Groups cannot be hidden, and are not counted in the main
  293. # totals. The Group* options do not, by default, hide all the items
  294. # that it matches.  If you want to hide the records that match (so just
  295. # the grouping record is displayed), follow with an identical Hide*
  296. # keyword with the same value.  (see example below)  In addition,
  297. # Group* keywords may have an optional label which will be displayed
  298. # instead of the keywords value.  The label should be seperated from
  299. # the value by at least one 'white-space' character, such as a space
  300. # or tab.
  301. #
  302. # The value can have either a leading or trailing '*' wildcard
  303. # character.  If no wildcard is found, a match can occur anywhere
  304. # in the string. Given a string "www.yourmama.com", the values "your",
  305. # "*mama.com" and "www.your*" will all match.
  306. # Your own site should be hidden
  307. #HideSite *mrunix.net
  308. #HideSite localhost
  309. # Your own site gives most referrals
  310. #HideReferrer mrunix.net/
  311. # This one hides non-referrers ("-" Direct requests)
  312. HideReferrer Direct Request
  313. # Usually you want to hide these
  314. #HideURL *.gif
  315. #HideURL *.GIF
  316. #HideURL *.jpg
  317. #HideURL *.JPG
  318. #HideURL *.png
  319. #HideURL *.PNG
  320. #HideURL *.ra
  321. # Hiding agents is kind of futile
  322. #HideAgent RealPlayer
  323. # You can also hide based on authenticated username
  324. #HideUser root
  325. #HideUser admin
  326. # Grouping options
  327. #GroupURL /cgi-bin/* CGI Scripts
  328. #GroupURL /images/* Images
  329. #GroupSite *.aol.com
  330. #GroupSite *.compuserve.com
  331. #GroupReferrer yahoo.com/ Yahoo!
  332. #GroupReferrer excite.com/     Excite
  333. #GroupReferrer infoseek.com/   InfoSeek
  334. #GroupReferrer webcrawler.com/ WebCrawler
  335. #GroupUser      root            Admin users
  336. #GroupUser      admin           Admin users
  337. #GroupUser      wheel           Admin users
  338. # The following is a great way to get an overall total
  339. # for browsers, and not display all the detail records.
  340. # (You should use MangleAgent to refine further...)
  341. #GroupAgent MSIE Micro$oft Internet Exploder
  342. #HideAgent MSIE
  343. #GroupAgent Mozilla Netscape
  344. #HideAgent Mozilla
  345. #GroupAgent Lynx* Lynx
  346. #HideAgent Lynx*
  347. # HideAllSites allows forcing individual sites to be hidden in the
  348. # report.  This is particularly useful when used in conjunction
  349. # with the "GroupDomain" feature, but could be useful in other
  350. # situations as well, such as when you only want to display grouped
  351. # sites (with the GroupSite keywords...).  The value for this
  352. # keyword can be either 'yes' or 'no', with 'no' the default,
  353. # allowing individual sites to be displayed.
  354. #HideAllSites no
  355. # The GroupDomains keyword allows you to group individual hostnames
  356. # into their respective domains.  The value specifies the level of
  357. # grouping to perform, and can be thought of as 'the number of dots'
  358. # that will be displayed.  For example, if a visiting host is named
  359. # cust1.tnt.mia.uu.net, a domain grouping of 1 will result in just
  360. # "uu.net" being displayed, while a 2 will result in "mia.uu.net".
  361. # The default value of zero disable this feature.  Domains will only
  362. # be grouped if they do not match any existing "GroupSite" records,
  363. # which allows overriding this feature with your own if desired.
  364. #GroupDomains 0
  365. # The GroupShading allows grouped rows to be shaded in the report.
  366. # Useful if you have lots of groups and individual records that
  367. # intermingle in the report, and you want to diferentiate the group
  368. # records a little more.  Value can be 'yes' or 'no', with 'yes'
  369. # being the default.
  370. #GroupShading yes
  371. # GroupHighlight allows the group record to be displayed in BOLD.
  372. # Can be either 'yes' or 'no' with the default 'yes'.
  373. #GroupHighlight yes
  374. # The Ignore* keywords allow you to completely ignore log records based
  375. # on hostname, URL, user agent, referrer or username.  I hessitated in
  376. # adding these, since the Webalizer was designed to generate _accurate_
  377. # statistics about a web servers performance.  By choosing to ignore
  378. # records, the accuracy of reports become skewed, negating why I wrote
  379. # this program in the first place.  However, due to popular demand, here
  380. # they are.  Use the same as the Hide* keywords, where the value can have
  381. # a leading or trailing wildcard '*'.  Use at your own risk ;)
  382. #IgnoreSite bad.site.net
  383. #IgnoreURL /test*
  384. #IgnoreReferrer file:/*
  385. #IgnoreAgent RealPlayer
  386. #IgnoreUser     root
  387. # The Include* keywords allow you to force the inclusion of log records
  388. # based on hostname, URL, user agent, referrer or username.  They take
  389. # precidence over the Ignore* keywords.  Note: Using Ignore/Include
  390. # combinations to selectivly process parts of a web site is _extremely
  391. # inefficent_!!! Avoid doing so if possible (ie: grep the records to a
  392. # seperate file if you really want that kind of report).
  393. # Example: Only show stats on Joe User's pages...
  394. #IgnoreURL *
  395. #IncludeURL ~joeuser*
  396. # Or based on an authenticated username
  397. #IgnoreUser     *
  398. #IncludeUser    someuser
  399. # The MangleAgents allows you to specify how much, if any, The Webalizer
  400. # should mangle user agent names.  This allows several levels of detail
  401. # to be produced when reporting user agent statistics.  There are six
  402. # levels that can be specified, which define different levels of detail
  403. # supression.  Level 5 shows only the browser name (MSIE or Mozilla)
  404. # and the major version number.  Level 4 adds the minor version number
  405. # (single decimal place).  Level 3 displays the minor version to two
  406. # decimal places.  Level 2 will add any sub-level designation (such
  407. # as Mozilla/3.01Gold or MSIE 3.0b).  Level 1 will attempt to also add
  408. # the system type if it is specified.  The default Level 0 displays the
  409. # full user agent field without modification and produces the greatest
  410. # amount of detail.  User agent names that can't be mangled will be
  411. # left unmodified.
  412. #MangleAgents    0
  413. # The SearchEngine keywords allow specification of search engines and
  414. # their query strings on the URL.  These are used to locate and report
  415. # what search strings are used to find your site.  The first word is
  416. # a substring to match in the referrer field that identifies the search
  417. # engine, and the second is the URL variable used by that search engine
  418. # to define it's search terms.
  419. #SearchEngine yahoo.com p=
  420. #SearchEngine altavista.com q=
  421. #SearchEngine google.com q=
  422. #SearchEngine eureka.com q=
  423. #SearchEngine lycos.com query=
  424. #SearchEngine hotbot.com MT=
  425. #SearchEngine msn.com MT=
  426. #SearchEngine infoseek.com qt=
  427. #SearchEngine webcrawler searchText=
  428. #SearchEngine excite search=
  429. #SearchEngine netscape.com search=
  430. #SearchEngine mamma.com query=
  431. #SearchEngine alltheweb.com query=
  432. #SearchEngine northernlight.com  qr=
  433. # The Dump* keywords allow the dumping of Sites, URL's, Referrers
  434. # User Agents, Usernames and Search strings to seperate tab delimited
  435. # text files, suitable for import into most database or spreadsheet
  436. # programs.
  437. # DumpPath specifies the path to dump the files.  If not specified,
  438. # it will default to the current output directory.  Do not use a
  439. # trailing slash ('/').
  440. #DumpPath /var/lib/httpd/logs
  441. # The DumpHeader keyword specifies if a header record should be
  442. # written to the file.  A header record is the first record of the
  443. # file, and contains the labels for each field written.  Normally,
  444. # files that are intended to be imported into a database system
  445. # will not need a header record, while spreadsheets usually do.
  446. # Value can be either 'yes' or 'no', with 'no' being the default.
  447. #DumpHeader no
  448. # DumpExtension allow you to specify the dump filename extension
  449. # to use.  The default is "tab", but some programs are pickey about
  450. # the filenames they use, so you may change it here (for example,
  451. # some people may prefer to use "csv").
  452. #DumpExtension tab
  453. # These control the dumping of each individual table.  The value
  454. # can be either 'yes' or 'no'.. the default is 'no'.
  455. #DumpSites no
  456. #DumpURLs no
  457. #DumpReferrers no
  458. #DumpAgents no
  459. #DumpUsers no
  460. #DumpSearchStr  no
  461. # End of configuration file...  Have a nice day!