regress.sgml
上传用户:blenddy
上传日期:2007-01-07
资源大小:6495k
文件大小:14k
源码类别:

数据库系统

开发平台:

Unix_Linux

  1. <Chapter Id="regress">
  2. <Title>Regression Test</Title>
  3. <Abstract>
  4. <Para>
  5. Regression test instructions and analysis.
  6. </Para>
  7. </Abstract>
  8. <Para>
  9.   The PostgreSQL regression tests are a comprehensive set of tests for the
  10.   SQL implementation embedded in PostgreSQL developed by Jolly Chen and
  11.   Andrew Yu. It tests standard SQL operations as well as the extended
  12.   capabilities of PostgreSQL.
  13. </Para>
  14. <Para>
  15.   These tests have recently been revised by Marc Fournier and Thomas Lockhart
  16. and are now packaged as
  17.   functional units which should make them easier to run and easier to interpret.
  18. From <ProductName>PostgreSQL</ProductName> v6.1 onward
  19.  the regression tests are current for every official release. 
  20. </Para>
  21. <Para>
  22.   Some properly installed and fully functional PostgreSQL installations
  23.   can fail some of these regression tests due to artifacts of floating point
  24.   representation and time zone support. The current tests are evaluated
  25.   using a simple "diff" algorithm, and are sensitive to small system
  26.   differences. For apparently failed tests, examining the differences
  27.   may reveal that the differences are not significant.
  28. </Para>
  29. <Para>
  30. The regression testing notes below assume the following (except where noted):
  31. <ItemizedList Mark="bullet" Spacing="compact">
  32. <ListItem>
  33. <Para>
  34. Commands are Unix-compatible. See note below.
  35. </Para>
  36. </ListItem>
  37. <ListItem>
  38. <Para>
  39. Defaults are used except where noted.
  40. </Para>
  41. </ListItem>
  42. <ListItem>
  43. <Para>
  44. User postgres is the <ProductName>Postgres</ProductName> superuser.
  45. </Para>
  46. </ListItem>
  47. <ListItem>
  48. <Para>
  49. The source path is /usr/src/pgsql (other paths are possible).
  50. </Para>
  51. </ListItem>
  52. <ListItem>
  53. <Para>
  54. The runtime path is /usr/local/pgsql (other paths are possible).
  55. </Para>
  56. </ListItem>
  57. </ItemizedList>
  58. </Para>
  59. <Sect1>
  60. <Title>Regression Environment</Title>
  61. <Para>
  62.   The regression test is invoked by the <Command>make</Command> command which compiles
  63.   a <Acronym>C</Acronym> program into a shared library
  64.   in the current directory.  Localized shell scripts are also created in
  65.   the current directory. The output file templates are massaged into the
  66.   <FileName>./expected/*.out</FileName> files.  The localization replaces macros in the source
  67.   files with absolute pathnames and user names.
  68. </Para>
  69. <Para>
  70.   Normally, the regression test should be run as the pg_superuser since
  71.   the 'src/test/regress' directory and sub-directories are owned by the
  72.   pg_superuser. If you run the regression test as another user the
  73.   'src/test/regress' directory tree should be writeable to that user.
  74. </Para>
  75. <Para>
  76.   It was formerly necessary to run the postmaster with system time zone
  77.   set to PST, but this is no longer required.  You can run the regression
  78.   tests under your normal postmaster configuration.  The test script will
  79.   set the PGTZ environment variable to ensure that timezone-dependent tests
  80.   produce the expected results.  However, your system must provide
  81.   library support for the PST8PDT time zone, or the timezone-dependent
  82.   tests will fail.
  83.   To verify that your machine does have this support, type
  84.   the following:
  85. <ProgramListing>
  86.     setenv TZ PST8PDT
  87.     date
  88. </ProgramListing>
  89. </Para>
  90. <Para>
  91.   The "date" command above should have returned the current system time
  92.   in the PST8PDT time zone. If the PST8PDT database is not available, then
  93.   your system may have returned the time in GMT. If the PST8PDT time zone
  94.   is not available, you can set the time zone rules explicitly:
  95. <ProgramListing>
  96.     setenv PGTZ PST8PDT7,M04.01.0,M10.05.03
  97.       </ProgramListing>
  98.     </Para>
  99.   </sect1>
  100.   
  101.   <Sect1>
  102.     <Title>Directory Layout</Title>
  103.     
  104.     <Para>
  105.       <Note>
  106. <Para>
  107.   This should become a table in the previous section.
  108. </Para>
  109.       </Note>
  110.     </Para>
  111.     
  112.     <Para>
  113.       <ProgramListing>
  114.   input/ .... .source files that are converted using 'make all' into
  115.               some of the .sql files in the 'sql' subdirectory
  116.   output/ ... .source files that are converted using 'make all' into
  117.               .out files in the 'expected' subdirectory
  118.   sql/ ...... .sql files used to perform the regression tests
  119.   expected/ . .out files that represent what we *expect* the results to
  120.               look like
  121.   results/ .. .out files that represent what the results *actually* look
  122.               like. Also used as temporary storage for table copy testing.
  123.       </ProgramListing>
  124.     </Para>
  125.   </Sect1>
  126.   
  127.   <Sect1>
  128.     <Title>Regression Test Procedure</Title>
  129.     
  130.     <Para>
  131.       Commands were tested on RedHat Linux version 4.2 using the bash shell.
  132.       Except where noted, they will probably work on most systems. Commands
  133.       like <FileName>ps</FileName> and <FileName>tar</FileName> vary wildly on what options you should use on each
  134.       platform. <Emphasis>Use common sense</Emphasis> before typing in these commands.
  135.     </Para>
  136.       
  137.       <Para>
  138. For a fresh install or upgrading from previous releases of
  139. <ProductName>Postgres</ProductName>:
  140.       </Para>
  141.     
  142.     <Procedure>
  143.       <Title><ProductName>Postgres</ProductName> Regression Configuration</Title>
  144.       <Step Performance="required">
  145. <Para>
  146.   The file /usr/src/pgsql/src/test/regress/README has detailed
  147.   instructions for running and interpreting the regression tests.
  148.   A short version follows here:
  149. </Para>
  150. <Para>
  151.   If the postmaster is not already running, start the postmaster on an
  152.   available window by typing
  153.   <ProgramListing>
  154.     postmaster
  155.   </ProgramListing>
  156.   
  157.   or start the postmaster daemon running in the background by typing
  158.   <ProgramListing>
  159.     cd
  160.     nohup postmaster > regress.log 2>&1 &
  161.   </ProgramListing>
  162. </Para>
  163. <Para>
  164.   Run postmaster from your <ProductName>Postgres</ProductName> super user account (typically
  165.   account postgres).
  166.   
  167.   <Note>
  168.     <Para>
  169.       Do not run <FileName>postmaster</FileName> from the root account.
  170.     </Para>
  171.   </Note>
  172. </Para>
  173.       </Step>
  174.       
  175.       <Step Performance="optional">
  176. <Para>
  177.   If you have previously invoked the regression test, clean up the
  178.   working directory with:
  179.   
  180.   <ProgramListing>
  181.     cd /usr/src/pgsql/src/test/regress
  182.     gmake clean
  183.   </ProgramListing>
  184. </para>
  185. <Para>
  186.   You do not need to type "gmake clean" if this is the first time you
  187.   are running the tests.
  188. </Para>
  189.       </step>
  190.       
  191.       <Step Performance="required">
  192. <Para>
  193.   Build the regression test. Type
  194.   <ProgramListing>
  195.     cd /usr/src/pgsql/src/test/regress
  196.     gmake all
  197.   </ProgramListing>
  198. </Para>
  199.       </Step>
  200.       
  201.       <Step Performance="required">
  202. <Para>
  203.   Run the regression tests.  Type
  204.   <ProgramListing>
  205.     cd /usr/src/pgsql/src/test/regress
  206.     gmake runtest
  207.   </ProgramListing>
  208. </Para>
  209.       </Step>
  210.       
  211.       <Step Performance="required">
  212. <Para>
  213.   
  214.   You should get on the screen (and also written to file ./regress.out)
  215.   a series of statements stating which tests passed and which tests
  216.   failed.  Please note that it can be normal for some of the tests to
  217.   "fail".  For the failed tests, use diff to compare the files in
  218.   directories ./results and ./expected.  If float8 failed, type
  219.   something like:
  220.   <ProgramListing>
  221.     cd /usr/src/pgsql/src/test/regress
  222.     diff -w expected/float8.out results
  223.   </ProgramListing>
  224. </Para>
  225.       </Step>
  226.       
  227.       <Step Performance="required">
  228. <Para>
  229.   After running the tests and examining the results, type
  230.   <ProgramListing>
  231.     destroydb regression
  232.     cd /usr/src/pgsql/src/test/regress
  233.     gmake clean
  234.   </ProgramListing>
  235.   to recover the temporary disk space used by the tests.
  236. </Para>
  237.       </Step>
  238.     </procedure>
  239.   </Sect1>
  240.   
  241.   <Sect1>
  242.     <Title>Regression Analysis</Title>
  243.      <Para>
  244.        The results are in files in the ./results directory. These results
  245.        can be compared with results in the ./expected directory using 'diff'.
  246.        (The test script does this for you, and leaves the differences
  247.        in ./regression.diffs.)
  248.      </Para>
  249.      <Para>
  250.        The files might not compare exactly.  The test script will report
  251.        any difference as a "failure", but the difference might be due
  252.        to small cross-system differences in error message wording,
  253.        math library behavior, etc.
  254.       "Failures" of this type do not indicate a problem with
  255.       <ProductName>Postgres</ProductName>.
  256.     </Para>
  257.     
  258.     <Para>
  259.       Thus, it is necessary to examine the actual differences for each
  260.       "failed" test to determine whether there is really a problem.
  261.       The following paragraphs attempt to provide some guidance in
  262.       determining whether a difference is significant or not.
  263.     </Para>
  264.     
  265.     <Sect2>
  266.       <Title>Error message differences</Title>
  267.       
  268.       <Para>
  269. Some of the regression tests involve intentional invalid input values.
  270. Error messages can come from either the Postgres code or from the host
  271. platform system routines. In the latter case, the messages may vary
  272. between platforms, but should reflect similar information. These
  273. differences in messages will result in a "failed" regression test which
  274. can be validated by inspection.
  275.       </Para>
  276.       
  277.     </Sect2>
  278.     
  279.     <Sect2>
  280.       <Title>OID differences</Title>
  281.       
  282.       <Para>
  283. There are several places where PostgreSQL OID (object identifiers) appear
  284. in 'regress.out'. OID's are unique 32-bit integers which are generated
  285. by the PostgreSQL backend whenever a table row is inserted or updated.
  286. If you run the regression test on a non-virgin database or run it multiple
  287. times, the OID's reported will have different values. 
  288. The following SQL statements in 'misc.out' have shown this behavior:
  289. QUERY: SELECT user_relns() AS user_relns ORDER BY user_relns;
  290. The 'a,523676' row is composed from an OID.
  291.       </Para>
  292.       
  293.     </Sect2>
  294.     
  295.     <Sect2>
  296.       <Title>Date and time differences</Title>
  297.       
  298.       <Para>
  299.   Most of the date and time results are dependent on timezone environment.
  300.   The reference files are generated for timezone PST8PDT (Berkeley,
  301.   California) and there will be apparent failures if the tests are not
  302.   run with that timezone setting.  The regression test driver sets
  303.   environment variable PGTZ to PST8PDT to ensure proper results.
  304.       </Para>
  305.       <Para>
  306.   There appear to be some systems which do not accept the recommended syntax
  307.   for explicitly setting the local time zone rules; you may need to use
  308.   a different PGTZ setting on such machines.
  309.       </Para>
  310.       <Para>
  311.   Some systems using older timezone libraries fail to apply daylight-savings
  312.   corrections to pre-1970 dates, causing pre-1970 PDT times to be displayed
  313.   in PST instead.  This will result in localized differences in the test
  314.   results.
  315.       </Para>
  316.       
  317.     </Sect2>
  318.     
  319.     <Sect2>
  320.       <Title>Floating point differences</Title>
  321.       
  322.       <Para>
  323. Some of the tests involve computing 64-bit (<Type>float8</Type>) numbers from table
  324. columns. Differences in results involving mathematical functions of
  325. <Type>float8</Type> columns have been observed.  The float8
  326. and geometry tests are particularly prone to small differences
  327. across platforms.
  328. Human eyeball comparison is needed to determine the real significance
  329. of these differences which are usually 10 places to the right of
  330. the decimal point.
  331.       </Para>
  332.       <Para>
  333. Some systems signal errors from pow() and exp() differently from
  334. the mechanism expected by the current Postgres code.
  335.       </Para>
  336.       
  337.     </Sect2>
  338.     
  339.     <Sect2>
  340.       <Title>Polygon differences</Title>
  341.       
  342.       <Para>
  343. Several of the tests involve operations on geographic date about the
  344. Oakland/Berkley CA street map. The map data is expressed as polygons
  345. whose vertices are represented as pairs of <Type>float8</Type> numbers (decimal
  346. latitude and longitude). Initially, some tables are created and
  347. loaded with geographic data, then some views are created which join
  348. two tables using the polygon intersection operator (##), then a select
  349. is done on the view. 
  350. When comparing the results from different platforms, differences occur
  351. in the 2nd or 3rd place to the right of the decimal point. The SQL
  352. statements where these problems occur are the folowing:
  353. <ProgramListing>
  354.   QUERY: SELECT * from street;
  355.   QUERY: SELECT * from iexit;
  356. </ProgramListing>
  357.       </Para>
  358.       
  359.     </Sect2>
  360.     
  361.     <Sect2>
  362.       <Title>Random differences</Title>
  363.       
  364.       <Para>
  365. There is at least one test case in random.out which is intended to produce
  366. random results. This causes random to fail the regression testing
  367. once in a while.
  368. Typing
  369. <ProgramListing>
  370.   diff results/random.out expected/random.out
  371. </ProgramListing>
  372. should produce only
  373. one or a few lines of differences for this reason, but other floating
  374. point differences on dissimilar architectures might cause many more
  375. differences. See the release notes below.
  376.       </Para>
  377.       
  378.     </Sect2>
  379.     
  380.     <Sect2>
  381.       <Title>The <Quote>expected</Quote> files</Title>
  382.       
  383.       <Para>
  384. The <FileName>./expected/*.out</FileName> files were adapted from the original monolithic
  385. <FileName>expected.input</FileName> file provided by Jolly Chen et al. Newer versions of these
  386. files generated on various development machines have been substituted after
  387. careful (?) inspection. Many of the development machines are running a
  388. Unix OS variant (FreeBSD, Linux, etc) on Ix86 hardware.
  389. The original <FileName>expected.input</FileName> file was created on a SPARC Solaris 2.4
  390. system using the <FileName>postgres5-1.02a5.tar.gz</FileName> source tree. It was compared
  391. with a file created on an I386 Solaris 2.4 system and the differences
  392. were only in the floating point polygons in the 3rd digit to the right
  393. of the decimal point. (see below)
  394. The original <FileName>sample.regress.out</FileName> file was from the postgres-1.01 release
  395. constructed by Jolly Chen and is included here for reference. It may
  396. have been created on a DEC ALPHA machine as the <FileName>Makefile.global</FileName>
  397. in the postgres-1.01 release has PORTNAME=alpha.
  398.       </Para>
  399.       
  400.     </Sect2>
  401.     
  402.   </Sect1>
  403.   
  404. </Chapter>