crc_i386.c
上传用户:andy_li
上传日期:2007-01-06
资源大小:1019k
文件大小:7k
源码类别:

压缩解压

开发平台:

MultiPlatform

  1. /* crc_i386.c -- Microsoft 32-bit C/C++ adaptation of crc_i386.asm
  2.  * Created by Rodney Brown from crc_i386.asm, modified by Chr. Spieler.
  3.  * Last revised: 22-Mai-1998
  4.  *
  5.  * Original coded (in crc_i386.asm) and put into the public domain
  6.  * by Paul Kienitz and Christian Spieler.
  7.  *
  8.  * Revised 06-Oct-96, Scott Field (sfield@microsoft.com)
  9.  *   fixed to assemble with masm by not using .model directive which makes
  10.  *   assumptions about segment alignment.  Also,
  11.  *   avoid using loop, and j[e]cxz where possible.  Use mov + inc, rather
  12.  *   than lodsb, and other misc. changes resulting in the following performance
  13.  *   increases:
  14.  *
  15.  *      unrolled loops                NO_UNROLLED_LOOPS
  16.  *      *8    >8      <8              *8      >8      <8
  17.  *
  18.  *      +54%  +42%    +35%            +82%    +52%    +25%
  19.  *
  20.  *   first item in each table is input buffer length, even multiple of 8
  21.  *   second item in each table is input buffer length, > 8
  22.  *   third item in each table is input buffer length, < 8
  23.  *
  24.  * Revised 02-Apr-97, Chr. Spieler, based on Rodney Brown (rdb@cmutual.com.au)
  25.  *   Incorporated Rodney Brown's 32-bit-reads optimization as found in the
  26.  *   UNIX AS source crc_i386.S. This new code can be disabled by defining
  27.  *   the macro symbol NO_32_BIT_LOADS.
  28.  *
  29.  * Revised 12-Oct-97, Chr. Spieler, based on Rodney Brown (rdb@cmutual.com.au)
  30.  *   Incorporated Rodney Brown's additional tweaks for 32-bit-optimized CPUs
  31.  *   (like the Pentium Pro, Pentium II, and probably some Pentium clones).
  32.  *   This optimization is controlled by the macro symbol __686 and is disabled
  33.  *   by default. (This default is based on the assumption that most users
  34.  *   do not yet work on a Pentium Pro or Pentium II machine ...)
  35.  *
  36.  * Revised 16-Nov-97, Chr. Spieler: Made code compatible with Borland C++
  37.  *   32-bit, removed unneeded kludge for potentially unknown movzx mnemonic,
  38.  *   confirmed correct working with MS VC++ (32-bit).
  39.  *
  40.  * Revised 22-Mai-98, Peter Kunath, Chr. Spieler : The 16-Nov-97 revision broke
  41.  *   MSVC 5.0. Inside preprocessor macros, each instruction is enclosed in its
  42.  *   own __asm {...} construct.  For MSVC, a "#pragma warning" was added to
  43.  *   shut up the "no return value" warning message.
  44.  *
  45.  * FLAT memory model assumed.
  46.  *
  47.  * The loop unrolling can be disabled by defining the macro NO_UNROLLED_LOOPS.
  48.  * This results in shorter code at the expense of reduced performance.
  49.  *
  50.  */
  51. #include "zip.h"
  52. #ifndef USE_ZLIB
  53. #ifndef ZCONST
  54. #  define ZCONST const
  55. #endif
  56. /* Select wether the following inline-assember code is supported. */
  57. #if (defined(_MSC_VER) && _MSC_VER >= 700)
  58. #if (defined(_M_IX86) && _M_IX86 >= 300)
  59. #  define MSC_INLINE_ASM_32BIT_SUPPORT
  60.    /* Disable warning for no return value, typical of asm functions */
  61. #  pragma warning( disable : 4035 )
  62. #endif
  63. #endif
  64. #if (defined(__BORLANDC__) && __BORLANDC__ >= 452)
  65. #  define MSC_INLINE_ASM_32BIT_SUPPORT
  66. #endif
  67. #ifdef MSC_INLINE_ASM_32BIT_SUPPORT
  68. /* This code is intended for Microsoft C/C++ (32-bit) compatible compilers. */
  69. /*
  70.  * These two (three) macros make up the loop body of the CRC32 cruncher.
  71.  * registers modified:
  72.  *   eax  : crc value "c"
  73.  *   esi  : pointer to next data byte (or dword) "buf++"
  74.  * registers read:
  75.  *   edi  : pointer to base of crc_table array
  76.  * scratch registers:
  77.  *   ebx  : index into crc_table array
  78.  *          (requires upper three bytes = 0 when __686 is undefined)
  79.  */
  80. #ifndef __686
  81. #define Do_CRC { 
  82.   __asm { mov   bl, al }; 
  83.   __asm { shr   eax, 8 }; 
  84.   __asm { xor   eax, [edi+ebx*4] }; }
  85. #else /* __686 */
  86. #define Do_CRC { 
  87.   __asm { movzx ebx, al }; 
  88.   __asm { shr   eax, 8  }; 
  89.   __asm { xor   eax, [edi+ebx*4] }; }
  90. #endif /* ?__686 */
  91. #define Do_CRC_byte { 
  92.   __asm { xor   al, byte ptr [esi] }; 
  93.   __asm { inc   esi }; 
  94.   Do_CRC; }
  95. #ifndef NO_32_BIT_LOADS
  96. #define Do_CRC_dword { 
  97.   __asm { xor   eax, dword ptr [esi] }; 
  98.   __asm { add   esi, 4 }; 
  99.   Do_CRC; 
  100.   Do_CRC; 
  101.   Do_CRC; 
  102.   Do_CRC; }
  103. #endif /* !NO_32_BIT_LOADS */
  104. /* ========================================================================= */
  105. ulg crc32(crc, buf, len)
  106.     ulg crc;                    /* crc shift register */
  107.     ZCONST uch *buf;            /* pointer to bytes to pump through */
  108.     extent len;                 /* number of bytes in buf[] */
  109. /* Run a set of bytes through the crc shift register.  If buf is a NULL
  110.    pointer, then initialize the crc shift register contents instead.
  111.    Return the current crc in either case. */
  112. {
  113.     __asm {
  114.                 push    edx
  115.                 push    ecx
  116.                 mov     esi,buf         ;/* 2nd arg: uch *buf              */
  117.                 sub     eax,eax         ;/*> if (!buf)                     */
  118.                 test    esi,esi         ;/*>   return 0;                   */
  119.                 jz      fine            ;/*> else {                        */
  120.                 call    get_crc_table
  121.                 mov     edi,eax
  122.                 mov     eax,crc         ;/* 1st arg: ulg crc               */
  123. #ifndef __686
  124.                 sub     ebx,ebx         ;/* ebx=0; => bl usable as a dword */
  125. #endif
  126.                 mov     ecx,len         ;/* 3rd arg: extent len            */
  127.                 not     eax             ;/*>   c = ~crc;                   */
  128. #ifndef NO_UNROLLED_LOOPS
  129. #  ifndef NO_32_BIT_LOADS
  130.                 test    ecx,ecx
  131.                 je      bail
  132. align_loop:
  133.                 test    esi,3           ;/* align buf pointer on next      */
  134.                 jz      aligned_now     ;/*  dword boundary                */
  135.     }
  136.                 Do_CRC_byte             ;
  137.     __asm {
  138.                 dec     ecx
  139.                 jnz     align_loop
  140. aligned_now:
  141. #  endif /* !NO_32_BIT_LOADS */
  142.                 mov     edx,ecx         ;/* save len in edx  */
  143.                 and     edx,000000007H  ;/* edx = len % 8    */
  144.                 shr     ecx,3           ;/* ecx = len / 8    */
  145.                 jz      No_Eights
  146. ; align loop head at start of 486 internal cache line !!
  147.                 align   16
  148. Next_Eight:
  149.     }
  150. #  ifndef NO_32_BIT_LOADS
  151.                 Do_CRC_dword ;
  152.                 Do_CRC_dword ;
  153. #  else /* NO_32_BIT_LOADS */
  154.                 Do_CRC_byte ;
  155.                 Do_CRC_byte ;
  156.                 Do_CRC_byte ;
  157.                 Do_CRC_byte ;
  158.                 Do_CRC_byte ;
  159.                 Do_CRC_byte ;
  160.                 Do_CRC_byte ;
  161.                 Do_CRC_byte ;
  162. #  endif /* ?NO_32_BIT_LOADS */
  163.     __asm {
  164.                 dec     ecx
  165.                 jnz     Next_Eight
  166. No_Eights:
  167.                 mov     ecx,edx
  168. #endif /* NO_UNROLLED_LOOPS */
  169. #ifndef NO_JECXZ_SUPPORT
  170.                 jecxz   bail            ;/*>  if (len)                     */
  171. #else
  172.                 test    ecx,ecx         ;/*>  if (len)                     */
  173.                 jz      bail
  174. #endif
  175. ; align loop head at start of 486 internal cache line !!
  176.                 align   16
  177. loupe:                                  ;/*>    do { */
  178.     }
  179.                 Do_CRC_byte             ;/*       c = CRC32(c, *buf++);    */
  180.     __asm {
  181.                 dec     ecx             ;/*>    } while (--len);           */
  182.                 jnz     loupe
  183. bail:                                   ;/*> }                             */
  184.                 not     eax             ;/*> return ~c;                    */
  185. fine:
  186.                 pop     ecx
  187.                 pop     edx
  188.     }
  189. #ifdef NEED_RETURN
  190.     return _EAX;
  191. #endif
  192. }
  193. #endif /* MSC_INLINE_ASM_32BIT_SUPPORT */
  194. #if (defined(_MSC_VER) && _MSC_VER >= 700)
  195. #if (defined(_M_IX86) && _M_IX86 >= 300)
  196.    /* Reenable missing return value warning */
  197. #  pragma warning( default : 4035 )
  198. #endif
  199. #endif
  200. #endif /* !USE_ZLIB */