ctype-ucs2.c
上传用户:romrleung
上传日期:2022-05-23
资源大小:18897k
文件大小:37k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /* Copyright (C) 2000 MySQL AB
  2.    
  3.    This library is free software; you can redistribute it and/or
  4.    modify it under the terms of the GNU Library General Public
  5.    License as published by the Free Software Foundation; either
  6.    version 2 of the License, or (at your option) any later version.
  7.    
  8.    This library is distributed in the hope that it will be useful,
  9.    but WITHOUT ANY WARRANTY; without even the implied warranty of
  10.    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
  11.    Library General Public License for more details.
  12.    
  13.    You should have received a copy of the GNU Library General Public
  14.    License along with this library; if not, write to the Free
  15.    Software Foundation, Inc., 59 Temple Place - Suite 330, Boston,
  16.    MA 02111-1307, USA */
  17. /* UCS2 support. Written by Alexander Barkov <bar@mysql.com> */
  18. #include <my_global.h>
  19. #include <my_sys.h>
  20. #include "m_string.h"
  21. #include "m_ctype.h"
  22. #include <errno.h>
  23. #ifdef HAVE_CHARSET_ucs2
  24. #ifndef EILSEQ
  25. #define EILSEQ ENOENT
  26. #endif
  27. extern MY_UNICASE_INFO *uni_plane[256];
  28. static uchar ctype_ucs2[] = {
  29.     0,
  30.    32, 32, 32, 32, 32, 32, 32, 32, 32, 40, 40, 40, 40, 40, 32, 32,
  31.    32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32,
  32.    72, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16,
  33.   132,132,132,132,132,132,132,132,132,132, 16, 16, 16, 16, 16, 16,
  34.    16,129,129,129,129,129,129,  1,  1,  1,  1,  1,  1,  1,  1,  1,
  35.     1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1, 16, 16, 16, 16, 16,
  36.    16,130,130,130,130,130,130,  2,  2,  2,  2,  2,  2,  2,  2,  2,
  37.     2,  2,  2,  2,  2,  2,  2,  2,  2,  2,  2, 16, 16, 16, 16, 32,
  38.     0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,
  39.     0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,
  40.     0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,
  41.     0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,
  42.     0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,
  43.     0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,
  44.     0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,
  45.     0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0
  46. };
  47. static uchar to_lower_ucs2[] = {
  48.     0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15,
  49.    16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31,
  50.    32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47,
  51.    48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63,
  52.    64, 97, 98, 99,100,101,102,103,104,105,106,107,108,109,110,111,
  53.   112,113,114,115,116,117,118,119,120,121,122, 91, 92, 93, 94, 95,
  54.    96, 97, 98, 99,100,101,102,103,104,105,106,107,108,109,110,111,
  55.   112,113,114,115,116,117,118,119,120,121,122,123,124,125,126,127,
  56.   128,129,130,131,132,133,134,135,136,137,138,139,140,141,142,143,
  57.   144,145,146,147,148,149,150,151,152,153,154,155,156,157,158,159,
  58.   160,161,162,163,164,165,166,167,168,169,170,171,172,173,174,175,
  59.   176,177,178,179,180,181,182,183,184,185,186,187,188,189,190,191,
  60.   192,193,194,195,196,197,198,199,200,201,202,203,204,205,206,207,
  61.   208,209,210,211,212,213,214,215,216,217,218,219,220,221,222,223,
  62.   224,225,226,227,228,229,230,231,232,233,234,235,236,237,238,239,
  63.   240,241,242,243,244,245,246,247,248,249,250,251,252,253,254,255
  64. };
  65. static uchar to_upper_ucs2[] = {
  66.     0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15,
  67.    16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31,
  68.    32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47,
  69.    48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63,
  70.    64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79,
  71.    80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95,
  72.    96, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79,
  73.    80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90,123,124,125,126,127,
  74.   128,129,130,131,132,133,134,135,136,137,138,139,140,141,142,143,
  75.   144,145,146,147,148,149,150,151,152,153,154,155,156,157,158,159,
  76.   160,161,162,163,164,165,166,167,168,169,170,171,172,173,174,175,
  77.   176,177,178,179,180,181,182,183,184,185,186,187,188,189,190,191,
  78.   192,193,194,195,196,197,198,199,200,201,202,203,204,205,206,207,
  79.   208,209,210,211,212,213,214,215,216,217,218,219,220,221,222,223,
  80.   224,225,226,227,228,229,230,231,232,233,234,235,236,237,238,239,
  81.   240,241,242,243,244,245,246,247,248,249,250,251,252,253,254,255
  82. };
  83. static int my_ucs2_uni(CHARSET_INFO *cs __attribute__((unused)),
  84.        my_wc_t * pwc, const uchar *s, const uchar *e)
  85. {
  86.   if (s+2 > e) /* Need 2 characters */
  87.     return MY_CS_TOOFEW(0);
  88.   
  89.   *pwc= ((unsigned char)s[0]) * 256  + ((unsigned char)s[1]);
  90.   return 2;
  91. }
  92. static int my_uni_ucs2(CHARSET_INFO *cs __attribute__((unused)) ,
  93.        my_wc_t wc, uchar *r, uchar *e)
  94. {
  95.   if ( r+2 > e ) 
  96.     return MY_CS_TOOSMALL;
  97.   
  98.   r[0]= (uchar) (wc >> 8);
  99.   r[1]= (uchar) (wc & 0xFF);
  100.   return 2;
  101. }
  102. static void my_caseup_ucs2(CHARSET_INFO *cs, char *s, uint slen)
  103. {
  104.   my_wc_t wc;
  105.   int res;
  106.   char *e=s+slen;
  107.   while ((s < e) && (res=my_ucs2_uni(cs,&wc, (uchar *)s, (uchar*)e))>0 )
  108.   {
  109.     int plane = (wc>>8) & 0xFF;
  110.     wc = uni_plane[plane] ? uni_plane[plane][wc & 0xFF].toupper : wc;
  111.     if (res != my_uni_ucs2(cs,wc,(uchar*)s,(uchar*)e))
  112.       break;
  113.     s+=res;
  114.   }
  115. }
  116. static void my_hash_sort_ucs2(CHARSET_INFO *cs, const uchar *s, uint slen,
  117.       ulong *n1, ulong *n2)
  118. {
  119.   my_wc_t wc;
  120.   int res;
  121.   const uchar *e=s+slen;
  122.   while ((s < e) && (res=my_ucs2_uni(cs,&wc, (uchar *)s, (uchar*)e)) >0)
  123.   {
  124.     int plane = (wc>>8) & 0xFF;
  125.     wc = uni_plane[plane] ? uni_plane[plane][wc & 0xFF].sort : wc;
  126.     n1[0]^= (((n1[0] & 63)+n2[0])*(wc & 0xFF))+ (n1[0] << 8);
  127.     n2[0]+=3;
  128.     n1[0]^= (((n1[0] & 63)+n2[0])*(wc >> 8))+ (n1[0] << 8);
  129.     n2[0]+=3;
  130.     s+=res;
  131.   }
  132. }
  133. static void my_caseup_str_ucs2(CHARSET_INFO * cs  __attribute__((unused)), 
  134.        char * s __attribute__((unused)))
  135. {
  136. }
  137. static void my_casedn_ucs2(CHARSET_INFO *cs, char *s, uint slen)
  138. {
  139.   my_wc_t wc;
  140.   int res;
  141.   char *e=s+slen;
  142.   while ((s < e) && (res=my_ucs2_uni(cs, &wc, (uchar*)s, (uchar*)e))>0)
  143.   {
  144.     int plane = (wc>>8) & 0xFF;
  145.     wc = uni_plane[plane] ? uni_plane[plane][wc & 0xFF].tolower : wc;
  146.     if (res != my_uni_ucs2(cs, wc, (uchar*)s, (uchar*)e))
  147.     {
  148.       break;
  149.     }
  150.     s+=res;
  151.   }
  152. }
  153. static void my_casedn_str_ucs2(CHARSET_INFO *cs __attribute__((unused)), 
  154.        char * s __attribute__((unused)))
  155. {
  156. }
  157. static int my_strnncoll_ucs2(CHARSET_INFO *cs, 
  158.      const uchar *s, uint slen, 
  159.                              const uchar *t, uint tlen,
  160.                              my_bool t_is_prefix)
  161. {
  162.   int s_res,t_res;
  163.   my_wc_t s_wc,t_wc;
  164.   const uchar *se=s+slen;
  165.   const uchar *te=t+tlen;
  166.   while ( s < se && t < te )
  167.   {
  168.     int plane;
  169.     s_res=my_ucs2_uni(cs,&s_wc, s, se);
  170.     t_res=my_ucs2_uni(cs,&t_wc, t, te);
  171.     
  172.     if ( s_res <= 0 || t_res <= 0 )
  173.     {
  174.       /* Incorrect string, compare by char value */
  175.       return ((int)s[0]-(int)t[0]); 
  176.     }
  177.     
  178.     plane=(s_wc>>8) & 0xFF;
  179.     s_wc = uni_plane[plane] ? uni_plane[plane][s_wc & 0xFF].sort : s_wc;
  180.     plane=(t_wc>>8) & 0xFF;
  181.     t_wc = uni_plane[plane] ? uni_plane[plane][t_wc & 0xFF].sort : t_wc;
  182.     if ( s_wc != t_wc )
  183.     {
  184.       return  s_wc > t_wc ? 1 : -1;
  185.     }
  186.     
  187.     s+=s_res;
  188.     t+=t_res;
  189.   }
  190.   return t_is_prefix ? (int) (t - te) : (int) ((se - s) - (te - t));
  191. }
  192. /*
  193.   Compare strings, discarding end space
  194.   SYNOPSIS
  195.     my_strnncollsp_ucs2()
  196.     cs                  character set handler
  197.     a                   First string to compare
  198.     a_length            Length of 'a'
  199.     b                   Second string to compare
  200.     b_length            Length of 'b'
  201.   IMPLEMENTATION
  202.     If one string is shorter as the other, then we space extend the other
  203.     so that the strings have equal length.
  204.     This will ensure that the following things hold:
  205.     "a"  == "a "
  206.     "a" < "a"
  207.     "a" < "a "
  208.   RETURN
  209.     < 0  a <  b
  210.     = 0  a == b
  211.     > 0  a > b
  212. */
  213. static int my_strnncollsp_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  214.                                const uchar *s, uint slen,
  215.                                const uchar *t, uint tlen)
  216. {
  217.   const uchar *se, *te;
  218.   uint minlen;
  219.   /* extra safety to make sure the lengths are even numbers */
  220.   slen= (slen >> 1) << 1;
  221.   tlen= (tlen >> 1) << 1;
  222.   se= s + slen;
  223.   te= t + tlen;
  224.   for (minlen= min(slen, tlen); minlen; minlen-= 2)
  225.   {
  226.     int s_wc = uni_plane[s[0]] ? (int) uni_plane[s[0]][s[1]].sort :
  227.                                  (((int) s[0]) << 8) + (int) s[1];
  228.     int t_wc = uni_plane[t[0]] ? (int) uni_plane[t[0]][t[1]].sort : 
  229.                                  (((int) t[0]) << 8) + (int) t[1];
  230.     if ( s_wc != t_wc )
  231.       return  s_wc > t_wc ? 1 : -1;
  232.     s+= 2;
  233.     t+= 2;
  234.   }
  235.   if (slen != tlen)
  236.   {
  237.     int swap= 1;
  238.     if (slen < tlen)
  239.     {
  240.       s= t;
  241.       se= te;
  242.       swap= -1;
  243.     }
  244.     for ( ; s < se ; s+= 2)
  245.     {
  246.       if (s[0] || s[1] != ' ')
  247.         return (s[0] == 0 && s[1] < ' ') ? -swap : swap;
  248.     }
  249.   }
  250.   return 0;
  251. }
  252. static int my_strncasecmp_ucs2(CHARSET_INFO *cs,
  253.        const char *s, const char *t,  uint len)
  254. {
  255.   int s_res,t_res;
  256.   my_wc_t s_wc,t_wc;
  257.   const char *se=s+len;
  258.   const char *te=t+len;
  259.   
  260.   while ( s < se && t < te )
  261.   {
  262.     int plane;
  263.     
  264.     s_res=my_ucs2_uni(cs,&s_wc, (const uchar*)s, (const uchar*)se);
  265.     t_res=my_ucs2_uni(cs,&t_wc, (const uchar*)t, (const uchar*)te);
  266.     
  267.     if ( s_res <= 0 || t_res <= 0 )
  268.     {
  269.       /* Incorrect string, compare by char value */
  270.       return ((int)s[0]-(int)t[0]); 
  271.     }
  272.     
  273.     plane=(s_wc>>8) & 0xFF;
  274.     s_wc = uni_plane[plane] ? uni_plane[plane][s_wc & 0xFF].tolower : s_wc;
  275.     plane=(t_wc>>8) & 0xFF;
  276.     t_wc = uni_plane[plane] ? uni_plane[plane][t_wc & 0xFF].tolower : t_wc;
  277.     
  278.     if ( s_wc != t_wc )
  279.       return  ((int) s_wc) - ((int) t_wc);
  280.     
  281.     s+=s_res;
  282.     t+=t_res;
  283.   }
  284.   return (int) ( (se-s) - (te-t) );
  285. }
  286. static int my_strcasecmp_ucs2(CHARSET_INFO *cs, const char *s, const char *t)
  287. {
  288.   uint s_len=strlen(s);
  289.   uint t_len=strlen(t);
  290.   uint len = (s_len > t_len) ? s_len : t_len;
  291.   return  my_strncasecmp_ucs2(cs, s, t, len);
  292. }
  293. static int my_strnxfrm_ucs2(CHARSET_INFO *cs, 
  294. uchar *dst, uint dstlen, const uchar *src, uint srclen)
  295. {
  296.   my_wc_t wc;
  297.   int res;
  298.   int plane;
  299.   uchar *de = dst + dstlen;
  300.   const uchar *se = src + srclen;
  301.   while( src < se && dst < de )
  302.   {
  303.     if ((res=my_ucs2_uni(cs,&wc, src, se))<0)
  304.     {
  305.       break;
  306.     }
  307.     src+=res;
  308.     srclen-=res;
  309.     
  310.     plane=(wc>>8) & 0xFF;
  311.     wc = uni_plane[plane] ? uni_plane[plane][wc & 0xFF].sort : wc;
  312.     
  313.     if ((res=my_uni_ucs2(cs,wc,dst,de)) <0)
  314.     {
  315.       break;
  316.     }
  317.     dst+=res;
  318.   }
  319.   if (dst < de)
  320.     cs->cset->fill(cs, dst, de - dst, ' ');
  321.   return dstlen;
  322. }
  323. static int my_ismbchar_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  324.                      const char *b __attribute__((unused)),
  325.                      const char *e __attribute__((unused)))
  326. {
  327.   return 2;
  328. }
  329. static int my_mbcharlen_ucs2(CHARSET_INFO *cs  __attribute__((unused)) , 
  330.                       uint c __attribute__((unused)))
  331. {
  332.   return 2;
  333. }
  334. #include <m_string.h>
  335. #include <stdarg.h>
  336. static int my_vsnprintf_ucs2(char *dst, uint n, const char* fmt, va_list ap)
  337. {
  338.   char *start=dst, *end=dst+n-1;
  339.   for (; *fmt ; fmt++)
  340.   {
  341.     if (fmt[0] != '%')
  342.     {
  343.       if (dst == end) /* End of buffer */
  344. break;
  345.       
  346.       *dst++=''; *dst++= *fmt; /* Copy ordinary char */
  347.       continue;
  348.     }
  349.     
  350.     fmt++;
  351.     
  352.     /* Skip if max size is used (to be compatible with printf) */
  353.     while ( (*fmt>='0' && *fmt<='9') || *fmt == '.' || *fmt == '-')
  354.       fmt++;
  355.     
  356.     if (*fmt == 'l')
  357.       fmt++;
  358.     
  359.     if (*fmt == 's') /* String parameter */
  360.     {
  361.       reg2 char *par = va_arg(ap, char *);
  362.       uint plen;
  363.       uint left_len = (uint)(end-dst);
  364.       if (!par) par = (char*)"(null)";
  365.       plen = (uint) strlen(par);
  366.       if (left_len <= plen*2)
  367. plen = left_len/2 - 1;
  368.       for ( ; plen ; plen--, dst+=2, par++)
  369.       {
  370.         dst[0]='';
  371.         dst[1]=par[0];
  372.       }
  373.       continue;
  374.     }
  375.     else if (*fmt == 'd' || *fmt == 'u') /* Integer parameter */
  376.     {
  377.       register int iarg;
  378.       char nbuf[16];
  379.       char *pbuf=nbuf;
  380.       
  381.       if ((uint) (end-dst) < 32)
  382. break;
  383.       iarg = va_arg(ap, int);
  384.       if (*fmt == 'd')
  385. int10_to_str((long) iarg, nbuf, -10);
  386.       else
  387. int10_to_str((long) (uint) iarg,nbuf,10);
  388.       for (; pbuf[0]; pbuf++)
  389.       {
  390.         *dst++='';
  391.         *dst++=*pbuf;
  392.       }
  393.       continue;
  394.     }
  395.     
  396.     /* We come here on '%%', unknown code or too long parameter */
  397.     if (dst == end)
  398.       break;
  399.     *dst++='';
  400.     *dst++='%'; /* % used as % or unknown code */
  401.   }
  402.   
  403.   DBUG_ASSERT(dst <= end);
  404.   *dst=''; /* End of errmessage */
  405.   return (uint) (dst - start);
  406. }
  407. static int my_snprintf_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  408.     char* to, uint n, const char* fmt, ...)
  409. {
  410.   va_list args;
  411.   va_start(args,fmt);
  412.   return my_vsnprintf_ucs2(to, n, fmt, args);
  413. }
  414. long my_strntol_ucs2(CHARSET_INFO *cs,
  415.      const char *nptr, uint l, int base,
  416.      char **endptr, int *err)
  417. {
  418.   int      negative=0;
  419.   int      overflow;
  420.   int      cnv;
  421.   my_wc_t  wc;
  422.   register unsigned int cutlim;
  423.   register uint32 cutoff;
  424.   register uint32 res;
  425.   register const uchar *s= (const uchar*) nptr;
  426.   register const uchar *e= (const uchar*) nptr+l;
  427.   const uchar *save;
  428.   
  429.   *err= 0;
  430.   do
  431.   {
  432.     if ((cnv=cs->cset->mb_wc(cs,&wc,s,e))>0)
  433.     {
  434.       switch (wc)
  435.       {
  436.         case ' ' : break;
  437.         case 't': break;
  438.         case '-' : negative= !negative; break;
  439.         case '+' : break;
  440.         default  : goto bs;
  441.       }
  442.     } 
  443.     else /* No more characters or bad multibyte sequence */
  444.     {
  445.       if (endptr !=NULL )
  446.         *endptr = (char*)s;
  447.       err[0] = (cnv==MY_CS_ILSEQ) ? EILSEQ : EDOM;
  448.       return 0;
  449.     } 
  450.     s+=cnv;
  451.   } while (1);
  452.   
  453. bs:
  454. #ifdef NOT_USED  
  455.   if (base <= 0 || base == 1 || base > 36)
  456.     base = 10;
  457. #endif
  458.   
  459.   overflow = 0;
  460.   res = 0;
  461.   save = s;
  462.   cutoff = ((uint32)~0L) / (uint32) base;
  463.   cutlim = (uint) (((uint32)~0L) % (uint32) base);
  464.   
  465.   do {
  466.     if ((cnv=cs->cset->mb_wc(cs,&wc,s,e))>0)
  467.     {
  468.       s+=cnv;
  469.       if ( wc>='0' && wc<='9')
  470.         wc -= '0';
  471.       else if ( wc>='A' && wc<='Z')
  472.         wc = wc - 'A' + 10;
  473.       else if ( wc>='a' && wc<='z')
  474.         wc = wc - 'a' + 10;
  475.       else
  476.         break;
  477.       if ((int)wc >= base)
  478.         break;
  479.       if (res > cutoff || (res == cutoff && wc > cutlim))
  480.         overflow = 1;
  481.       else
  482.       {
  483.         res *= (uint32) base;
  484.         res += wc;
  485.       }
  486.     }
  487.     else if (cnv==MY_CS_ILSEQ)
  488.     {
  489.       if (endptr !=NULL )
  490.         *endptr = (char*)s;
  491.       err[0]=EILSEQ;
  492.       return 0;
  493.     } 
  494.     else
  495.     {
  496.       /* No more characters */
  497.       break;
  498.     }
  499.   } while(1);
  500.   
  501.   if (endptr != NULL)
  502.     *endptr = (char *) s;
  503.   
  504.   if (s == save)
  505.   {
  506.     err[0]=EDOM;
  507.     return 0L;
  508.   }
  509.   
  510.   if (negative)
  511.   {
  512.     if (res > (uint32) INT_MIN32)
  513.       overflow = 1;
  514.   }
  515.   else if (res > INT_MAX32)
  516.     overflow = 1;
  517.   
  518.   if (overflow)
  519.   {
  520.     err[0]=ERANGE;
  521.     return negative ? INT_MIN32 : INT_MAX32;
  522.   }
  523.   
  524.   return (negative ? -((long) res) : (long) res);
  525. }
  526. ulong my_strntoul_ucs2(CHARSET_INFO *cs,
  527.        const char *nptr, uint l, int base, 
  528.        char **endptr, int *err)
  529. {
  530.   int      negative=0;
  531.   int      overflow;
  532.   int      cnv;
  533.   my_wc_t  wc;
  534.   register unsigned int cutlim;
  535.   register uint32 cutoff;
  536.   register uint32 res;
  537.   register const uchar *s= (const uchar*) nptr;
  538.   register const uchar *e= (const uchar*) nptr+l;
  539.   const uchar *save;
  540.   
  541.   *err= 0;
  542.   do
  543.   {
  544.     if ((cnv=cs->cset->mb_wc(cs,&wc,s,e))>0)
  545.     {
  546.       switch (wc)
  547.       {
  548.         case ' ' : break;
  549.         case 't': break;
  550.         case '-' : negative= !negative; break;
  551.         case '+' : break;
  552.         default  : goto bs;
  553.       }
  554.     } 
  555.     else /* No more characters or bad multibyte sequence */
  556.     {
  557.       if (endptr !=NULL )
  558.         *endptr = (char*)s;
  559.       err[0] = (cnv==MY_CS_ILSEQ) ? EILSEQ : EDOM;
  560.       return 0;
  561.     } 
  562.     s+=cnv;
  563.   } while (1);
  564.   
  565. bs:
  566. #ifdef NOT_USED
  567.   if (base <= 0 || base == 1 || base > 36)
  568.     base = 10;
  569. #endif
  570.   overflow = 0;
  571.   res = 0;
  572.   save = s;
  573.   cutoff = ((uint32)~0L) / (uint32) base;
  574.   cutlim = (uint) (((uint32)~0L) % (uint32) base);
  575.   
  576.   do
  577.   {
  578.     if ((cnv=cs->cset->mb_wc(cs,&wc,s,e))>0)
  579.     {
  580.       s+=cnv;
  581.       if ( wc>='0' && wc<='9')
  582.         wc -= '0';
  583.       else if ( wc>='A' && wc<='Z')
  584.         wc = wc - 'A' + 10;
  585.       else if ( wc>='a' && wc<='z')
  586.         wc = wc - 'a' + 10;
  587.       else
  588.         break;
  589.       if ((int)wc >= base)
  590.         break;
  591.       if (res > cutoff || (res == cutoff && wc > cutlim))
  592.         overflow = 1;
  593.       else
  594.       {
  595.         res *= (uint32) base;
  596.         res += wc;
  597.       }
  598.     }
  599.     else if (cnv==MY_CS_ILSEQ)
  600.     {
  601.       if (endptr !=NULL )
  602.         *endptr = (char*)s;
  603.       err[0]=EILSEQ;
  604.       return 0;
  605.     } 
  606.     else
  607.     {
  608.       /* No more characters */
  609.       break;
  610.     }
  611.   } while(1);
  612.   
  613.   if (endptr != NULL)
  614.     *endptr = (char *) s;
  615.   
  616.   if (s == save)
  617.   {
  618.     err[0]=EDOM;
  619.     return 0L;
  620.   }
  621.   
  622.   if (overflow)
  623.   {
  624.     err[0]=(ERANGE);
  625.     return (~(uint32) 0);
  626.   }
  627.   
  628.   return (negative ? -((long) res) : (long) res);
  629. }
  630. longlong  my_strntoll_ucs2(CHARSET_INFO *cs,
  631.    const char *nptr, uint l, int base,
  632.    char **endptr, int *err)
  633. {
  634.   int      negative=0;
  635.   int      overflow;
  636.   int      cnv;
  637.   my_wc_t  wc;
  638.   register ulonglong    cutoff;
  639.   register unsigned int cutlim;
  640.   register ulonglong    res;
  641.   register const uchar *s= (const uchar*) nptr;
  642.   register const uchar *e= (const uchar*) nptr+l;
  643.   const uchar *save;
  644.   
  645.   *err= 0;
  646.   do
  647.   {
  648.     if ((cnv=cs->cset->mb_wc(cs,&wc,s,e))>0)
  649.     {
  650.       switch (wc)
  651.       {
  652.         case ' ' : break;
  653.         case 't': break;
  654.         case '-' : negative= !negative; break;
  655.         case '+' : break;
  656.         default  : goto bs;
  657.       }
  658.     } 
  659.     else /* No more characters or bad multibyte sequence */
  660.     {
  661.       if (endptr !=NULL )
  662.         *endptr = (char*)s;
  663.       err[0] = (cnv==MY_CS_ILSEQ) ? EILSEQ : EDOM;
  664.       return 0;
  665.     } 
  666.     s+=cnv;
  667.   } while (1);
  668.   
  669. bs:
  670. #ifdef NOT_USED  
  671.   if (base <= 0 || base == 1 || base > 36)
  672.     base = 10;
  673. #endif
  674.   overflow = 0;
  675.   res = 0;
  676.   save = s;
  677.   cutoff = (~(ulonglong) 0) / (unsigned long int) base;
  678.   cutlim = (uint) ((~(ulonglong) 0) % (unsigned long int) base);
  679.   do {
  680.     if ((cnv=cs->cset->mb_wc(cs,&wc,s,e))>0)
  681.     {
  682.       s+=cnv;
  683.       if ( wc>='0' && wc<='9')
  684.         wc -= '0';
  685.       else if ( wc>='A' && wc<='Z')
  686.         wc = wc - 'A' + 10;
  687.       else if ( wc>='a' && wc<='z')
  688.         wc = wc - 'a' + 10;
  689.       else
  690.         break;
  691.       if ((int)wc >= base)
  692.         break;
  693.       if (res > cutoff || (res == cutoff && wc > cutlim))
  694.         overflow = 1;
  695.       else
  696.       {
  697.         res *= (ulonglong) base;
  698.         res += wc;
  699.       }
  700.     }
  701.     else if (cnv==MY_CS_ILSEQ)
  702.     {
  703.       if (endptr !=NULL )
  704.         *endptr = (char*)s;
  705.       err[0]=EILSEQ;
  706.       return 0;
  707.     } 
  708.     else
  709.     {
  710.       /* No more characters */
  711.       break;
  712.     }
  713.   } while(1);
  714.   
  715.   if (endptr != NULL)
  716.     *endptr = (char *) s;
  717.   
  718.   if (s == save)
  719.   {
  720.     err[0]=EDOM;
  721.     return 0L;
  722.   }
  723.   
  724.   if (negative)
  725.   {
  726.     if (res  > (ulonglong) LONGLONG_MIN)
  727.       overflow = 1;
  728.   }
  729.   else if (res > (ulonglong) LONGLONG_MAX)
  730.     overflow = 1;
  731.   
  732.   if (overflow)
  733.   {
  734.     err[0]=ERANGE;
  735.     return negative ? LONGLONG_MIN : LONGLONG_MAX;
  736.   }
  737.   
  738.   return (negative ? -((longlong)res) : (longlong)res);
  739. }
  740. ulonglong  my_strntoull_ucs2(CHARSET_INFO *cs,
  741.    const char *nptr, uint l, int base,
  742.    char **endptr, int *err)
  743. {
  744.   int      negative=0;
  745.   int      overflow;
  746.   int      cnv;
  747.   my_wc_t  wc;
  748.   register ulonglong    cutoff;
  749.   register unsigned int cutlim;
  750.   register ulonglong    res;
  751.   register const uchar *s= (const uchar*) nptr;
  752.   register const uchar *e= (const uchar*) nptr+l;
  753.   const uchar *save;
  754.   
  755.   *err= 0;
  756.   do
  757.   {
  758.     if ((cnv=cs->cset->mb_wc(cs,&wc,s,e))>0)
  759.     {
  760.       switch (wc)
  761.       {
  762.         case ' ' : break;
  763.         case 't': break;
  764.         case '-' : negative= !negative; break;
  765.         case '+' : break;
  766.         default  : goto bs;
  767.       }
  768.     } 
  769.     else /* No more characters or bad multibyte sequence */
  770.     {
  771.       if (endptr !=NULL )
  772.         *endptr = (char*)s;
  773.       err[0]= (cnv==MY_CS_ILSEQ) ? EILSEQ : EDOM;
  774.       return 0;
  775.     } 
  776.     s+=cnv;
  777.   } while (1);
  778.   
  779. bs:
  780.   
  781. #ifdef NOT_USED
  782.   if (base <= 0 || base == 1 || base > 36)
  783.     base = 10;
  784. #endif
  785.   overflow = 0;
  786.   res = 0;
  787.   save = s;
  788.   cutoff = (~(ulonglong) 0) / (unsigned long int) base;
  789.   cutlim = (uint) ((~(ulonglong) 0) % (unsigned long int) base);
  790.   do
  791.   {
  792.     if ((cnv=cs->cset->mb_wc(cs,&wc,s,e))>0)
  793.     {
  794.       s+=cnv;
  795.       if ( wc>='0' && wc<='9')
  796.         wc -= '0';
  797.       else if ( wc>='A' && wc<='Z')
  798.         wc = wc - 'A' + 10;
  799.       else if ( wc>='a' && wc<='z')
  800.         wc = wc - 'a' + 10;
  801.       else
  802.         break;
  803.       if ((int)wc >= base)
  804.         break;
  805.       if (res > cutoff || (res == cutoff && wc > cutlim))
  806.         overflow = 1;
  807.       else
  808.       {
  809.         res *= (ulonglong) base;
  810.         res += wc;
  811.       }
  812.     }
  813.     else if (cnv==MY_CS_ILSEQ)
  814.     {
  815.       if (endptr !=NULL )
  816.         *endptr = (char*)s;
  817.       err[0]= EILSEQ;
  818.       return 0;
  819.     } 
  820.     else
  821.     {
  822.       /* No more characters */
  823.       break;
  824.     }
  825.   } while(1);
  826.   
  827.   if (endptr != NULL)
  828.     *endptr = (char *) s;
  829.   
  830.   if (s == save)
  831.   {
  832.     err[0]= EDOM;
  833.     return 0L;
  834.   }
  835.   
  836.   if (overflow)
  837.   {
  838.     err[0]= ERANGE;
  839.     return (~(ulonglong) 0);
  840.   }
  841.   return (negative ? -((longlong) res) : (longlong) res);
  842. }
  843. double      my_strntod_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  844.    char *nptr, uint length, 
  845.    char **endptr, int *err)
  846. {
  847.   char     buf[256];
  848.   double   res;
  849.   register char *b=buf;
  850.   register const uchar *s= (const uchar*) nptr;
  851.   register const uchar *end;
  852.   my_wc_t  wc;
  853.   int      cnv;
  854.   *err= 0;
  855.   /* Cut too long strings */
  856.   if (length >= sizeof(buf))
  857.     length= sizeof(buf)-1;
  858.   end= s+length;
  859.   while ((cnv=cs->cset->mb_wc(cs,&wc,s,end)) > 0)
  860.   {
  861.     s+=cnv;
  862.     if (wc > (int) (uchar) 'e' || !wc)
  863.       break; /* Can't be part of double */
  864.     *b++= (char) wc;
  865.   }
  866.   *endptr= b;
  867.   res= my_strtod(buf, endptr, err);
  868.   *endptr= nptr + (uint) (*endptr- buf);
  869.   return res;
  870. }
  871. /*
  872.   This is a fast version optimized for the case of radix 10 / -10
  873. */
  874. int my_l10tostr_ucs2(CHARSET_INFO *cs,
  875.      char *dst, uint len, int radix, long int val)
  876. {
  877.   char buffer[66];
  878.   register char *p, *db, *de;
  879.   long int new_val;
  880.   int  sl=0;
  881.   
  882.   p = &buffer[sizeof(buffer)-1];
  883.   *p='';
  884.   
  885.   if (radix < 0)
  886.   {
  887.     if (val < 0)
  888.     {
  889.       sl   = 1;
  890.       val  = -val;
  891.     }
  892.   }
  893.   
  894.   new_val = (long) ((unsigned long int) val / 10);
  895.   *--p    = '0'+ (char) ((unsigned long int) val - (unsigned long) new_val * 10);
  896.   val     = new_val;
  897.   
  898.   while (val != 0)
  899.   {
  900.     new_val=val/10;
  901.     *--p = '0' + (char) (val-new_val*10);
  902.     val= new_val;
  903.   }
  904.   
  905.   if (sl)
  906.   {
  907.     *--p='-';
  908.   }
  909.   
  910.   for ( db=dst, de=dst+len ; (dst<de) && *p ; p++)
  911.   {
  912.     int cnvres=cs->cset->wc_mb(cs,(my_wc_t)p[0],(uchar*) dst, (uchar*) de);
  913.     if (cnvres>0)
  914.       dst+=cnvres;
  915.     else
  916.       break;
  917.   }
  918.   return (int) (dst-db);
  919. }
  920. int my_ll10tostr_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  921.       char *dst, uint len, int radix, longlong val)
  922. {
  923.   char buffer[65];
  924.   register char *p, *db, *de;
  925.   long long_val;
  926.   int  sl=0;
  927.   
  928.   if (radix < 0)
  929.   {
  930.     if (val < 0)
  931.     {
  932.       sl=1;
  933.       val = -val;
  934.     }
  935.   }
  936.   
  937.   p = &buffer[sizeof(buffer)-1];
  938.   *p='';
  939.   
  940.   if (val == 0)
  941.   {
  942.     *--p='0';
  943.     goto cnv;
  944.   }
  945.   
  946.   while ((ulonglong) val > (ulonglong) LONG_MAX)
  947.   {
  948.     ulonglong quo=(ulonglong) val/(uint) 10;
  949.     uint rem= (uint) (val- quo* (uint) 10);
  950.     *--p = '0' + rem;
  951.     val= quo;
  952.   }
  953.   
  954.   long_val= (long) val;
  955.   while (long_val != 0)
  956.   {
  957.     long quo= long_val/10;
  958.     *--p = (char) ('0' + (long_val - quo*10));
  959.     long_val= quo;
  960.   }
  961.   
  962. cnv:
  963.   if (sl)
  964.   {
  965.     *--p='-';
  966.   }
  967.   
  968.   for ( db=dst, de=dst+len ; (dst<de) && *p ; p++)
  969.   {
  970.     int cnvres=cs->cset->wc_mb(cs, (my_wc_t) p[0], (uchar*) dst, (uchar*) de);
  971.     if (cnvres>0)
  972.       dst+=cnvres;
  973.     else
  974.       break;
  975.   }
  976.   return (int) (dst-db);
  977. }
  978. #undef  ULONGLONG_MAX
  979. #define ULONGLONG_MAX (~(ulonglong) 0)
  980. #define MAX_NEGATIVE_NUMBER ((ulonglong) LL(0x8000000000000000))
  981. #define INIT_CNT  9
  982. #define LFACTOR   ULL(1000000000)
  983. #define LFACTOR1  ULL(10000000000)
  984. #define LFACTOR2  ULL(100000000000)
  985. static unsigned long lfactor[9]=
  986. {
  987.   1L, 10L, 100L, 1000L, 10000L, 100000L, 1000000L, 10000000L, 100000000L
  988. };
  989. longlong my_strtoll10_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  990.                            const char *nptr, char **endptr, int *error)
  991. {
  992.   const char *s, *end, *start, *n_end, *true_end;
  993.   unsigned char c;
  994.   unsigned long i, j, k;
  995.   ulonglong li;
  996.   int negative;
  997.   ulong cutoff, cutoff2, cutoff3;
  998.   s= nptr;
  999.   /* If fixed length string */
  1000.   if (endptr)
  1001.   {
  1002.     /* Make sure string length is even */
  1003.     end= s + ((*endptr - s) / 2) * 2;
  1004.     while (s < end && !s[0] && (s[1] == ' ' || s[1] == 't'))
  1005.       s+= 2;
  1006.     if (s == end)
  1007.       goto no_conv;
  1008.   }
  1009.   else
  1010.   {
  1011.      /* We don't support null terminated strings in UCS2 */
  1012.      goto no_conv;
  1013.   }
  1014.   /* Check for a sign. */
  1015.   negative= 0;
  1016.   if (!s[0] && s[1] == '-')
  1017.   {
  1018.     *error= -1; /* Mark as negative number */
  1019.     negative= 1;
  1020.     s+= 2;
  1021.     if (s == end)
  1022.       goto no_conv;
  1023.     cutoff=  MAX_NEGATIVE_NUMBER / LFACTOR2;
  1024.     cutoff2= (MAX_NEGATIVE_NUMBER % LFACTOR2) / 100;
  1025.     cutoff3=  MAX_NEGATIVE_NUMBER % 100;
  1026.   }
  1027.   else
  1028.   {
  1029.     *error= 0;
  1030.     if (!s[0] && s[1] == '+')
  1031.     {
  1032.       s+= 2;
  1033.       if (s == end)
  1034. goto no_conv;
  1035.     }
  1036.     cutoff=  ULONGLONG_MAX / LFACTOR2;
  1037.     cutoff2= ULONGLONG_MAX % LFACTOR2 / 100;
  1038.     cutoff3=  ULONGLONG_MAX % 100;
  1039.   }
  1040.   /* Handle case where we have a lot of pre-zero */
  1041.   if (!s[0] && s[1] == '0')
  1042.   {
  1043.     i= 0;
  1044.     do
  1045.     {
  1046.       s+= 2;
  1047.       if (s == end)
  1048. goto end_i; /* Return 0 */
  1049.     }
  1050.     while (!s[0] && s[1] == '0');
  1051.     n_end= s + 2 * INIT_CNT;
  1052.   }
  1053.   else
  1054.   {
  1055.     /* Read first digit to check that it's a valid number */
  1056.     if (s[0] || (c= (s[1]-'0')) > 9)
  1057.       goto no_conv;
  1058.     i= c;
  1059.     s+= 2;
  1060.     n_end= s + 2 * (INIT_CNT-1);
  1061.   }
  1062.   /* Handle first 9 digits and store them in i */
  1063.   if (n_end > end)
  1064.     n_end= end;
  1065.   for (; s != n_end ; s+= 2)
  1066.   {
  1067.     if (s[0] || (c= (s[1]-'0')) > 9)
  1068.       goto end_i;
  1069.     i= i*10+c;
  1070.   }
  1071.   if (s == end)
  1072.     goto end_i;
  1073.   /* Handle next 9 digits and store them in j */
  1074.   j= 0;
  1075.   start= s; /* Used to know how much to shift i */
  1076.   n_end= true_end= s + 2 * INIT_CNT;
  1077.   if (n_end > end)
  1078.     n_end= end;
  1079.   do
  1080.   {
  1081.     if (s[0] || (c= (s[1]-'0')) > 9)
  1082.       goto end_i_and_j;
  1083.     j= j*10+c;
  1084.     s+= 2;
  1085.   } while (s != n_end);
  1086.   if (s == end)
  1087.   {
  1088.     if (s != true_end)
  1089.       goto end_i_and_j;
  1090.     goto end3;
  1091.   }
  1092.   if (s[0] || (c= (s[1]-'0')) > 9)
  1093.     goto end3;
  1094.   /* Handle the next 1 or 2 digits and store them in k */
  1095.   k=c;
  1096.   s+= 2;
  1097.   if (s == end || s[0] || (c= (s[1]-'0')) > 9)
  1098.     goto end4;
  1099.   k= k*10+c;
  1100.   s+= 2;
  1101.   *endptr= (char*) s;
  1102.   /* number string should have ended here */
  1103.   if (s != end && !s[0] && (c= (s[1]-'0')) <= 9)
  1104.     goto overflow;
  1105.   /* Check that we didn't get an overflow with the last digit */
  1106.   if (i > cutoff || (i == cutoff && ((j > cutoff2 || j == cutoff2) &&
  1107.                                      k > cutoff3)))
  1108.     goto overflow;
  1109.   li=i*LFACTOR2+ (ulonglong) j*100 + k;
  1110.   return (longlong) li;
  1111. overflow: /* *endptr is set here */
  1112.   *error= MY_ERRNO_ERANGE;
  1113.   return negative ? LONGLONG_MIN : (longlong) ULONGLONG_MAX;
  1114. end_i:
  1115.   *endptr= (char*) s;
  1116.   return (negative ? ((longlong) -(long) i) : (longlong) i);
  1117. end_i_and_j:
  1118.   li= (ulonglong) i * lfactor[(uint) (s-start) / 2] + j;
  1119.   *endptr= (char*) s;
  1120.   return (negative ? -((longlong) li) : (longlong) li);
  1121. end3:
  1122.   li=(ulonglong) i*LFACTOR+ (ulonglong) j;
  1123.   *endptr= (char*) s;
  1124.   return (negative ? -((longlong) li) : (longlong) li);
  1125. end4:
  1126.   li=(ulonglong) i*LFACTOR1+ (ulonglong) j * 10 + k;
  1127.   *endptr= (char*) s;
  1128.   if (negative)
  1129.   {
  1130.    if (li > MAX_NEGATIVE_NUMBER)
  1131.      goto overflow;
  1132.    return -((longlong) li);
  1133.   }
  1134.   return (longlong) li;
  1135. no_conv:
  1136.   /* There was no number to convert.  */
  1137.   *error= MY_ERRNO_EDOM;
  1138.   *endptr= (char *) nptr;
  1139.   return 0;
  1140. }
  1141. static
  1142. uint my_numchars_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  1143.       const char *b, const char *e)
  1144. {
  1145.   return (uint) (e-b)/2;
  1146. }
  1147. static
  1148. uint my_charpos_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  1149.      const char *b  __attribute__((unused)),
  1150.      const char *e  __attribute__((unused)),
  1151.      uint pos)
  1152. {
  1153.   uint string_length= (uint) (e - b);
  1154.   return pos > string_length ? string_length + 2 : pos * 2;
  1155. }
  1156. static
  1157. uint my_well_formed_len_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  1158.                              const char *b, const char *e,
  1159.                              uint nchars, int *error)
  1160. {
  1161.   /* Ensure string length is dividable with 2 */
  1162.   uint nbytes= ((uint) (e-b)) & ~(uint) 1;
  1163.   *error= 0;
  1164.   nchars*= 2;
  1165.   return min(nbytes, nchars);
  1166. }
  1167. static
  1168. void my_fill_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  1169.    char *s, uint l, int fill)
  1170. {
  1171.   for ( ; l >= 2; s[0]= 0, s[1]= fill, s+=2, l-=2);
  1172. }
  1173. static
  1174. uint my_lengthsp_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  1175.       const char *ptr, uint length)
  1176. {
  1177.   const char *end= ptr+length;
  1178.   while (end > ptr+1 && end[-1] == ' ' && end[-2] == '')
  1179.     end-=2;
  1180.   return (uint) (end-ptr);
  1181. }
  1182. static
  1183. int my_wildcmp_ucs2_ci(CHARSET_INFO *cs,
  1184.     const char *str,const char *str_end,
  1185.     const char *wildstr,const char *wildend,
  1186.     int escape, int w_one, int w_many)
  1187. {
  1188.   return my_wildcmp_unicode(cs,str,str_end,wildstr,wildend,
  1189.                             escape,w_one,w_many,uni_plane); 
  1190. }
  1191. static
  1192. int my_wildcmp_ucs2_bin(CHARSET_INFO *cs,
  1193.     const char *str,const char *str_end,
  1194.     const char *wildstr,const char *wildend,
  1195.     int escape, int w_one, int w_many)
  1196. {
  1197.   return my_wildcmp_unicode(cs,str,str_end,wildstr,wildend,
  1198.                             escape,w_one,w_many,NULL); 
  1199. }
  1200. static
  1201. int my_strnncoll_ucs2_bin(CHARSET_INFO *cs, 
  1202.                           const uchar *s, uint slen,
  1203.                           const uchar *t, uint tlen,
  1204.                           my_bool t_is_prefix)
  1205. {
  1206.   int s_res,t_res;
  1207.   my_wc_t s_wc,t_wc;
  1208.   const uchar *se=s+slen;
  1209.   const uchar *te=t+tlen;
  1210.   while ( s < se && t < te )
  1211.   {
  1212.     s_res=my_ucs2_uni(cs,&s_wc, s, se);
  1213.     t_res=my_ucs2_uni(cs,&t_wc, t, te);
  1214.     
  1215.     if ( s_res <= 0 || t_res <= 0 )
  1216.     {
  1217.       /* Incorrect string, compare by char value */
  1218.       return ((int)s[0]-(int)t[0]); 
  1219.     }
  1220.     if ( s_wc != t_wc )
  1221.     {
  1222.       return  s_wc > t_wc ? 1 : -1;
  1223.     }
  1224.     
  1225.     s+=s_res;
  1226.     t+=t_res;
  1227.   }
  1228.   return t_is_prefix ? (int) (t - te) : (int) ((se-s) - (te-t));
  1229. }
  1230. static int my_strnncollsp_ucs2_bin(CHARSET_INFO *cs, 
  1231.                                    const uchar *s, uint slen, 
  1232.                                    const uchar *t, uint tlen)
  1233. {
  1234.   return my_strnncoll_ucs2_bin(cs,s,slen,t,tlen,0);
  1235. }
  1236. static
  1237. int my_strcasecmp_ucs2_bin(CHARSET_INFO *cs, const char *s, const char *t)
  1238. {
  1239.   uint s_len=strlen(s);
  1240.   uint t_len=strlen(t);
  1241.   uint len = (s_len > t_len) ? s_len : t_len;
  1242.   return  my_strncasecmp_ucs2(cs, s, t, len);
  1243. }
  1244. static
  1245. int my_strnxfrm_ucs2_bin(CHARSET_INFO *cs __attribute__((unused)),
  1246.  uchar *dst, uint dstlen,
  1247.  const uchar *src, uint srclen)
  1248. {
  1249.   if (dst != src)
  1250.     memcpy(dst,src,srclen= min(dstlen,srclen));
  1251.   if (dstlen > srclen)
  1252.     cs->cset->fill(cs, dst + srclen, dstlen - srclen, ' ');
  1253.   return dstlen;
  1254. }
  1255. static
  1256. void my_hash_sort_ucs2_bin(CHARSET_INFO *cs __attribute__((unused)),
  1257.    const uchar *key, uint len,ulong *nr1, ulong *nr2)
  1258. {
  1259.   const uchar *pos = key;
  1260.   
  1261.   key+= len;
  1262.   
  1263.   for (; pos < (uchar*) key ; pos++)
  1264.   {
  1265.     nr1[0]^=(ulong) ((((uint) nr1[0] & 63)+nr2[0]) * 
  1266.      ((uint)*pos)) + (nr1[0] << 8);
  1267.     nr2[0]+=3;
  1268.   }
  1269. }
  1270. /*
  1271. ** Calculate min_str and max_str that ranges a LIKE string.
  1272. ** Arguments:
  1273. ** ptr Pointer to LIKE string.
  1274. ** ptr_length Length of LIKE string.
  1275. ** escape Escape character in LIKE.  (Normally '').
  1276. ** All escape characters should be removed from min_str and max_str
  1277. ** res_length Length of min_str and max_str.
  1278. ** min_str Smallest case sensitive string that ranges LIKE.
  1279. ** Should be space padded to res_length.
  1280. ** max_str Largest case sensitive string that ranges LIKE.
  1281. ** Normally padded with the biggest character sort value.
  1282. **
  1283. ** The function should return 0 if ok and 1 if the LIKE string can't be
  1284. ** optimized !
  1285. */
  1286. my_bool my_like_range_ucs2(CHARSET_INFO *cs,
  1287.    const char *ptr,uint ptr_length,
  1288.    pbool escape, pbool w_one, pbool w_many,
  1289.    uint res_length,
  1290.    char *min_str,char *max_str,
  1291.    uint *min_length,uint *max_length)
  1292. {
  1293.   const char *end=ptr+ptr_length;
  1294.   char *min_org=min_str;
  1295.   char *min_end=min_str+res_length;
  1296.   uint charlen= res_length / cs->mbmaxlen;
  1297.   
  1298.   for ( ; ptr + 1 < end && min_str + 1 < min_end && charlen > 0
  1299.         ; ptr+=2, charlen--)
  1300.   {
  1301.     if (ptr[0] == '' && ptr[1] == escape && ptr + 1 < end)
  1302.     {
  1303.       ptr+=2; /* Skip escape */
  1304.       *min_str++= *max_str++ = ptr[0];
  1305.       *min_str++= *max_str++ = ptr[1];
  1306.       continue;
  1307.     }
  1308.     if (ptr[0] == '' && ptr[1] == w_one) /* '_' in SQL */
  1309.     {
  1310.       *min_str++= (char) (cs->min_sort_char >> 8);
  1311.       *min_str++= (char) (cs->min_sort_char & 255);
  1312.       *max_str++= (char) (cs->max_sort_char >> 8);
  1313.       *max_str++= (char) (cs->max_sort_char & 255);
  1314.       continue;
  1315.     }
  1316.     if (ptr[0] == '' && ptr[1] == w_many) /* '%' in SQL */
  1317.     {
  1318.       *min_length= (uint) (min_str - min_org);
  1319.       *max_length=res_length;
  1320.       do {
  1321.         *min_str++ = 0;
  1322. *min_str++ = 0;
  1323. *max_str++ = (char) (cs->max_sort_char >> 8);
  1324. *max_str++ = (char) (cs->max_sort_char & 255);
  1325.       } while (min_str + 1 < min_end);
  1326.       return 0;
  1327.     }
  1328.     *min_str++= *max_str++ = ptr[0];
  1329.     *min_str++= *max_str++ = ptr[1];
  1330.   }
  1331.   *min_length= *max_length = (uint) (min_str - min_org);
  1332.   /* Temporary fix for handling w_one at end of string (key compression) */
  1333.   {
  1334.     char *tmp;
  1335.     for (tmp= min_str ; tmp-1 > min_org && tmp[-1] == '' && tmp[-2]=='';)
  1336.     {
  1337.       *--tmp=' ';
  1338.       *--tmp='';
  1339.     }
  1340.   }
  1341.   
  1342.   while (min_str + 1 < min_end)
  1343.   {
  1344.     *min_str++ = *max_str++ = '';
  1345.     *min_str++ = *max_str++ = ' '; /* Because if key compression */
  1346.   }
  1347.   return 0;
  1348. }
  1349. ulong my_scan_ucs2(CHARSET_INFO *cs __attribute__((unused)),
  1350.                    const char *str, const char *end, int sequence_type)
  1351. {
  1352.   const char *str0= str;
  1353.   end--; /* for easier loop condition, because of two bytes per character */
  1354.   
  1355.   switch (sequence_type)
  1356.   {
  1357.   case MY_SEQ_SPACES:
  1358.     for ( ; str < end; str+= 2)
  1359.     {
  1360.       if (str[0] != '' || str[1] != ' ')
  1361.         break;
  1362.     }
  1363.     return (ulong) (str - str0);
  1364.   default:
  1365.     return 0;
  1366.   }
  1367. }
  1368. static MY_COLLATION_HANDLER my_collation_ucs2_general_ci_handler =
  1369. {
  1370.     NULL, /* init */
  1371.     my_strnncoll_ucs2,
  1372.     my_strnncollsp_ucs2,
  1373.     my_strnxfrm_ucs2,
  1374.     my_like_range_ucs2,
  1375.     my_wildcmp_ucs2_ci,
  1376.     my_strcasecmp_ucs2,
  1377.     my_instr_mb,
  1378.     my_hash_sort_ucs2
  1379. };
  1380. static MY_COLLATION_HANDLER my_collation_ucs2_bin_handler =
  1381. {
  1382.     NULL, /* init */
  1383.     my_strnncoll_ucs2_bin,
  1384.     my_strnncollsp_ucs2_bin,
  1385.     my_strnxfrm_ucs2_bin,
  1386.     my_like_range_simple,
  1387.     my_wildcmp_ucs2_bin,
  1388.     my_strcasecmp_ucs2_bin,
  1389.     my_instr_mb,
  1390.     my_hash_sort_ucs2_bin
  1391. };
  1392. MY_CHARSET_HANDLER my_charset_ucs2_handler=
  1393. {
  1394.     NULL, /* init */
  1395.     my_ismbchar_ucs2, /* ismbchar     */
  1396.     my_mbcharlen_ucs2, /* mbcharlen    */
  1397.     my_numchars_ucs2,
  1398.     my_charpos_ucs2,
  1399.     my_well_formed_len_ucs2,
  1400.     my_lengthsp_ucs2,
  1401.     my_numcells_mb,
  1402.     my_ucs2_uni, /* mb_wc        */
  1403.     my_uni_ucs2, /* wc_mb        */
  1404.     my_caseup_str_ucs2,
  1405.     my_casedn_str_ucs2,
  1406.     my_caseup_ucs2,
  1407.     my_casedn_ucs2,
  1408.     my_snprintf_ucs2,
  1409.     my_l10tostr_ucs2,
  1410.     my_ll10tostr_ucs2,
  1411.     my_fill_ucs2,
  1412.     my_strntol_ucs2,
  1413.     my_strntoul_ucs2,
  1414.     my_strntoll_ucs2,
  1415.     my_strntoull_ucs2,
  1416.     my_strntod_ucs2,
  1417.     my_strtoll10_ucs2,
  1418.     my_scan_ucs2
  1419. };
  1420. CHARSET_INFO my_charset_ucs2_general_ci=
  1421. {
  1422.     35,0,0, /* number       */
  1423.     MY_CS_COMPILED|MY_CS_PRIMARY|MY_CS_STRNXFRM|MY_CS_UNICODE,
  1424.     "ucs2", /* cs name    */
  1425.     "ucs2_general_ci", /* name         */
  1426.     "", /* comment      */
  1427.     NULL, /* tailoring    */
  1428.     ctype_ucs2, /* ctype        */
  1429.     to_lower_ucs2, /* to_lower     */
  1430.     to_upper_ucs2, /* to_upper     */
  1431.     to_upper_ucs2, /* sort_order   */
  1432.     NULL, /* contractions */
  1433.     NULL, /* sort_order_big*/
  1434.     NULL, /* tab_to_uni   */
  1435.     NULL, /* tab_from_uni */
  1436.     NULL, /* state_map    */
  1437.     NULL, /* ident_map    */
  1438.     1, /* strxfrm_multiply */
  1439.     2, /* mbminlen     */
  1440.     2, /* mbmaxlen     */
  1441.     0, /* min_sort_char */
  1442.     0xFFFF, /* max_sort_char */
  1443.     0,                  /* escape_with_backslash_is_dangerous */
  1444.     &my_charset_ucs2_handler,
  1445.     &my_collation_ucs2_general_ci_handler
  1446. };
  1447. CHARSET_INFO my_charset_ucs2_bin=
  1448. {
  1449.     90,0,0, /* number       */
  1450.     MY_CS_COMPILED|MY_CS_BINSORT|MY_CS_UNICODE,
  1451.     "ucs2", /* cs name    */
  1452.     "ucs2_bin", /* name         */
  1453.     "", /* comment      */
  1454.     NULL, /* tailoring    */
  1455.     ctype_ucs2, /* ctype        */
  1456.     to_lower_ucs2, /* to_lower     */
  1457.     to_upper_ucs2, /* to_upper     */
  1458.     NULL, /* sort_order   */
  1459.     NULL, /* contractions */
  1460.     NULL, /* sort_order_big*/
  1461.     NULL, /* tab_to_uni   */
  1462.     NULL, /* tab_from_uni */
  1463.     NULL, /* state_map    */
  1464.     NULL, /* ident_map    */
  1465.     1, /* strxfrm_multiply */
  1466.     2, /* mbminlen     */
  1467.     2, /* mbmaxlen     */
  1468.     0, /* min_sort_char */
  1469.     0xFFFF, /* max_sort_char */
  1470.     0,                  /* escape_with_backslash_is_dangerous */
  1471.     &my_charset_ucs2_handler,
  1472.     &my_collation_ucs2_bin_handler
  1473. };
  1474. #endif