sql_lex.cc
上传用户:tsgydb
上传日期:2007-04-14
资源大小:10674k
文件大小:22k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /* Copyright (C) 2000 MySQL AB & MySQL Finland AB & TCX DataKonsult AB
  2.    
  3.    This program is free software; you can redistribute it and/or modify
  4.    it under the terms of the GNU General Public License as published by
  5.    the Free Software Foundation; either version 2 of the License, or
  6.    (at your option) any later version.
  7.    
  8.    This program is distributed in the hope that it will be useful,
  9.    but WITHOUT ANY WARRANTY; without even the implied warranty of
  10.    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  11.    GNU General Public License for more details.
  12.    
  13.    You should have received a copy of the GNU General Public License
  14.    along with this program; if not, write to the Free Software
  15.    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA */
  16. /* A lexical scanner on a temporary buffer with a yacc interface */
  17. #include "mysql_priv.h"
  18. #include "item_create.h"
  19. #include <m_ctype.h>
  20. #include <hash.h>
  21. LEX_STRING tmp_table_alias= {(char*) "tmp-table",8};
  22. /* Macros to look like lex */
  23. #define yyGet() *(lex->ptr++)
  24. #define yyGetLast() lex->ptr[-1]
  25. #define yyPeek() lex->ptr[0]
  26. #define yyPeek2() lex->ptr[1]
  27. #define yyUnget() lex->ptr--
  28. #define yySkip() lex->ptr++
  29. #define yyLength() ((uint) (lex->ptr - lex->tok_start)-1)
  30. #if MYSQL_VERSION_ID < 32300
  31. #define FLOAT_NUM REAL_NUM
  32. #endif
  33. pthread_key(LEX*,THR_LEX);
  34. #define TOCK_NAME_LENGTH 24
  35. /*
  36.   The following is based on the latin1 character set, and is only
  37.   used when comparing keywords
  38. */
  39. uchar to_upper_lex[] = {
  40.     0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15,
  41.    16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31,
  42.    32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47,
  43.    48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63,
  44.    64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79,
  45.    80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95,
  46.    96, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79,
  47.    80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90,123,124,125,126,127,
  48.   128,129,130,131,132,133,134,135,136,137,138,139,140,141,142,143,
  49.   144,145,146,147,148,149,150,151,152,153,154,155,156,157,158,159,
  50.   160,161,162,163,164,165,166,167,168,169,170,171,172,173,174,175,
  51.   176,177,178,179,180,181,182,183,184,185,186,187,188,189,190,191,
  52.   192,193,194,195,196,197,198,199,200,201,202,203,204,205,206,207,
  53.   208,209,210,211,212,213,214,215,216,217,218,219,220,221,222,223,
  54.   192,193,194,195,196,197,198,199,200,201,202,203,204,205,206,207,
  55.   208,209,210,211,212,213,214,247,216,217,218,219,220,221,222,255
  56. };
  57. inline int lex_casecmp(const char *s, const char *t, uint len)
  58. {
  59.   while (len-- != 0 &&
  60.  to_upper_lex[(uchar) *s++] == to_upper_lex[(uchar) *t++]) ;
  61.   return (int) len+1;
  62. }
  63. #include "lex_hash.h"
  64. static uchar state_map[256];
  65. void lex_init(void)
  66. {
  67.   uint i;
  68.   DBUG_ENTER("lex_init");
  69.   for (i=0 ; i < array_elements(symbols) ; i++)
  70.     symbols[i].length=(uchar) strlen(symbols[i].name);
  71.   for (i=0 ; i < array_elements(sql_functions) ; i++)
  72.     sql_functions[i].length=(uchar) strlen(sql_functions[i].name);
  73.   VOID(pthread_key_create(&THR_LEX,NULL));
  74.   /* Fill state_map with states to get a faster parser */
  75.   for (i=0; i < 256 ; i++)
  76.   {
  77.     if (isalpha(i))
  78.       state_map[i]=(uchar) STATE_IDENT;
  79.     else if (isdigit(i))
  80.       state_map[i]=(uchar) STATE_NUMBER_IDENT;
  81. #if defined(USE_MB) && defined(USE_MB_IDENT)
  82.     else if (use_mb(default_charset_info) && my_ismbhead(default_charset_info, i))
  83.       state_map[i]=(uchar) STATE_IDENT;
  84. #endif
  85.     else if (!isgraph(i))
  86.       state_map[i]=(uchar) STATE_SKIP;      
  87.     else
  88.       state_map[i]=(uchar) STATE_CHAR;
  89.   }
  90.   state_map[(uchar)'_']=state_map[(uchar)'$']=(uchar) STATE_IDENT;
  91.   state_map[(uchar)''']=state_map[(uchar)'"']=(uchar) STATE_STRING;
  92.   state_map[(uchar)'-']=state_map[(uchar)'+']=(uchar) STATE_SIGNED_NUMBER;
  93.   state_map[(uchar)'.']=(uchar) STATE_REAL_OR_POINT;
  94.   state_map[(uchar)'>']=state_map[(uchar)'=']=state_map[(uchar)'!']= (uchar) STATE_CMP_OP;
  95.   state_map[(uchar)'<']= (uchar) STATE_LONG_CMP_OP;
  96.   state_map[(uchar)'&']=state_map[(uchar)'|']=(uchar) STATE_BOOL;
  97.   state_map[(uchar)'#']=(uchar) STATE_COMMENT;
  98.   state_map[(uchar)';']=(uchar) STATE_COLON;
  99.   state_map[(uchar)':']=(uchar) STATE_SET_VAR;
  100.   state_map[0]=(uchar) STATE_EOL;
  101.   state_map[(uchar)'\']= (uchar) STATE_ESCAPE;
  102.   state_map[(uchar)'/']= (uchar) STATE_LONG_COMMENT;
  103.   state_map[(uchar)'*']= (uchar) STATE_END_LONG_COMMENT;
  104.   state_map[(uchar)'@']= (uchar) STATE_USER_END;
  105.   state_map[(uchar) '`']= (uchar) STATE_USER_VARIABLE_DELIMITER;
  106.   if (thd_startup_options & OPTION_ANSI_MODE)
  107.   {
  108.     state_map[(uchar) '"'] = STATE_USER_VARIABLE_DELIMITER;
  109.   }
  110.   DBUG_VOID_RETURN;
  111. }
  112. void lex_free(void)
  113. { // Call this when daemon ends
  114.   DBUG_ENTER("lex_free");
  115.   DBUG_VOID_RETURN;
  116. }
  117. LEX *lex_start(THD *thd, uchar *buf,uint length)
  118. {
  119.   LEX *lex= &thd->lex;
  120.   lex->next_state=STATE_START;
  121.   lex->end_of_query=(lex->ptr=buf)+length;
  122.   lex->yylineno = 1;
  123.   lex->create_refs=lex->in_comment=0;
  124.   lex->length=0;
  125.   lex->in_sum_expr=0;
  126.   lex->expr_list.empty();
  127.   lex->ftfunc_list.empty();
  128.   lex->convert_set=(lex->thd=thd)->convert_set;
  129.   lex->yacc_yyss=lex->yacc_yyvs=0;
  130.   lex->ignore_space=test(thd->client_capabilities & CLIENT_IGNORE_SPACE);
  131.   return lex;
  132. }
  133. void lex_end(LEX *lex)
  134. {
  135.   lex->expr_list.delete_elements(); // If error when parsing sql-varargs
  136.   x_free(lex->yacc_yyss);
  137.   x_free(lex->yacc_yyvs);
  138. }
  139. static int find_keyword(LEX *lex, uint len, bool function)
  140. {
  141.   uchar *tok=lex->tok_start;
  142.   SYMBOL *symbol = get_hash_symbol((const char *)tok,len,function);
  143.   if (symbol)
  144.   {
  145.     lex->yylval->symbol.symbol=symbol;
  146.     lex->yylval->symbol.str= (char*) tok;
  147.     lex->yylval->symbol.length=len;
  148.     return symbol->tok;
  149.   }
  150. #ifdef HAVE_DLOPEN
  151.   udf_func *udf;
  152.   if (function && using_udf_functions && (udf=find_udf((char*) tok, len)))
  153.   {
  154.     switch (udf->returns) {
  155.     case STRING_RESULT:
  156.       lex->yylval->udf=udf;
  157.       return (udf->type == UDFTYPE_FUNCTION) ? UDF_CHAR_FUNC : UDA_CHAR_SUM;
  158.     case REAL_RESULT:
  159.       lex->yylval->udf=udf;
  160.       return (udf->type == UDFTYPE_FUNCTION) ? UDF_FLOAT_FUNC : UDA_FLOAT_SUM;
  161.     case INT_RESULT:
  162.       lex->yylval->udf=udf;
  163.       return (udf->type == UDFTYPE_FUNCTION) ? UDF_INT_FUNC : UDA_INT_SUM;
  164.     }
  165.   }
  166. #endif
  167.   return 0;
  168. }
  169. /* make a copy of token before ptr and set yytoklen */
  170. static inline LEX_STRING get_token(LEX *lex,uint length)
  171. {
  172.   LEX_STRING tmp;
  173.   yyUnget(); // ptr points now after last token char
  174.   tmp.length=lex->yytoklen=length;
  175.   tmp.str=(char*) sql_strmake((char*) lex->tok_start,tmp.length);
  176.   return tmp;
  177. }
  178. /* Return an unescaped text literal without quotes */
  179. /* Fix sometimes to do only one scan of the string */
  180. static char *get_text(LEX *lex)
  181. {
  182.   reg1 uchar c,sep;
  183.   uint found_escape=0;
  184.   sep= yyGetLast(); // String should end with this
  185.   //lex->tok_start=lex->ptr-1; // Remember '
  186.   while (lex->ptr != lex->end_of_query)
  187.   {
  188.     c = yyGet();
  189. #ifdef USE_MB
  190.     int l;
  191.     if (use_mb(default_charset_info) &&
  192.         (l = my_ismbchar(default_charset_info,
  193.                          (const char *)lex->ptr-1,
  194.                          (const char *)lex->end_of_query))) {
  195. lex->ptr += l-1;
  196. continue;
  197.     }
  198. #endif
  199.     if (c == '\')
  200.     { // Escaped character
  201.       found_escape=1;
  202.       if (lex->ptr == lex->end_of_query)
  203. return 0;
  204.       yySkip();
  205.     }
  206.     else if (c == sep)
  207.     {
  208.       if (c == yyGet()) // Check if two separators in a row
  209.       {
  210. found_escape=1; // dupplicate. Remember for delete
  211. continue;
  212.       }
  213.       else
  214. yyUnget();
  215.       /* Found end. Unescape and return string */
  216.       uchar *str,*end,*start;
  217.       str=lex->tok_start+1;
  218.       end=lex->ptr-1;
  219.       if (!(start=(uchar*) sql_alloc((uint) (end-str)+1)))
  220. return (char*) ""; // Sql_alloc has set error flag
  221.       if (!found_escape)
  222.       {
  223. lex->yytoklen=(uint) (end-str);
  224. memcpy(start,str,lex->yytoklen);
  225. start[lex->yytoklen]=0;
  226.       }
  227.       else
  228.       {
  229. uchar *to;
  230. for (to=start ; str != end ; str++)
  231. {
  232. #ifdef USE_MB
  233.   int l;
  234.   if (use_mb(default_charset_info) &&
  235.               (l = my_ismbchar(default_charset_info,
  236.                                (const char *)str, (const char *)end))) {
  237.       while (l--)
  238.   *to++ = *str++;
  239.       str--;
  240.       continue;
  241.   }
  242. #endif
  243.   if (*str == '\' && str+1 != end)
  244.   {
  245.     switch(*++str) {
  246.     case 'n':
  247.       *to++='n';
  248.       break;
  249.     case 't':
  250.       *to++= 't';
  251.       break;
  252.     case 'r':
  253.       *to++ = 'r';
  254.       break;
  255.     case 'b':
  256.       *to++ = 'b';
  257.       break;
  258.     case '0':
  259.       *to++= 0; // Ascii null
  260.       break;
  261.     case 'Z': // ^Z must be escaped on Win32
  262.       *to++='32';
  263.       break;
  264.     case '_':
  265.     case '%':
  266.       *to++= '\'; // remember prefix for wildcard
  267.       /* Fall through */
  268.     default:
  269.       *to++ = *str;
  270.       break;
  271.     }
  272.   }
  273.   else if (*str == sep)
  274.     *to++= *str++; // Two ' or "
  275.   else
  276.     *to++ = *str;
  277. }
  278. *to=0;
  279. lex->yytoklen=(uint) (to-start);
  280.       }
  281.       if (lex->convert_set)
  282. lex->convert_set->convert((char*) start,lex->yytoklen);
  283.       return (char*) start;
  284.     }
  285.   }
  286.   return 0; // unexpected end of query
  287. }
  288. /*
  289. ** Calc type of integer; long integer, longlong integer or real.
  290. ** Returns smallest type that match the string.
  291. ** When using unsigned long long values the result is converted to a real
  292. ** because else they will be unexpected sign changes because all calculation
  293. ** is done with longlong or double.
  294. */
  295. static const char *long_str="2147483647";
  296. static const uint long_len=10;
  297. static const char *signed_long_str="-2147483648";
  298. static const char *longlong_str="9223372036854775807";
  299. static const uint longlong_len=19;
  300. static const char *signed_longlong_str="-9223372036854775808";
  301. static const uint signed_longlong_len=19;
  302. inline static uint int_token(const char *str,uint length)
  303. {
  304.   if (length < long_len) // quick normal case
  305.     return NUM;
  306.   bool neg=0;
  307.   if (*str == '+') // Remove sign and pre-zeros
  308.   {
  309.     str++; length--;
  310.   }
  311.   else if (*str == '-')
  312.   {
  313.     str++; length--;
  314.     neg=1;
  315.   }
  316.   while (*str == '0' && length)
  317.   {
  318.     str++; length --;
  319.   }
  320.   if (length < long_len)
  321.     return NUM;
  322.   uint smaller,bigger;
  323.   const char *cmp;
  324.   if (neg)
  325.   {
  326.     if (length == long_len)
  327.     {
  328.       cmp= signed_long_str+1;
  329.       smaller=NUM; // If <= signed_long_str
  330.       bigger=LONG_NUM; // If >= signed_long_str
  331.     }
  332.     else if (length < signed_longlong_len)
  333.       return LONG_NUM;
  334.     else if (length > signed_longlong_len)
  335.       return REAL_NUM;
  336.     else
  337.     {
  338.       cmp=signed_longlong_str+1;
  339.       smaller=LONG_NUM; // If <= signed_longlong_str
  340.       bigger=REAL_NUM;
  341.     }
  342.   }
  343.   else
  344.   {
  345.     if (length == long_len)
  346.     {
  347.       cmp= long_str;
  348.       smaller=NUM;
  349.       bigger=LONG_NUM;
  350.     }
  351.     else if (length < longlong_len)
  352.       return LONG_NUM;
  353.     else if (length > longlong_len)
  354.       return REAL_NUM;
  355.     else
  356.     {
  357.       cmp=longlong_str;
  358.       smaller=LONG_NUM;
  359.       bigger=REAL_NUM;
  360.     }
  361.   }
  362.   while (*cmp && *cmp++ == *str++) ;
  363.   return ((uchar) str[-1] <= (uchar) cmp[-1]) ? smaller : bigger;
  364. }
  365. // yylex remember the following states from the following yylex()
  366. // STATE_EOQ ; found end of query
  367. // STATE_OPERATOR_OR_IDENT ; last state was an ident, text or number
  368. //       (which can't be followed by a signed number)
  369. int yylex(void *arg)
  370. {
  371.   reg1 uchar c;
  372.   int tokval;
  373.   uint length;
  374.   enum lex_states state,prev_state;
  375.   LEX *lex=current_lex;
  376.   YYSTYPE *yylval=(YYSTYPE*) arg;
  377.   lex->yylval=yylval; // The global state
  378.   lex->tok_start=lex->tok_end=lex->ptr;
  379.   prev_state=state=lex->next_state;
  380.   lex->next_state=STATE_OPERATOR_OR_IDENT;
  381.   LINT_INIT(c);
  382.   for (;;)
  383.   {
  384.     switch(state) {
  385.     case STATE_OPERATOR_OR_IDENT: // Next is operator or keyword
  386.     case STATE_START: // Start of token
  387.       // Skipp startspace
  388.       for (c=yyGet() ; (state_map[c] == STATE_SKIP) ; c= yyGet())
  389.       {
  390. if (c == 'n')
  391.   lex->yylineno++;
  392.       }
  393.       lex->tok_start=lex->ptr-1; // Start of real token
  394.       state= (enum lex_states) state_map[c];
  395.       break;
  396.     case STATE_ESCAPE:
  397.       if (yyGet() == 'N')
  398.       { // Allow N as shortcut for NULL
  399. yylval->lex_str.str=(char*) "\N";
  400. yylval->lex_str.length=2;
  401. return NULL_SYM;
  402.       }
  403.     case STATE_CHAR: // Unknown or single char token
  404.     case STATE_SKIP: // This should not happen
  405.       yylval->lex_str.str=(char*) (lex->ptr=lex->tok_start);// Set to first char
  406.       yylval->lex_str.length=1;
  407.       c=yyGet();
  408.       if (c != ')')
  409. lex->next_state= STATE_START; // Allow signed numbers
  410.       if (c == ',')
  411. lex->tok_start=lex->ptr; // Let tok_start point at next item
  412.       return((int) c);
  413.     case STATE_IDENT: // Incomplete keyword or ident
  414. #if defined(USE_MB) && defined(USE_MB_IDENT)
  415.       if (use_mb(default_charset_info))
  416.       {
  417.         if (my_ismbhead(default_charset_info, yyGetLast()))
  418.         {
  419.           int l = my_ismbchar(default_charset_info,
  420.                               (const char *)lex->ptr-1,
  421.                               (const char *)lex->end_of_query);
  422.           if (l == 0) {
  423.             state = STATE_CHAR;
  424.             continue;
  425.           }
  426.           lex->ptr += l - 1;
  427.         }
  428.         while (state_map[c=yyGet()] == STATE_IDENT ||
  429.                state_map[c] == STATE_NUMBER_IDENT)
  430.         {
  431.           if (my_ismbhead(default_charset_info, c))
  432.           {
  433.             int l;
  434.             if ((l = my_ismbchar(default_charset_info,
  435.                               (const char *)lex->ptr-1,
  436.                               (const char *)lex->end_of_query)) == 0)
  437.               break;
  438.             lex->ptr += l-1;
  439.           }
  440.         }
  441.       }
  442.       else
  443. #endif
  444.         while (state_map[c=yyGet()] == STATE_IDENT ||
  445.                state_map[c] == STATE_NUMBER_IDENT) ;
  446.       length= (uint) (lex->ptr - lex->tok_start)-1;
  447.       if (lex->ignore_space)
  448.       {
  449. for ( ; state_map[c] == STATE_SKIP ; c= yyGet());
  450.       }
  451.       if (c == '.' && (state_map[yyPeek()] == STATE_IDENT ||
  452.        state_map[yyPeek()] == STATE_NUMBER_IDENT))
  453. lex->next_state=STATE_IDENT_SEP;
  454.       else
  455.       { // '(' must follow directly if function
  456. yyUnget();
  457. if ((tokval = find_keyword(lex,length,c == '(')))
  458. {
  459.   lex->next_state= STATE_START; // Allow signed numbers
  460.   return(tokval); // Was keyword
  461. }
  462. yySkip(); // next state does a unget
  463.       }
  464.       yylval->lex_str=get_token(lex,length);
  465.       return(IDENT);
  466.     case STATE_IDENT_SEP: // Found ident and now '.'
  467.       lex->next_state=STATE_IDENT_START;// Next is an ident (not a keyword)
  468.       yylval->lex_str.str=(char*) lex->ptr;
  469.       yylval->lex_str.length=1;
  470.       c=yyGet(); // should be '.'
  471.       return((int) c);
  472.     case STATE_NUMBER_IDENT: // number or ident which starts with num
  473.       while (isdigit((c = yyGet()))) ;
  474.       if (state_map[c] != STATE_IDENT)
  475.       { // Can't be identifier
  476. state=STATE_INT_OR_REAL;
  477. break;
  478.       }
  479.       if (c == 'e' || c == 'E')
  480.       {
  481. // The following test is written this way to allow numbers of type 1e1
  482. if (isdigit(yyPeek()) || (c=(yyGet())) == '+' || c == '-')
  483. { // Allow 1E+10
  484.   if (isdigit(yyPeek())) // Number must have digit after sign
  485.   {
  486.     yySkip();
  487.     while (isdigit(yyGet())) ;
  488.     yylval->lex_str=get_token(lex,yyLength());
  489.     return(FLOAT_NUM);
  490.   }
  491. }
  492. yyUnget(); /* purecov: inspected */
  493.       }
  494.       else if (c == 'x' && (lex->ptr - lex->tok_start) == 2 &&
  495.   lex->tok_start[0] == '0' )
  496.       { // Varbinary
  497. while (isxdigit((c = yyGet()))) ;
  498. if ((lex->ptr - lex->tok_start) >= 4)
  499. {
  500.   yylval->lex_str=get_token(lex,yyLength());
  501.   yylval->lex_str.str+=2; // Skipp 0x
  502.   yylval->lex_str.length-=2;
  503.   lex->yytoklen-=2;
  504.   return (HEX_NUM);
  505. }
  506. yyUnget();
  507.       }
  508.       // fall through
  509.     case STATE_IDENT_START: // Incomplete ident
  510. #if defined(USE_MB) && defined(USE_MB_IDENT)
  511.       if (use_mb(default_charset_info))
  512.       {
  513.         if (my_ismbhead(default_charset_info, yyGetLast()))
  514.         {
  515.           int l = my_ismbchar(default_charset_info,
  516.                               (const char *)lex->ptr-1,
  517.                               (const char *)lex->end_of_query);
  518.           if (l == 0)
  519.           {
  520.             state = STATE_CHAR;
  521.             continue;
  522.           }
  523.           lex->ptr += l - 1;
  524.         }
  525.         while (state_map[c=yyGet()] == STATE_IDENT ||
  526.                state_map[c] == STATE_NUMBER_IDENT)
  527.         {
  528.           if (my_ismbhead(default_charset_info, c))
  529.           {
  530.             int l;
  531.             if ((l = my_ismbchar(default_charset_info,
  532.                                  (const char *)lex->ptr-1,
  533.                                  (const char *)lex->end_of_query)) == 0)
  534.               break;
  535.             lex->ptr += l-1;
  536.           }
  537.         }
  538.       }
  539.       else
  540. #endif
  541.         while (state_map[c = yyGet()] == STATE_IDENT ||
  542.                state_map[c] == STATE_NUMBER_IDENT) ;
  543.       if (c == '.' && (state_map[yyPeek()] == STATE_IDENT ||
  544.        state_map[yyPeek()] == STATE_NUMBER_IDENT))
  545. lex->next_state=STATE_IDENT_SEP;// Next is '.'
  546.       // fall through
  547.     case STATE_FOUND_IDENT: // Complete ident
  548.       yylval->lex_str=get_token(lex,yyLength());
  549.       return(IDENT);
  550.     case STATE_USER_VARIABLE_DELIMITER:
  551.       lex->tok_start=lex->ptr; // Skipp first `
  552.       while ((c=yyGet()) && state_map[c] != STATE_USER_VARIABLE_DELIMITER &&
  553.      c != (uchar) NAMES_SEP_CHAR) ;
  554.       yylval->lex_str=get_token(lex,yyLength());
  555.       if (state_map[c] == STATE_USER_VARIABLE_DELIMITER)
  556. yySkip(); // Skipp end `
  557.       return(IDENT);
  558.     case STATE_SIGNED_NUMBER: // Incomplete signed number
  559.       if (prev_state == STATE_OPERATOR_OR_IDENT)
  560.       {
  561. if (c == '-' && yyPeek() == '-' && isspace(yyPeek2()))
  562.   state=STATE_COMMENT;
  563. else
  564.   state= STATE_CHAR; // Must be operator
  565. break;
  566.       }
  567.       if (!isdigit(c=yyGet()) || yyPeek() == 'x')
  568.       {
  569. if (c != '.')
  570. {
  571.   if (c == '-' && isspace(yyPeek()))
  572.     state=STATE_COMMENT;
  573.   else
  574.     state = STATE_CHAR; // Return sign as single char
  575.   break;
  576. }
  577. yyUnget(); // Fix for next loop
  578.       }
  579.       while (isdigit(c=yyGet())) ; // Incomplete real or int number
  580.       if ((c == 'e' || c == 'E') &&
  581.   (yyPeek() == '+' || yyPeek() == '-' || isdigit(yyPeek())))
  582.       { // Real number
  583. yyUnget();
  584. c= '.'; // Fool next test
  585.       }
  586.       // fall through
  587.     case STATE_INT_OR_REAL: // Compleat int or incompleat real
  588.       if (c != '.')
  589.       { // Found complete integer number.
  590. yylval->lex_str=get_token(lex,yyLength());
  591. return int_token(yylval->lex_str.str,yylval->lex_str.length);
  592.       }
  593.       // fall through
  594.     case STATE_REAL: // Incomplete real number
  595.       while (isdigit(c = yyGet())) ;
  596.       if (c == 'e' || c == 'E')
  597.       {
  598. c = yyGet();
  599. if (c != '-' && c != '+' && !isdigit(c))
  600. { // No exp sig found
  601.   state= STATE_CHAR;
  602.   break;
  603. }
  604. if (!isdigit(yyGet()))
  605. { // No digit after sign
  606.   state= STATE_CHAR;
  607.   break;
  608. }
  609. while (isdigit(yyGet())) ;
  610. yylval->lex_str=get_token(lex,yyLength());
  611. return(FLOAT_NUM);
  612.       }
  613.       yylval->lex_str=get_token(lex,yyLength());
  614.       return(REAL_NUM);
  615.     case STATE_CMP_OP: // Incomplete comparison operator
  616.       if (state_map[yyPeek()] == STATE_CMP_OP ||
  617.   state_map[yyPeek()] == STATE_LONG_CMP_OP)
  618. yySkip();
  619.       if ((tokval = find_keyword(lex,(uint) (lex->ptr - lex->tok_start),0)))
  620.       {
  621. lex->next_state= STATE_START; // Allow signed numbers
  622. return(tokval);
  623.       }
  624.       state = STATE_CHAR; // Something fishy found
  625.       break;
  626.     case STATE_LONG_CMP_OP: // Incomplete comparison operator
  627.       if (state_map[yyPeek()] == STATE_CMP_OP ||
  628.   state_map[yyPeek()] == STATE_LONG_CMP_OP)
  629.       {
  630. yySkip();
  631. if (state_map[yyPeek()] == STATE_CMP_OP)
  632.   yySkip();
  633.       }
  634.       if ((tokval = find_keyword(lex,(uint) (lex->ptr - lex->tok_start),0)))
  635.       {
  636. lex->next_state= STATE_START; // Found long op
  637. return(tokval);
  638.       }
  639.       state = STATE_CHAR; // Something fishy found
  640.       break;
  641.     case STATE_BOOL:
  642.       if (c != yyPeek())
  643.       {
  644. state=STATE_CHAR;
  645. break;
  646.       }
  647.       yySkip();
  648.       tokval = find_keyword(lex,2,0); // Is a bool operator
  649.       lex->next_state= STATE_START; // Allow signed numbers
  650.       return(tokval);
  651.     case STATE_STRING: // Incomplete text string
  652.       if (!(yylval->lex_str.str = get_text(lex)))
  653.       {
  654. state= STATE_CHAR; // Read char by char
  655. break;
  656.       }
  657.       yylval->lex_str.length=lex->yytoklen;
  658.       return(TEXT_STRING);
  659.     case STATE_COMMENT: //  Comment
  660.       while ((c = yyGet()) != 'n' && c) ;
  661.       yyUnget(); // Safety against eof
  662.       state = STATE_START; // Try again
  663.       break;
  664.     case STATE_LONG_COMMENT: /* Long C comment? */
  665.       if (yyPeek() != '*')
  666.       {
  667. state=STATE_CHAR; // Probable division
  668. break;
  669.       }
  670.       yySkip(); // Skip '*'
  671.       if (yyPeek() == '!') // MySQL command in comment
  672.       {
  673. ulong version=MYSQL_VERSION_ID;
  674. yySkip();
  675. state=STATE_START;
  676. if (isdigit(yyPeek()))
  677. { // Version number
  678.   version=strtol((char*) lex->ptr,(char**) &lex->ptr,10);
  679. }
  680. if (version <= MYSQL_VERSION_ID)
  681. {
  682.   lex->in_comment=1;
  683.   break;
  684. }
  685.       }
  686.       while (lex->ptr != lex->end_of_query &&
  687.      ((c=yyGet()) != '*' || yyPeek() != '/'))
  688.       {
  689. if (c == 'n')
  690.   lex->yylineno++;
  691.       }
  692.       if (lex->ptr != lex->end_of_query)
  693. yySkip(); // remove last '/'
  694.       state = STATE_START; // Try again
  695.       break;
  696.     case STATE_END_LONG_COMMENT:
  697.       if (lex->in_comment && yyPeek() == '/')
  698.       {
  699. yySkip();
  700. lex->in_comment=0;
  701. state=STATE_START;
  702.       }
  703.       else
  704. state=STATE_CHAR; // Return '*'
  705.       break;
  706.     case STATE_SET_VAR: // Check if ':='
  707.       if (yyPeek() != '=')
  708.       {
  709. state=STATE_CHAR; // Return ':'
  710. break;
  711.       }
  712.       yySkip();
  713.       return (SET_VAR);
  714.     case STATE_COLON: // optional line terminator
  715.       if (yyPeek())
  716.       {
  717. state=STATE_CHAR; // Return ';'
  718. break;
  719.       }
  720.       /* fall true */
  721.     case STATE_EOL:
  722.       lex->next_state=STATE_END; // Mark for next loop
  723.       return(END_OF_INPUT);
  724.     case STATE_END:
  725.       lex->next_state=STATE_END;
  726.       return(0); // We found end of input last time
  727.       // Actually real shouldn't start
  728.       // with . but allow them anyhow
  729.     case STATE_REAL_OR_POINT:
  730.       if (isdigit(yyPeek()))
  731. state = STATE_REAL; // Real
  732.       else
  733.       {
  734. state = STATE_CHAR; // return '.'
  735. lex->next_state=STATE_IDENT_START;// Next is an ident (not a keyword)
  736.       }
  737.       break;
  738.     case STATE_USER_END: // end '@' of user@hostname
  739.       if (state_map[yyPeek()] != STATE_STRING &&
  740.   state_map[yyPeek()] != STATE_USER_VARIABLE_DELIMITER)
  741. lex->next_state=STATE_HOSTNAME; // Mark for next loop     
  742.       yylval->lex_str.str=(char*) lex->ptr;
  743.       yylval->lex_str.length=1;
  744.       return((int) '@');
  745.     case STATE_HOSTNAME: // end '@' of user@hostname
  746.       for (c=yyGet() ;
  747.    isalnum(c) || c == '.' || c == '_' || c == '$';
  748.    c= yyGet()) ;
  749.       yylval->lex_str=get_token(lex,yyLength());
  750.       return(LEX_HOSTNAME);
  751.     }
  752.   }
  753. }