fts3_porter.c.svn-base
上传用户:sunhongbo
上传日期:2022-01-25
资源大小:3010k
文件大小:17k
源码类别:

数据库系统

开发平台:

C/C++

  1. /*
  2. ** 2006 September 30
  3. **
  4. ** The author disclaims copyright to this source code.  In place of
  5. ** a legal notice, here is a blessing:
  6. **
  7. **    May you do good and not evil.
  8. **    May you find forgiveness for yourself and forgive others.
  9. **    May you share freely, never taking more than you give.
  10. **
  11. *************************************************************************
  12. ** Implementation of the full-text-search tokenizer that implements
  13. ** a Porter stemmer.
  14. */
  15. /*
  16. ** The code in this file is only compiled if:
  17. **
  18. **     * The FTS3 module is being built as an extension
  19. **       (in which case SQLITE_CORE is not defined), or
  20. **
  21. **     * The FTS3 module is being built into the core of
  22. **       SQLite (in which case SQLITE_ENABLE_FTS3 is defined).
  23. */
  24. #if !defined(SQLITE_CORE) || defined(SQLITE_ENABLE_FTS3)
  25. #include <assert.h>
  26. #include <stdlib.h>
  27. #include <stdio.h>
  28. #include <string.h>
  29. #include <ctype.h>
  30. #include "fts3_tokenizer.h"
  31. /*
  32. ** Class derived from sqlite3_tokenizer
  33. */
  34. typedef struct porter_tokenizer {
  35.   sqlite3_tokenizer base;      /* Base class */
  36. } porter_tokenizer;
  37. /*
  38. ** Class derived from sqlit3_tokenizer_cursor
  39. */
  40. typedef struct porter_tokenizer_cursor {
  41.   sqlite3_tokenizer_cursor base;
  42.   const char *zInput;          /* input we are tokenizing */
  43.   int nInput;                  /* size of the input */
  44.   int iOffset;                 /* current position in zInput */
  45.   int iToken;                  /* index of next token to be returned */
  46.   char *zToken;                /* storage for current token */
  47.   int nAllocated;              /* space allocated to zToken buffer */
  48. } porter_tokenizer_cursor;
  49. /* Forward declaration */
  50. static const sqlite3_tokenizer_module porterTokenizerModule;
  51. /*
  52. ** Create a new tokenizer instance.
  53. */
  54. static int porterCreate(
  55.   int argc, const char * const *argv,
  56.   sqlite3_tokenizer **ppTokenizer
  57. ){
  58.   porter_tokenizer *t;
  59.   t = (porter_tokenizer *) sqlite3_malloc(sizeof(*t));
  60.   if( t==NULL ) return SQLITE_NOMEM;
  61.   memset(t, 0, sizeof(*t));
  62.   *ppTokenizer = &t->base;
  63.   return SQLITE_OK;
  64. }
  65. /*
  66. ** Destroy a tokenizer
  67. */
  68. static int porterDestroy(sqlite3_tokenizer *pTokenizer){
  69.   sqlite3_free(pTokenizer);
  70.   return SQLITE_OK;
  71. }
  72. /*
  73. ** Prepare to begin tokenizing a particular string.  The input
  74. ** string to be tokenized is zInput[0..nInput-1].  A cursor
  75. ** used to incrementally tokenize this string is returned in 
  76. ** *ppCursor.
  77. */
  78. static int porterOpen(
  79.   sqlite3_tokenizer *pTokenizer,         /* The tokenizer */
  80.   const char *zInput, int nInput,        /* String to be tokenized */
  81.   sqlite3_tokenizer_cursor **ppCursor    /* OUT: Tokenization cursor */
  82. ){
  83.   porter_tokenizer_cursor *c;
  84.   c = (porter_tokenizer_cursor *) sqlite3_malloc(sizeof(*c));
  85.   if( c==NULL ) return SQLITE_NOMEM;
  86.   c->zInput = zInput;
  87.   if( zInput==0 ){
  88.     c->nInput = 0;
  89.   }else if( nInput<0 ){
  90.     c->nInput = (int)strlen(zInput);
  91.   }else{
  92.     c->nInput = nInput;
  93.   }
  94.   c->iOffset = 0;                 /* start tokenizing at the beginning */
  95.   c->iToken = 0;
  96.   c->zToken = NULL;               /* no space allocated, yet. */
  97.   c->nAllocated = 0;
  98.   *ppCursor = &c->base;
  99.   return SQLITE_OK;
  100. }
  101. /*
  102. ** Close a tokenization cursor previously opened by a call to
  103. ** porterOpen() above.
  104. */
  105. static int porterClose(sqlite3_tokenizer_cursor *pCursor){
  106.   porter_tokenizer_cursor *c = (porter_tokenizer_cursor *) pCursor;
  107.   sqlite3_free(c->zToken);
  108.   sqlite3_free(c);
  109.   return SQLITE_OK;
  110. }
  111. /*
  112. ** Vowel or consonant
  113. */
  114. static const char cType[] = {
  115.    0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0,
  116.    1, 1, 1, 2, 1
  117. };
  118. /*
  119. ** isConsonant() and isVowel() determine if their first character in
  120. ** the string they point to is a consonant or a vowel, according
  121. ** to Porter ruls.  
  122. **
  123. ** A consonate is any letter other than 'a', 'e', 'i', 'o', or 'u'.
  124. ** 'Y' is a consonant unless it follows another consonant,
  125. ** in which case it is a vowel.
  126. **
  127. ** In these routine, the letters are in reverse order.  So the 'y' rule
  128. ** is that 'y' is a consonant unless it is followed by another
  129. ** consonent.
  130. */
  131. static int isVowel(const char*);
  132. static int isConsonant(const char *z){
  133.   int j;
  134.   char x = *z;
  135.   if( x==0 ) return 0;
  136.   assert( x>='a' && x<='z' );
  137.   j = cType[x-'a'];
  138.   if( j<2 ) return j;
  139.   return z[1]==0 || isVowel(z + 1);
  140. }
  141. static int isVowel(const char *z){
  142.   int j;
  143.   char x = *z;
  144.   if( x==0 ) return 0;
  145.   assert( x>='a' && x<='z' );
  146.   j = cType[x-'a'];
  147.   if( j<2 ) return 1-j;
  148.   return isConsonant(z + 1);
  149. }
  150. /*
  151. ** Let any sequence of one or more vowels be represented by V and let
  152. ** C be sequence of one or more consonants.  Then every word can be
  153. ** represented as:
  154. **
  155. **           [C] (VC){m} [V]
  156. **
  157. ** In prose:  A word is an optional consonant followed by zero or
  158. ** vowel-consonant pairs followed by an optional vowel.  "m" is the
  159. ** number of vowel consonant pairs.  This routine computes the value
  160. ** of m for the first i bytes of a word.
  161. **
  162. ** Return true if the m-value for z is 1 or more.  In other words,
  163. ** return true if z contains at least one vowel that is followed
  164. ** by a consonant.
  165. **
  166. ** In this routine z[] is in reverse order.  So we are really looking
  167. ** for an instance of of a consonant followed by a vowel.
  168. */
  169. static int m_gt_0(const char *z){
  170.   while( isVowel(z) ){ z++; }
  171.   if( *z==0 ) return 0;
  172.   while( isConsonant(z) ){ z++; }
  173.   return *z!=0;
  174. }
  175. /* Like mgt0 above except we are looking for a value of m which is
  176. ** exactly 1
  177. */
  178. static int m_eq_1(const char *z){
  179.   while( isVowel(z) ){ z++; }
  180.   if( *z==0 ) return 0;
  181.   while( isConsonant(z) ){ z++; }
  182.   if( *z==0 ) return 0;
  183.   while( isVowel(z) ){ z++; }
  184.   if( *z==0 ) return 1;
  185.   while( isConsonant(z) ){ z++; }
  186.   return *z==0;
  187. }
  188. /* Like mgt0 above except we are looking for a value of m>1 instead
  189. ** or m>0
  190. */
  191. static int m_gt_1(const char *z){
  192.   while( isVowel(z) ){ z++; }
  193.   if( *z==0 ) return 0;
  194.   while( isConsonant(z) ){ z++; }
  195.   if( *z==0 ) return 0;
  196.   while( isVowel(z) ){ z++; }
  197.   if( *z==0 ) return 0;
  198.   while( isConsonant(z) ){ z++; }
  199.   return *z!=0;
  200. }
  201. /*
  202. ** Return TRUE if there is a vowel anywhere within z[0..n-1]
  203. */
  204. static int hasVowel(const char *z){
  205.   while( isConsonant(z) ){ z++; }
  206.   return *z!=0;
  207. }
  208. /*
  209. ** Return TRUE if the word ends in a double consonant.
  210. **
  211. ** The text is reversed here. So we are really looking at
  212. ** the first two characters of z[].
  213. */
  214. static int doubleConsonant(const char *z){
  215.   return isConsonant(z) && z[0]==z[1] && isConsonant(z+1);
  216. }
  217. /*
  218. ** Return TRUE if the word ends with three letters which
  219. ** are consonant-vowel-consonent and where the final consonant
  220. ** is not 'w', 'x', or 'y'.
  221. **
  222. ** The word is reversed here.  So we are really checking the
  223. ** first three letters and the first one cannot be in [wxy].
  224. */
  225. static int star_oh(const char *z){
  226.   return
  227.     z[0]!=0 && isConsonant(z) &&
  228.     z[0]!='w' && z[0]!='x' && z[0]!='y' &&
  229.     z[1]!=0 && isVowel(z+1) &&
  230.     z[2]!=0 && isConsonant(z+2);
  231. }
  232. /*
  233. ** If the word ends with zFrom and xCond() is true for the stem
  234. ** of the word that preceeds the zFrom ending, then change the 
  235. ** ending to zTo.
  236. **
  237. ** The input word *pz and zFrom are both in reverse order.  zTo
  238. ** is in normal order. 
  239. **
  240. ** Return TRUE if zFrom matches.  Return FALSE if zFrom does not
  241. ** match.  Not that TRUE is returned even if xCond() fails and
  242. ** no substitution occurs.
  243. */
  244. static int stem(
  245.   char **pz,             /* The word being stemmed (Reversed) */
  246.   const char *zFrom,     /* If the ending matches this... (Reversed) */
  247.   const char *zTo,       /* ... change the ending to this (not reversed) */
  248.   int (*xCond)(const char*)   /* Condition that must be true */
  249. ){
  250.   char *z = *pz;
  251.   while( *zFrom && *zFrom==*z ){ z++; zFrom++; }
  252.   if( *zFrom!=0 ) return 0;
  253.   if( xCond && !xCond(z) ) return 1;
  254.   while( *zTo ){
  255.     *(--z) = *(zTo++);
  256.   }
  257.   *pz = z;
  258.   return 1;
  259. }
  260. /*
  261. ** This is the fallback stemmer used when the porter stemmer is
  262. ** inappropriate.  The input word is copied into the output with
  263. ** US-ASCII case folding.  If the input word is too long (more
  264. ** than 20 bytes if it contains no digits or more than 6 bytes if
  265. ** it contains digits) then word is truncated to 20 or 6 bytes
  266. ** by taking 10 or 3 bytes from the beginning and end.
  267. */
  268. static void copy_stemmer(const char *zIn, int nIn, char *zOut, int *pnOut){
  269.   int i, mx, j;
  270.   int hasDigit = 0;
  271.   for(i=0; i<nIn; i++){
  272.     int c = zIn[i];
  273.     if( c>='A' && c<='Z' ){
  274.       zOut[i] = c - 'A' + 'a';
  275.     }else{
  276.       if( c>='0' && c<='9' ) hasDigit = 1;
  277.       zOut[i] = c;
  278.     }
  279.   }
  280.   mx = hasDigit ? 3 : 10;
  281.   if( nIn>mx*2 ){
  282.     for(j=mx, i=nIn-mx; i<nIn; i++, j++){
  283.       zOut[j] = zOut[i];
  284.     }
  285.     i = j;
  286.   }
  287.   zOut[i] = 0;
  288.   *pnOut = i;
  289. }
  290. /*
  291. ** Stem the input word zIn[0..nIn-1].  Store the output in zOut.
  292. ** zOut is at least big enough to hold nIn bytes.  Write the actual
  293. ** size of the output word (exclusive of the '' terminator) into *pnOut.
  294. **
  295. ** Any upper-case characters in the US-ASCII character set ([A-Z])
  296. ** are converted to lower case.  Upper-case UTF characters are
  297. ** unchanged.
  298. **
  299. ** Words that are longer than about 20 bytes are stemmed by retaining
  300. ** a few bytes from the beginning and the end of the word.  If the
  301. ** word contains digits, 3 bytes are taken from the beginning and
  302. ** 3 bytes from the end.  For long words without digits, 10 bytes
  303. ** are taken from each end.  US-ASCII case folding still applies.
  304. ** 
  305. ** If the input word contains not digits but does characters not 
  306. ** in [a-zA-Z] then no stemming is attempted and this routine just 
  307. ** copies the input into the input into the output with US-ASCII
  308. ** case folding.
  309. **
  310. ** Stemming never increases the length of the word.  So there is
  311. ** no chance of overflowing the zOut buffer.
  312. */
  313. static void porter_stemmer(const char *zIn, int nIn, char *zOut, int *pnOut){
  314.   int i, j, c;
  315.   char zReverse[28];
  316.   char *z, *z2;
  317.   if( nIn<3 || nIn>=sizeof(zReverse)-7 ){
  318.     /* The word is too big or too small for the porter stemmer.
  319.     ** Fallback to the copy stemmer */
  320.     copy_stemmer(zIn, nIn, zOut, pnOut);
  321.     return;
  322.   }
  323.   for(i=0, j=sizeof(zReverse)-6; i<nIn; i++, j--){
  324.     c = zIn[i];
  325.     if( c>='A' && c<='Z' ){
  326.       zReverse[j] = c + 'a' - 'A';
  327.     }else if( c>='a' && c<='z' ){
  328.       zReverse[j] = c;
  329.     }else{
  330.       /* The use of a character not in [a-zA-Z] means that we fallback
  331.       ** to the copy stemmer */
  332.       copy_stemmer(zIn, nIn, zOut, pnOut);
  333.       return;
  334.     }
  335.   }
  336.   memset(&zReverse[sizeof(zReverse)-5], 0, 5);
  337.   z = &zReverse[j+1];
  338.   /* Step 1a */
  339.   if( z[0]=='s' ){
  340.     if(
  341.      !stem(&z, "sess", "ss", 0) &&
  342.      !stem(&z, "sei", "i", 0)  &&
  343.      !stem(&z, "ss", "ss", 0)
  344.     ){
  345.       z++;
  346.     }
  347.   }
  348.   /* Step 1b */  
  349.   z2 = z;
  350.   if( stem(&z, "dee", "ee", m_gt_0) ){
  351.     /* Do nothing.  The work was all in the test */
  352.   }else if( 
  353.      (stem(&z, "gni", "", hasVowel) || stem(&z, "de", "", hasVowel))
  354.       && z!=z2
  355.   ){
  356.      if( stem(&z, "ta", "ate", 0) ||
  357.          stem(&z, "lb", "ble", 0) ||
  358.          stem(&z, "zi", "ize", 0) ){
  359.        /* Do nothing.  The work was all in the test */
  360.      }else if( doubleConsonant(z) && (*z!='l' && *z!='s' && *z!='z') ){
  361.        z++;
  362.      }else if( m_eq_1(z) && star_oh(z) ){
  363.        *(--z) = 'e';
  364.      }
  365.   }
  366.   /* Step 1c */
  367.   if( z[0]=='y' && hasVowel(z+1) ){
  368.     z[0] = 'i';
  369.   }
  370.   /* Step 2 */
  371.   switch( z[1] ){
  372.    case 'a':
  373.      stem(&z, "lanoita", "ate", m_gt_0) ||
  374.      stem(&z, "lanoit", "tion", m_gt_0);
  375.      break;
  376.    case 'c':
  377.      stem(&z, "icne", "ence", m_gt_0) ||
  378.      stem(&z, "icna", "ance", m_gt_0);
  379.      break;
  380.    case 'e':
  381.      stem(&z, "rezi", "ize", m_gt_0);
  382.      break;
  383.    case 'g':
  384.      stem(&z, "igol", "log", m_gt_0);
  385.      break;
  386.    case 'l':
  387.      stem(&z, "ilb", "ble", m_gt_0) ||
  388.      stem(&z, "illa", "al", m_gt_0) ||
  389.      stem(&z, "iltne", "ent", m_gt_0) ||
  390.      stem(&z, "ile", "e", m_gt_0) ||
  391.      stem(&z, "ilsuo", "ous", m_gt_0);
  392.      break;
  393.    case 'o':
  394.      stem(&z, "noitazi", "ize", m_gt_0) ||
  395.      stem(&z, "noita", "ate", m_gt_0) ||
  396.      stem(&z, "rota", "ate", m_gt_0);
  397.      break;
  398.    case 's':
  399.      stem(&z, "msila", "al", m_gt_0) ||
  400.      stem(&z, "ssenevi", "ive", m_gt_0) ||
  401.      stem(&z, "ssenluf", "ful", m_gt_0) ||
  402.      stem(&z, "ssensuo", "ous", m_gt_0);
  403.      break;
  404.    case 't':
  405.      stem(&z, "itila", "al", m_gt_0) ||
  406.      stem(&z, "itivi", "ive", m_gt_0) ||
  407.      stem(&z, "itilib", "ble", m_gt_0);
  408.      break;
  409.   }
  410.   /* Step 3 */
  411.   switch( z[0] ){
  412.    case 'e':
  413.      stem(&z, "etaci", "ic", m_gt_0) ||
  414.      stem(&z, "evita", "", m_gt_0)   ||
  415.      stem(&z, "ezila", "al", m_gt_0);
  416.      break;
  417.    case 'i':
  418.      stem(&z, "itici", "ic", m_gt_0);
  419.      break;
  420.    case 'l':
  421.      stem(&z, "laci", "ic", m_gt_0) ||
  422.      stem(&z, "luf", "", m_gt_0);
  423.      break;
  424.    case 's':
  425.      stem(&z, "ssen", "", m_gt_0);
  426.      break;
  427.   }
  428.   /* Step 4 */
  429.   switch( z[1] ){
  430.    case 'a':
  431.      if( z[0]=='l' && m_gt_1(z+2) ){
  432.        z += 2;
  433.      }
  434.      break;
  435.    case 'c':
  436.      if( z[0]=='e' && z[2]=='n' && (z[3]=='a' || z[3]=='e')  && m_gt_1(z+4)  ){
  437.        z += 4;
  438.      }
  439.      break;
  440.    case 'e':
  441.      if( z[0]=='r' && m_gt_1(z+2) ){
  442.        z += 2;
  443.      }
  444.      break;
  445.    case 'i':
  446.      if( z[0]=='c' && m_gt_1(z+2) ){
  447.        z += 2;
  448.      }
  449.      break;
  450.    case 'l':
  451.      if( z[0]=='e' && z[2]=='b' && (z[3]=='a' || z[3]=='i') && m_gt_1(z+4) ){
  452.        z += 4;
  453.      }
  454.      break;
  455.    case 'n':
  456.      if( z[0]=='t' ){
  457.        if( z[2]=='a' ){
  458.          if( m_gt_1(z+3) ){
  459.            z += 3;
  460.          }
  461.        }else if( z[2]=='e' ){
  462.          stem(&z, "tneme", "", m_gt_1) ||
  463.          stem(&z, "tnem", "", m_gt_1) ||
  464.          stem(&z, "tne", "", m_gt_1);
  465.        }
  466.      }
  467.      break;
  468.    case 'o':
  469.      if( z[0]=='u' ){
  470.        if( m_gt_1(z+2) ){
  471.          z += 2;
  472.        }
  473.      }else if( z[3]=='s' || z[3]=='t' ){
  474.        stem(&z, "noi", "", m_gt_1);
  475.      }
  476.      break;
  477.    case 's':
  478.      if( z[0]=='m' && z[2]=='i' && m_gt_1(z+3) ){
  479.        z += 3;
  480.      }
  481.      break;
  482.    case 't':
  483.      stem(&z, "eta", "", m_gt_1) ||
  484.      stem(&z, "iti", "", m_gt_1);
  485.      break;
  486.    case 'u':
  487.      if( z[0]=='s' && z[2]=='o' && m_gt_1(z+3) ){
  488.        z += 3;
  489.      }
  490.      break;
  491.    case 'v':
  492.    case 'z':
  493.      if( z[0]=='e' && z[2]=='i' && m_gt_1(z+3) ){
  494.        z += 3;
  495.      }
  496.      break;
  497.   }
  498.   /* Step 5a */
  499.   if( z[0]=='e' ){
  500.     if( m_gt_1(z+1) ){
  501.       z++;
  502.     }else if( m_eq_1(z+1) && !star_oh(z+1) ){
  503.       z++;
  504.     }
  505.   }
  506.   /* Step 5b */
  507.   if( m_gt_1(z) && z[0]=='l' && z[1]=='l' ){
  508.     z++;
  509.   }
  510.   /* z[] is now the stemmed word in reverse order.  Flip it back
  511.   ** around into forward order and return.
  512.   */
  513.   *pnOut = i = strlen(z);
  514.   zOut[i] = 0;
  515.   while( *z ){
  516.     zOut[--i] = *(z++);
  517.   }
  518. }
  519. /*
  520. ** Characters that can be part of a token.  We assume any character
  521. ** whose value is greater than 0x80 (any UTF character) can be
  522. ** part of a token.  In other words, delimiters all must have
  523. ** values of 0x7f or lower.
  524. */
  525. static const char porterIdChar[] = {
  526. /* x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF */
  527.     1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0,  /* 3x */
  528.     0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,  /* 4x */
  529.     1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1,  /* 5x */
  530.     0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,  /* 6x */
  531.     1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0,  /* 7x */
  532. };
  533. #define isDelim(C) (((ch=C)&0x80)==0 && (ch<0x30 || !porterIdChar[ch-0x30]))
  534. /*
  535. ** Extract the next token from a tokenization cursor.  The cursor must
  536. ** have been opened by a prior call to porterOpen().
  537. */
  538. static int porterNext(
  539.   sqlite3_tokenizer_cursor *pCursor,  /* Cursor returned by porterOpen */
  540.   const char **pzToken,               /* OUT: *pzToken is the token text */
  541.   int *pnBytes,                       /* OUT: Number of bytes in token */
  542.   int *piStartOffset,                 /* OUT: Starting offset of token */
  543.   int *piEndOffset,                   /* OUT: Ending offset of token */
  544.   int *piPosition                     /* OUT: Position integer of token */
  545. ){
  546.   porter_tokenizer_cursor *c = (porter_tokenizer_cursor *) pCursor;
  547.   const char *z = c->zInput;
  548.   while( c->iOffset<c->nInput ){
  549.     int iStartOffset, ch;
  550.     /* Scan past delimiter characters */
  551.     while( c->iOffset<c->nInput && isDelim(z[c->iOffset]) ){
  552.       c->iOffset++;
  553.     }
  554.     /* Count non-delimiter characters. */
  555.     iStartOffset = c->iOffset;
  556.     while( c->iOffset<c->nInput && !isDelim(z[c->iOffset]) ){
  557.       c->iOffset++;
  558.     }
  559.     if( c->iOffset>iStartOffset ){
  560.       int n = c->iOffset-iStartOffset;
  561.       if( n>c->nAllocated ){
  562.         c->nAllocated = n+20;
  563.         c->zToken = sqlite3_realloc(c->zToken, c->nAllocated);
  564.         if( c->zToken==NULL ) return SQLITE_NOMEM;
  565.       }
  566.       porter_stemmer(&z[iStartOffset], n, c->zToken, pnBytes);
  567.       *pzToken = c->zToken;
  568.       *piStartOffset = iStartOffset;
  569.       *piEndOffset = c->iOffset;
  570.       *piPosition = c->iToken++;
  571.       return SQLITE_OK;
  572.     }
  573.   }
  574.   return SQLITE_DONE;
  575. }
  576. /*
  577. ** The set of routines that implement the porter-stemmer tokenizer
  578. */
  579. static const sqlite3_tokenizer_module porterTokenizerModule = {
  580.   0,
  581.   porterCreate,
  582.   porterDestroy,
  583.   porterOpen,
  584.   porterClose,
  585.   porterNext,
  586. };
  587. /*
  588. ** Allocate a new porter tokenizer.  Return a pointer to the new
  589. ** tokenizer in *ppModule
  590. */
  591. void sqlite3Fts3PorterTokenizerModule(
  592.   sqlite3_tokenizer_module const**ppModule
  593. ){
  594.   *ppModule = &porterTokenizerModule;
  595. }
  596. #endif /* !defined(SQLITE_CORE) || defined(SQLITE_ENABLE_FTS3) */