SGML.c
上传用户:zlh9724
上传日期:2007-01-04
资源大小:1991k
文件大小:20k
源码类别:

浏览器

开发平台:

Unix_Linux

  1. /*  SGML.c
  2. ** GENERAL SGML PARSER CODE
  3. **
  4. ** (c) COPYRIGHT MIT 1995.
  5. ** Please first read the full copyright statement in the file COPYRIGH.
  6. **
  7. ** This module implements an HTStream object. To parse an
  8. ** SGML file, create this object which is a parser. The object
  9. ** is (currently) created by being passed a DTD structure,
  10. ** and a target HTStructured oject at which to throw the parsed stuff.
  11. **
  12. **  6 Feb 93   Binary seraches used. Intreface modified.
  13. **  8 Jul 94  FM Insulate free() from _free structure element.
  14. */
  15. /* Library include files */
  16. #include "tcp.h"
  17. #include "HTUtils.h"
  18. #include "HTString.h"
  19. #include "HTChunk.h"
  20. #include "SGML.h"
  21. #define INVALID (-1)
  22. /* The State (context) of the parser
  23. **
  24. ** This is passed with each call to make the parser reentrant
  25. **
  26. */
  27. /* Element Stack
  28. ** -------------
  29. ** This allows us to return down the stack reselcting styles.
  30. ** As we return, attribute values will be garbage in general.
  31. */
  32. typedef struct _HTElement HTElement;
  33. struct _HTElement {
  34. HTElement * next; /* Previously nested element or 0 */
  35. HTTag* tag; /* The tag at this level  */
  36. };
  37. typedef enum _sgml_state {
  38.     S_text, S_literal, S_tag, S_tag_gap, 
  39.     S_attr, S_attr_gap, S_equals, S_value, S_after_open,
  40.     S_nl, S_nl_tago,
  41.     S_ero, S_cro,
  42. #ifdef ISO_2022_JP
  43.     S_esc, S_dollar, S_paren, S_nonascii_text,
  44. #endif
  45.     S_squoted, S_dquoted, S_end, S_entity, S_junk_tag
  46. } sgml_state;
  47. /* Internal Context Data Structure
  48. ** -------------------------------
  49. */
  50. struct _HTStream {
  51.     CONST HTStreamClass * isa; /* inherited from HTStream */
  52.     
  53.     CONST SGML_dtd  *dtd;
  54.     HTStructuredClass *actions; /* target class  */
  55.     HTStructured *target; /* target object */
  56.     HTTag  *current_tag;
  57.     int  current_attribute_number;
  58.     HTChunk *string;
  59.     HTElement *element_stack;
  60.     sgml_state state;
  61. #ifdef CALLERDATA   
  62.     void * callerData;
  63. #endif
  64.     BOOL present[MAX_ATTRIBUTES]; /* Flags: attribute is present? */
  65.     char * value[MAX_ATTRIBUTES]; /* malloc'd strings or NULL if none */
  66. } ;
  67. #define PUTC(ch) ((*context->actions->put_character)(context->target, ch))
  68. /* Find Attribute Number
  69. ** ---------------------
  70. */
  71. PUBLIC int SGMLFindAttribute  (HTTag* tag, CONST char * s)
  72. {
  73.     attr* attributes = tag->attributes;
  74.     int high, low, i, diff; /* Binary search for attribute name */
  75.     for(low=0, high=tag->number_of_attributes;
  76.      high > low ;
  77. diff < 0 ? (low = i+1) : (high = i) )  {
  78. i = (low + (high-low)/2);
  79. diff = strcasecomp(attributes[i].name, s);
  80. if (diff==0) return i; /* success: found it */
  81.     } /* for */
  82.     
  83.     return -1;
  84. }
  85. /* Handle Attribute
  86. ** ----------------
  87. */
  88. /* PUBLIC CONST char * SGML_default = "";   ?? */
  89. PRIVATE void handle_attribute_name (HTStream * context, CONST char * s)
  90. {
  91.     HTTag * tag = context->current_tag;
  92.     int i = SGMLFindAttribute(tag, s);
  93.     if (i>=0) {
  94. context->current_attribute_number = i;
  95. context->present[i] = YES;
  96. if (context->value[i]) {
  97.     HT_FREE(context->value[i]);
  98.     context->value[i] = NULL;
  99. }
  100. return;
  101.     } /* if */
  102.     if (SGML_TRACE)
  103. TTYPrint(TDEST, "SGML: Unknown attribute %s for tag %sn",
  104.     s, context->current_tag->name);
  105.     context->current_attribute_number = INVALID; /* Invalid */
  106. }
  107. /* Handle attribute value
  108. ** ----------------------
  109. */
  110. PRIVATE void handle_attribute_value (HTStream * context, CONST char * s)
  111. {
  112.     if (context->current_attribute_number != INVALID) {
  113. StrAllocCopy(context->value[context->current_attribute_number], s);
  114.     } else {
  115.         if (SGML_TRACE) TTYPrint(TDEST, "SGML: Attribute value %s ignoredn", s);
  116.     }
  117.     context->current_attribute_number = INVALID; /* can't have two assignments! */
  118. }
  119. /* Handle entity
  120. ** -------------
  121. **
  122. ** On entry,
  123. ** s contains the entity name zero terminated
  124. ** Bugs:
  125. ** If the entity name is unknown, the terminator is treated as
  126. ** a printable non-special character in all cases, even if it is '<'
  127. */
  128. PRIVATE void handle_entity (HTStream * context, char term)
  129. {
  130.     CONST char ** entities = context->dtd->entity_names;
  131.     CONST char *s = context->string->data;
  132.     
  133.     int high, low, i, diff;
  134.     for(low=0, high = context->dtd->number_of_entities;
  135.      high > low ;
  136. diff < 0 ? (low = i+1) : (high = i))   {  /* Binary serach */
  137. i = (low + (high-low)/2);
  138. diff = strcmp(entities[i], s); /* Csse sensitive! */
  139. if (diff==0) { /* success: found it */
  140.     (*context->actions->put_entity)(context->target, i);
  141.     return;
  142. }
  143.     }
  144.     /* If entity string not found, display as text */
  145.     if (SGML_TRACE)
  146. TTYPrint(TDEST, "SGML: Unknown entity %sn", s); 
  147.     PUTC('&');
  148.     {
  149. CONST char *p;
  150. for (p=s; *p; p++) {
  151.     PUTC(*p);
  152. }
  153.     }
  154.     PUTC(term);
  155. }
  156. /*
  157. ** Helper function to check if the tag is on the stack
  158. */
  159. PRIVATE BOOL lookup_element_stack (HTElement* stack, HTTag *tag)
  160. {
  161.     HTElement* elem;
  162.     for (elem = stack; elem != NULL; elem = elem->next)
  163.     {
  164.         if (elem->tag == tag)  return YES;
  165.     }
  166.     return NO;
  167. }
  168. /* End element
  169. ** -----------
  170. */
  171. PRIVATE void end_element (HTStream * context, HTTag * old_tag)
  172. {
  173.     if (SGML_TRACE) TTYPrint(TDEST, "SGML: End   </%s>n", old_tag->name);
  174.     if (old_tag->contents == SGML_EMPTY) {
  175.         if (SGML_TRACE) TTYPrint(TDEST,"SGML: Illegal end tag </%s> found.n",
  176. old_tag->name);
  177. return;
  178.     }
  179.     while (context->element_stack)  {/* Loop is error path only */
  180. HTElement * N = context->element_stack;
  181. HTTag * t = N->tag;
  182. if (old_tag != t) { /* Mismatch: syntax error */
  183.     /*
  184.     ** Patch from Maciej Puzio, puzio@laser.mimuw.edu.pl
  185.     ** See explanation in ../User/Patch/lib_4.0_1.fix
  186.     */
  187.             if (context->element_stack->next   /* This is not the last level */
  188. && lookup_element_stack(context->element_stack, old_tag)) {
  189. if (SGML_TRACE) TTYPrint(TDEST,
  190.      "SGML: Found </%s> when expecting </%s>. </%s> assumed.n",
  191.     old_tag->name, t->name, t->name);
  192.     } else { /* last level */
  193. if (SGML_TRACE) TTYPrint(TDEST,
  194.             "SGML: Found </%s> when expecting </%s>. </%s> Ignored.n",
  195.     old_tag->name, t->name, old_tag->name);
  196.         return; /* Ignore */
  197.     }
  198. }
  199. context->element_stack = N->next; /* Remove from stack */
  200. HT_FREE(N);
  201. (*context->actions->end_element)(context->target,
  202.  t - context->dtd->tags);
  203. if (old_tag == t) return;  /* Correct sequence */
  204. /* Syntax error path only */
  205.     }
  206.     if (SGML_TRACE) TTYPrint(TDEST,
  207. "SGML: Extra end tag </%s> found and ignored.n", old_tag->name);
  208. }
  209. /* Start an element
  210. ** ----------------
  211. */
  212. PRIVATE void start_element (HTStream * context)
  213. {
  214.     HTTag * new_tag = context->current_tag;
  215.     
  216.     if (SGML_TRACE) TTYPrint(TDEST, "SGML: Start <%s>n", new_tag->name);
  217.     (*context->actions->start_element)(
  218.      context->target,
  219. new_tag - context->dtd->tags,
  220. context->present,
  221. (CONST char**) context->value);  /* coerce type for think c */
  222.     if (new_tag->contents != SGML_EMPTY) { /* i.e. tag not empty */
  223. HTElement * N;
  224. if ((N = (HTElement  *) HT_MALLOC(sizeof(HTElement))) == NULL)
  225.     HT_OUTOFMEM("start_element");
  226. N->next = context->element_stack;
  227. N->tag = new_tag;
  228. context->element_stack = N;
  229.     }
  230. }
  231. /* Find Tag in DTD tag list
  232. ** ------------------------
  233. **
  234. ** On entry,
  235. ** dtd points to dtd structire including valid tag list
  236. ** string points to name of tag in question
  237. **
  238. ** On exit,
  239. ** returns:
  240. ** NULL tag not found
  241. ** else address of tag structure in dtd
  242. */
  243. PUBLIC HTTag * SGMLFindTag (CONST SGML_dtd* dtd, CONST char * string)
  244. {
  245.     int high, low, i, diff;
  246.     for(low=0, high=dtd->number_of_tags;
  247.      high > low ;
  248. diff < 0 ? (low = i+1) : (high = i))   {  /* Binary serach */
  249. i = (low + (high-low)/2);
  250. diff = strcasecomp(dtd->tags[i].name, string); /* Case insensitive */
  251. if (diff==0) { /* success: found it */
  252.     return &dtd->tags[i];
  253. }
  254.     }
  255.     return NULL;
  256. }
  257. /*________________________________________________________________________
  258. ** Public Methods
  259. */
  260. /* Could check that we are back to bottom of stack! @@  */
  261. PUBLIC int SGML_flush  (HTStream * context)
  262. {
  263.     while (context->element_stack) {
  264. HTElement *ptr = context->element_stack;
  265. if (SGML_TRACE)
  266.     TTYPrint(TDEST, "SGML........ Non-matched tag found: <%s>n",
  267.     context->element_stack->tag->name);
  268. context->element_stack = ptr->next;
  269. HT_FREE(ptr);
  270.     }
  271.     return (*context->actions->flush)(context->target);
  272. }
  273. PUBLIC int SGML_free  (HTStream * context)
  274. {
  275.     int status;
  276.     int cnt;
  277.     while (context->element_stack) {    /* Make sure, that all tags are gone */
  278. HTElement *ptr = context->element_stack;
  279. if (SGML_TRACE)
  280.     TTYPrint(TDEST, "SGML........ Non-matched tag found: <%s>n",
  281.     context->element_stack->tag->name);
  282. context->element_stack = ptr->next;
  283. HT_FREE(ptr);
  284.     }
  285.     if ((status = (*context->actions->_free)(context->target)) != HT_OK)
  286. return status;
  287.     HTChunk_delete(context->string);
  288.     for(cnt=0; cnt<MAX_ATTRIBUTES; cnt++)        /* Leak fix Henrik 18/02-94 */
  289. if(context->value[cnt])
  290.     HT_FREE(context->value[cnt]);
  291.     HT_FREE(context);
  292.     return HT_OK;
  293. }
  294. PUBLIC int SGML_abort  (HTStream * context, HTList * e)
  295. {
  296.     int cnt;
  297.     while (context->element_stack) {    /* Make sure, that all tags are gone */
  298. HTElement *ptr = context->element_stack;
  299. if (SGML_TRACE)
  300.     TTYPrint(TDEST, "SGML........ Non-matched tag found: <%s>n",
  301.     context->element_stack->tag->name);
  302. context->element_stack = ptr->next;
  303. HT_FREE(ptr);
  304.     }
  305.     (*context->actions->abort)(context->target, e);
  306.     HTChunk_delete(context->string);
  307.     for(cnt=0; cnt<MAX_ATTRIBUTES; cnt++)       /* Leak fix Henrik 18/02-94 */
  308. if(context->value[cnt])
  309.     HT_FREE(context->value[cnt]);
  310.     HT_FREE(context);
  311.     return HT_ERROR;
  312. }
  313. /* Read and write user callback handle
  314. ** -----------------------------------
  315. **
  316. **   The callbacks from the SGML parser have an SGML context parameter.
  317. **   These calls allow the caller to associate his own context with a
  318. **   particular SGML context.
  319. */
  320. #ifdef CALLERDATA   
  321. PUBLIC void* SGML_callerData (HTStream * context)
  322. {
  323.     return context->callerData;
  324. }
  325. PUBLIC void SGML_setCallerData (HTStream * context, void* data)
  326. {
  327.     context->callerData = data;
  328. }
  329. #else
  330. #ifdef WWW_WIN_DLL
  331. PUBLIC void * SGML_callerData (HTStream * context) {return NULL;}
  332. PUBLIC void SGML_setCallerData (HTStream * context, void* data) {}
  333. #endif /* WWW_WIN_DLL */
  334. #endif /* CALLERDATA */
  335. PUBLIC int SGML_character (HTStream * context, char c)
  336. {
  337.     CONST SGML_dtd *dtd = context->dtd;
  338.     HTChunk *string =  context->string;
  339.     switch(context->state) {
  340.     
  341.     case S_after_open: /* Strip one trainling newline
  342.      only after opening nonempty element.  - SGML:Ugh! */
  343.         if (c=='n' && (context->current_tag->contents != SGML_EMPTY)) {
  344.     break;
  345. }
  346. context->state = S_text;
  347. goto normal_text;
  348. /* (***falls through***) */
  349.     case S_text:
  350. normal_text:
  351. #ifdef ISO_2022_JP
  352.   if (c=='33') {
  353.       context->state = S_esc;
  354.       PUTC(c);
  355.       break;
  356.   }
  357. #endif /* ISO_2022_JP */
  358. if (c=='&' && (!context->element_stack || (
  359.       context->element_stack->tag  &&
  360.       ( context->element_stack->tag->contents == SGML_MIXED
  361.    || context->element_stack->tag->contents ==
  362.         SGML_RCDATA)
  363. ))) {
  364.     string->size = 0;
  365.     context->state = S_ero;
  366.     
  367. } else if (c=='<') {
  368.     string->size = 0;
  369.     context->state = (context->element_stack &&
  370.      context->element_stack->tag  &&
  371.      context->element_stack->tag->contents == SGML_LITERAL) ?
  372.      S_literal : S_tag;
  373. } else if (c=='n') { /* Newline - ignore if before tag end! */
  374.     context->state = S_nl;
  375. } else PUTC(c);
  376. break;
  377.     case S_nl:
  378.         if (c=='<') {
  379.     string->size = 0;
  380.     context->state = (context->element_stack &&
  381. context->element_stack->tag  &&
  382. context->element_stack->tag->contents == SGML_LITERAL) ?
  383. S_literal : S_nl_tago;
  384. } else {
  385.     PUTC('n');
  386.     context->state = S_text;
  387.     goto normal_text;
  388. }
  389. break;
  390.     case S_nl_tago: /* Had newline and tag opener */
  391.         if (c != '/') {
  392.     PUTC('n'); /* Only ignore newline before </ */
  393. }
  394. context->state = S_tag;
  395. goto handle_S_tag;
  396. #ifdef ISO_2022_JP
  397.     case S_esc:
  398. if (c=='$') {
  399.     context->state = S_dollar;
  400. } else if (c=='(') {
  401.     context->state = S_paren;
  402. } else {
  403.     context->state = S_text;
  404. }
  405. PUTC(c);
  406. break;
  407.     case S_dollar:
  408. if (c=='@' || c=='B') {
  409.     context->state = S_nonascii_text;
  410. } else {
  411.     context->state = S_text;
  412. }
  413. PUTC(c);
  414. break;
  415.     case S_paren:
  416. if (c=='B' || c=='J') {
  417.     context->state = S_text;
  418. } else {
  419.     context->state = S_text;
  420. }
  421. PUTC(c);
  422. break;
  423.     case S_nonascii_text:
  424. if (c=='33') {
  425.     context->state = S_esc;
  426.     PUTC(c);
  427. } else {
  428.     PUTC(c);
  429. }
  430. break;
  431. #endif /* ISO_2022_JP */
  432. /* In literal mode, waits only for specific end tag!
  433. ** Only foir compatibility with old servers.
  434. */
  435.     case S_literal :
  436. HTChunk_putc(string, c);
  437. if ( TOUPPER(c) != ((string->size ==1) ? '/'
  438. : context->element_stack->tag->name[string->size-2])) {
  439.     int i;
  440.     
  441.     /* If complete match, end literal */
  442.     if ((c=='>') && (!context->element_stack->tag->name[string->size-2])) {
  443. end_element(context, context->element_stack->tag);
  444. string->size = 0;
  445. context->current_attribute_number = INVALID;
  446. context->state = S_text;
  447. break;
  448.     } /* If Mismatch: recover string. */
  449.     PUTC( '<');
  450.     for (i=0; i<string->size; i++) /* recover */
  451.        PUTC(
  452.               string->data[i]);
  453.     context->state = S_text;
  454. }
  455.         break;
  456. /* Character reference or Entity
  457. */
  458.    case S_ero:
  459.     if (c=='#') {
  460.     context->state = S_cro;  /*   &# is Char Ref Open */ 
  461.     break;
  462. }
  463. context->state = S_entity;    /* Fall through! */
  464. /* Handle Entities
  465. */
  466.     case S_entity:
  467. if (isalnum(c))
  468.     HTChunk_putc(string, c);
  469. else {
  470.     HTChunk_terminate(string);
  471.     handle_entity(context, c);
  472.     context->state = S_text;
  473. }
  474. break;
  475. /* Character reference
  476. */
  477.     case S_cro:
  478. if (isalnum(c))
  479.     HTChunk_putc(string, c); /* accumulate a character NUMBER */
  480. else {
  481.     int value;
  482.     HTChunk_terminate(string);
  483.     if (sscanf(string->data, "%d", &value)==1)
  484.         PUTC((char) value);
  485.     context->state = S_text;
  486. }
  487. break;
  488. /* Tag
  489. */     
  490.     case S_tag: /* new tag */
  491. handle_S_tag:
  492. if (isalnum(c))
  493.     HTChunk_putc(string, c);
  494. else { /* End of tag name */
  495.     HTTag * t;
  496.     if (c=='/') {
  497. if (SGML_TRACE) if (string->size!=0)
  498.     TTYPrint(TDEST,"SGML:  `<%s/' found!n", string->data);
  499. context->state = S_end;
  500. break;
  501.     }
  502.     HTChunk_terminate(string) ;
  503.     t = SGMLFindTag(dtd, string->data);
  504.     if (!t) {
  505. if(SGML_TRACE) TTYPrint(TDEST, "SGML: *** Unknown element %sn",
  506. string->data);
  507. context->state = (c=='>') ? S_text : S_junk_tag;
  508. break;
  509.     }
  510.     context->current_tag = t;
  511.     
  512.     /*  Clear out attributes
  513.     */
  514.     
  515.     {
  516.         int i;
  517.         for (i=0; i< context->current_tag->number_of_attributes; i++)
  518.          context->present[i] = NO;
  519.     }
  520.     string->size = 0;
  521.     context->current_attribute_number = INVALID;
  522.     
  523.     if (c=='>') {
  524. if (context->current_tag->name) start_element(context);
  525. context->state = S_after_open;
  526.     } else {
  527.         context->state = S_tag_gap;
  528.     }
  529. }
  530. break;
  531.     case S_tag_gap: /* Expecting attribute or > */
  532. if (WHITE(c)) break; /* Gap between attributes */
  533. if (c=='>') { /* End of tag */
  534.     if (context->current_tag->name) start_element(context);
  535.     context->state = S_after_open;
  536.     break;
  537. }
  538. HTChunk_putc(string, c);
  539. context->state = S_attr; /* Get attribute */
  540. break;
  541.     /* accumulating value */
  542.     case S_attr:
  543. if (WHITE(c) || (c=='>') || (c=='=')) { /* End of word */
  544.     HTChunk_terminate(string) ;
  545.     handle_attribute_name(context, string->data);
  546.     string->size = 0;
  547.     if (c=='>') { /* End of tag */
  548. if (context->current_tag->name) start_element(context);
  549. context->state = S_after_open;
  550. break;
  551.     }
  552.     context->state = (c=='=' ?  S_equals: S_attr_gap);
  553. } else {
  554.     HTChunk_putc(string, c);
  555. }
  556. break;
  557.     case S_attr_gap: /* Expecting attribute or = or > */
  558. if (WHITE(c)) break; /* Gap after attribute */
  559. if (c=='>') { /* End of tag */
  560.     if (context->current_tag->name) start_element(context);
  561.     context->state = S_after_open;
  562.     break;
  563. } else if (c=='=') {
  564.     context->state = S_equals;
  565.     break;
  566. }
  567. HTChunk_putc(string, c);
  568. context->state = S_attr; /* Get next attribute */
  569. break;
  570.     case S_equals: /* After attr = */ 
  571. if (WHITE(c)) break; /* Before attribute value */
  572. if (c=='>') { /* End of tag */
  573.     if (SGML_TRACE) TTYPrint(TDEST, "SGML: found = but no valuen");
  574.     if (context->current_tag->name) start_element(context);
  575.     context->state = S_after_open;
  576.     break;
  577.     
  578. } else if (c==''') {
  579.     context->state = S_squoted;
  580.     break;
  581. } else if (c=='"') {
  582.     context->state = S_dquoted;
  583.     break;
  584. }
  585. HTChunk_putc(string, c);
  586. context->state = S_value;
  587. break;
  588.     case S_value:
  589. if (WHITE(c) || (c=='>')) { /* End of word */
  590.     HTChunk_terminate(string) ;
  591.     handle_attribute_value(context, string->data);
  592.     string->size = 0;
  593.     if (c=='>') { /* End of tag */
  594. if (context->current_tag->name) start_element(context);
  595. context->state = S_after_open;
  596. break;
  597.     }
  598.     else context->state = S_tag_gap;
  599. } else {
  600.     HTChunk_putc(string, c);
  601. }
  602. break;
  603.     case S_squoted: /* Quoted attribute value */
  604. if (c==''') { /* End of attribute value */
  605.     HTChunk_terminate(string) ;
  606.     handle_attribute_value(context, string->data);
  607.     string->size = 0;
  608.     context->state = S_tag_gap;
  609. } else {
  610.     HTChunk_putc(string, c);
  611. }
  612. break;
  613.     case S_dquoted: /* Quoted attribute value */
  614. if (c=='"') { /* End of attribute value */
  615.     HTChunk_terminate(string) ;
  616.     handle_attribute_value(context, string->data);
  617.     string->size = 0;
  618.     context->state = S_tag_gap;
  619. } else {
  620.     HTChunk_putc(string, c);
  621. }
  622. break;
  623.     case S_end: /* </ */
  624. if (isalnum(c))
  625.     HTChunk_putc(string, c);
  626. else { /* End of end tag name */
  627.     HTTag * t;
  628.     HTChunk_terminate(string) ;
  629.     if (!*string->data) { /* Empty end tag */
  630.         t = context->element_stack->tag;
  631.     } else {
  632. t = SGMLFindTag(dtd, string->data);
  633.     }
  634.     if (!t) {
  635. if(SGML_TRACE) TTYPrint(TDEST,
  636.     "Unknown end tag </%s>n", string->data); 
  637.     } else {
  638.         context->current_tag = t;
  639. end_element( context, context->current_tag);
  640.     }
  641.     string->size = 0;
  642.     context->current_attribute_number = INVALID;
  643.     if (c!='>') {
  644. if (SGML_TRACE && !WHITE(c))
  645.     TTYPrint(TDEST,"SGML:  `</%s%c' found!n",
  646.      string->data, c);
  647. context->state = S_junk_tag;
  648.     } else {
  649.         context->state = S_text;
  650.     }
  651. }
  652. break;
  653.     case S_junk_tag:
  654. if (c=='>') {
  655.     context->state = S_text;
  656. }
  657.     } /* switch on context->state */
  658.     return HT_OK;
  659. }
  660. PUBLIC int SGML_string (HTStream * context, CONST char* s)
  661. {
  662.     while (*s)
  663.         SGML_character(context, *s++);
  664.     return HT_OK;
  665. }
  666. PUBLIC int SGML_write (HTStream * context, CONST char* b, int l)
  667. {
  668.     while (l-- > 0)
  669.         SGML_character(context, *b++);
  670.     return HT_OK;
  671. }
  672. /*_______________________________________________________________________
  673. */
  674. /* Structured Object Class
  675. ** -----------------------
  676. */
  677. PRIVATE CONST HTStreamClass SGMLParser = 
  678. {
  679.     "SGMLParser",
  680.     SGML_flush,
  681.     SGML_free,
  682.     SGML_abort,
  683.     SGML_character, 
  684.     SGML_string,
  685.     SGML_write,
  686. }; 
  687. /* Create SGML Engine
  688. ** ------------------
  689. **
  690. ** On entry,
  691. ** dtd represents the DTD, along with
  692. ** actions is the sink for the data as a set of routines.
  693. **
  694. */
  695. PUBLIC HTStream * SGML_new (CONST SGML_dtd * dtd, HTStructured * target)
  696. {
  697.     int i;
  698.     HTStream* context;
  699.     if ((context = (HTStream  *) HT_MALLOC(sizeof(*context))) == NULL)
  700.         HT_OUTOFMEM("SGML_begin");
  701.     context->isa = &SGMLParser;
  702.     context->string = HTChunk_new(128); /* Grow by this much */
  703.     context->dtd = dtd;
  704.     context->target = target;
  705.     context->actions = (HTStructuredClass*)(((HTStream*)target)->isa);
  706.      /* Ugh: no OO */
  707.     context->state = S_text;
  708.     context->element_stack = 0; /* empty */
  709. #ifdef CALLERDATA   
  710.     context->callerData = (void*) callerData;
  711. #endif    
  712.     for(i=0; i<MAX_ATTRIBUTES; i++) context->value[i] = 0;
  713.     return context;
  714. }