gb_graph.w
上传用户:rrhhcc
上传日期:2015-12-11
资源大小:54129k
文件大小:37k
源码类别:

通讯编程

开发平台:

Visual C++

  1. % This file is part of the Stanford GraphBase (c) Stanford University 1993
  2. @i boilerplate.w %<< legal stuff: PLEASE READ IT BEFORE MAKING ANY CHANGES!
  3. deftitle{GB_,GRAPH}
  4. @* Introduction. This is {sc GB_,GRAPH}, the data-structure module
  5. used by all GraphBase routines to allocate memory. The basic data
  6. types for graph representation are also defined~here.
  7. Many examples of how to use these conventions appear in other GraphBase
  8. modules. The best introduction to such examples can probably be found
  9. in {sc GB_,BASIC}, which contains subroutines for generating and
  10. transforming various classical graphs.
  11. @ The code below is believed to be system-independent; it should
  12. produce equivalent results on all systems, assuming that the standard
  13. |calloc| and |free| functions of CEE/ are available.
  14. However, a test program helps build confidence that everything does in fact
  15. work as it should. To make such a test, simply compile and run .{test_graph}.
  16. This particular test is fairly rudimentary, but it should be passed before
  17. more elaborate routines are tested.
  18. @(test_graph.c@>=
  19. #include "gb_graph.h"  /* all users of {sc GB_,GRAPH} should do this */
  20. @<Declarations of test variables@>@;
  21. @#
  22. int main()
  23. {
  24.   @<Create a small graph@>;
  25.   @<Test some intentional errors@>;
  26.   @<Check that the small graph is still there@>;
  27.   printf("OK, the gb_graph routines seem to work!n");
  28.   return 0;
  29. }
  30. @ The CEE/ code for {sc GB_,GRAPH} doesn't have a main routine;
  31. it's just a bunch of subroutines waiting to be incorporated into
  32. programs at a higher level via the system loading routine. Here is
  33. the general outline of .{gb_graph.c}:
  34. @p
  35. #ifdef SYSV
  36. #include <string.h>
  37. #else
  38. #include <strings.h>
  39. #endif
  40. #include <stdio.h>
  41. #include <stdlib.h>
  42. @h@#
  43. @<Type declarations@>@;
  44. @<Private declarations@>@;
  45. @<External declarations@>@;
  46. @<External functions@>
  47. @ The type declarations of {sc GB_,GRAPH} appear also in the header file
  48. .{gb_graph.h}. For convenience, that header file also incorporates the
  49. standard system headers for input/output and string manipulation.
  50. Some system header files define an unsafe macro called |min|, which will
  51. interfere with GraphBase use of a useful identifier. We scotch that.
  52. @(gb_graph.h@>=
  53. #include <stdio.h>
  54. #include <stdlib.h>
  55. #ifdef SYSV
  56. #include <string.h>
  57. #else
  58. #include <strings.h>
  59. #endif
  60. #undef min
  61. @<Type declarations@>@;
  62. @ GraphBase programs often have a ``verbose'' option, which needs to
  63. be enabled by the setting of an external variable. They also tend to have
  64. a variable called |panic_code|, which helps identify unusual errors.
  65. We might as well declare those variables here.
  66. @<External d...@>=
  67. long verbose=0; /* nonzero if ``verbose'' output is desired */
  68. long panic_code=0; /* set nonzero if graph generator returns null pointer */
  69. @ Every external variable should be declared twice in this .{CWEB}
  70. file: once for {sc GB_,GRAPH} itself (the ``real'' declaration for
  71. storage allocation purposes) and once in .{gb_graph.h} (for
  72. cross-references by {sc GB_,GRAPH} users).
  73. @(gb_graph.h@>=
  74. extern long verbose; /* nonzero if ``verbose'' output is desired */
  75. extern long panic_code; /* set nonzero if graph generator panics */
  76. @ When |panic_code| is assigned a nonzero value, one of the symbolic
  77. names defined here is used to help pinpoint the problem.
  78. Small values indicate memory limitations; values in the 10s and 20s
  79. indicate input/output anomalies; values in the 30s and 40s indicate
  80. errors in the parameters to a subroutine. Some panic codes
  81. stand for cases the author doesn't think will ever arise, although
  82. the program checks for them just to be extra safe. Multiple instances
  83. of the same type of error within a single subroutine are distinguished
  84. by adding an integer; for example, `|syntax_error+1|' and `|syntax_error+2|'
  85. identify two different kinds of syntax error, as an aid in trouble-shooting.
  86. The |early_data_fault| and |late_data_fault| codes are explained further
  87. by the value of |io_errors|.
  88. @(gb_graph.h@>=
  89. #define alloc_fault (-1) /* a previous memory request failed */
  90. #define no_room 1 /* the current memory request failed */
  91. #define early_data_fault 10 /* error detected at beginning of .{.dat} file */
  92. #define late_data_fault 11 /* error detected at end of .{.dat} file */
  93. #define syntax_error 20 /* error detected while reading .{.dat} file */
  94. #define bad_specs 30 /* parameter out of range or otherwise disallowed */
  95. #define very_bad_specs 40 /* parameter far out of range or otherwise stupid */
  96. #define missing_operand 50 /* graph parameter is |NULL| */
  97. #define invalid_operand 60 /* graph parameter doesn't obey assumptions */
  98. #define impossible 90 /* ``this can't happen'' */
  99. @* Representation of graphs. The GraphBase programs employ a simple
  100. and flexible set of data structures to represent and manipulate graphs
  101. in computer memory.  Vertices appear in a sequential array of
  102. &{Vertex} records, and the arcs emanating from each vertex appear in
  103. a linked list of &{Arc} records. There is also a &{Graph} record, to
  104. provide information about the graph as a whole.
  105. The structure layouts for &{Vertex}, &{Arc}, and &{Graph} records
  106. include a number of utility fields that can be used for any purpose by
  107. algorithms that manipulate the graphs. Each utility field is a union
  108. type that can be either a pointer of various kinds or a (long) integer.
  109. Let's begin the formal definition of these data structures by declaring the
  110. union type &{util}. The suffixes .|V|, .|A|, .|G|, and .|S| on the name
  111. of a utility variable mean that the variable is a pointer to a vertex, arc,
  112. graph, or string, respectively; the suffix .|I| means that the variable is
  113. an integer. (We use one-character names because such names are easy to type
  114. when debugging.)
  115. @<Type dec...@>=
  116. typedef union {
  117.   struct vertex_struct *V; /* pointer to &{Vertex} */
  118.   struct arc_struct *A; /* pointer to &{Arc} */
  119.   struct graph_struct *G; /* pointer to &{Graph} */
  120.   char *S; /* pointer to string */
  121.   long I; /* integer */
  122. } util;
  123. @ Each &{Vertex} has two standard fields and six utility fields; hence it
  124. occupies 32 bytes on most systems, not counting the memory needed for
  125. supplementary string data. The standard fields are
  126. $$vcenter{halign{#,  hfil&#hfilcr
  127. |arcs|&a pointer to an &{Arc};cr
  128. |name|&a pointer to a string of characters.cr}}$$
  129. If |v| points to a &{Vertex} and |v->arcs| is |NULL|, there are no arcs
  130. emanating from~|v|. But if |v->arcs| is non-|NULL|, it points to an &{Arc}
  131. record representing an arc from~|v|, and that record has a |next| field that
  132. points in the same way to the representations of all other arcs from~|v|.
  133. The utility fields are called |u|, |v|, |w|, |x|, |y|, |z|. Macros can
  134. be used to give them syntactic sugar in particular applications. They are
  135. typically used to record such things as the in-degree or out-degree, or
  136. whether a vertex is `marked'. Utility fields might also link the vertex
  137. to other vertices or arcs in one or more lists.
  138. @<Type dec...@>=
  139. typedef struct vertex_struct {
  140.   struct arc_struct *arcs; /* linked list of arcs coming out of this vertex */
  141.   char *name; /* string identifying this vertex symbolically */
  142.   util u,v,w,x,y,z; /* multipurpose fields */
  143. } Vertex;
  144. @ Each &{Arc} has three standard fields and two utility fields. Thus it
  145. occupies 20~bytes on most computer systems. The standard fields are
  146. $$vcenter{halign{#,  hfil&#hfilcr
  147. |tip|&a pointer to a |Vertex|;cr
  148. |next|&a pointer to an &{Arc};cr
  149. |len|&a (long) integer.cr}}$$
  150. If |a| points to an &{Arc} in the list of arcs from vertex~|v|, it represents
  151. an arc of length |a->len| from |v| to |a->tip|, and the next arc from |v|
  152. in the list is represented by |a->next|.
  153. The utility fields are called |a| and |b|.
  154. @<Type dec...@>=
  155. typedef struct arc_struct {
  156.   struct vertex_struct *tip; /* the arc points to this vertex */
  157.   struct arc_struct *next; /* another arc pointing from the same vertex */
  158.   long len; /* length of this arc */
  159.   util a,b; /* multipurpose fields */
  160. } Arc;
  161. @* Storage allocation. Memory space must be set aside dynamically for
  162. vertices, arcs, and their attributes. The GraphBase routines provided by
  163. {sc GB_,GRAPH} accomplish this task with reasonable ease and efficiency
  164. by using the concept of memory ``areas.'' The user should first declare an
  165. &{Area} variable by saying, for example,
  166. $$hbox{&{Area} |s|;}$$
  167. and if this variable isn't static or otherwise known to be zero, it must be
  168. cleared initially by saying `|init_area(s)|'. Then any number of subroutine
  169. calls of the form  `|gb_alloc(n,s)|' can be given; |gb_alloc|
  170. will return a pointer to a block of |n| consecutive bytes, all cleared to zero.
  171. Finally, the user can issue the command
  172. $$hbox{|gb_free(s)|;}$$
  173. this statement will return all memory blocks currently allocated to area~|s|,
  174. making them available for future allocation.
  175. The number of bytes |n| specified to |gb_alloc| must be positive, and
  176. it should usually be 1000 or more, since this will reduce the number
  177. of system calls. Other routines are provided below to allocate smaller
  178. amounts of memory, such as the space needed for a single new &{Arc}.
  179. If no memory of the requested size is presently available, |gb_alloc|
  180. returns the null pointer |NULL|. In such cases |gb_alloc| also sets
  181. the external variable |gb_trouble_code| to a nonzero value. The user
  182. can therefore discover whether any one of an arbitrarily long series
  183. of allocation requests has failed by making a single test, `|if
  184. (gb_trouble_code)|'. The value of |gb_trouble_code| should be cleared to zero
  185. by every graph generation subroutine; therefore it need not be
  186. initialized to zero.
  187. A special macro |gb_typed_alloc(n,t,s)| makes it convenient to allocate
  188. the space for |n| items of type~|t| in area~|s|.
  189. @d gb_typed_alloc(n,t,s) @[(t*)@]gb_alloc((long)((n)*@[sizeof@](t)),s)
  190. @ The implementation of this scheme is almost ridiculously easy. The
  191. value of~|n| is increased by twice the number of bytes in a pointer,
  192. and the resulting number is rounded upwards if necessary so that it's
  193. a multiple of 256. Then memory is allocated using |calloc|.  The extra
  194. bytes will contain two pointers, one to the beginning of the block and
  195. one to the next block associated with the same area variable.
  196. The &{Area} type is defined to be an array of length 1. This makes it possible
  197. for users to say just `|s|' instead of `|&s|' when using an area
  198. variable as a parameter.
  199. @<Type...@>=
  200. #define init_area(s) @tquad@> @[*s=NULL@]
  201. struct area_pointers {
  202.   char *first; /* address of the beginning of this block */
  203.   struct area_pointers *next; /* address of area pointers in the previously
  204.         allocated block */
  205. };
  206. typedef struct area_pointers *Area[1];
  207. @ First we round |n| up, if necessary, so that it's a multiple of the
  208. size of a pointer variable. Then we know we can put |area_pointers| into
  209. memory at a position |n| after any address returned by |calloc|. (This
  210. logic should work whenever the number of bytes in a pointer variable
  211. is a divisor of~256.)
  212. The upper limit on |n| here is governed by old CEE/ conventions in
  213. which the first parameter to |calloc| must be less than~$2^{16}$.
  214. Users who need graphs with more than half a million vertices might
  215. want to raise this limit on their systems, but they would probably
  216. be better off representing large graphs in a more compact way.
  217. {sl Important Note:/}
  218. Programs of the Stanford GraphBase implicitly assume that all
  219. memory allocated by |calloc| comes from a single underlying memory array.
  220. Pointer values are compared to each other in many places, even when
  221. the objects pointed to have been allocated at different times. Strictly
  222. speaking, this liberal use of pointer comparisons fails to conform to
  223. the restrictions of ANSI Standard CEE/, if the comparison involves
  224. a less-than or greater-than relation. Users whose system supports only
  225. the strict standard will need to make several dozen changes.
  226. @^system dependencies@>
  227. @<External fun...@>=
  228. char *gb_alloc(n,s)
  229.   long n; /* number of consecutive bytes desired */
  230.   Area s; /* storage area that will contain the new block */
  231. {@+long m=sizeof(char *); /* |m| is the size of a pointer variable */
  232.   Area t; /* a temporary pointer */
  233.   char *loc; /* the block address */
  234.   if (n<=0 || n>0xffff00-2*m) {
  235.     gb_trouble_code|=2; /* illegal request */
  236.     return NULL;
  237.   }
  238.   n=((n+m-1)/m)*m; /* round up to multiple of |m| */
  239.   loc=(char*)calloc((unsigned)((n+2*m+255)/256),256);
  240.   if (loc) {
  241.     *t=(struct area_pointers*)(loc+n);
  242.     (*t)->first=loc;
  243.     (*t)->next=*s;
  244.     *s=*t;
  245.   }@+else gb_trouble_code|=1;
  246.   return loc;
  247. }
  248. @ @<External d...@>=
  249. long gb_trouble_code=0; /* did |gb_alloc| return |NULL|? */
  250. @ @(gb_graph.h@>=
  251. extern long gb_trouble_code; /* anomalies noted by |gb_alloc| */
  252. @ Notice that |gb_free(s)| can be called twice in a row, because the list
  253. of blocks is cleared out of the area variable~|s|.
  254. @<External fun...@>=
  255. void gb_free(s)
  256.   Area s;
  257. {@+Area t;
  258.   while (*s) {
  259.     *t=(*s)->next;
  260.     free((*s)->first);
  261.     *s=*t;
  262.   }
  263. }
  264. @ The two external procedures we've defined above should be mentioned in
  265. the header file, so let's do that before we forget.
  266. @(gb_graph.h@>=
  267. extern char *gb_alloc(); /* allocate another block for an area */
  268. #define gb_typed_alloc(n,t,s) @[@tquad@>
  269.                @[(t*)@]gb_alloc((long)((n)*@[sizeof@](t)),s)@]
  270. extern void gb_free(); /* deallocate all blocks for an area */
  271. @ Here we try to allocate 10 million bytes of memory. If we succeed,
  272. fine; if not, we verify that the error was properly reported.
  273. (An early draft of this program attempted to allocate memory until all
  274. space was exhausted. That tactic provided a more thorough test, but it
  275. was a bad idea because it brought certain large systems to their
  276. knees; it was terribly unfriendly to other users who were innocently
  277. trying to do their own work on the same machine.)
  278. @<Test some intentional errors@>=
  279. if (gb_alloc(0L,s)!=NULL || gb_trouble_code!=2) {
  280.   fprintf(stderr,"Allocation error 2 wasn't reported properly!n");@+return -2;
  281. }
  282. for (;g->vv.I<100;g->vv.I++)@+ if (gb_alloc(100000L,s)) {
  283.   g->uu.I++;
  284.   printf(".");
  285.   fflush(stdout);
  286. }
  287. if (g->uu.I<100 && gb_trouble_code!=3) {
  288.   fprintf(stderr,"Allocation error 1 wasn't reported properly!n");@+return -1;
  289. }
  290. if (g->uu.I==0) {
  291.   fprintf(stderr,"I couldn't allocate any memory!n");@+return -3;
  292. }
  293. gb_free(s); /* we've exhausted memory, let's put some back */
  294. printf("Hey, I allocated %ld00000 bytes successfully. Terrific...n",g->uu.I);
  295. gb_trouble_code=0;
  296. @ @<Decl...@>=
  297. Area s; /* temporary allocations in the test routine */
  298. @*Growing a graph. Now we're ready to look at the &{Graph} type. This is
  299. a data structure that can be passed to an algorithm that operates on
  300. graphs---to find minimum spanning trees, or strong components, or whatever.
  301. A &{Graph} record has seven standard fields and six utility fields. The
  302. standard fields are
  303. $$vcenter{halign{#,  hfil&#hfilcr
  304. |vertices|&a pointer to an array of |Vertex| records;cr
  305. |n|&the total number of vertices;cr
  306. |m|&the total number of arcs;cr
  307. |id|&a symbolic identification giving parameters of the GraphBase procedurecr
  308. omit& that generated this graph;cr
  309. |util_types|&a symbolic representation of the data types in utility fields;cr
  310. |data|&an |Area| used for |Arc| storage and string storage;cr
  311. |aux_data|&an |Area| used for auxiliary information that some users mightcr
  312. omit     &want to discard.cr}}$$
  313. The utility fields are called |uu|, |vv|, |ww|, |xx|, |yy|, and |zz|.
  314. As a consequence of these conventions, we can visit all arcs of a
  315. graph~|g| by using the following program:
  316. $$vcenter{halign{#hfilcr
  317. |Vertex *v;|cr
  318. |Arc *a;|cr
  319. |for (v=g->vertices; v<g->vertices+g->n; v++)|cr
  320. quad|for (a=v->arcs; a; a=a->next)|cr
  321. qquad\{visit}|(v,a)|;cr}}$$
  322. @<Type...@>=
  323. #define ID_FIELD_SIZE 161
  324. typedef struct graph_struct {
  325.   Vertex *vertices; /* beginning of the vertex array */
  326.   long n; /* total number of vertices */
  327.   long m; /* total number of arcs */
  328.   char id[ID_FIELD_SIZE]; /* GraphBase identification */
  329.   char util_types[15]; /* usage of utility fields */
  330.   Area data; /* the main data blocks */
  331.   Area aux_data; /* subsidiary data blocks */
  332.   util uu,vv,ww,xx,yy,zz; /* multipurpose fields */
  333. } Graph;
  334. @ The |util_types| field should always hold a string of length 14, followed
  335. as usual by a null character to terminate that string. The first six
  336. characters of |util_types| specify the usage of utility fields |u|, |v|,
  337. |w|, |x|, |y|, and~|z| in |Vertex| records; the next two characters give the
  338. format of the utility fields in |Arc| records; the last six give the
  339. format of the utility fields in |Graph| records.  Each character
  340. should be either .I (denoting a |long| integer),
  341. .S (denoting a pointer to a string),
  342. .V (denoting a pointer to a |Vertex|), .A (denoting a pointer to an
  343. |Arc|), .G (denoting a pointer to a |Graph|), or .Z (denoting an
  344. unused field that remains zero). The default for |util_types| is
  345. |"ZZZZZZZZZZZZZZ"|, when none of the utility fields is being used.
  346. For example, suppose that a bipartite graph |g| is using field |g->uu.I|
  347. to specify the size of its first part. Suppose further that |g| has a
  348. string in utility field |a| of each |Arc| and uses
  349. utility field |w| of |Vertex| records to point to an |Arc|. If |g|
  350. leaves all other utility fields untouched, its |util_types| should be
  351. |"ZZAZZZSZIZZZZZ"|.
  352. The |util_types| string is presently examined only by the |save_graph| and
  353. |restore_graph| routines, which convert GraphBase graphs from internal
  354. data structures to symbolic external files and vice versa. Therefore
  355. users need not update the |util_types| when they write algorithms to
  356. manipulate graphs, unless they are going to use |save_graph| to output
  357. a graph in symbolic form, or unless they are using some other
  358. GraphBase-related software that might rely on the conventions of
  359. |util_types|.  (Such software is not part of the ``official'' Stanford
  360. GraphBase, but it might conceivably exist some~day.)
  361. @ Some applications of bipartite graphs require all vertices of the first
  362. part to appear at the beginning of the |vertices| array. In such cases,
  363. utility field |uu.I| is traditionally given the symbolic name |n_1|, and
  364. it is set equal to the size of that first part. The size of the other
  365. part is then |g->n - g->n_1|.
  366. @^bipartite graph@>
  367. @d n_1 uu.I /* utility field |uu| may denote size of bipartite first part */
  368. @(gb_graph.h@>=
  369. #define n_1 @tquad@> uu.I
  370. #define mark_bipartite(g,n1) @[g->n_1=n1,g->util_types[8]='I'@]
  371. @ A new graph is created by calling |gb_new_graph(n)|, which returns a
  372. pointer to a |Graph| record for a graph with |n| vertices and no arcs.
  373. This function also initializes several private variables that are used
  374. by the |gb_new_arc|, |gb_new_edge|, |gb_virgin_arc|, and |gb_save_string|
  375. procedures below.
  376. We actually reserve space for |n+extra_n| vertices, although claiming only~$n$,
  377. because several graph manipulation algorithms like to add a special vertex
  378. or two to the graphs they deal with. 
  379. @<External f...@>=
  380. Graph *gb_new_graph(n)
  381.   long n; /* desired number of vertices */
  382. {
  383.   cur_graph=(Graph*)calloc(1,sizeof(Graph));
  384.   if (cur_graph) {
  385.     cur_graph->vertices=gb_typed_alloc(n+extra_n,Vertex,cur_graph->data);
  386.     if (cur_graph->vertices) {Vertex *p;
  387.       cur_graph->n=n;
  388.       for (p=cur_graph->vertices+n+extra_n-1; p>=cur_graph->vertices; p--)
  389.         p->name=null_string;
  390.       sprintf(cur_graph->id,"gb_new_graph(%ld)",n);
  391.       strcpy(cur_graph->util_types,"ZZZZZZZZZZZZZZ");
  392.     }@+else {
  393.       free((char*)cur_graph);
  394.       cur_graph=NULL;
  395.     }
  396.   }
  397.   next_arc=bad_arc=NULL;
  398.   next_string=bad_string=NULL;
  399.   gb_trouble_code=0;
  400.   return cur_graph;
  401. }
  402. @ The value of |extra_n| is ordinarily~4, and it should probably always be at
  403. least~4.
  404. @<External d...@>=
  405. long extra_n=4; /* the number of shadow vertices allocated by |gb_new_graph| */
  406. char null_string[1]; /* a null string constant */
  407. @ @(gb_graph.h@>=
  408. extern long extra_n;
  409.   /* the number of shadow vertices allocated by |gb_new_graph| */
  410. extern char null_string[]; /* a null string constant */
  411. extern void make_compound_id();
  412.   /* routine to set one |id| field from another */
  413. extern void make_double_compound_id(); /* ditto, but from two others */
  414. @ The |id| field of a graph is sometimes manufactured from the |id| field
  415. of another graph. The following routines do this without allowing the
  416. string to get too long after repeated copying.
  417. @<External f...@>=
  418. void make_compound_id(g,s1,gg,s2) /* |sprintf(g->id,"%s%s%s",s1,gg->id,s2)| */
  419.   Graph *g; /* graph whose |id| is to be set */
  420.   char *s1; /* string for the beginning of the new |id| */
  421.   Graph *gg; /* graph whose |id| is to be copied */
  422.   char *s2; /* string for the end of the new |id| */
  423. {@+int avail=ID_FIELD_SIZE-strlen(s1)-strlen(s2);
  424.   char tmp[ID_FIELD_SIZE];
  425.   strcpy(tmp,gg->id);
  426.   if (strlen(tmp)<avail) sprintf(g->id,"%s%s%s",s1,tmp,s2);
  427.   else sprintf(g->id,"%s%.*s...)%s",s1,avail-5,tmp,s2);
  428. }
  429. @ @<External f...@>=
  430. void make_double_compound_id(g,s1,gg,s2,ggg,s3)
  431.               /* |sprintf(g->id,"%s%s%s%s%s",s1,gg->id,s2,ggg->id,s3)| */
  432.   Graph *g; /* graph whose |id| is to be set */
  433.   char *s1; /* string for the beginning of the new |id| */
  434.   Graph *gg; /* first graph whose |id| is to be copied */
  435.   char *s2; /* string for the middle of the new |id| */
  436.   Graph *ggg; /* second graph whose |id| is to be copied */
  437.   char *s3; /* string for the end of the new |id| */
  438. {@+int avail=ID_FIELD_SIZE-strlen(s1)-strlen(s2)-strlen(s3);
  439.   if (strlen(gg->id)+strlen(ggg->id)<avail)
  440.     sprintf(g->id,"%s%s%s%s%s",s1,gg->id,s2,ggg->id,s3);
  441.   else sprintf(g->id,"%s%.*s...)%s%.*s...)%s",s1,avail/2-5,gg->id,
  442.              s2,(avail-9)/2,ggg->id,s3);
  443. }
  444. @ But how do the arcs get there? That's where the private variables in
  445. |gb_new_graph| come in. If |next_arc| is unequal to |bad_arc|, it points to
  446. an unused |Arc| record in a previously allocated block of |Arc| records.
  447. Similarly, |next_string| and |bad_string| are addresses used to
  448. place strings into a block of memory allocated for that purpose.
  449. @<Private...@>=
  450. static Arc *next_arc; /* the next |Arc| available for allocation */
  451. static Arc *bad_arc; /* but if |next_arc=bad_arc|, that |Arc| isn't there */
  452. static char *next_string; /* the next byte available for storing a string */
  453. static char *bad_string; /* but if |next_string=bad_string|, don't byte */
  454. static Arc dummy_arc[2]; /* an |Arc| record to point to in an emergency */
  455. static Graph dummy_graph; /* a |Graph| record that's normally unused */
  456. static Graph *cur_graph=&dummy_graph; /* the |Graph| most recently created */
  457. @ All new |Arc| records that are created by the automatic |next_arc|/|bad_arc|
  458. scheme originate in a procedure called |gb_virgin_arc|, which returns the
  459. address of a new record having type |Arc|.
  460. When a new block of |Arc| records is needed, we create 102 of them at once.
  461. This strategy causes exactly 2048 bytes to be allocated on most
  462. computer systems---a nice round number. The routine will still work, however,
  463. if 102 is replaced by any positive even number. The new block goes into
  464. the |data| area of |cur_graph|.
  465. Graph-building programs do not usually call |gb_virgin_arc| directly;
  466. they generally invoke one of the higher-level routines |gb_new_arc|
  467. or |gb_new_edge| described below.
  468. If memory space has been exhausted, |gb_virgin_arc| will return a
  469. pointer to |dummy_arc|, so that the calling procedure can safely
  470. refer to fields of the result even though |gb_trouble_code| is nonzero.
  471. @d arcs_per_block 102
  472. @<External f...@>=
  473. Arc *gb_virgin_arc()
  474. {@+register Arc *cur_arc=next_arc;
  475.   if (cur_arc==bad_arc) {
  476.     cur_arc=gb_typed_alloc(arcs_per_block,Arc,cur_graph->data);
  477.     if (cur_arc==NULL)
  478.       cur_arc=dummy_arc;
  479.     else {
  480.       next_arc = cur_arc+1;
  481.       bad_arc = cur_arc+arcs_per_block;
  482.     }
  483.   }
  484.   else next_arc++;
  485.   return cur_arc;
  486. }
  487. @ The routine |gb_new_arc(u,v,len)| creates a new arc of length |len|
  488. from vertex~|u| to vertex~|v|. The arc becomes part of the graph that
  489. was most recently created by |gb_new_graph|---the graph
  490. pointed to by the private variable |cur_graph|. This routine assumes
  491. that |u| and |v| are both vertices in |cur_graph|.
  492. The new arc will be pointed to by |u->arcs|, immediately after
  493. |gb_new_arc(u,v,len)| has acted. If there is no room for the new arc,
  494. |gb_trouble_code| is set nonzero, but |u->arcs| will point to the non-|NULL|
  495. record |dummy_arc|
  496. so that additional information can safely be stored in its utility fields
  497. without risking system crashes before |gb_trouble_code| is tested.
  498. However, the linking structure of arcs is apt to be fouled up in such
  499. cases; programs should make sure that |gb_trouble_code==0| before doing any
  500. extensive computation on a graph.
  501. @<External f...@>=
  502. void gb_new_arc(u,v,len)
  503.   Vertex *u, *v; /* a newly created arc will go from |u| to |v| */
  504.   long len; /* its length */
  505. {@+register Arc *cur_arc=gb_virgin_arc();
  506.   cur_arc->tip=v; @+cur_arc->next=u->arcs; @+cur_arc->len=len;
  507.   u->arcs=cur_arc;
  508.   cur_graph->m++;
  509. }
  510. @ An undirected graph has ``edges'' instead of arcs. We represent an edge
  511. by two arcs, one going each way.
  512. @^undirected graph@>
  513. The fact that |arcs_per_block| is even means that the |gb_new_edge|
  514. routine needs to call |gb_virgin_arc| only once instead of twice.
  515. Caveats: This routine, like |gb_new_arc|, should be used only after
  516. |gb_new_graph| has caused the private variable |cur_graph| to point to
  517. the graph containing the new edge. The routine |gb_new_edge| must
  518. not be used together with |gb_new_arc| or |gb_virgin_arc| when
  519. building a graph, unless |gb_new_arc| and |gb_virgin_arc| have been
  520. called an even number of times before |gb_new_edge| is invoked.
  521. The new edge will be pointed to by |u->arcs| and by |v->arcs| immediately
  522. after |gb_new_edge| has created it, assuming that |u!=v|. The two arcs
  523. appear next to each other in memory; indeed, |gb_new_edge| rigs things so
  524. that |v->arcs| is |u->arcs+1| when |u<v|.
  525. On many computers it turns out that the first |Arc| record of every such
  526. pair of arcs will have an address that is a multiple of~8, and the
  527. second |Arc| record will have an address that is not a multiple of~8 (because
  528. the first |Arc| will be 20 bytes long, and because |calloc| always returns
  529. a multiple of~8). However, it is not safe to assume this when writing
  530. portable code. Algorithms for undirected graphs can still make good use of
  531. the fact that arcs for edges are paired, without needing any mod~8 assumptions,
  532. if all edges have been created and linked into the graph by |gb_new_edge|:
  533. The inverse of an arc~|a| from |u| to~|v| will be arc |a+1| if and only if
  534. |u<v| or |a->next=a+1|; it will be arc |a-1| if and only if |u>=v| and
  535. |a->next!=a+1|. The condition |a->next=a+1| can hold only if |u=v|.
  536. @d gb_new_graph gb_nugraph /* abbreviations for Procrustean linkers */
  537. @d gb_new_arc gb_nuarc
  538. @d gb_new_edge gb_nuedge
  539. @<External f...@>=
  540. void gb_new_edge(u,v,len)
  541.   Vertex *u, *v; /* new arcs will go from |u| to |v| and from |v| to |u| */
  542.   long len; /* their length */
  543. {@+register Arc *cur_arc=gb_virgin_arc();
  544.   if (cur_arc!=dummy_arc) next_arc++;
  545.   if (u<v) {
  546.     cur_arc->tip=v; @+cur_arc->next=u->arcs;
  547.     (cur_arc+1)->tip=u; @+(cur_arc+1)->next=v->arcs;
  548.     u->arcs=cur_arc; v->arcs=cur_arc+1;
  549.   }@+else {
  550.     (cur_arc+1)->tip=v; @+(cur_arc+1)->next=u->arcs;
  551.     u->arcs=cur_arc+1; /* do this now in case |u==v| */
  552.     cur_arc->tip=u; @+cur_arc->next=v->arcs;
  553.     v->arcs=cur_arc;
  554.   }
  555.   cur_arc->len=(cur_arc+1)->len=len;
  556.   cur_graph->m+=2;
  557. }
  558. @ Sometimes (let us hope rarely) we might need to use a dirty trick
  559. hinted at in the previous discussion. On most computers, the mate to
  560. arc~|a| will be |a-1| if and only if |edge_trick&(siz_t)a|
  561. is nonzero.
  562. @^system dependencies@>
  563. @^pointer hacks@>
  564. @<External d...@>=
  565. siz_t edge_trick=sizeof(Arc)-(sizeof(Arc)&(sizeof(Arc)-1));
  566. @ @(gb_graph.h@>=
  567. extern siz_t edge_trick; /* least significant 1 bit in |sizeof(Arc)| */
  568. @ The type |siz_t| just mentioned should be the type returned by CEE/'s
  569. |sizeof| operation; it's the basic unsigned type for machine
  570. addresses in pointers. ANSI standard CEE/ calls this type &{size_t},
  571. but we cannot safely use &{size_t} in all the GraphBase programs
  572. because some older CEE/
  573. systems mistakenly define &{size_t} to be a signed type.
  574. @^system dependencies@>
  575. @f siz_t int
  576. @<Type d...@>=
  577. typedef unsigned long @[siz_t@];
  578.   /* basic machine address, as signless integer */
  579. @ Vertices generally have a symbolic name, and we need a place to put
  580. such names. The |gb_save_string| function is a convenient utility
  581. for this purpose:
  582. Given a null-terminated string of any length, |gb_save_string| stashes
  583. it away in a safe place and returns a pointer to that place. Memory is
  584. conserved by combining strings from the current graph into largish blocks
  585. of a convenient size.
  586. Note that |gb_save_string| should be used only after |gb_new_graph|
  587. has provided suitable initialization, because the private variable
  588. |cur_graph| must point to the graph for which storage is currently
  589. being allocated, and because the private variables |next_string| and
  590. |bad_string| must also have suitable values.
  591. @d string_block_size 1016 /* $1024-8$ is usually efficient */
  592. @<External f...@>=
  593. char *gb_save_string(s)
  594.   register char *s; /* the string to be copied */
  595. {@+register char *p=s;
  596.   register long len;
  597.        /* length of the string and the following null character */
  598.   while (*p++) ; /* advance to the end of the string */
  599.   len=p-s;
  600.   p=next_string;
  601.   if (p+len>bad_string) { /* not enough room in the current block */
  602.     long size=string_block_size;
  603.     if (len>size)
  604.       size=len;
  605.     p=gb_alloc(size,cur_graph->data);
  606.     if (p==NULL)
  607.       return null_string; /* return a pointer to |""| if memory ran out */
  608.     bad_string=p+size;
  609.   }
  610.   while (*s) *p++=*s++; /* copy the non-null bytes of the string */
  611.   *p++=''; /* and append a null character */
  612.   next_string=p;
  613.   return p-len;
  614. }
  615. @ The test routine illustrates some of these basic maneuvers.
  616. @<Create a small graph@>=
  617. g=gb_new_graph(2L);
  618. if (g==NULL) {
  619.   fprintf(stderr,"Oops, I couldn't even create a trivial graph!n");
  620.   return -4;
  621. }
  622. u=g->vertices;@+ v=u+1;
  623. u->name=gb_save_string("vertex 0");
  624. v->name=gb_save_string("vertex 1");
  625. @ @<Decl...@>=
  626. Graph *g;
  627. Vertex *u,*v;
  628. @ If the ``edge trick'' fails, the standard GraphBase routines are
  629. unaffected except for the demonstration program {sc MILES_,SPAN}. (And
  630. that program uses |edge_trick| only when printing verbose comments.)
  631. @^edge trick failure@>
  632. @<Check that the small graph is still there@>=
  633. if (strncmp(u->name,v->name,7)) {
  634.   fprintf(stderr,"Something is fouled up in the string storage machinery!n");
  635.   return -5;
  636. }
  637. gb_new_edge(v,u,-1L);
  638. gb_new_edge(u,u,1L);
  639. gb_new_arc(v,u,-1L);
  640. if ((edge_trick&(siz_t)(u->arcs))||
  641.     (edge_trick&(siz_t)(u->arcs->next->next))||
  642.     !(edge_trick&(siz_t)(v->arcs->next)))
  643.   printf("Warning: The "edge trick" failed!n");
  644. if (v->name[7]+g->n!=v->arcs->next->tip->name[7]+g->m-2) {
  645.      /* |'1'+2!='0'+5-2| */
  646.   fprintf(stderr,"Sorry, the graph data structures aren't working yet.n");
  647.   return -6;
  648. }
  649. @ Some applications might need to add arcs to several graphs at a time,
  650. violating the assumptions stated above about |cur_graph| and the other
  651. private variables. The |switch_to_graph| function gets around that
  652. restriction, by using the utility slots |ww|, |xx|, |yy|, and
  653. |zz| of |Graph| records to save and restore the private variables.
  654. Just say |switch_to_graph(g)| in order to make |cur_graph| be~|g| and
  655. to restore the other private variables that are needed by
  656. |gb_new_arc|, |gb_virgin_arc|, |gb_new_edge|, and |gb_save_string|.
  657. Restriction: The graph |g| being switched to must have previously been
  658. switched from; that is, it must have been |cur_graph| when |switch_to_graph|
  659. was called previously. Otherwise its private allocation variables will
  660. not have been saved. To meet this restriction, you should say
  661. |switch_to_graph(NULL)| just before calling |gb_new_graph|, if you
  662. intend to switch back to the current graph later.
  663. (The swap-in-swap-out nature of these conventions may seem inelegant, but
  664. convenience and efficiency are more important than elegance when most
  665. applications do not need the ability to switch between graphs.)
  666. @<External f...@>=
  667. void switch_to_graph(g)
  668.   Graph *g;
  669. {
  670.   cur_graph->ww.A=next_arc; @+cur_graph->xx.A=bad_arc;
  671.   cur_graph->yy.S=next_string; @+cur_graph->zz.S=bad_string;
  672.   cur_graph=(g? g: &dummy_graph);
  673.   next_arc=cur_graph->ww.A; @+bad_arc=cur_graph->xx.A;
  674.   next_string=cur_graph->yy.S; @+bad_string=cur_graph->zz.S;
  675.   cur_graph->ww.A=NULL;
  676.   cur_graph->xx.A=NULL;
  677.   cur_graph->yy.S=NULL;
  678.   cur_graph->zz.S=NULL;
  679. }
  680. @ Finally,
  681. here's a routine that obliterates an entire graph when it is no longer needed:
  682. @<External fun...@>=
  683. void gb_recycle(g)
  684.   Graph *g;
  685. {
  686.   if (g) {
  687.     gb_free(g->data);
  688.     gb_free(g->aux_data);
  689.     free((char*)g); /* the user must not refer to |g| again */
  690.   }
  691. }
  692. @ @(gb_graph.h@>=
  693. #define gb_new_graph gb_nugraph /* abbreviations for external linkage */
  694. #define gb_new_arc gb_nuarc
  695. #define gb_new_edge gb_nuedge
  696. extern Graph*gb_new_graph(); /* create a new graph structure */
  697. extern void gb_new_arc(); /* append an arc to the current graph */
  698. extern Arc*gb_virgin_arc(); /* allocate a new |Arc| record */
  699. extern void gb_new_edge(); /* append an edge (two arcs) to the current graph */
  700. extern char*gb_save_string(); /* store a string in the current graph */
  701. extern void switch_to_graph(); /* save allocation variables, swap in others */
  702. extern void gb_recycle(); /* delete a graph structure */
  703. @* Searching for vertices. We sometimes want to be able to find a vertex, given
  704. its name, and it is nice to do this in a standard way. The following simple
  705. subroutines can be used:
  706. {narrower
  707. smallskip|hash_in(v)| puts the name of vertex |v| into the hash table;
  708. smallskip|hash_out(s)| finds a vertex named |s|, if present in the hash table;
  709. smallskip|hash_setup(g)| prepares a hash table for all vertices of graph~|g|;
  710. smallskip|hash_lookup(s,g)| looks up the name |s| in the hash table of |g|.
  711. smallskip}
  712. noindent Routines |hash_in| and |hash_out| apply to the current graph being
  713. created, while |hash_setup| and |hash_lookup| apply to arbitrary graphs.
  714. Important: Utility fields |u| and |v| of each vertex are reserved for use by
  715. the search routine when hashing is active. You can crash the system
  716. if you try to fool around with these values yourself, or if you use any
  717. subroutines that change those fields. The first two characters in the
  718. current graph's |util_types| field should be .{VV} if the hash table
  719. information is to be saved by {sc GB_,SAVE}.
  720. Warning: Users of this hash scheme must preserve the number of
  721. vertices |g->n| in the current graph~|g|. If |g->n| is changed,
  722. the hash table will be worthless, unless |hash_setup| is used to
  723. rehash everything.
  724. @<gb_graph.h@>=
  725. extern void hash_in(); /* input a name to the hash table of current graph */
  726. extern Vertex* hash_out(); /* find a name in hash table of current graph */
  727. extern void hash_setup(); /* create a hash table for a given graph */
  728. extern Vertex* hash_lookup(); /* find a name in a given graph */
  729. @ The lookup scheme is quite simple. We compute a more-or-less random
  730. value |h| based on the vertex name, where |0<=h<n|, assuming that
  731. the graph has |n|~vertices. There is a list of all vertices whose hash
  732. address is~|h|, starting at |(g->vertices+h)->hash_head| and linked
  733. together in the |hash_link| fields, where |hash_head| and |hash_link| are
  734. utility fields |u.V| and |v.V|.
  735. @d hash_link u.V
  736. @d hash_head v.V
  737. @ @<External fun...@>=
  738. void hash_in(v)
  739.   Vertex *v;
  740. {@+  register char *t=v->name;
  741.   register Vertex *u;
  742.   @<Find vertex |u|, whose location is the hash code for string |t|@>;
  743.   v->hash_link=u->hash_head;
  744.   u->hash_head=v;
  745. }
  746. @ The hash code for a string $c_1c_2ldots c_l$ of length $l$ is a
  747. nonlinear function of the characters; this function appears to produce
  748. reasonably random results between 0 and the number of vertices in the
  749. current graph.  Simpler approaches were noticeably poorer in the
  750. author's tests.
  751. Caution: This hash coding scheme is system-dependent, because it
  752. uses the system's character codes. If you create a graph on a
  753. machine with ASCII code and save it with {sc GB_,SAVE}, and if you
  754. subsequently ship the
  755. resulting text file to some friend whose machine does not use ASCII code,
  756. your friend will have to rebuild the hash structure with |hash_setup|
  757. before being able to use |hash_lookup| successfully.
  758. @^character-set dependencies@>
  759. @d HASH_MULT 314159 /* random multiplier */
  760. @d HASH_PRIME 516595003 /* the 27182818th prime; it's less than $2^{29}$ */
  761. @<Find vertex |u|...@>=
  762. {@+register long h;
  763.   for (h=0;*t;t++) {
  764.     h+=(h^(h>>1))+HASH_MULT*(unsigned char)*t;
  765.     while (h>=HASH_PRIME) h-=HASH_PRIME;
  766.   }
  767.   u=cur_graph->vertices+(h % cur_graph->n);
  768. }
  769. @ If the hash function were truly random, the average number of
  770. string comparisons made would be less than $(e^2+7)/8approx 1.80$ on
  771. a successful search, and less than $(e^2+1)/4approx2.10$ on an
  772. unsuccessful search [{sl Sorting and Searching}, Section 6.4,
  773. Eqs.~(15) and~(16)].
  774. @<External fun...@>=
  775. Vertex* hash_out(s)
  776.   char* s;
  777. {@+register char *t=s;
  778.   register Vertex *u;
  779.   @<Find vertex |u|...@>;
  780.   for (u=u->hash_head;u;u=u->hash_link)
  781.     if (strcmp(s,u->name)==0) return u;
  782.   return NULL; /* not found */
  783. }
  784. @ @<External fun...@>=
  785. void hash_setup(g)
  786.   Graph *g;
  787. {@+Graph *save_cur_graph;
  788.   if (g && g->n>0) {@+register Vertex *v;
  789.     save_cur_graph=cur_graph;
  790.     cur_graph=g;
  791.     for (v=g->vertices;v<g->vertices+g->n;v++) v->hash_head=NULL;
  792.     for (v=g->vertices;v<g->vertices+g->n;v++) hash_in(v);
  793.     g->util_types[0]=g->util_types[1]='V';
  794.          /* indicate usage of |hash_head| and |hash_link| */
  795.     cur_graph=save_cur_graph;
  796.   }
  797. }
  798. @ @<External fun...@>=
  799. Vertex* hash_lookup(s,g)
  800.   char *s;
  801.   Graph *g;
  802. {@+Graph *save_cur_graph;
  803.   if (g && g->n>0) {@+register Vertex *v;
  804.     save_cur_graph=cur_graph;
  805.     cur_graph=g;
  806.     v=hash_out(s);
  807.     cur_graph=save_cur_graph;
  808.     return v;
  809.   }
  810.   else return NULL;
  811. }
  812. @* Index. Here is a list that shows where the identifiers of this program are
  813. defined and used.