mime.c
上传用户:xu_441
上传日期:2007-01-04
资源大小:1640k
文件大小:27k
源码类别:

Email客户端

开发平台:

Unix_Linux

  1. /*
  2.  * Copyright (c) 1998, 1999 Sendmail, Inc. and its suppliers.
  3.  * All rights reserved.
  4.  * Copyright (c) 1994, 1996-1997 Eric P. Allman.  All rights reserved.
  5.  * Copyright (c) 1994
  6.  * The Regents of the University of California.  All rights reserved.
  7.  *
  8.  * By using this file, you agree to the terms and conditions set
  9.  * forth in the LICENSE file which can be found at the top level of
  10.  * the sendmail distribution.
  11.  *
  12.  */
  13. #include <sendmail.h>
  14. #include <string.h>
  15. #ifndef lint
  16. static char id[] = "@(#)$Id: mime.c,v 8.94 1999/10/17 17:35:58 ca Exp $";
  17. #endif /* ! lint */
  18. static int isboundary __P((char *, char **));
  19. static int mimeboundary __P((char *, char **));
  20. static int mime_fromqp __P((u_char *, u_char **, int, int));
  21. static int mime_getchar __P((FILE *, char **, int *));
  22. static int mime_getchar_crlf __P((FILE *, char **, int *));
  23. /*
  24. **  MIME support.
  25. **
  26. ** I am indebted to John Beck of Hewlett-Packard, who contributed
  27. ** his code to me for inclusion.  As it turns out, I did not use
  28. ** his code since he used a "minimum change" approach that used
  29. ** several temp files, and I wanted a "minimum impact" approach
  30. ** that would avoid copying.  However, looking over his code
  31. ** helped me cement my understanding of the problem.
  32. **
  33. ** I also looked at, but did not directly use, Nathaniel
  34. ** Borenstein's "code.c" module.  Again, it functioned as
  35. ** a file-to-file translator, which did not fit within my
  36. ** design bounds, but it was a useful base for understanding
  37. ** the problem.
  38. */
  39. #if MIME8TO7
  40. /* character set for hex and base64 encoding */
  41. static char Base16Code[] = "0123456789ABCDEF";
  42. static char Base64Code[] = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
  43. /* types of MIME boundaries */
  44. # define MBT_SYNTAX 0 /* syntax error */
  45. # define MBT_NOTSEP 1 /* not a boundary */
  46. # define MBT_INTERMED 2 /* intermediate boundary (no trailing --) */
  47. # define MBT_FINAL 3 /* final boundary (trailing -- included) */
  48. static char *MimeBoundaryNames[] =
  49. {
  50. "SYNTAX", "NOTSEP", "INTERMED", "FINAL"
  51. };
  52. static bool MapNLtoCRLF;
  53. /*
  54. **  MIME8TO7 -- output 8 bit body in 7 bit format
  55. **
  56. ** The header has already been output -- this has to do the
  57. ** 8 to 7 bit conversion.  It would be easy if we didn't have
  58. ** to deal with nested formats (multipart/xxx and message/rfc822).
  59. **
  60. ** We won't be called if we don't have to do a conversion, and
  61. ** appropriate MIME-Version: and Content-Type: fields have been
  62. ** output.  Any Content-Transfer-Encoding: field has not been
  63. ** output, and we can add it here.
  64. **
  65. ** Parameters:
  66. ** mci -- mailer connection information.
  67. ** header -- the header for this body part.
  68. ** e -- envelope.
  69. ** boundaries -- the currently pending message boundaries.
  70. ** NULL if we are processing the outer portion.
  71. ** flags -- to tweak processing.
  72. **
  73. ** Returns:
  74. ** An indicator of what terminated the message part:
  75. **   MBT_FINAL -- the final boundary
  76. **   MBT_INTERMED -- an intermediate boundary
  77. **   MBT_NOTSEP -- an end of file
  78. */
  79. struct args
  80. {
  81. char *a_field; /* name of field */
  82. char *a_value; /* value of that field */
  83. };
  84. int
  85. mime8to7(mci, header, e, boundaries, flags)
  86. register MCI *mci;
  87. HDR *header;
  88. register ENVELOPE *e;
  89. char **boundaries;
  90. int flags;
  91. {
  92. register char *p;
  93. int linelen;
  94. int bt;
  95. off_t offset;
  96. size_t sectionsize, sectionhighbits;
  97. int i;
  98. char *type;
  99. char *subtype;
  100. char *cte;
  101. char **pvp;
  102. int argc = 0;
  103. char *bp;
  104. bool use_qp = FALSE;
  105. struct args argv[MAXMIMEARGS];
  106. char bbuf[128];
  107. char buf[MAXLINE];
  108. char pvpbuf[MAXLINE];
  109. extern u_char MimeTokenTab[256];
  110. if (tTd(43, 1))
  111. {
  112. dprintf("mime8to7: flags = %x, boundaries =", flags);
  113. if (boundaries[0] == NULL)
  114. dprintf(" <none>");
  115. else
  116. {
  117. for (i = 0; boundaries[i] != NULL; i++)
  118. dprintf(" %s", boundaries[i]);
  119. }
  120. dprintf("n");
  121. }
  122. MapNLtoCRLF = TRUE;
  123. p = hvalue("Content-Transfer-Encoding", header);
  124. if (p == NULL ||
  125.     (pvp = prescan(p, '', pvpbuf, sizeof pvpbuf, NULL,
  126.    MimeTokenTab)) == NULL ||
  127.     pvp[0] == NULL)
  128. {
  129. cte = NULL;
  130. }
  131. else
  132. {
  133. cataddr(pvp, NULL, buf, sizeof buf, '');
  134. cte = newstr(buf);
  135. }
  136. type = subtype = NULL;
  137. p = hvalue("Content-Type", header);
  138. if (p == NULL)
  139. {
  140. if (bitset(M87F_DIGEST, flags))
  141. p = "message/rfc822";
  142. else
  143. p = "text/plain";
  144. }
  145. if (p != NULL &&
  146.     (pvp = prescan(p, '', pvpbuf, sizeof pvpbuf, NULL,
  147.    MimeTokenTab)) != NULL &&
  148.     pvp[0] != NULL)
  149. {
  150. if (tTd(43, 40))
  151. {
  152. for (i = 0; pvp[i] != NULL; i++)
  153. dprintf("pvp[%d] = "%s"n", i, pvp[i]);
  154. }
  155. type = *pvp++;
  156. if (*pvp != NULL && strcmp(*pvp, "/") == 0 &&
  157.     *++pvp != NULL)
  158. {
  159. subtype = *pvp++;
  160. }
  161. /* break out parameters */
  162. while (*pvp != NULL && argc < MAXMIMEARGS)
  163. {
  164. /* skip to semicolon separator */
  165. while (*pvp != NULL && strcmp(*pvp, ";") != 0)
  166. pvp++;
  167. if (*pvp++ == NULL || *pvp == NULL)
  168. break;
  169. /* complain about empty values */
  170. if (strcmp(*pvp, ";") == 0)
  171. {
  172. usrerr("mime8to7: Empty parameter in Content-Type header");
  173. /* avoid bounce loops */
  174. e->e_flags |= EF_DONT_MIME;
  175. continue;
  176. }
  177. /* extract field name */
  178. argv[argc].a_field = *pvp++;
  179. /* see if there is a value */
  180. if (*pvp != NULL && strcmp(*pvp, "=") == 0 &&
  181.     (*++pvp == NULL || strcmp(*pvp, ";") != 0))
  182. {
  183. argv[argc].a_value = *pvp;
  184. argc++;
  185. }
  186. }
  187. }
  188. /* check for disaster cases */
  189. if (type == NULL)
  190. type = "-none-";
  191. if (subtype == NULL)
  192. subtype = "-none-";
  193. /* don't propogate some flags more than one level into the message */
  194. flags &= ~M87F_DIGEST;
  195. /*
  196. **  Check for cases that can not be encoded.
  197. **
  198. ** For example, you can't encode certain kinds of types
  199. ** or already-encoded messages.  If we find this case,
  200. ** just copy it through.
  201. */
  202. snprintf(buf, sizeof buf, "%.100s/%.100s", type, subtype);
  203. if (wordinclass(buf, 'n') || (cte != NULL && !wordinclass(cte, 'e')))
  204. flags |= M87F_NO8BIT;
  205. # ifdef USE_B_CLASS
  206. if (wordinclass(buf, 'b') || wordinclass(type, 'b'))
  207. MapNLtoCRLF = FALSE;
  208. # endif /* USE_B_CLASS */
  209. if (wordinclass(buf, 'q') || wordinclass(type, 'q'))
  210. use_qp = TRUE;
  211. /*
  212. **  Multipart requires special processing.
  213. **
  214. ** Do a recursive descent into the message.
  215. */
  216. if (strcasecmp(type, "multipart") == 0 &&
  217.     (!bitset(M87F_NO8BIT, flags) || bitset(M87F_NO8TO7, flags)))
  218. {
  219. if (strcasecmp(subtype, "digest") == 0)
  220. flags |= M87F_DIGEST;
  221. for (i = 0; i < argc; i++)
  222. {
  223. if (strcasecmp(argv[i].a_field, "boundary") == 0)
  224. break;
  225. }
  226. if (i >= argc || argv[i].a_value == NULL)
  227. {
  228. usrerr("mime8to7: Content-Type: "%s": %s boundary",
  229. i >= argc ? "missing" : "bogus", p);
  230. p = "---";
  231. /* avoid bounce loops */
  232. e->e_flags |= EF_DONT_MIME;
  233. }
  234. else
  235. {
  236. p = argv[i].a_value;
  237. stripquotes(p);
  238. }
  239. if (strlcpy(bbuf, p, sizeof bbuf) >= sizeof bbuf)
  240. {
  241. usrerr("mime8to7: multipart boundary "%s" too long",
  242. p);
  243. /* avoid bounce loops */
  244. e->e_flags |= EF_DONT_MIME;
  245. }
  246. if (tTd(43, 1))
  247. dprintf("mime8to7: multipart boundary "%s"n", bbuf);
  248. for (i = 0; i < MAXMIMENESTING; i++)
  249. if (boundaries[i] == NULL)
  250. break;
  251. if (i >= MAXMIMENESTING)
  252. {
  253. usrerr("mime8to7: multipart nesting boundary too deep");
  254. /* avoid bounce loops */
  255. e->e_flags |= EF_DONT_MIME;
  256. }
  257. else
  258. {
  259. boundaries[i] = bbuf;
  260. boundaries[i + 1] = NULL;
  261. }
  262. mci->mci_flags |= MCIF_INMIME;
  263. /* skip the early "comment" prologue */
  264. putline("", mci);
  265. mci->mci_flags &= ~MCIF_INHEADER;
  266. bt = MBT_FINAL;
  267. while (fgets(buf, sizeof buf, e->e_dfp) != NULL)
  268. {
  269. bt = mimeboundary(buf, boundaries);
  270. if (bt != MBT_NOTSEP)
  271. break;
  272. putxline(buf, strlen(buf), mci, PXLF_MAPFROM|PXLF_STRIP8BIT);
  273. if (tTd(43, 99))
  274. dprintf("  ...%s", buf);
  275. }
  276. if (feof(e->e_dfp))
  277. bt = MBT_FINAL;
  278. while (bt != MBT_FINAL)
  279. {
  280. auto HDR *hdr = NULL;
  281. snprintf(buf, sizeof buf, "--%s", bbuf);
  282. putline(buf, mci);
  283. if (tTd(43, 35))
  284. dprintf("  ...%sn", buf);
  285. collect(e->e_dfp, FALSE, &hdr, e);
  286. if (tTd(43, 101))
  287. putline("+++after collect", mci);
  288. putheader(mci, hdr, e, flags);
  289. if (tTd(43, 101))
  290. putline("+++after putheader", mci);
  291. bt = mime8to7(mci, hdr, e, boundaries, flags);
  292. }
  293. snprintf(buf, sizeof buf, "--%s--", bbuf);
  294. putline(buf, mci);
  295. if (tTd(43, 35))
  296. dprintf("  ...%sn", buf);
  297. boundaries[i] = NULL;
  298. mci->mci_flags &= ~MCIF_INMIME;
  299. /* skip the late "comment" epilogue */
  300. while (fgets(buf, sizeof buf, e->e_dfp) != NULL)
  301. {
  302. bt = mimeboundary(buf, boundaries);
  303. if (bt != MBT_NOTSEP)
  304. break;
  305. putxline(buf, strlen(buf), mci, PXLF_MAPFROM|PXLF_STRIP8BIT);
  306. if (tTd(43, 99))
  307. dprintf("  ...%s", buf);
  308. }
  309. if (feof(e->e_dfp))
  310. bt = MBT_FINAL;
  311. if (tTd(43, 3))
  312. dprintf("tttmime8to7=>%s (multipart)n",
  313. MimeBoundaryNames[bt]);
  314. return bt;
  315. }
  316. /*
  317. **  Message/xxx types -- recurse exactly once.
  318. **
  319. ** Class 's' is predefined to have "rfc822" only.
  320. */
  321. if (strcasecmp(type, "message") == 0)
  322. {
  323. if (!wordinclass(subtype, 's'))
  324. {
  325. flags |= M87F_NO8BIT;
  326. }
  327. else
  328. {
  329. auto HDR *hdr = NULL;
  330. putline("", mci);
  331. mci->mci_flags |= MCIF_INMIME;
  332. collect(e->e_dfp, FALSE, &hdr, e);
  333. if (tTd(43, 101))
  334. putline("+++after collect", mci);
  335. putheader(mci, hdr, e, flags);
  336. if (tTd(43, 101))
  337. putline("+++after putheader", mci);
  338. if (hvalue("MIME-Version", hdr) == NULL)
  339. putline("MIME-Version: 1.0", mci);
  340. bt = mime8to7(mci, hdr, e, boundaries, flags);
  341. mci->mci_flags &= ~MCIF_INMIME;
  342. return bt;
  343. }
  344. }
  345. /*
  346. **  Non-compound body type
  347. **
  348. ** Compute the ratio of seven to eight bit characters;
  349. ** use that as a heuristic to decide how to do the
  350. ** encoding.
  351. */
  352. sectionsize = sectionhighbits = 0;
  353. if (!bitset(M87F_NO8BIT|M87F_NO8TO7, flags))
  354. {
  355. /* remember where we were */
  356. offset = ftell(e->e_dfp);
  357. if (offset == -1)
  358. syserr("mime8to7: cannot ftell on df%s", e->e_id);
  359. /* do a scan of this body type to count character types */
  360. while (fgets(buf, sizeof buf, e->e_dfp) != NULL)
  361. {
  362. if (mimeboundary(buf, boundaries) != MBT_NOTSEP)
  363. break;
  364. for (p = buf; *p != ''; p++)
  365. {
  366. /* count bytes with the high bit set */
  367. sectionsize++;
  368. if (bitset(0200, *p))
  369. sectionhighbits++;
  370. }
  371. /*
  372. **  Heuristic: if 1/4 of the first 4K bytes are 8-bit,
  373. **  assume base64.  This heuristic avoids double-reading
  374. **  large graphics or video files.
  375. */
  376. if (sectionsize >= 4096 &&
  377.     sectionhighbits > sectionsize / 4)
  378. break;
  379. }
  380. /* return to the original offset for processing */
  381. /* XXX use relative seeks to handle >31 bit file sizes? */
  382. if (fseek(e->e_dfp, offset, SEEK_SET) < 0)
  383. syserr("mime8to7: cannot fseek on df%s", e->e_id);
  384. else
  385. clearerr(e->e_dfp);
  386. }
  387. /*
  388. **  Heuristically determine encoding method.
  389. ** If more than 1/8 of the total characters have the
  390. ** eighth bit set, use base64; else use quoted-printable.
  391. ** However, only encode binary encoded data as base64,
  392. ** since otherwise the NL=>CRLF mapping will be a problem.
  393. */
  394. if (tTd(43, 8))
  395. {
  396. dprintf("mime8to7: %ld high bit(s) in %ld byte(s), cte=%s, type=%s/%sn",
  397. (long) sectionhighbits, (long) sectionsize,
  398. cte == NULL ? "[none]" : cte,
  399. type == NULL ? "[none]" : type,
  400. subtype == NULL ? "[none]" : subtype);
  401. }
  402. if (cte != NULL && strcasecmp(cte, "binary") == 0)
  403. sectionsize = sectionhighbits;
  404. linelen = 0;
  405. bp = buf;
  406. if (sectionhighbits == 0)
  407. {
  408. /* no encoding necessary */
  409. if (cte != NULL &&
  410.     bitset(MCIF_CVT8TO7|MCIF_CVT7TO8|MCIF_INMIME,
  411.    mci->mci_flags) &&
  412.     !bitset(M87F_NO8TO7, flags))
  413. {
  414. /*
  415. **  Skip _unless_ in MIME mode and potentially
  416. **  converting from 8 bit to 7 bit MIME.  See
  417. **  putheader() for the counterpart where the
  418. **  CTE header is skipped in the opposite
  419. **  situation.
  420. */
  421. snprintf(buf, sizeof buf,
  422. "Content-Transfer-Encoding: %.200s", cte);
  423. putline(buf, mci);
  424. if (tTd(43, 36))
  425. dprintf("  ...%sn", buf);
  426. }
  427. putline("", mci);
  428. mci->mci_flags &= ~MCIF_INHEADER;
  429. while (fgets(buf, sizeof buf, e->e_dfp) != NULL)
  430. {
  431. bt = mimeboundary(buf, boundaries);
  432. if (bt != MBT_NOTSEP)
  433. break;
  434. putline(buf, mci);
  435. }
  436. if (feof(e->e_dfp))
  437. bt = MBT_FINAL;
  438. }
  439. else if (!MapNLtoCRLF ||
  440.  (sectionsize / 8 < sectionhighbits && !use_qp))
  441. {
  442. /* use base64 encoding */
  443. int c1, c2;
  444. if (tTd(43, 36))
  445. dprintf("  ...Content-Transfer-Encoding: base64n");
  446. putline("Content-Transfer-Encoding: base64", mci);
  447. snprintf(buf, sizeof buf,
  448. "X-MIME-Autoconverted: from 8bit to base64 by %s id %s",
  449. MyHostName, e->e_id);
  450. putline(buf, mci);
  451. putline("", mci);
  452. mci->mci_flags &= ~MCIF_INHEADER;
  453. while ((c1 = mime_getchar_crlf(e->e_dfp, boundaries, &bt)) != EOF)
  454. {
  455. if (linelen > 71)
  456. {
  457. *bp = '';
  458. putline(buf, mci);
  459. linelen = 0;
  460. bp = buf;
  461. }
  462. linelen += 4;
  463. *bp++ = Base64Code[(c1 >> 2)];
  464. c1 = (c1 & 0x03) << 4;
  465. c2 = mime_getchar_crlf(e->e_dfp, boundaries, &bt);
  466. if (c2 == EOF)
  467. {
  468. *bp++ = Base64Code[c1];
  469. *bp++ = '=';
  470. *bp++ = '=';
  471. break;
  472. }
  473. c1 |= (c2 >> 4) & 0x0f;
  474. *bp++ = Base64Code[c1];
  475. c1 = (c2 & 0x0f) << 2;
  476. c2 = mime_getchar_crlf(e->e_dfp, boundaries, &bt);
  477. if (c2 == EOF)
  478. {
  479. *bp++ = Base64Code[c1];
  480. *bp++ = '=';
  481. break;
  482. }
  483. c1 |= (c2 >> 6) & 0x03;
  484. *bp++ = Base64Code[c1];
  485. *bp++ = Base64Code[c2 & 0x3f];
  486. }
  487. *bp = '';
  488. putline(buf, mci);
  489. }
  490. else
  491. {
  492. /* use quoted-printable encoding */
  493. int c1, c2;
  494. int fromstate;
  495. BITMAP256 badchars;
  496. /* set up map of characters that must be mapped */
  497. clrbitmap(badchars);
  498. for (c1 = 0x00; c1 < 0x20; c1++)
  499. setbitn(c1, badchars);
  500. clrbitn('t', badchars);
  501. for (c1 = 0x7f; c1 < 0x100; c1++)
  502. setbitn(c1, badchars);
  503. setbitn('=', badchars);
  504. if (bitnset(M_EBCDIC, mci->mci_mailer->m_flags))
  505. for (p = "!"#$@[\]^`{|}~"; *p != ''; p++)
  506. setbitn(*p, badchars);
  507. if (tTd(43, 36))
  508. dprintf("  ...Content-Transfer-Encoding: quoted-printablen");
  509. putline("Content-Transfer-Encoding: quoted-printable", mci);
  510. snprintf(buf, sizeof buf,
  511. "X-MIME-Autoconverted: from 8bit to quoted-printable by %s id %s",
  512. MyHostName, e->e_id);
  513. putline(buf, mci);
  514. putline("", mci);
  515. mci->mci_flags &= ~MCIF_INHEADER;
  516. fromstate = 0;
  517. c2 = 'n';
  518. while ((c1 = mime_getchar(e->e_dfp, boundaries, &bt)) != EOF)
  519. {
  520. if (c1 == 'n')
  521. {
  522. if (c2 == ' ' || c2 == 't')
  523. {
  524. *bp++ = '=';
  525. *bp++ = Base16Code[(c2 >> 4) & 0x0f];
  526. *bp++ = Base16Code[c2 & 0x0f];
  527. }
  528. if (buf[0] == '.' && bp == &buf[1])
  529. {
  530. buf[0] = '=';
  531. *bp++ = Base16Code[('.' >> 4) & 0x0f];
  532. *bp++ = Base16Code['.' & 0x0f];
  533. }
  534. *bp = '';
  535. putline(buf, mci);
  536. linelen = fromstate = 0;
  537. bp = buf;
  538. c2 = c1;
  539. continue;
  540. }
  541. if (c2 == ' ' && linelen == 4 && fromstate == 4 &&
  542.     bitnset(M_ESCFROM, mci->mci_mailer->m_flags))
  543. {
  544. *bp++ = '=';
  545. *bp++ = '2';
  546. *bp++ = '0';
  547. linelen += 3;
  548. }
  549. else if (c2 == ' ' || c2 == 't')
  550. {
  551. *bp++ = c2;
  552. linelen++;
  553. }
  554. if (linelen > 72 &&
  555.     (linelen > 75 || c1 != '.' ||
  556.      (linelen > 73 && c2 == '.')))
  557. {
  558. if (linelen > 73 && c2 == '.')
  559. bp--;
  560. else
  561. c2 = 'n';
  562. *bp++ = '=';
  563. *bp = '';
  564. putline(buf, mci);
  565. linelen = fromstate = 0;
  566. bp = buf;
  567. if (c2 == '.')
  568. {
  569. *bp++ = '.';
  570. linelen++;
  571. }
  572. }
  573. if (bitnset(c1 & 0xff, badchars))
  574. {
  575. *bp++ = '=';
  576. *bp++ = Base16Code[(c1 >> 4) & 0x0f];
  577. *bp++ = Base16Code[c1 & 0x0f];
  578. linelen += 3;
  579. }
  580. else if (c1 != ' ' && c1 != 't')
  581. {
  582. if (linelen < 4 && c1 == "From"[linelen])
  583. fromstate++;
  584. *bp++ = c1;
  585. linelen++;
  586. }
  587. c2 = c1;
  588. }
  589. /* output any saved character */
  590. if (c2 == ' ' || c2 == 't')
  591. {
  592. *bp++ = '=';
  593. *bp++ = Base16Code[(c2 >> 4) & 0x0f];
  594. *bp++ = Base16Code[c2 & 0x0f];
  595. linelen += 3;
  596. }
  597. if (linelen > 0 || boundaries[0] != NULL)
  598. {
  599. *bp = '';
  600. putline(buf, mci);
  601. }
  602. }
  603. if (tTd(43, 3))
  604. dprintf("tttmime8to7=>%s (basic)n", MimeBoundaryNames[bt]);
  605. return bt;
  606. }
  607. /*
  608. **  MIME_GETCHAR -- get a character for MIME processing
  609. **
  610. ** Treats boundaries as EOF.
  611. **
  612. ** Parameters:
  613. ** fp -- the input file.
  614. ** boundaries -- the current MIME boundaries.
  615. ** btp -- if the return value is EOF, *btp is set to
  616. ** the type of the boundary.
  617. **
  618. ** Returns:
  619. ** The next character in the input stream.
  620. */
  621. static int
  622. mime_getchar(fp, boundaries, btp)
  623. register FILE *fp;
  624. char **boundaries;
  625. int *btp;
  626. {
  627. int c;
  628. static u_char *bp = NULL;
  629. static int buflen = 0;
  630. static bool atbol = TRUE; /* at beginning of line */
  631. static int bt = MBT_SYNTAX; /* boundary type of next EOF */
  632. static u_char buf[128]; /* need not be a full line */
  633. int start = 0; /* indicates position of - in buffer */
  634. if (buflen == 1 && *bp == 'n')
  635. {
  636. /* last n in buffer may be part of next MIME boundary */
  637. c = *bp;
  638. }
  639. else if (buflen > 0)
  640. {
  641. buflen--;
  642. return *bp++;
  643. }
  644. else
  645. c = getc(fp);
  646. bp = buf;
  647. buflen = 0;
  648. if (c == 'n')
  649. {
  650. /* might be part of a MIME boundary */
  651. *bp++ = c;
  652. atbol = TRUE;
  653. c = getc(fp);
  654. if (c == 'n')
  655. {
  656. (void) ungetc(c, fp);
  657. return c;
  658. }
  659. start = 1;
  660. }
  661. if (c != EOF)
  662. *bp++ = c;
  663. else
  664. bt = MBT_FINAL;
  665. if (atbol && c == '-')
  666. {
  667. /* check for a message boundary */
  668. c = getc(fp);
  669. if (c != '-')
  670. {
  671. if (c != EOF)
  672. *bp++ = c;
  673. else
  674. bt = MBT_FINAL;
  675. buflen = bp - buf - 1;
  676. bp = buf;
  677. return *bp++;
  678. }
  679. /* got "--", now check for rest of separator */
  680. *bp++ = '-';
  681. while (bp < &buf[sizeof buf - 2] &&
  682.        (c = getc(fp)) != EOF && c != 'n')
  683. {
  684. *bp++ = c;
  685. }
  686. *bp = '';
  687. bt = mimeboundary((char *) &buf[start], boundaries);
  688. switch (bt)
  689. {
  690.   case MBT_FINAL:
  691.   case MBT_INTERMED:
  692. /* we have a message boundary */
  693. buflen = 0;
  694. *btp = bt;
  695. return EOF;
  696. }
  697. atbol = c == 'n';
  698. if (c != EOF)
  699. *bp++ = c;
  700. }
  701. buflen = bp - buf - 1;
  702. if (buflen < 0)
  703. {
  704. *btp = bt;
  705. return EOF;
  706. }
  707. bp = buf;
  708. return *bp++;
  709. }
  710. /*
  711. **  MIME_GETCHAR_CRLF -- do mime_getchar, but translate NL => CRLF
  712. **
  713. ** Parameters:
  714. ** fp -- the input file.
  715. ** boundaries -- the current MIME boundaries.
  716. ** btp -- if the return value is EOF, *btp is set to
  717. ** the type of the boundary.
  718. **
  719. ** Returns:
  720. ** The next character in the input stream.
  721. */
  722. static int
  723. mime_getchar_crlf(fp, boundaries, btp)
  724. register FILE *fp;
  725. char **boundaries;
  726. int *btp;
  727. {
  728. static bool sendlf = FALSE;
  729. int c;
  730. if (sendlf)
  731. {
  732. sendlf = FALSE;
  733. return 'n';
  734. }
  735. c = mime_getchar(fp, boundaries, btp);
  736. if (c == 'n' && MapNLtoCRLF)
  737. {
  738. sendlf = TRUE;
  739. return 'r';
  740. }
  741. return c;
  742. }
  743. /*
  744. **  MIMEBOUNDARY -- determine if this line is a MIME boundary & its type
  745. **
  746. ** Parameters:
  747. ** line -- the input line.
  748. ** boundaries -- the set of currently pending boundaries.
  749. **
  750. ** Returns:
  751. ** MBT_NOTSEP -- if this is not a separator line
  752. ** MBT_INTERMED -- if this is an intermediate separator
  753. ** MBT_FINAL -- if this is a final boundary
  754. ** MBT_SYNTAX -- if this is a boundary for the wrong
  755. ** enclosure -- i.e., a syntax error.
  756. */
  757. static int
  758. mimeboundary(line, boundaries)
  759. register char *line;
  760. char **boundaries;
  761. {
  762. int type = MBT_NOTSEP;
  763. int i;
  764. int savec;
  765. if (line[0] != '-' || line[1] != '-' || boundaries == NULL)
  766. return MBT_NOTSEP;
  767. i = strlen(line);
  768. if (line[i - 1] == 'n')
  769. i--;
  770. /* strip off trailing whitespace */
  771. while (line[i - 1] == ' ' || line[i - 1] == 't')
  772. i--;
  773. savec = line[i];
  774. line[i] = '';
  775. if (tTd(43, 5))
  776. dprintf("mimeboundary: line="%s"... ", line);
  777. /* check for this as an intermediate boundary */
  778. if (isboundary(&line[2], boundaries) >= 0)
  779. type = MBT_INTERMED;
  780. else if (i > 2 && strncmp(&line[i - 2], "--", 2) == 0)
  781. {
  782. /* check for a final boundary */
  783. line[i - 2] = '';
  784. if (isboundary(&line[2], boundaries) >= 0)
  785. type = MBT_FINAL;
  786. line[i - 2] = '-';
  787. }
  788. line[i] = savec;
  789. if (tTd(43, 5))
  790. dprintf("%sn", MimeBoundaryNames[type]);
  791. return type;
  792. }
  793. /*
  794. **  DEFCHARSET -- return default character set for message
  795. **
  796. ** The first choice for character set is for the mailer
  797. ** corresponding to the envelope sender.  If neither that
  798. ** nor the global configuration file has a default character
  799. ** set defined, return "unknown-8bit" as recommended by
  800. ** RFC 1428 section 3.
  801. **
  802. ** Parameters:
  803. ** e -- the envelope for this message.
  804. **
  805. ** Returns:
  806. ** The default character set for that mailer.
  807. */
  808. char *
  809. defcharset(e)
  810. register ENVELOPE *e;
  811. {
  812. if (e != NULL && e->e_from.q_mailer != NULL &&
  813.     e->e_from.q_mailer->m_defcharset != NULL)
  814. return e->e_from.q_mailer->m_defcharset;
  815. if (DefaultCharSet != NULL)
  816. return DefaultCharSet;
  817. return "unknown-8bit";
  818. }
  819. /*
  820. **  ISBOUNDARY -- is a given string a currently valid boundary?
  821. **
  822. ** Parameters:
  823. ** line -- the current input line.
  824. ** boundaries -- the list of valid boundaries.
  825. **
  826. ** Returns:
  827. ** The index number in boundaries if the line is found.
  828. ** -1 -- otherwise.
  829. **
  830. */
  831. static int
  832. isboundary(line, boundaries)
  833. char *line;
  834. char **boundaries;
  835. {
  836. register int i;
  837. for (i = 0; boundaries[i] != NULL; i++)
  838. {
  839. if (strcmp(line, boundaries[i]) == 0)
  840. return i;
  841. }
  842. return -1;
  843. }
  844. #endif /* MIME8TO7 */
  845. #if MIME7TO8
  846. /*
  847. **  MIME7TO8 -- output 7 bit encoded MIME body in 8 bit format
  848. **
  849. **  This is a hack. Supports translating the two 7-bit body-encodings
  850. **  (quoted-printable and base64) to 8-bit coded bodies.
  851. **
  852. **  There is not much point in supporting multipart here, as the UA
  853. **  will be able to deal with encoded MIME bodies if it can parse MIME
  854. **  multipart messages.
  855. **
  856. **  Note also that we wont be called unless it is a text/plain MIME
  857. **  message, encoded base64 or QP and mailer flag '9' has been defined
  858. **  on mailer.
  859. **
  860. **  Contributed by Marius Olaffson <marius@rhi.hi.is>.
  861. **
  862. ** Parameters:
  863. ** mci -- mailer connection information.
  864. ** header -- the header for this body part.
  865. ** e -- envelope.
  866. **
  867. ** Returns:
  868. ** none.
  869. */
  870. static char index_64[128] =
  871. {
  872. -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1,
  873. -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1,
  874. -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,62, -1,-1,-1,63,
  875. 52,53,54,55, 56,57,58,59, 60,61,-1,-1, -1,-1,-1,-1,
  876. -1, 0, 1, 2,  3, 4, 5, 6,  7, 8, 9,10, 11,12,13,14,
  877. 15,16,17,18, 19,20,21,22, 23,24,25,-1, -1,-1,-1,-1,
  878. -1,26,27,28, 29,30,31,32, 33,34,35,36, 37,38,39,40,
  879. 41,42,43,44, 45,46,47,48, 49,50,51,-1, -1,-1,-1,-1
  880. };
  881. # define CHAR64(c)  (((c) < 0 || (c) > 127) ? -1 : index_64[(c)])
  882. void
  883. mime7to8(mci, header, e)
  884. register MCI *mci;
  885. HDR *header;
  886. register ENVELOPE *e;
  887. {
  888. register char *p;
  889. char *cte;
  890. char **pvp;
  891. u_char *fbufp;
  892. char buf[MAXLINE];
  893. u_char fbuf[MAXLINE + 1];
  894. char pvpbuf[MAXLINE];
  895. extern u_char MimeTokenTab[256];
  896. p = hvalue("Content-Transfer-Encoding", header);
  897. if (p == NULL ||
  898.     (pvp = prescan(p, '', pvpbuf, sizeof pvpbuf, NULL,
  899.    MimeTokenTab)) == NULL ||
  900.     pvp[0] == NULL)
  901. {
  902. /* "can't happen" -- upper level should have caught this */
  903. syserr("mime7to8: unparsable CTE %s", p == NULL ? "<NULL>" : p);
  904. /* avoid bounce loops */
  905. e->e_flags |= EF_DONT_MIME;
  906. /* cheap failsafe algorithm -- should work on text/plain */
  907. if (p != NULL)
  908. {
  909. snprintf(buf, sizeof buf,
  910. "Content-Transfer-Encoding: %s", p);
  911. putline(buf, mci);
  912. }
  913. putline("", mci);
  914. mci->mci_flags &= ~MCIF_INHEADER;
  915. while (fgets(buf, sizeof buf, e->e_dfp) != NULL)
  916. putline(buf, mci);
  917. return;
  918. }
  919. cataddr(pvp, NULL, buf, sizeof buf, '');
  920. cte = newstr(buf);
  921. mci->mci_flags |= MCIF_INHEADER;
  922. putline("Content-Transfer-Encoding: 8bit", mci);
  923. snprintf(buf, sizeof buf,
  924. "X-MIME-Autoconverted: from %.200s to 8bit by %s id %s",
  925. cte, MyHostName, e->e_id);
  926. putline(buf, mci);
  927. putline("", mci);
  928. mci->mci_flags &= ~MCIF_INHEADER;
  929. /*
  930. **  Translate body encoding to 8-bit.  Supports two types of
  931. **  encodings; "base64" and "quoted-printable". Assume qp if
  932. **  it is not base64.
  933. */
  934. if (strcasecmp(cte, "base64") == 0)
  935. {
  936. int c1, c2, c3, c4;
  937. fbufp = fbuf;
  938. while ((c1 = fgetc(e->e_dfp)) != EOF)
  939. {
  940. if (isascii(c1) && isspace(c1))
  941. continue;
  942. do
  943. {
  944. c2 = fgetc(e->e_dfp);
  945. } while (isascii(c2) && isspace(c2));
  946. if (c2 == EOF)
  947. break;
  948. do
  949. {
  950. c3 = fgetc(e->e_dfp);
  951. } while (isascii(c3) && isspace(c3));
  952. if (c3 == EOF)
  953. break;
  954. do
  955. {
  956. c4 = fgetc(e->e_dfp);
  957. } while (isascii(c4) && isspace(c4));
  958. if (c4 == EOF)
  959. break;
  960. if (c1 == '=' || c2 == '=')
  961. continue;
  962. c1 = CHAR64(c1);
  963. c2 = CHAR64(c2);
  964. *fbufp = (c1 << 2) | ((c2 & 0x30) >> 4);
  965. if (*fbufp++ == 'n' || fbufp >= &fbuf[MAXLINE])
  966. {
  967. if (*--fbufp != 'n' ||
  968.     (fbufp > fbuf && *--fbufp != 'r'))
  969. fbufp++;
  970. putxline((char *) fbuf, fbufp - fbuf,
  971.  mci, PXLF_MAPFROM);
  972. fbufp = fbuf;
  973. }
  974. if (c3 == '=')
  975. continue;
  976. c3 = CHAR64(c3);
  977. *fbufp = ((c2 & 0x0f) << 4) | ((c3 & 0x3c) >> 2);
  978. if (*fbufp++ == 'n' || fbufp >= &fbuf[MAXLINE])
  979. {
  980. if (*--fbufp != 'n' ||
  981.     (fbufp > fbuf && *--fbufp != 'r'))
  982. fbufp++;
  983. putxline((char *) fbuf, fbufp - fbuf,
  984.  mci, PXLF_MAPFROM);
  985. fbufp = fbuf;
  986. }
  987. if (c4 == '=')
  988. continue;
  989. c4 = CHAR64(c4);
  990. *fbufp = ((c3 & 0x03) << 6) | c4;
  991. if (*fbufp++ == 'n' || fbufp >= &fbuf[MAXLINE])
  992. {
  993. if (*--fbufp != 'n' ||
  994.     (fbufp > fbuf && *--fbufp != 'r'))
  995. fbufp++;
  996. putxline((char *) fbuf, fbufp - fbuf,
  997.  mci, PXLF_MAPFROM);
  998. fbufp = fbuf;
  999. }
  1000. }
  1001. }
  1002. else
  1003. {
  1004. /* quoted-printable */
  1005. fbufp = fbuf;
  1006. while (fgets(buf, sizeof buf, e->e_dfp) != NULL)
  1007. {
  1008. if (mime_fromqp((u_char *) buf, &fbufp, 0,
  1009. &fbuf[MAXLINE] - fbufp) == 0)
  1010. continue;
  1011. if (fbufp - fbuf > 0)
  1012. putxline((char *) fbuf, fbufp - fbuf - 1, mci,
  1013.  PXLF_MAPFROM);
  1014. fbufp = fbuf;
  1015. }
  1016. }
  1017. /* force out partial last line */
  1018. if (fbufp > fbuf)
  1019. {
  1020. *fbufp = '';
  1021. putxline((char *) fbuf, fbufp - fbuf, mci, PXLF_MAPFROM);
  1022. }
  1023. if (tTd(43, 3))
  1024. dprintf("tttmime7to8 => %s to 8bit donen", cte);
  1025. }
  1026. /*
  1027. **  The following is based on Borenstein's "codes.c" module, with simplifying
  1028. **  changes as we do not deal with multipart, and to do the translation in-core,
  1029. **  with an attempt to prevent overrun of output buffers.
  1030. **
  1031. **  What is needed here are changes to defned this code better against
  1032. **  bad encodings. Questionable to always return 0xFF for bad mappings.
  1033. */
  1034. static char index_hex[128] =
  1035. {
  1036. -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1,
  1037. -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1,
  1038. -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1,
  1039. 0, 1, 2, 3,  4, 5, 6, 7,  8, 9,-1,-1, -1,-1,-1,-1,
  1040. -1,10,11,12, 13,14,15,-1, -1,-1,-1,-1, -1,-1,-1,-1,
  1041. -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1,
  1042. -1,10,11,12, 13,14,15,-1, -1,-1,-1,-1, -1,-1,-1,-1,
  1043. -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1
  1044. };
  1045. # define HEXCHAR(c)  (((c) < 0 || (c) > 127) ? -1 : index_hex[(c)])
  1046. static int
  1047. mime_fromqp(infile, outfile, state, maxlen)
  1048. u_char *infile;
  1049. u_char **outfile;
  1050. int state; /* Decoding body (0) or header (1) */
  1051. int maxlen; /* Max # of chars allowed in outfile */
  1052. {
  1053. int c1, c2;
  1054. int nchar = 0;
  1055. while ((c1 = *infile++) != '')
  1056. {
  1057. if (c1 == '=')
  1058. {
  1059. if ((c1 = *infile++) == 0)
  1060. break;
  1061. if (c1 == 'n' || (c1 = HEXCHAR(c1)) == -1)
  1062. {
  1063. /* ignore it */
  1064. if (state == 0)
  1065. return 0;
  1066. }
  1067. else
  1068. {
  1069. do
  1070. {
  1071. if ((c2 = *infile++) == '')
  1072. {
  1073. c2 = -1;
  1074. break;
  1075. }
  1076. } while ((c2 = HEXCHAR(c2)) == -1);
  1077. if (c2 == -1 || ++nchar > maxlen)
  1078. break;
  1079. *(*outfile)++ = c1 << 4 | c2;
  1080. }
  1081. }
  1082. else
  1083. {
  1084. if (state == 1 && c1 == '_')
  1085. c1 = ' ';
  1086. if (++nchar > maxlen)
  1087. break;
  1088. *(*outfile)++ = c1;
  1089. if (c1 == 'n')
  1090. break;
  1091. }
  1092. }
  1093. *(*outfile)++ = '';
  1094. return 1;
  1095. }
  1096. #endif /* MIME7TO8 */