NOTES
上传用户:xxcykj
上传日期:2007-01-04
资源大小:727k
文件大小:24k
源码类别:

Email客户端

开发平台:

Unix_Linux

  1.      _________________________________________________________________
  2.    
  3.                          Design Notes On Fetchmail
  4.                                       
  5.    These notes are for the benefit of future hackers and maintainers. The
  6.    following sections are both functional and narrative, read from
  7.    beginning to end.
  8.    
  9.                                     History
  10.                                        
  11.    A direct ancestor of the fetchmail program was originally authored
  12.    (under the name popclient) by Carl Harris <ceharris@mal.com>. I took
  13.    over development in June 1996 and subsequently renamed the program
  14.    `fetchmail' to reflect the addition of IMAP support. In early November
  15.    1996 Carl officially ended support for the last popclient versions.
  16.    
  17.    Before accepting responsibility for the popclient sources from Carl, I
  18.    had investigated and used and tinkered with every other UNIX
  19.    remote-mail forwarder I could find, including fetchpop1.9,
  20.    PopTart-0.9.3, get-mail, gwpop, pimp-1.0, pop-perl5-1.2, popc,
  21.    popmail-1.6 and upop. My major goal was to get a header-rewrite
  22.    feature like fetchmail's working so I wouldn't have reply problems
  23.    anymore.
  24.    
  25.    Despite having done a good bit of work on fetchpop1.9, when I found
  26.    popclient I quickly concluded that it offered the solidest base for
  27.    future development. I was convinced of this primarily by the presence
  28.    of multiple-protocol support. The competition didn't do
  29.    POP2/RPOP/APOP, and I was already having vague thoughts of maybe
  30.    adding IMAP. (This would advance two other goals: learn IMAP and get
  31.    comfortable writing TCP/IP client software.)
  32.    
  33.    Until popclient 3.05 I was simply following out the implications of
  34.    Carl's basic design. He already had daemon.c in the distribution, and
  35.    I wanted daemon mode almost as badly as I wanted the header rewrite
  36.    feature. The other things I added were bug fixes or minor extensions.
  37.    
  38.    After 3.1, when I put in SMTP-forwarding support (more about this
  39.    below) the nature of the project changed -- it became a
  40.    carefully-thought-out attempt to render obsolete every other program
  41.    in its class. The name change quickly followed.
  42.    
  43.                               The rewrite option
  44.                                        
  45.    RFC 1123 stipulates that MTAs ought to canonicalize the addresses of
  46.    outgoing mail so that From:, To:, Cc:, Bcc: and other address headers
  47.    contain only fully qualified domain names. Failure to do so can break
  48.    the reply function on many mailers.
  49.    
  50.    This problem only becomes obvious when a reply is generated on a
  51.    machine different from where the message was delivered. The two
  52.    machines will have different local username spaces, potentially
  53.    leading to misrouted mail.
  54.    
  55.    Most MTAs (and sendmail in particular) do not canonicalize address
  56.    headers in this way (violating RFC 1123). Fetchmail therefore has to
  57.    do it. This is the first feature I added to the ancestral popclient.
  58.    
  59.                                 Reorganization
  60.                                        
  61.    The second thing I did reorganize and simplify popclient a lot. Carl
  62.    Harris's implementation was very sound, but exhibited a kind of
  63.    unnecessary complexity common to many C programmers. He treated the
  64.    code as central and the data structures as support for the code. As a
  65.    result, the code was beautiful but the data structure design ad-hoc
  66.    and rather ugly (at least to this old LISP hacker).
  67.    
  68.    I was able to improve matters significantly by reorganizing most of
  69.    the program around the `query' data structure and eliminating a bunch
  70.    of global context. This especially simplified the main sequence in
  71.    fetchmail.c and was critical in enabling the daemon mode changes.
  72.    
  73.                        IMAP support and the method table
  74.                                        
  75.    The next step was IMAP support. I initially wrote the IMAP code as a
  76.    generic query driver and a method table. The idea was to have all the
  77.    protocol-independent setup logic and flow of control in the driver,
  78.    and the protocol-specific stuff in the method table.
  79.    
  80.    Once this worked, I rewrote the POP3 code to use the same
  81.    organization. The POP2 code kept its own driver for a couple more
  82.    releases, until I found sources of a POP2 server to test against (the
  83.    breed seems to be nearly extinct).
  84.    
  85.    The purpose of this reorganization, of course, is to trivialize the
  86.    development of support for future protocols as much as possible. All
  87.    mail-retrieval protocols have to have pretty similar logical design by
  88.    the nature of the task. By abstracting out that common logic and its
  89.    interface to the rest of the program, both the common and
  90.    protocol-specific parts become easier to understand.
  91.    
  92.    Furthermore, many kinds of new features can instantly be supported
  93.    across all protocols by modifying the one driver module.
  94.    
  95.                         Implications of smtp forwarding
  96.                                        
  97.    The direction of the project changed radically when Harry Hochheiser
  98.    sent me his scratch code for forwarding fetched mail to the SMTP port.
  99.    I realized almost immediately that a reliable implementation of this
  100.    feature would make all the other delivery modes obsolete.
  101.    
  102.    Why mess with all the complexity of configuring an MDA or setting up
  103.    lock-and-append on a mailbox when port 25 is guaranteed to be there on
  104.    any platform with TCP/IP support in the first place? Especially when
  105.    this means retrieved mail is guaranteed to look like normal sender-
  106.    initiated SMTP mail, which is really what we want anyway.
  107.    
  108.    Clearly, the right thing to do was (1) hack SMTP forwarding support
  109.    into the generic driver, (2) make it the default mode, and (3)
  110.    eventually throw out all the other delivery modes.
  111.    
  112.    I hesitated over step 3 for some time, fearing to upset long-time
  113.    popclient users dependent on the alternate delivery mechanisms. In
  114.    theory, they could immediately switch to .forward files or their
  115.    non-sendmail equivalents to get the same effects. In practice the
  116.    transition might have been messy.
  117.    
  118.    But when I did it (see the NEWS note on the great options massacre)
  119.    the benefits proved huge. The cruftiest parts of the driver code
  120.    vanished. Configuration got radically simpler -- no more grovelling
  121.    around for the system MDA and user's mailbox, no more worries about
  122.    whether the underlying OS supports file locking.
  123.    
  124.    Also, the only way to lose mail vanished. If you specified localfolder
  125.    and the disk got full, your mail got lost. This can't happen with SMTP
  126.    forwarding because your SMTP listener won't return OK unless the
  127.    message can be spooled or processed.
  128.    
  129.    Also, performance improved (though not so you'd notice it in a single
  130.    run). Another not insignificant benefit of this change was that the
  131.    manual page got a lot simpler.
  132.    
  133.    Later, I had to bring --mda back in order to allow handling of some
  134.    obscure situations involving dynamic SLIP. But I found a much simpler
  135.    way to do it.
  136.    
  137.    The moral? Don't hesitate to throw away superannuated features when
  138.    you can do it without loss of effectiveness. I tanked a couple I'd
  139.    added myself and have no regrets at all. As Saint-Exupery said,
  140.    "Perfection [in design] is achieved not when there is nothing more to
  141.    add, but rather when there is nothing more to take away." This program
  142.    isn't perfect, but it's trying.
  143.    
  144.         The most-requested features that I will never add, and why not:
  145.                                        
  146. Password encryption in .fetchmailrc
  147.    The reason there's no facility to store passwords encrypted in the
  148.    .fetchmailrc file is because this doesn't actually add protection.
  149.    
  150.    Anyone who's acquired the 0600 permissions needed to read your
  151.    .fetchmailrc file will be able to run fetchmail as you anyway -- and
  152.    if it's your password they're after, they'd be able to rip the
  153.    necessary decoder out of the fetchmail code itself to get it.
  154.    
  155.    All .fetchmailrc encryption would do is give a false sense of security
  156.    to people who don't think very hard.
  157.    
  158. Truly concurrent queries to multiple hosts
  159.    Occasionally I get a request for this on "efficiency" grounds. These
  160.    people aren't thinking either. True concurrency would do nothing to
  161.    lessen fetchmail's total IP volume. The best it could possibly do is
  162.    change the usage profile to shorten the duration of the active part of
  163.    a poll cycle at the cost of increasing its demand on IP volume per
  164.    unit time.
  165.    
  166.    If one could thread the protocol code so that fetchmail didn't block
  167.    on waiting for a protocol response, but rather switched to trying to
  168.    process another host query, one might get an efficiency gain (close to
  169.    constant loading at the single-host level).
  170.    
  171.    Fortunately, I've only seldom seen a server that incurred significant
  172.    wait time on an individual response. I judge the gain from this not
  173.    worth the hideous complexity increase it would require in the code.
  174.    
  175. Multiple concurrent instances of fetchmail
  176.    Fetchmail locking is on a per-invoking-user because finer-grained
  177.    locks would be really hard to implement in a portable way. The problem
  178.    is that you don't want two fetchmails querying the same site for the
  179.    same remote user at the same time.
  180.    
  181.    To handle this optimally, multiple fetchmails would have to associate
  182.    a system-wide semaphore with each active pair of a remote user and
  183.    host canonical address. A fetchmail would have to block until getting
  184.    this semaphore at the start of a query, and release it at the end of a
  185.    query.
  186.    
  187.    This would be way too complicated to do just for an "it might be nice"
  188.    feature. Instead, you can run a single root fetchmail polling for
  189.    multiple users in either single-drop or multidrop mode.
  190.    
  191.    The fundamental problem here is how an instance of fetchmail polling
  192.    host foo can assert that it's doing so in a way visible to all other
  193.    fetchmails. System V semaphores would be ideal for this purpose, but
  194.    they're not portable.
  195.    
  196.    I've thought about this a lot and roughed up several designs. All are
  197.    complicated and fragile, with a bunch of the standard problems (what
  198.    happens if a fetchmail aborts before clearing its semaphore, and how
  199.    do we recover reliably?).
  200.    
  201.    I'm just not satisfied that there's enough functional gain here to pay
  202.    for the large increase in complexity that adding these semaphores
  203.    would entail.
  204.    
  205.                          Multidrop and alias handling
  206.                                        
  207.    I decided to add the multidrop support partly because some users were
  208.    clamoring for it, but mostly because I thought it would shake bugs out
  209.    of the single-drop code by forcing me to deal with addressing in full
  210.    generality. And so it proved.
  211.    
  212.    There are two important aspects of the features for handling
  213.    multiple-drop aliases and mailing lists which future hackers should be
  214.    careful to preserve.
  215.    
  216.     1. The logic path for single-recipient mailboxes doesn't involve
  217.        header parsing or DNS lookups at all. This is important -- it
  218.        means the code for the most common case can be much simpler and
  219.        more robust.
  220.     2. The multidrop handing does not rely on doing the equivalent of
  221.        passing the message to sendmail -oem -t. Instead, it explicitly
  222.        mines members of a specified set of local usernames out of the
  223.        header.
  224.     3. We do not attempt delivery to multidrop mailboxes in the presence
  225.        of DNS errors. Before each multidrop poll we probe DNS to see if
  226.        we have a nameserver handy. If not, the poll is skipped. If DNS
  227.        crashes during a poll, the error return from the next nameserver
  228.        lookup aborts message delivery and ends the poll. The daemon mode
  229.        will then quietly spin until DNS comes up again, at which point it
  230.        will resume delivering mail.
  231.        
  232.    When I designed this support, I was terrified of doing anything that
  233.    could conceivably cause a mail loop (you should be too). That's why
  234.    the code as written can only append local names (never @-addresses) to
  235.    the recipients list.
  236.    
  237.    The code in mxget.c is nasty, no two ways about it. But it's utterly
  238.    necessary, there are a lot of MX pointers out there. It really ought
  239.    to be a (documented!) entry point in the bind library.
  240.    
  241.                               DNS error handling
  242.                                        
  243.    Fetchmail's behavior on DNS errors is to suppress forwarding and
  244.    deletion of the individual message that each occurs in, leaving it
  245.    queued on the server for retrieval on a subsequent poll. The
  246.    assumption is that DNS errors are transient, due to temporary server
  247.    outages.
  248.    
  249.    Unfortunately this means that if a DNS error is permanent a message
  250.    can be perpetually stuck in the server mailbox. We've had a couple bug
  251.    reports of this kind due to subtle RFC822 parsing errors in the
  252.    fetchmail code that resulted in impossible things getting passed to
  253.    the DNS lookup routines.
  254.    
  255.    Alternative ways to handle the problem: ignore DNS errors (treating
  256.    them as a non-match on the mailserver domain), or forward messages
  257.    with errors to fetchmail's invoking user in addition to any other
  258.    recipients. These would fit an assumption that DNS lookup errors are
  259.    likely to be permanent problems associated with an address.
  260.    
  261.                                 IPv6 and IPSEC
  262.                                        
  263.    The IPv6 support patches are really more protocol-family independence
  264.    patches. Because of this, in most places, "ports" (numbers) have been
  265.    replaced with "services" (strings, that may be digits). This allows us
  266.    to run with certain protocols that use strings as "service names"
  267.    where we in the IP world think of port numbers. Someday we'll plumb
  268.    strings all over and then, if inet6 is not enabled, do a
  269.    getservbyname() down in SocketOpen. The IPv6 support patches use
  270.    getaddrinfo(), which is a POSIX p1003.1g mandated function. So, in the
  271.    not too distant future, we'll zap the ifdefs and just let autoconf
  272.    check for getaddrinfo. IPv6 support comes pretty much automatically
  273.    once you have protocol family independence.
  274.    
  275.                              Internationalization
  276.                                        
  277.    Internationalization is handled using GNU gettext (see the file
  278.    ABOUT_NLS in the source distribution). This places some minor
  279.    constraints on the code.
  280.    
  281.    Strings that must be subject to translation should be wrapped with _()
  282.    or N_() -- the former in functuib arguments, the latter in static
  283.    initializers and other non-function-argument contexts.
  284.    
  285.                          Checklist for Adding Options
  286.                                        
  287.    Adding a control option is not complicated in principle, but there are
  288.    a lot of fiddly details in the process. You'll need to do the
  289.    following minimum steps.
  290.      * Add a field to represent the control in struct run, struct query,
  291.        or struct hostdata.
  292.      * Go to rcfile_y.y. Add the token to the grammar. Don't forget the
  293.        %token declaration.
  294.      * Pick an actual string to declare the option in the .fetchmailrc
  295.        file. Add the token to rcfile_l.
  296.      * Pick a long-form option name, and a one-letter short option if any
  297.        are left. Go to options.c. Pick a new LA_ value. Hack the
  298.        longoptions table to set up the association. Hack the big switch
  299.        statement to set the option. Hack the `?' message to describe it.
  300.      * If the default is nonzero, set it in def_opts near the top of
  301.        load_params in fetchmail.c.
  302.      * Add code to dump the option value in fetchmail.c:dump_params.
  303.      * Add proper FLAG_MERGE actions in fetchmail.c's optmerge()
  304.        function. (If it's a global option, add an override at the end of
  305.        load_params.)
  306.      * Document the option in fetchmail.man. This will require at least
  307.        two changes; one to the collected table of options, and one full
  308.        text description of the option.
  309.      * Add the new token and a brief description to the header comment of
  310.        sample.rcfile.
  311.      * Hack fetchmailconf to configure it. Bump the fetchmailconf
  312.        version.
  313.      * Hack conf.c to dump the option so we won't have a version-skew
  314.        problem.
  315.      * Add an entry to NEWS.
  316.        
  317.    There may be other things you have to do in the way of logic, of
  318.    course.
  319.    
  320.    Before you implement an option, though, think hard. Is there any way
  321.    to make fetchmail automatically detect the circumstances under which
  322.    it should change its behavior? If so, don't write an option. Just do
  323.    the check!
  324.    
  325.                                 Lessons learned
  326.                                        
  327.   1. Server-side state is essential
  328.   
  329.    The person(s) responsible for removing LAST from POP3 deserve to
  330.    suffer. Without it, a client has no way to know which messages in a
  331.    box have been read by other means, such as an MUA running on the
  332.    server.
  333.    
  334.    The POP3 UID feature described in RFC1725 to replace LAST is
  335.    insufficient. The only problem it solves is tracking which messages
  336.    have been read by this client -- and even that requires tricky,
  337.    fragile implementation.
  338.    
  339.    The underlying lesson is that maintaining accessible server-side
  340.    `seen' state bits associated with Status headers is indispensible in a
  341.    Unix/RFC822 mail server protocol. IMAP gets this right.
  342.    
  343.   2. Readable text protocol transactions are a Good Thing
  344.   
  345.    A nice thing about the general class of text-based protocols that
  346.    SMTP, POP2, POP3, and IMAP belongs to is that client/server
  347.    transactions are easy to watch and transaction code correspondingly
  348.    easy to debug. Given a decent layer of socket utility functions (which
  349.    Carl provided) it's easy to write protocol engines and not hard to
  350.    show that they're working correctly.
  351.    
  352.    This is an advantage not to be despised! Because of it, this project
  353.    has been interesting and fun -- no serious or persistent bugs, no long
  354.    hours spent looking for subtle pathologies.
  355.    
  356.   3. IMAP is a Good Thing.
  357.   
  358.    If there were a standard IMAP equivalent of the POP3 APOP validation,
  359.    POP3 would be completely obsolete.
  360.    
  361.   4. SMTP is the Right Thing
  362.   
  363.    In retrospect it seems clear that this program (and others like it)
  364.    should have been designed to forward via SMTP from the beginning. This
  365.    lesson may be applicable to other Unix programs that now call the
  366.    local MDA/MTA as a program.
  367.    
  368.   5. Syntactic noise can be your friend
  369.   
  370.    The optional `noise' keywords in the rc file syntax started out as a
  371.    late-night experiment. The English-like syntax they allow is
  372.    considerably more readable than the traditional terse keyword-value
  373.    pairs you get when you strip them all out. I think there may be a
  374.    wider lesson here.
  375.    
  376.                            Motivation and validation
  377.                                        
  378.    It is truly written: the best hacks start out as personal solutions to
  379.    the author's everyday problems, and spread because the problem turns
  380.    out to be typical for a large class of users. So it was with Carl
  381.    Harris and the ancestral popclient, and so with me and fetchmail.
  382.    
  383.    It's gratifying that fetchmail has become so popular. Until just
  384.    before 1.9 I was designing strictly to my own taste. The multi-drop
  385.    mailbox support and the new --limit option were the first features to
  386.    go in that I didn't need myself.
  387.    
  388.    By 1.9, four months after I started hacking on popclient and a month
  389.    after the first fetchmail release, there were literally a hundred
  390.    people on the fetchmail-friends contact list. That's pretty powerful
  391.    motivation. And they were a good crowd, too, sending fixes and
  392.    intelligent bug reports in volume. A user population like that is a
  393.    gift from the gods, and this is my expression of gratitude.
  394.    
  395.    The beta testers didn't know it at the time, but they were also the
  396.    subjects of a sociological experiment. The results are described in my
  397.    paper, The Cathedral And The Bazaar.
  398.    
  399.                                     Credits
  400.                                        
  401.    Special thanks go to Carl Harris, who built a good solid code base and
  402.    then tolerated me hacking it out of recognition. And to Harry
  403.    Hochheiser, who gave me the idea of the SMTP-forwarding delivery mode.
  404.    
  405.    Other significant contributors to the code have included Dave
  406.    Bodenstab (error.c code and --syslog), George Sipe (--monitor and
  407.    --interface), Gordon Matzigkeit (netrc.c), Al Longyear (UIDL support),
  408.    Chris Hanson (Kerberos V4 support), and Craig Metz (OPIE, IPv6,
  409.    IPSEC).
  410.    
  411.                                   Conclusion
  412.                                        
  413.    At this point, the fetchmail code appears to be pretty stable. It will
  414.    probably undergo substantial change only if and when support for a new
  415.    retrieval protocol or authentication method is added.
  416.    
  417.                                  Relevant RFCS
  418.                                        
  419.    Not all of these describe standards explicitly used in fetchmail, but
  420.    they all shaped the design in one way or another.
  421.    
  422.    RFC821
  423.           SMTP protocol
  424.           
  425.    RFC822
  426.           Mail header format
  427.           
  428.    RFC937
  429.           Post Office Protocol - Version 2
  430.           
  431.    RFC974
  432.           MX routing
  433.           
  434.    RFC976
  435.           UUCP mail format
  436.           
  437.    RFC1081
  438.           Post Office Protocol - Version 3
  439.           
  440.    RFC1123
  441.           Host requirements (modifies 821, 822, and 974)
  442.           
  443.    RFC1176
  444.           Interactive Mail Access Protocol - Version 2
  445.           
  446.    RFC1203
  447.           Interactive Mail Access Protocol - Version 3
  448.           
  449.    RFC1225
  450.           Post Office Protocol - Version 3
  451.           
  452.    RFC1344
  453.           Implications of MIME for Internet Mail Gateways
  454.           
  455.    RFC1413
  456.           Identification server
  457.           
  458.    RFC1428
  459.           Transition of Internet Mail from Just-Send-8 to 8-bit SMTP/MIME
  460.           
  461.    RFC1460
  462.           Post Office Protocol - Version 3
  463.           
  464.    RFC1521
  465.           MIME: Multipurpose Internet Mail Extensions
  466.           
  467.    RFC1869
  468.           SMTP Service Extensions (ESMTP spec)
  469.           
  470.    RFC1652
  471.           SMTP Service Extension for 8bit-MIMEtransport
  472.           
  473.    RFC1725
  474.           Post Office Protocol - Version 3
  475.           
  476.    RFC1730
  477.           Interactive Mail Access Protocol - Version 4
  478.           
  479.    RFC1731
  480.           IMAP4 Authentication Mechanisms
  481.           
  482.    RFC1732
  483.           IMAP4 Compatibility With IMAP2 And IMAP2bis
  484.           
  485.    RFC1734
  486.           POP3 AUTHentication command
  487.           
  488.    RFC1870
  489.           SMTP Service Extension for Message Size Declaration
  490.           
  491.    RFC1891
  492.           SMTP Service Extension for Delivery Status Notifications
  493.           
  494.    RFC1892
  495.           The Multipart/Report Content Type for the Reporting of Mail
  496.           System Administrative Messages
  497.           
  498.    RFC1894
  499.           An Extensible Message Format for Delivery Status Notifications
  500.           
  501.    RFC1893
  502.           Enhanced Mail System Status Codes
  503.           
  504.    RFC1894
  505.           An Extensible Message Format for Delivery Status Notifications
  506.           
  507.    RFC1938
  508.           A One-Time Password System
  509.           
  510.    RFC1939
  511.           Post Office Protocol - Version 3
  512.           
  513.    RFC1957
  514.           Some Observations on Implementations of the Post Office
  515.           Protocol (POP3)
  516.           
  517.    RFC1985
  518.           SMTP Service Extension for Remote Message Queue Starting
  519.           
  520.    RFC2033
  521.           Local Mail Transfer Protocol
  522.           
  523.    RFC2060
  524.           Internet Message Access Protocol - Version 4rev1
  525.           
  526.    RFC2061
  527.           IMAP4 Compatibility With IMAP2bis
  528.           
  529.    RFC2062
  530.           Internet Message Access Protocol - Obsolete Syntax
  531.           
  532.    RFC2195
  533.           IMAP/POP AUTHorize Extension for Simple Challenge/Response
  534.           
  535.    RFC2449
  536.           IMAP/POP AUTHorize Extension for Simple Challenge/Response
  537.           
  538.    RFC2449
  539.           POP3 Extension Mechanism
  540.      _________________________________________________________________
  541.    
  542.    
  543.    
  544.     Eric S. Raymond <esr@snark.thyrsus.com>