tcp_timer.c
上传用户:baixin
上传日期:2008-03-13
资源大小:4795k
文件大小:12k
开发平台:

MultiPlatform

  1. /* tcp_timer.c - TCP timer routines */
  2. /* Copyright 1984 - 2001 Wind River Systems, Inc. */
  3. #include "copyright_wrs.h"
  4. /*
  5.  * Copyright (c) 1982, 1986, 1988, 1990, 1993, 1995
  6.  * The Regents of the University of California.  All rights reserved.
  7.  *
  8.  * Redistribution and use in source and binary forms, with or without
  9.  * modification, are permitted provided that the following conditions
  10.  * are met:
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  * 2. Redistributions in binary form must reproduce the above copyright
  14.  *    notice, this list of conditions and the following disclaimer in the
  15.  *    documentation and/or other materials provided with the distribution.
  16.  * 3. All advertising materials mentioning features or use of this software
  17.  *    must display the following acknowledgement:
  18.  * This product includes software developed by the University of
  19.  * California, Berkeley and its contributors.
  20.  * 4. Neither the name of the University nor the names of its contributors
  21.  *    may be used to endorse or promote products derived from this software
  22.  *    without specific prior written permission.
  23.  *
  24.  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
  25.  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
  26.  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
  27.  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
  28.  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
  29.  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
  30.  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
  31.  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
  32.  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
  33.  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  34.  * SUCH DAMAGE.
  35.  *
  36.  * @(#)tcp_timer.c 8.2 (Berkeley) 5/24/95
  37.  */
  38. /*
  39. modification history
  40. --------------------
  41. 01d,12oct01,rae  merge from truestack ver 01g, base 01f (cleanup, rand hook ...)
  42. 01c,08mar97,vin  added changes to accomodate changes in pcb structure.
  43. 01b,30oct96,vin  changed calls to tcp_respond, mtod(tp->t_template ...).
  44. 01a,03mar96,vin  created from BSD4.4 stuff,integrated with 02j.
  45. */
  46. /*
  47. DESCRIPTION
  48. */
  49. #include "vxWorks.h"
  50. #include "net/systm.h"
  51. #include "net/mbuf.h"
  52. #include "sys/socket.h"
  53. #include "net/socketvar.h"
  54. #include "net/protosw.h"
  55. #include "errno.h"
  56. #include "net/if.h"
  57. #include "net/route.h"
  58. #include "netinet/in.h"
  59. #include "netinet/in_pcb.h"
  60. #include "netinet/in_systm.h"
  61. #include "netinet/ip.h"
  62. #include "netinet/ip_var.h"
  63. #include "netinet/tcp.h"
  64. #include "netinet/tcp_fsm.h"
  65. #include "netinet/tcp_seq.h"
  66. #include "netinet/tcp_timer.h"
  67. #include "netinet/tcp_debug.h"
  68. #include "netinet/tcp_var.h"
  69. #include "netinet/tcpip.h"
  70. #ifdef WV_INSTRUMENTATION
  71. #ifdef INCLUDE_WVNET
  72. #include "wvNetLib.h"
  73. #endif
  74. #endif
  75. #ifdef VIRTUAL_STACK
  76. #include "netinet/vsLib.h"
  77. #else
  78. /* globals */
  79. int     tcp_keepidle = TCPTV_KEEP_IDLE;
  80. int     tcp_keepintvl = TCPTV_KEEPINTVL;
  81. int tcp_keepcnt = TCPTV_KEEPCNT;
  82. int tcp_keepinit = TCPTV_KEEP_INIT;
  83. int tcp_maxpersistidle = TCPTV_KEEP_IDLE;   /* max idle time in persist */
  84. int     tcp_maxidle;
  85. #endif /* VIRTUAL_STACK */
  86. IMPORT unsigned long (*pTcpRandHook)(void);
  87. #ifdef WV_INSTRUMENTATION
  88. #ifdef INCLUDE_WVNET
  89.     /* Set common fields of event identifiers for this module. */
  90. LOCAL UCHAR wvNetModuleId = WV_NET_TCPTIMER_MODULE; /* Value for tcp_timer.c */
  91. LOCAL UCHAR wvNetLocalFilter = WV_NET_NONE;     /* Available event filter */
  92. LOCAL ULONG wvNetEventId;       /* Event identifier: see wvNetLib.h */
  93. #endif    /* INCLUDE_WVNET */
  94. #endif
  95. /*
  96.  * Fast timeout routine for processing delayed acks
  97.  */
  98. void
  99. tcp_fasttimo()
  100. {
  101. register struct inpcb *inp;
  102. register struct tcpcb *tp;
  103. int s;
  104. #ifdef WV_INSTRUMENTATION
  105. #ifdef INCLUDE_WVNET    /* WV_NET_INFO event */
  106.     WV_NET_MARKER_0 (NET_AUX_EVENT, WV_NET_INFO, 44, 1,
  107.                      WV_NETEVENT_TCPFASTTIMER_START)
  108. #endif  /* INCLUDE_WVNET */
  109. #endif
  110.         s = splnet();
  111.         for (inp = tcb.lh_first; inp != NULL; inp = inp->inp_list.le_next) {
  112. if ((tp = (struct tcpcb *)inp->inp_ppcb) &&
  113.     (tp->t_flags & TF_DELACK)) {
  114. tp->t_flags &= ~TF_DELACK;
  115. tp->t_flags |= TF_ACKNOW;
  116. tcpstat.tcps_delack++;
  117. (void) tcp_output(tp);
  118. }
  119.         }
  120. splx(s);
  121. }
  122. /*
  123.  * Tcp protocol timeout routine called every 500 ms.
  124.  * Updates the timers in all active tcb's and
  125.  * causes finite state machine actions if timers expire.
  126.  */
  127. void
  128. tcp_slowtimo()
  129. {
  130. register struct inpcb *ip, *ipnxt;
  131. register struct tcpcb *tp;
  132. int s = splnet();
  133. #ifdef BSDDEBUG
  134.         int ostate;
  135. #endif
  136. register int i;
  137. #ifdef WV_INSTRUMENTATION
  138. #ifdef INCLUDE_WVNET    /* WV_NET_INFO event */
  139.     WV_NET_MARKER_0 (NET_AUX_EVENT, WV_NET_INFO, 45, 2,
  140.                      WV_NETEVENT_TCPSLOWTIMER_START)
  141. #endif  /* INCLUDE_WVNET */
  142. #endif
  143. tcp_maxidle = tcp_keepcnt * tcp_keepintvl;
  144. /*
  145.  * Search through tcb's and update active timers.
  146.  */
  147. ip = tcb.lh_first;
  148. if (ip == 0) {
  149. splx(s);
  150. return;
  151. }
  152. for (; ip != NULL; ip = ipnxt) {
  153. ipnxt = ip->inp_list.le_next;
  154. tp = intotcpcb(ip);
  155. if (tp == 0 || tp->t_state == TCPS_LISTEN)
  156. continue;
  157. for (i = 0; i < TCPT_NTIMERS; i++) {
  158. if (tp->t_timer[i] && --tp->t_timer[i] == 0) {
  159. #ifdef BSDDEBUG
  160.                                 ostate = tp->t_state;
  161. #endif
  162.                                 tp = tcp_timers(tp, i);
  163.                                 if (tp == NULL)
  164.                                         goto tpgone;
  165. #ifdef BSDDEBUG
  166.                                 if (tp->t_inpcb->inp_socket->so_options
  167.                                     & SO_DEBUG)
  168.                                     (*tcpTraceRtn)(TA_USER, ostate, tp,
  169.                                                    (struct tcpiphdr *)0,
  170.                                                    PRU_SLOWTIMO);
  171. #endif
  172. }
  173. }
  174. tp->t_idle++;
  175. if (tp->t_rtt)
  176. tp->t_rtt++;
  177. tpgone:
  178. ;
  179. }
  180. tcp_iss += TCP_ISSINCR/PR_SLOWHZ +
  181.            ((0x0000ffff) & (pTcpRandHook() >> 16));
  182. #ifdef TCP_COMPAT_42
  183. if ((int)tcp_iss < 0)
  184. tcp_iss = TCP_ISSINCR; /* XXX */
  185. #endif
  186. tcp_now++; /* for timestamps */
  187. splx(s);
  188. }
  189. /*
  190.  * Cancel all timers for TCP tp.
  191.  */
  192. void
  193. tcp_canceltimers(tp)
  194. struct tcpcb *tp;
  195. {
  196. register int i;
  197. for (i = 0; i < TCPT_NTIMERS; i++)
  198. tp->t_timer[i] = 0;
  199. }
  200. int tcp_backoff[TCP_MAXRXTSHIFT + 1] =
  201.     { 1, 2, 4, 8, 16, 32, 64, 64, 64, 64, 64, 64, 64 };
  202. int tcp_totbackoff = 511; /* sum of tcp_backoff[] */
  203. /*
  204.  * TCP timer processing.
  205.  */
  206. struct tcpcb *
  207. tcp_timers(tp, timer)
  208. register struct tcpcb *tp;
  209. int timer;
  210. {
  211. register int rexmt;
  212. #ifdef WV_INSTRUMENTATION
  213. #ifdef INCLUDE_WVNET    /* WV_NET_VERBOSE event */
  214.     WV_NET_MARKER_2 (NET_AUX_EVENT, WV_NET_VERBOSE, 40, 3,
  215.                      WV_NETEVENT_TCPTIMER_START,
  216.                      tp->t_inpcb->inp_socket->so_fd, timer)
  217. #endif  /* INCLUDE_WVNET */
  218. #endif
  219. switch (timer) {
  220. /*
  221.  * 2 MSL timeout in shutdown went off.  If we're closed but
  222.  * still waiting for peer to close and connection has been idle
  223.  * too long, or if 2MSL time is up from TIME_WAIT, delete connection
  224.  * control block.  Otherwise, check again in a bit.
  225.  */
  226. case TCPT_2MSL:
  227. if (tp->t_state != TCPS_TIME_WAIT &&
  228.     tp->t_idle <= tcp_maxidle)
  229. tp->t_timer[TCPT_2MSL] = tcp_keepintvl;
  230. else
  231. tp = tcp_close(tp);
  232. break;
  233. /*
  234.  * Retransmission timer went off.  Message has not
  235.  * been acked within retransmit interval.  Back off
  236.  * to a longer retransmit interval and retransmit one segment.
  237.  */
  238. case TCPT_REXMT:
  239. if (++tp->t_rxtshift > TCP_MAXRXTSHIFT) {
  240. tp->t_rxtshift = TCP_MAXRXTSHIFT;
  241. tcpstat.tcps_timeoutdrop++;
  242. tp = tcp_drop(tp, tp->t_softerror ?
  243.     tp->t_softerror : ETIMEDOUT);
  244. break;
  245. }
  246. tcpstat.tcps_rexmttimeo++;
  247. rexmt = TCP_REXMTVAL(tp) * tcp_backoff[tp->t_rxtshift];
  248. TCPT_RANGESET(tp->t_rxtcur, rexmt,
  249.     tp->t_rttmin, TCPTV_REXMTMAX);
  250. tp->t_timer[TCPT_REXMT] = tp->t_rxtcur;
  251. /*
  252.  * If losing, let the lower level know and try for
  253.  * a better route.  Also, if we backed off this far,
  254.  * our srtt estimate is probably bogus.  Clobber it
  255.  * so we'll take the next rtt measurement as our srtt;
  256.  * move the current srtt into rttvar to keep the current
  257.  * retransmit times until then.
  258.  */
  259. if (tp->t_rxtshift > TCP_MAXRXTSHIFT / 4) {
  260. in_losing(tp->t_inpcb);
  261. tp->t_rttvar += (tp->t_srtt >> TCP_RTT_SHIFT);
  262. tp->t_srtt = 0;
  263. }
  264. tp->snd_nxt = tp->snd_una;
  265. /*
  266.  * If timing a segment in this window, stop the timer.
  267.  */
  268. tp->t_rtt = 0;
  269. /*
  270.  * Close the congestion window down to one segment
  271.  * (we'll open it by one segment for each ack we get).
  272.  * Since we probably have a window's worth of unacked
  273.  * data accumulated, this "slow start" keeps us from
  274.  * dumping all that data as back-to-back packets (which
  275.  * might overwhelm an intermediate gateway).
  276.  *
  277.  * There are two phases to the opening: Initially we
  278.  * open by one mss on each ack.  This makes the window
  279.  * size increase exponentially with time.  If the
  280.  * window is larger than the path can handle, this
  281.  * exponential growth results in dropped packet(s)
  282.  * almost immediately.  To get more time between 
  283.  * drops but still "push" the network to take advantage
  284.  * of improving conditions, we switch from exponential
  285.  * to linear window opening at some threshhold size.
  286.  * For a threshhold, we use half the current window
  287.  * size, truncated to a multiple of the mss.
  288.  *
  289.  * (the minimum cwnd that will give us exponential
  290.  * growth is 2 mss.  We don't allow the threshhold
  291.  * to go below this.)
  292.  */
  293. {
  294. u_int win = min(tp->snd_wnd, tp->snd_cwnd) / 2 / tp->t_maxseg;
  295. if (win < 2)
  296. win = 2;
  297. tp->snd_cwnd = tp->t_maxseg;
  298. tp->snd_ssthresh = win * tp->t_maxseg;
  299. tp->t_dupacks = 0;
  300. }
  301. (void) tcp_output(tp);
  302. break;
  303. /*
  304.  * Persistance timer into zero window.
  305.  * Force a byte to be output, if possible.
  306.  */
  307. case TCPT_PERSIST:
  308. tcpstat.tcps_persisttimeo++;
  309. /*
  310.  * Hack: if the peer is dead/unreachable, we do not
  311.  * time out if the window is closed.  After a full
  312.  * backoff, drop the connection if the idle time
  313.  * (no responses to probes) reaches the maximum
  314.  * backoff that we would use if retransmitting.
  315.  */
  316. if (tp->t_rxtshift == TCP_MAXRXTSHIFT &&
  317.     (tp->t_idle >= tcp_maxpersistidle ||
  318.     tp->t_idle >= TCP_REXMTVAL(tp) * tcp_totbackoff)) {
  319. tcpstat.tcps_persistdrop++;
  320. tp = tcp_drop(tp, ETIMEDOUT);
  321. break;
  322. }
  323. tcp_setpersist(tp);
  324. tp->t_force = 1;
  325. (void) tcp_output(tp);
  326. tp->t_force = 0;
  327. break;
  328. /*
  329.  * Keep-alive timer went off; send something
  330.  * or drop connection if idle for too long.
  331.  */
  332. case TCPT_KEEP:
  333. tcpstat.tcps_keeptimeo++;
  334. if (tp->t_state < TCPS_ESTABLISHED)
  335. goto dropit;
  336. if (tp->t_inpcb->inp_socket->so_options & SO_KEEPALIVE &&
  337.     tp->t_state <= TCPS_CLOSE_WAIT) {
  338.      if (tp->t_idle >= tcp_keepidle + tcp_maxidle)
  339. goto dropit;
  340. /*
  341.  * Send a packet designed to force a response
  342.  * if the peer is up and reachable:
  343.  * either an ACK if the connection is still alive,
  344.  * or an RST if the peer has closed the connection
  345.  * due to timeout or reboot.
  346.  * Using sequence number tp->snd_una-1
  347.  * causes the transmitted zero-length segment
  348.  * to lie outside the receive window;
  349.  * by the protocol spec, this requires the
  350.  * correspondent TCP to respond.
  351.  */
  352. tcpstat.tcps_keepprobe++;
  353. #ifdef TCP_COMPAT_42
  354. /*
  355.  * The keepalive packet must have nonzero length
  356.  * to get a 4.2 host to respond.
  357.  */
  358. tcp_respond(tp, 
  359.     mtod(tp->t_template, struct tcpiphdr *),
  360.     (struct mbuf *)NULL,
  361.     tp->rcv_nxt - 1, tp->snd_una - 1, 0);
  362. #else
  363. tcp_respond(tp, 
  364.     mtod(tp->t_template, struct tcpiphdr *),
  365.     (struct mbuf *)NULL,
  366.     tp->rcv_nxt, tp->snd_una - 1, 0);
  367. #endif
  368. tp->t_timer[TCPT_KEEP] = tcp_keepintvl;
  369. } else
  370. tp->t_timer[TCPT_KEEP] = tcp_keepidle;
  371. break;
  372. dropit:
  373. tcpstat.tcps_keepdrops++;
  374. tp = tcp_drop(tp, ETIMEDOUT);
  375. break;
  376. }
  377. return (tp);
  378. }