bonding.c
上传用户:jlfgdled
上传日期:2013-04-10
资源大小:33168k
文件大小:67k
源码类别:

Linux/Unix编程

开发平台:

Unix_Linux

  1. /*
  2.  * originally based on the dummy device.
  3.  *
  4.  * Copyright 1999, Thomas Davis, tadavis@lbl.gov.  
  5.  * Licensed under the GPL. Based on dummy.c, and eql.c devices.
  6.  *
  7.  * bonding.c: an Ethernet Bonding driver
  8.  *
  9.  * This is useful to talk to a Cisco EtherChannel compatible equipment:
  10.  * Cisco 5500
  11.  * Sun Trunking (Solaris)
  12.  * Alteon AceDirector Trunks
  13.  * Linux Bonding
  14.  * and probably many L2 switches ...
  15.  *
  16.  * How it works:
  17.  *    ifconfig bond0 ipaddress netmask up
  18.  *      will setup a network device, with an ip address.  No mac address 
  19.  * will be assigned at this time.  The hw mac address will come from 
  20.  * the first slave bonded to the channel.  All slaves will then use 
  21.  * this hw mac address.
  22.  *
  23.  *    ifconfig bond0 down
  24.  *         will release all slaves, marking them as down.
  25.  *
  26.  *    ifenslave bond0 eth0
  27.  * will attach eth0 to bond0 as a slave.  eth0 hw mac address will either
  28.  * a: be used as initial mac address
  29.  * b: if a hw mac address already is there, eth0's hw mac address 
  30.  *    will then be set from bond0.
  31.  *
  32.  * v0.1 - first working version.
  33.  * v0.2 - changed stats to be calculated by summing slaves stats.
  34.  *
  35.  * Changes:
  36.  * Arnaldo Carvalho de Melo <acme@conectiva.com.br>
  37.  * - fix leaks on failure at bond_init
  38.  *
  39.  * 2000/09/30 - Willy Tarreau <willy at meta-x.org>
  40.  *     - added trivial code to release a slave device.
  41.  *     - fixed security bug (CAP_NET_ADMIN not checked)
  42.  *     - implemented MII link monitoring to disable dead links :
  43.  *       All MII capable slaves are checked every <miimon> milliseconds
  44.  *       (100 ms seems good). This value can be changed by passing it to
  45.  *       insmod. A value of zero disables the monitoring (default).
  46.  *     - fixed an infinite loop in bond_xmit_roundrobin() when there's no
  47.  *       good slave.
  48.  *     - made the code hopefully SMP safe
  49.  *
  50.  * 2000/10/03 - Willy Tarreau <willy at meta-x.org>
  51.  *     - optimized slave lists based on relevant suggestions from Thomas Davis
  52.  *     - implemented active-backup method to obtain HA with two switches:
  53.  *       stay as long as possible on the same active interface, while we
  54.  *       also monitor the backup one (MII link status) because we want to know
  55.  *       if we are able to switch at any time. ( pass "mode=1" to insmod )
  56.  *     - lots of stress testings because we need it to be more robust than the
  57.  *       wires ! :->
  58.  *
  59.  * 2000/10/09 - Willy Tarreau <willy at meta-x.org>
  60.  *     - added up and down delays after link state change.
  61.  *     - optimized the slaves chaining so that when we run forward, we never
  62.  *       repass through the bond itself, but we can find it by searching
  63.  *       backwards. Renders the deletion more difficult, but accelerates the
  64.  *       scan.
  65.  *     - smarter enslaving and releasing.
  66.  *     - finer and more robust SMP locking
  67.  *
  68.  * 2000/10/17 - Willy Tarreau <willy at meta-x.org>
  69.  *     - fixed two potential SMP race conditions
  70.  *
  71.  * 2000/10/18 - Willy Tarreau <willy at meta-x.org>
  72.  *     - small fixes to the monitoring FSM in case of zero delays
  73.  * 2000/11/01 - Willy Tarreau <willy at meta-x.org>
  74.  *     - fixed first slave not automatically used in trunk mode.
  75.  * 2000/11/10 : spelling of "EtherChannel" corrected.
  76.  * 2000/11/13 : fixed a race condition in case of concurrent accesses to ioctl().
  77.  * 2000/12/16 : fixed improper usage of rtnl_exlock_nowait().
  78.  *
  79.  * 2001/1/3 - Chad N. Tindel <ctindel at ieee dot org>
  80.  *     - The bonding driver now simulates MII status monitoring, just like
  81.  *       a normal network device.  It will show that the link is down iff
  82.  *       every slave in the bond shows that their links are down.  If at least
  83.  *       one slave is up, the bond's MII status will appear as up.
  84.  *
  85.  * 2001/2/7 - Chad N. Tindel <ctindel at ieee dot org>
  86.  *     - Applications can now query the bond from user space to get
  87.  *       information which may be useful.  They do this by calling
  88.  *       the BOND_INFO_QUERY ioctl.  Once the app knows how many slaves
  89.  *       are in the bond, it can call the BOND_SLAVE_INFO_QUERY ioctl to
  90.  *       get slave specific information (# link failures, etc).  See
  91.  *       <linux/if_bonding.h> for more details.  The structs of interest
  92.  *       are ifbond and ifslave.
  93.  *
  94.  * 2001/4/5 - Chad N. Tindel <ctindel at ieee dot org>
  95.  *     - Ported to 2.4 Kernel
  96.  * 
  97.  * 2001/5/2 - Jeffrey E. Mast <jeff at mastfamily dot com>
  98.  *     - When a device is detached from a bond, the slave device is no longer
  99.  *       left thinking that is has a master.
  100.  *
  101.  * 2001/5/16 - Jeffrey E. Mast <jeff at mastfamily dot com>
  102.  *     - memset did not appropriately initialized the bond rw_locks. Used 
  103.  *       rwlock_init to initialize to unlocked state to prevent deadlock when 
  104.  *       first attempting a lock
  105.  *     - Called SET_MODULE_OWNER for bond device
  106.  *
  107.  * 2001/5/17 - Tim Anderson <tsa at mvista.com>
  108.  *     - 2 paths for releasing for slave release; 1 through ioctl
  109.  *       and 2) through close. Both paths need to release the same way.
  110.  *     - the free slave in bond release is changing slave status before
  111.  *       the free. The netdev_set_master() is intended to change slave state
  112.  *       so it should not be done as part of the release process.
  113.  *     - Simple rule for slave state at release: only the active in A/B and
  114.  *       only one in the trunked case.
  115.  *
  116.  * 2001/6/01 - Tim Anderson <tsa at mvista.com>
  117.  *     - Now call dev_close when releasing a slave so it doesn't screw up
  118.  *       out routing table.
  119.  *
  120.  * 2001/6/01 - Chad N. Tindel <ctindel at ieee dot org>
  121.  *     - Added /proc support for getting bond and slave information.
  122.  *       Information is in /proc/net/<bond device>/info. 
  123.  *     - Changed the locking when calling bond_close to prevent deadlock.
  124.  *
  125.  * 2001/8/05 - Janice Girouard <girouard at us.ibm.com>
  126.  *     - correct problem where refcnt of slave is not incremented in bond_ioctl
  127.  *       so the system hangs when halting.
  128.  *     - correct locking problem when unable to malloc in bond_enslave.
  129.  *     - adding bond_xmit_xor logic.
  130.  *     - adding multiple bond device support.
  131.  *
  132.  * 2001/8/13 - Erik Habbinga <erik_habbinga at hp dot com>
  133.  *     - correct locking problem with rtnl_exlock_nowait
  134.  *
  135.  * 2001/8/23 - Janice Girouard <girouard at us.ibm.com>
  136.  *     - bzero initial dev_bonds, to correct oops
  137.  *     - convert SIOCDEVPRIVATE to new MII ioctl calls
  138.  *
  139.  * 2001/9/13 - Takao Indoh <indou dot takao at jp dot fujitsu dot com>
  140.  *     - Add the BOND_CHANGE_ACTIVE ioctl implementation
  141.  *
  142.  * 2001/9/14 - Mark Huth <mhuth at mvista dot com>
  143.  *     - Change MII_LINK_READY to not check for end of auto-negotiation,
  144.  *       but only for an up link.
  145.  *
  146.  * 2001/9/20 - Chad N. Tindel <ctindel at ieee dot org>
  147.  *     - Add the device field to bonding_t.  Previously the net_device 
  148.  *       corresponding to a bond wasn't available from the bonding_t 
  149.  *       structure.
  150.  *
  151.  * 2001/9/25 - Janice Girouard <girouard at us.ibm.com>
  152.  *     - add arp_monitor for active backup mode
  153.  *
  154.  * 2001/10/23 - Takao Indoh <indou dot takao at jp dot fujitsu dot com>
  155.  *     - Various memory leak fixes
  156.  *
  157.  * 2001/11/5 - Mark Huth <mark dot huth at mvista dot com>
  158.  *     - Don't take rtnl lock in bond_mii_monitor as it deadlocks under 
  159.  *       certain hotswap conditions.  
  160.  *       Note:  this same change may be required in bond_arp_monitor ???
  161.  *     - Remove possibility of calling bond_sethwaddr with NULL slave_dev ptr 
  162.  *     - Handle hot swap ethernet interface deregistration events to remove
  163.  *       kernel oops following hot swap of enslaved interface
  164.  *
  165.  * 2002/1/2 - Chad N. Tindel <ctindel at ieee dot org>
  166.  *     - Restore original slave flags at release time.
  167.  *
  168.  * 2002/02/18 - Erik Habbinga <erik_habbinga at hp dot com>
  169.  *     - bond_release(): calling kfree on our_slave after call to
  170.  *       bond_restore_slave_flags, not before
  171.  *     - bond_enslave(): saving slave flags into original_flags before
  172.  *       call to netdev_set_master, so the IFF_SLAVE flag doesn't end
  173.  *       up in original_flags
  174.  *
  175.  * 2002/04/05 - Mark Smith <mark.smith at comdev dot cc> and
  176.  *              Steve Mead <steve.mead at comdev dot cc>
  177.  *     - Port Gleb Natapov's multicast support patchs from 2.4.12
  178.  *       to 2.4.18 adding support for multicast.
  179.  *
  180.  * 2002/06/17 - Tony Cureington <tony.cureington * hp_com>
  181.  *     - corrected uninitialized pointer (ifr.ifr_data) in bond_check_dev_link;
  182.  *       actually changed function to use ETHTOOL, then MIIPHY, and finally
  183.  *       MIIREG to determine the link status
  184.  *     - fixed bad ifr_data pointer assignments in bond_ioctl
  185.  *     - corrected mode 1 being reported as active-backup in bond_get_info;
  186.  *       also added text to distinguish type of load balancing (rr or xor)
  187.  *     - change arp_ip_target module param from "1-12s" (array of 12 ptrs)
  188.  *       to "s" (a single ptr)
  189.  *
  190.  * 2002/09/18 - Jay Vosburgh <fubar at us dot ibm dot com>
  191.  *     - Fixed up bond_check_dev_link() (and callers): removed some magic
  192.  *  numbers, banished local MII_ defines, wrapped ioctl calls to
  193.  *  prevent EFAULT errors
  194.  */
  195. #include <linux/config.h>
  196. #include <linux/kernel.h>
  197. #include <linux/module.h>
  198. #include <linux/sched.h>
  199. #include <linux/types.h>
  200. #include <linux/fcntl.h>
  201. #include <linux/interrupt.h>
  202. #include <linux/ptrace.h>
  203. #include <linux/ioport.h>
  204. #include <linux/in.h>
  205. #include <linux/slab.h>
  206. #include <linux/string.h>
  207. #include <linux/init.h>
  208. #include <linux/timer.h>
  209. #include <linux/socket.h>
  210. #include <asm/system.h>
  211. #include <asm/bitops.h>
  212. #include <asm/io.h>
  213. #include <asm/dma.h>
  214. #include <asm/uaccess.h>
  215. #include <linux/errno.h>
  216. #include <linux/netdevice.h>
  217. #include <linux/etherdevice.h>
  218. #include <linux/skbuff.h>
  219. #include <net/sock.h>
  220. #include <linux/rtnetlink.h>
  221. #include <linux/if_bonding.h>
  222. #include <linux/smp.h>
  223. #include <linux/if_ether.h>
  224. #include <linux/if_arp.h>
  225. #include <linux/mii.h>
  226. #include <linux/ethtool.h>
  227. /* monitor all links that often (in milliseconds). <=0 disables monitoring */
  228. #ifndef BOND_LINK_MON_INTERV
  229. #define BOND_LINK_MON_INTERV 0
  230. #endif
  231. #ifndef BOND_LINK_ARP_INTERV
  232. #define BOND_LINK_ARP_INTERV 0
  233. #endif
  234. static int arp_interval = BOND_LINK_ARP_INTERV;
  235. static char *arp_ip_target = NULL;
  236. static unsigned long arp_target = 0;
  237. static u32 my_ip = 0;
  238. char *arp_target_hw_addr = NULL;
  239. static int max_bonds = BOND_DEFAULT_MAX_BONDS;
  240. static int miimon = BOND_LINK_MON_INTERV;
  241. static int mode = BOND_MODE_ROUNDROBIN;
  242. static int updelay = 0;
  243. static int downdelay = 0;
  244. static int first_pass = 1;
  245. int bond_cnt;
  246. static struct bonding *these_bonds =  NULL;
  247. static struct net_device *dev_bonds = NULL;
  248. MODULE_PARM(max_bonds, "i");
  249. MODULE_PARM_DESC(max_bonds, "Max number of bonded devices");
  250. MODULE_PARM(miimon, "i");
  251. MODULE_PARM_DESC(miimon, "Link check interval in milliseconds");
  252. MODULE_PARM(mode, "i");
  253. MODULE_PARM(arp_interval, "i");
  254. MODULE_PARM_DESC(arp_interval, "arp interval in milliseconds");
  255. MODULE_PARM(arp_ip_target, "s");
  256. MODULE_PARM_DESC(arp_ip_target, "arp target in n.n.n.n form");
  257. MODULE_PARM_DESC(mode, "Mode of operation : 0 for round robin, 1 for active-backup, 2 for xor");
  258. MODULE_PARM(updelay, "i");
  259. MODULE_PARM_DESC(updelay, "Delay before considering link up, in milliseconds");
  260. MODULE_PARM(downdelay, "i");
  261. MODULE_PARM_DESC(downdelay, "Delay before considering link down, in milliseconds");
  262. extern void arp_send( int type, int ptype, u32 dest_ip, struct net_device *dev,
  263. u32 src_ip, unsigned char *dest_hw, unsigned char *src_hw, 
  264. unsigned char *target_hw);
  265. static int bond_xmit_roundrobin(struct sk_buff *skb, struct net_device *dev);
  266. static int bond_xmit_xor(struct sk_buff *skb, struct net_device *dev);
  267. static int bond_xmit_activebackup(struct sk_buff *skb, struct net_device *dev);
  268. static struct net_device_stats *bond_get_stats(struct net_device *dev);
  269. static void bond_mii_monitor(struct net_device *dev);
  270. static void bond_arp_monitor(struct net_device *dev);
  271. static int bond_event(struct notifier_block *this, unsigned long event, void *ptr);
  272. static void bond_restore_slave_flags(slave_t *slave);
  273. static void bond_mc_list_destroy(struct bonding *bond);
  274. static void bond_mc_add(bonding_t *bond, void *addr, int alen);
  275. static void bond_mc_delete(bonding_t *bond, void *addr, int alen);
  276. static int bond_mc_list_copy (struct dev_mc_list *src, struct bonding *dst, int gpf_flag);
  277. static inline int dmi_same(struct dev_mc_list *dmi1, struct dev_mc_list *dmi2);
  278. static void bond_set_promiscuity(bonding_t *bond, int inc);
  279. static void bond_set_allmulti(bonding_t *bond, int inc);
  280. static struct dev_mc_list* bond_mc_list_find_dmi(struct dev_mc_list *dmi, struct dev_mc_list *mc_list);
  281. static void bond_set_slave_inactive_flags(slave_t *slave);
  282. static void bond_set_slave_active_flags(slave_t *slave);
  283. static int bond_enslave(struct net_device *master, struct net_device *slave);
  284. static int bond_release(struct net_device *master, struct net_device *slave);
  285. static int bond_release_all(struct net_device *master);
  286. static int bond_sethwaddr(struct net_device *master, struct net_device *slave);
  287. /*
  288.  * bond_get_info is the interface into the /proc filesystem.  This is
  289.  * a different interface than the BOND_INFO_QUERY ioctl.  That is done
  290.  * through the generic networking ioctl interface, and bond_info_query
  291.  * is the internal function which provides that information.
  292.  */
  293. static int bond_get_info(char *buf, char **start, off_t offset, int length);
  294. /* #define BONDING_DEBUG 1 */
  295. /* several macros */
  296. #define IS_UP(dev) ((((dev)->flags & (IFF_UP)) == (IFF_UP)) && 
  297. (netif_running(dev) && netif_carrier_ok(dev)))
  298. static void bond_restore_slave_flags(slave_t *slave)
  299. {
  300. slave->dev->flags = slave->original_flags;
  301. }
  302. static void bond_set_slave_inactive_flags(slave_t *slave)
  303. {
  304. slave->state = BOND_STATE_BACKUP;
  305. slave->dev->flags |= IFF_NOARP;
  306. }
  307. static void bond_set_slave_active_flags(slave_t *slave)
  308. {
  309. slave->state = BOND_STATE_ACTIVE;
  310. slave->dev->flags &= ~IFF_NOARP;
  311. }
  312. /* 
  313.  * This function detaches the slave <slave> from the list <bond>.
  314.  * WARNING: no check is made to verify if the slave effectively
  315.  * belongs to <bond>. It returns <slave> in case it's needed.
  316.  * Nothing is freed on return, structures are just unchained.
  317.  * If the bond->current_slave pointer was pointing to <slave>,
  318.  * it's replaced with slave->next, or <bond> if not applicable.
  319.  */
  320. static slave_t *bond_detach_slave(bonding_t *bond, slave_t *slave)
  321. {
  322. if ((bond == NULL) || (slave == NULL) ||
  323.    ((void *)bond == (void *)slave)) {
  324. printk(KERN_ERR
  325. "bond_detach_slave(): trying to detach "
  326. "slave %p from bond %pn", bond, slave);
  327. return slave;
  328. }
  329. if (bond->next == slave) {  /* is the slave at the head ? */
  330. if (bond->prev == slave) {  /* is the slave alone ? */
  331. write_lock(&bond->ptrlock);
  332. bond->current_slave = NULL; /* no slave anymore */
  333. write_unlock(&bond->ptrlock);
  334. bond->prev = bond->next = (slave_t *)bond;
  335. } else { /* not alone */
  336. bond->next        = slave->next;
  337. slave->next->prev = (slave_t *)bond;
  338. bond->prev->next  = slave->next;
  339. write_lock(&bond->ptrlock);
  340. if (bond->current_slave == slave) {
  341. bond->current_slave = slave->next;
  342. }
  343. write_unlock(&bond->ptrlock);
  344. }
  345. }
  346. else {
  347. slave->prev->next = slave->next;
  348. if (bond->prev == slave) {  /* is this slave the last one ? */
  349. bond->prev = slave->prev;
  350. } else {
  351. slave->next->prev = slave->prev;
  352. }
  353. write_lock(&bond->ptrlock);
  354. if (bond->current_slave == slave) {
  355. bond->current_slave = slave->next;
  356. }
  357. write_unlock(&bond->ptrlock);
  358. }
  359. return slave;
  360. }
  361. /*
  362.  * Less bad way to call ioctl from within the kernel; this needs to be
  363.  * done some other way to get the call out of interrupt context.
  364.  * Needs "ioctl" variable to be supplied by calling context.
  365.  */
  366. #define IOCTL(dev, arg, cmd) ({
  367. int ret;
  368. mm_segment_t fs = get_fs();
  369. set_fs(get_ds());
  370. ret = ioctl(dev, arg, cmd);
  371. set_fs(fs);
  372. ret; })
  373. /* 
  374.  * if <dev> supports MII link status reporting, check its link status.
  375.  *
  376.  * Return either BMSR_LSTATUS, meaning that the link is up (or we
  377.  * can't tell and just pretend it is), or 0, meaning that the link is
  378.  * down.
  379.  */
  380. static u16 bond_check_dev_link(struct net_device *dev)
  381. {
  382. static int (* ioctl)(struct net_device *, struct ifreq *, int);
  383. struct ifreq ifr;
  384. struct mii_ioctl_data *mii;
  385. struct ethtool_value etool;
  386. ioctl = dev->do_ioctl;
  387. if (ioctl) {
  388. /* TODO: set pointer to correct ioctl on a per team member */
  389. /*       bases to make this more efficient. that is, once  */
  390. /*       we determine the correct ioctl, we will always    */
  391. /*       call it and not the others for that team          */
  392. /*       member.                                           */
  393. /* try SOICETHTOOL ioctl, some drivers cache ETHTOOL_GLINK */
  394. /* for a period of time; we need to encourage link status  */
  395. /* be reported by network drivers in real time; if the     */
  396. /* value is cached, the mmimon module parm may have no     */
  397. /* effect...                                               */
  398.         etool.cmd = ETHTOOL_GLINK;
  399.         ifr.ifr_data = (char*)&etool;
  400. if (IOCTL(dev, &ifr, SIOCETHTOOL) == 0) {
  401. if (etool.data == 1) {
  402. return BMSR_LSTATUS;
  403. else { 
  404. return(0);
  405. }
  406. /*
  407.  * We cannot assume that SIOCGMIIPHY will also read a
  408.  * register; not all network drivers support that.
  409.  */
  410. /* Yes, the mii is overlaid on the ifreq.ifr_ifru */
  411. mii = (struct mii_ioctl_data *)&ifr.ifr_data;
  412. if (IOCTL(dev, &ifr, SIOCGMIIPHY) != 0) {
  413. return BMSR_LSTATUS;  /* can't tell */
  414. }
  415. mii->reg_num = MII_BMSR;
  416. if (IOCTL(dev, &ifr, SIOCGMIIREG) == 0) {
  417. return mii->val_out & BMSR_LSTATUS;
  418. }
  419. }
  420. return BMSR_LSTATUS;  /* spoof link up ( we can't check it) */
  421. }
  422. static u16 bond_check_mii_link(bonding_t *bond)
  423. {
  424. int has_active_interface = 0;
  425. unsigned long flags;
  426. read_lock_irqsave(&bond->lock, flags);
  427. read_lock(&bond->ptrlock);
  428. has_active_interface = (bond->current_slave != NULL);
  429. read_unlock(&bond->ptrlock);
  430. read_unlock_irqrestore(&bond->lock, flags);
  431. return (has_active_interface ? BMSR_LSTATUS : 0);
  432. }
  433. static int bond_open(struct net_device *dev)
  434. {
  435. struct timer_list *timer = &((struct bonding *)(dev->priv))->mii_timer;
  436. struct timer_list *arp_timer = &((struct bonding *)(dev->priv))->arp_timer;
  437. MOD_INC_USE_COUNT;
  438. if (miimon > 0) {  /* link check interval, in milliseconds. */
  439. init_timer(timer);
  440. timer->expires  = jiffies + (miimon * HZ / 1000);
  441. timer->data     = (unsigned long)dev;
  442. timer->function = (void *)&bond_mii_monitor;
  443. add_timer(timer);
  444. }
  445. if (arp_interval> 0) {  /* arp interval, in milliseconds. */
  446. init_timer(arp_timer);
  447. arp_timer->expires  = jiffies + (arp_interval * HZ / 1000);
  448. arp_timer->data     = (unsigned long)dev;
  449. arp_timer->function = (void *)&bond_arp_monitor;
  450. add_timer(arp_timer);
  451. }
  452. return 0;
  453. }
  454. static int bond_close(struct net_device *master)
  455. {
  456. bonding_t *bond = (struct bonding *) master->priv;
  457. unsigned long flags;
  458. write_lock_irqsave(&bond->lock, flags);
  459. if (miimon > 0) {  /* link check interval, in milliseconds. */
  460. del_timer(&bond->mii_timer);
  461. }
  462. if (arp_interval> 0) {  /* arp interval, in milliseconds. */
  463. del_timer(&bond->arp_timer);
  464. }
  465. /* Release the bonded slaves */
  466. bond_release_all(master);
  467. bond_mc_list_destroy (bond);
  468. write_unlock_irqrestore(&bond->lock, flags);
  469. MOD_DEC_USE_COUNT;
  470. return 0;
  471. }
  472. /* 
  473.  * flush all members of flush->mc_list from device dev->mc_list
  474.  */
  475. static void bond_mc_list_flush(struct net_device *dev, struct net_device *flush)
  476. struct dev_mc_list *dmi; 
  477.  
  478. for (dmi = flush->mc_list; dmi != NULL; dmi = dmi->next) 
  479. dev_mc_delete(dev, dmi->dmi_addr, dmi->dmi_addrlen, 0);
  480. }
  481. /*
  482.  * Totally destroys the mc_list in bond
  483.  */
  484. static void bond_mc_list_destroy(struct bonding *bond)
  485. {
  486. struct dev_mc_list *dmi;
  487. dmi = bond->mc_list; 
  488. while (dmi) { 
  489. bond->mc_list = dmi->next; 
  490. kfree(dmi); 
  491. dmi = bond->mc_list; 
  492. }
  493. }
  494. /*
  495.  * Add a Multicast address to every slave in the bonding group
  496.  */
  497. static void bond_mc_add(bonding_t *bond, void *addr, int alen)
  498. slave_t *slave;
  499. for (slave = bond->prev; slave != (slave_t*)bond; slave = slave->prev) {
  500. dev_mc_add(slave->dev, addr, alen, 0);
  501. }
  502. /*
  503.  * Remove a multicast address from every slave in the bonding group
  504.  */
  505. static void bond_mc_delete(bonding_t *bond, void *addr, int alen)
  506. slave_t *slave; 
  507. for (slave = bond->prev; slave != (slave_t*)bond; slave = slave->prev)
  508. dev_mc_delete(slave->dev, addr, alen, 0);
  509. /*
  510.  * Copy all the Multicast addresses from src to the bonding device dst
  511.  */
  512. static int bond_mc_list_copy (struct dev_mc_list *src, struct bonding *dst,
  513.  int gpf_flag)
  514. {
  515. struct dev_mc_list *dmi, *new_dmi;
  516.     for (dmi = src; dmi != NULL; dmi = dmi->next) { 
  517. new_dmi = kmalloc(sizeof(struct dev_mc_list), gpf_flag);
  518. if (new_dmi == NULL) {
  519. return -ENOMEM; 
  520. }
  521. new_dmi->next = dst->mc_list; 
  522. dst->mc_list = new_dmi;
  523. new_dmi->dmi_addrlen = dmi->dmi_addrlen; 
  524. memcpy(new_dmi->dmi_addr, dmi->dmi_addr, dmi->dmi_addrlen); 
  525. new_dmi->dmi_users = dmi->dmi_users;
  526. new_dmi->dmi_gusers = dmi->dmi_gusers; 
  527. return 0;
  528. }
  529. /*
  530.  * Returns 0 if dmi1 and dmi2 are the same, non-0 otherwise
  531.  */
  532. static inline int dmi_same(struct dev_mc_list *dmi1, struct dev_mc_list *dmi2)
  533. return memcmp(dmi1->dmi_addr, dmi2->dmi_addr, dmi1->dmi_addrlen) == 0 &&
  534.  dmi1->dmi_addrlen == dmi2->dmi_addrlen;
  535. /*
  536.  * Push the promiscuity flag down to all slaves
  537.  */
  538. static void bond_set_promiscuity(bonding_t *bond, int inc)
  539. slave_t *slave; 
  540.  
  541. for (slave = bond->prev; slave != (slave_t*)bond; slave = slave->prev)
  542. dev_set_promiscuity(slave->dev, inc);
  543. /*
  544.  * Push the allmulti flag down to all slaves
  545.  */
  546. static void bond_set_allmulti(bonding_t *bond, int inc)
  547. slave_t *slave; 
  548.  
  549. for (slave = bond->prev; slave != (slave_t*)bond; slave = slave->prev)
  550. dev_set_allmulti(slave->dev, inc);
  551. /* 
  552.  * returns dmi entry if found, NULL otherwise 
  553.  */
  554. static struct dev_mc_list* bond_mc_list_find_dmi(struct dev_mc_list *dmi,
  555.  struct dev_mc_list *mc_list)
  556. struct dev_mc_list *idmi;
  557. for (idmi = mc_list; idmi != NULL; idmi = idmi->next) {
  558. if (dmi_same(dmi, idmi)) {
  559. return idmi; 
  560. }
  561. }
  562. return NULL;
  563. static void set_multicast_list(struct net_device *master)
  564. {
  565. bonding_t *bond = master->priv;
  566. struct dev_mc_list *dmi;
  567. unsigned long flags = 0;
  568. /*
  569.  * Lock the private data for the master
  570.  */
  571. write_lock_irqsave(&bond->lock, flags);
  572. /* set promiscuity flag to slaves */
  573. if ( (master->flags & IFF_PROMISC) && !(bond->flags & IFF_PROMISC) )
  574. bond_set_promiscuity(bond, 1); 
  575. if ( !(master->flags & IFF_PROMISC) && (bond->flags & IFF_PROMISC) ) 
  576. bond_set_promiscuity(bond, -1); 
  577. /* set allmulti flag to slaves */ 
  578. if ( (master->flags & IFF_ALLMULTI) && !(bond->flags & IFF_ALLMULTI) ) 
  579. bond_set_allmulti(bond, 1); 
  580. if ( !(master->flags & IFF_ALLMULTI) && (bond->flags & IFF_ALLMULTI) )
  581. bond_set_allmulti(bond, -1); 
  582. bond->flags = master->flags; 
  583. /* looking for addresses to add to slaves' mc list */ 
  584. for (dmi = master->mc_list; dmi != NULL; dmi = dmi->next) { 
  585. if (bond_mc_list_find_dmi(dmi, bond->mc_list) == NULL) 
  586.  bond_mc_add(bond, dmi->dmi_addr, dmi->dmi_addrlen); 
  587. /* looking for addresses to delete from slaves' list */ 
  588. for (dmi = bond->mc_list; dmi != NULL; dmi = dmi->next) { 
  589. if (bond_mc_list_find_dmi(dmi, master->mc_list) == NULL) 
  590.  bond_mc_delete(bond, dmi->dmi_addr, dmi->dmi_addrlen); 
  591. }
  592. /* save master's multicast list */ 
  593. bond_mc_list_destroy (bond);
  594. bond_mc_list_copy (master->mc_list, bond, GFP_KERNEL);
  595. write_unlock_irqrestore(&bond->lock, flags);
  596. }
  597. /*
  598.  * This function counts the the number of attached 
  599.  * slaves for use by bond_xmit_xor.
  600.  */
  601. static void update_slave_cnt(bonding_t *bond)
  602. {
  603. slave_t *slave = NULL;
  604. bond->slave_cnt = 0;
  605. for (slave = bond->prev; slave != (slave_t*)bond; slave = slave->prev) {
  606. bond->slave_cnt++;
  607. }
  608. }
  609. /* enslave device <slave> to bond device <master> */
  610. static int bond_enslave(struct net_device *master_dev, 
  611.                         struct net_device *slave_dev)
  612. {
  613. bonding_t *bond = NULL;
  614. slave_t *new_slave = NULL;
  615. unsigned long flags = 0;
  616. int ndx = 0;
  617. int err = 0;
  618. struct dev_mc_list *dmi;
  619. if (master_dev == NULL || slave_dev == NULL) {
  620. return -ENODEV;
  621. }
  622. bond = (struct bonding *) master_dev->priv;
  623. if (slave_dev->do_ioctl == NULL) {
  624. printk(KERN_DEBUG
  625. "Warning : no link monitoring support for %sn",
  626. slave_dev->name);
  627. }
  628. write_lock_irqsave(&bond->lock, flags);
  629. /* not running. */
  630. if ((slave_dev->flags & IFF_UP) != IFF_UP) {
  631. #ifdef BONDING_DEBUG
  632. printk(KERN_CRIT "Error, slave_dev is not runningn");
  633. #endif
  634. write_unlock_irqrestore(&bond->lock, flags);
  635. return -EINVAL;
  636. }
  637. /* already enslaved */
  638. if (master_dev->flags & IFF_SLAVE || slave_dev->flags & IFF_SLAVE) {
  639. #ifdef BONDING_DEBUG
  640. printk(KERN_CRIT "Error, Device was already enslavedn");
  641. #endif
  642. write_unlock_irqrestore(&bond->lock, flags);
  643. return -EBUSY;
  644. }
  645.    
  646. if ((new_slave = kmalloc(sizeof(slave_t), GFP_KERNEL)) == NULL) {
  647. write_unlock_irqrestore(&bond->lock, flags);
  648. return -ENOMEM;
  649. }
  650. memset(new_slave, 0, sizeof(slave_t));
  651. /* save flags before call to netdev_set_master */
  652. new_slave->original_flags = slave_dev->flags;
  653. err = netdev_set_master(slave_dev, master_dev);
  654. if (err) {
  655. #ifdef BONDING_DEBUG
  656. printk(KERN_CRIT "Error %d calling netdev_set_mastern", err);
  657. #endif
  658. kfree(new_slave);
  659. write_unlock_irqrestore(&bond->lock, flags);
  660. return err;      
  661. }
  662. new_slave->dev = slave_dev;
  663. /* set promiscuity level to new slave */ 
  664. if (master_dev->flags & IFF_PROMISC)
  665. dev_set_promiscuity(slave_dev, 1); 
  666.  
  667. /* set allmulti level to new slave */
  668. if (master_dev->flags & IFF_ALLMULTI) 
  669. dev_set_allmulti(slave_dev, 1); 
  670.  
  671. /* upload master's mc_list to new slave */ 
  672. for (dmi = master_dev->mc_list; dmi != NULL; dmi = dmi->next) 
  673. dev_mc_add (slave_dev, dmi->dmi_addr, dmi->dmi_addrlen, 0);
  674. /* 
  675.  * queue to the end of the slaves list, make the first element its
  676.  * successor, the last one its predecessor, and make it the bond's
  677.  * predecessor. 
  678.  *
  679.  * Just to clarify, so future bonding driver hackers don't go through
  680.  * the same confusion stage I did trying to figure this out, the
  681.  * slaves are stored in a double linked circular list, sortof.
  682.  * In the ->next direction, the last slave points to the first slave,
  683.  * bypassing bond; only the slaves are in the ->next direction.
  684.  * In the ->prev direction, however, the first slave points to bond
  685.  * and bond points to the last slave.
  686.  *
  687.  * It looks like a circle with a little bubble hanging off one side
  688.  * in the ->prev direction only.
  689.  *
  690.  * When going through the list once, its best to start at bond->prev
  691.  * and go in the ->prev direction, testing for bond.  Doing this
  692.  * in the ->next direction doesn't work.  Trust me, I know this now.
  693.  * :)  -mts 2002.03.14
  694.  */
  695. new_slave->prev       = bond->prev;
  696. new_slave->prev->next = new_slave;
  697. bond->prev            = new_slave;
  698. new_slave->next       = bond->next;
  699. new_slave->delay = 0;
  700. new_slave->link_failure_count = 0;
  701. /* check for initial state */
  702. if ((miimon <= 0) ||
  703.     (bond_check_dev_link(slave_dev) == BMSR_LSTATUS)) {
  704. #ifdef BONDING_DEBUG
  705. printk(KERN_CRIT "Initial state of slave_dev is BOND_LINK_UPn");
  706. #endif
  707. new_slave->link  = BOND_LINK_UP;
  708. }
  709. else {
  710. #ifdef BONDING_DEBUG
  711. printk(KERN_CRIT "Initial state of slave_dev is BOND_LINK_DOWNn");
  712. #endif
  713. new_slave->link  = BOND_LINK_DOWN;
  714. }
  715. /* if we're in active-backup mode, we need one and only one active
  716.  * interface. The backup interfaces will have their NOARP flag set
  717.  * because we need them to be completely deaf and not to respond to
  718.  * any ARP request on the network to avoid fooling a switch. Thus,
  719.  * since we guarantee that current_slave always point to the last
  720.  * usable interface, we just have to verify this interface's flag.
  721.  */
  722. if (mode == BOND_MODE_ACTIVEBACKUP) {
  723. if (((bond->current_slave == NULL)
  724. || (bond->current_slave->dev->flags & IFF_NOARP))
  725. && (new_slave->link == BOND_LINK_UP)) {
  726. #ifdef BONDING_DEBUG
  727. printk(KERN_CRIT "This is the first active slaven");
  728. #endif
  729. /* first slave or no active slave yet, and this link
  730.    is OK, so make this interface the active one */
  731. bond->current_slave = new_slave;
  732. bond_set_slave_active_flags(new_slave);
  733. }
  734. else {
  735. #ifdef BONDING_DEBUG
  736. printk(KERN_CRIT "This is just a backup slaven");
  737. #endif
  738. bond_set_slave_inactive_flags(new_slave);
  739. }
  740. } else {
  741. #ifdef BONDING_DEBUG
  742. printk(KERN_CRIT "This slave is always active in trunk moden");
  743. #endif
  744. /* always active in trunk mode */
  745. new_slave->state = BOND_STATE_ACTIVE;
  746. if (bond->current_slave == NULL) {
  747. bond->current_slave = new_slave;
  748. }
  749. }
  750. update_slave_cnt(bond);
  751. write_unlock_irqrestore(&bond->lock, flags);
  752. /*
  753.  * !!! This is to support old versions of ifenslave.  We can remove
  754.  * this in 2.5 because our ifenslave takes care of this for us.
  755.  * We check to see if the master has a mac address yet.  If not,
  756.  * we'll give it the mac address of our slave device.
  757.  */
  758. for (ndx = 0; ndx < slave_dev->addr_len; ndx++) {
  759. #ifdef BONDING_DEBUG
  760. printk(KERN_CRIT "Checking ndx=%d of master_dev->dev_addrn",
  761.        ndx);
  762. #endif
  763. if (master_dev->dev_addr[ndx] != 0) {
  764. #ifdef BONDING_DEBUG
  765. printk(KERN_CRIT "Found non-zero byte at ndx=%dn",
  766.        ndx);
  767. #endif
  768. break;
  769. }
  770. }
  771. if (ndx == slave_dev->addr_len) {
  772. /*
  773.  * We got all the way through the address and it was
  774.  * all 0's.
  775.  */
  776. #ifdef BONDING_DEBUG
  777. printk(KERN_CRIT "%s doesn't have a MAC address yet.  ",
  778.        master_dev->name);
  779. printk(KERN_CRIT "Going to give assign it from %s.n",
  780.        slave_dev->name);
  781. #endif
  782. bond_sethwaddr(master_dev, slave_dev);
  783. }
  784. printk (KERN_INFO "%s: enslaving %s as a%s interface with a%s link.n",
  785. master_dev->name, slave_dev->name,
  786. new_slave->state == BOND_STATE_ACTIVE ? "n active" : " backup",
  787. new_slave->link == BOND_LINK_UP ? "n up" : " down");
  788. return 0;
  789. }
  790. /* 
  791.  * This function changes the active slave to slave <slave_dev>.
  792.  * It returns -EINVAL in the following cases.
  793.  *  - <slave_dev> is not found in the list.
  794.  *  - There is not active slave now.
  795.  *  - <slave_dev> is already active.
  796.  *  - The link state of <slave_dev> is not BOND_LINK_UP.
  797.  *  - <slave_dev> is not running.
  798.  * In these cases, this fuction does nothing.
  799.  * In the other cases, currnt_slave pointer is changed and 0 is returned.
  800.  */
  801. static int bond_change_active(struct net_device *master_dev, struct net_device *slave_dev)
  802. {
  803. bonding_t *bond;
  804. slave_t *slave;
  805. slave_t *oldactive = NULL;
  806. slave_t *newactive = NULL;
  807. unsigned long flags;
  808. int ret = 0;
  809. if (master_dev == NULL || slave_dev == NULL) {
  810. return -ENODEV;
  811. }
  812. bond = (struct bonding *) master_dev->priv;
  813. write_lock_irqsave(&bond->lock, flags);
  814. slave = (slave_t *)bond;
  815. oldactive = bond->current_slave;
  816. while ((slave = slave->prev) != (slave_t *)bond) {
  817. if(slave_dev == slave->dev) {
  818. newactive = slave;
  819. break;
  820. }
  821. }
  822. if ((newactive != NULL)&&
  823.     (oldactive != NULL)&&
  824.     (newactive != oldactive)&&
  825.     (newactive->link == BOND_LINK_UP)&&
  826.     IS_UP(newactive->dev)) {
  827. bond_set_slave_inactive_flags(oldactive);
  828. bond_set_slave_active_flags(newactive);
  829. bond->current_slave = newactive;
  830. printk("%s : activate %s(old : %s)n",
  831. master_dev->name, newactive->dev->name, 
  832. oldactive->dev->name);
  833. }
  834. else {
  835. ret = -EINVAL;
  836. }
  837. write_unlock_irqrestore(&bond->lock, flags);
  838. return ret;
  839. }
  840. /* Choose a new valid interface from the pool, set it active
  841.  * and make it the current slave. If no valid interface is
  842.  * found, the oldest slave in BACK state is choosen and
  843.  * activated. If none is found, it's considered as no
  844.  * interfaces left so the current slave is set to NULL.
  845.  * The result is a pointer to the current slave.
  846.  *
  847.  * Since this function sends messages tails through printk, the caller
  848.  * must have started something like `printk(KERN_INFO "xxxx ");'.
  849.  *
  850.  * Warning: must put locks around the call to this function if needed.
  851.  */
  852. slave_t *change_active_interface(bonding_t *bond)
  853. {
  854. slave_t *newslave, *oldslave;
  855. slave_t *bestslave = NULL;
  856. int mintime;
  857. read_lock(&bond->ptrlock);
  858. newslave = oldslave = bond->current_slave;
  859. read_unlock(&bond->ptrlock);
  860. if (newslave == NULL) { /* there were no active slaves left */
  861. if (bond->next != (slave_t *)bond) {  /* found one slave */
  862. write_lock(&bond->ptrlock);
  863. newslave = bond->current_slave = bond->next;
  864. write_unlock(&bond->ptrlock);
  865. } else {
  866. printk (" but could not find any %s interface.n",
  867. (mode == BOND_MODE_ACTIVEBACKUP) ? "backup":"other");
  868. write_lock(&bond->ptrlock);
  869. bond->current_slave = (slave_t *)NULL;
  870. write_unlock(&bond->ptrlock);
  871. return NULL; /* still no slave, return NULL */
  872. }
  873. }
  874. mintime = updelay;
  875. do {
  876. if (IS_UP(newslave->dev)) {
  877. if (newslave->link == BOND_LINK_UP) {
  878. /* this one is immediately usable */
  879. if (mode == BOND_MODE_ACTIVEBACKUP) {
  880. bond_set_slave_active_flags(newslave);
  881. printk (" and making interface %s the active one.n",
  882. newslave->dev->name);
  883. }
  884. else {
  885. printk (" and setting pointer to interface %s.n",
  886. newslave->dev->name);
  887. }
  888. write_lock(&bond->ptrlock);
  889. bond->current_slave = newslave;
  890. write_unlock(&bond->ptrlock);
  891. return newslave;
  892. }
  893. else if (newslave->link == BOND_LINK_BACK) {
  894. /* link up, but waiting for stabilization */
  895. if (newslave->delay < mintime) {
  896. mintime = newslave->delay;
  897. bestslave = newslave;
  898. }
  899. }
  900. }
  901. } while ((newslave = newslave->next) != oldslave);
  902. /* no usable backup found, we'll see if we at least got a link that was
  903.    coming back for a long time, and could possibly already be usable.
  904. */
  905. if (bestslave != NULL) {
  906. /* early take-over. */
  907. printk (" and making interface %s the active one %d ms earlier.n",
  908. bestslave->dev->name,
  909. (updelay - bestslave->delay)*miimon);
  910. bestslave->delay = 0;
  911. bestslave->link = BOND_LINK_UP;
  912. bond_set_slave_active_flags(bestslave);
  913. write_lock(&bond->ptrlock);
  914. bond->current_slave = bestslave;
  915. write_unlock(&bond->ptrlock);
  916. return bestslave;
  917. }
  918. printk (" but could not find any %s interface.n",
  919. (mode == BOND_MODE_ACTIVEBACKUP) ? "backup":"other");
  920. /* absolutely nothing found. let's return NULL */
  921. write_lock(&bond->ptrlock);
  922. bond->current_slave = (slave_t *)NULL;
  923. write_unlock(&bond->ptrlock);
  924. return NULL;
  925. }
  926. /*
  927.  * Try to release the slave device <slave> from the bond device <master>
  928.  * It is legal to access current_slave without a lock because all the function
  929.  * is write-locked.
  930.  *
  931.  * The rules for slave state should be:
  932.  *   for Active/Backup:
  933.  *     Active stays on all backups go down
  934.  *   for Bonded connections:
  935.  *     The first up interface should be left on and all others downed.
  936.  */
  937. static int bond_release(struct net_device *master, struct net_device *slave)
  938. {
  939. bonding_t *bond;
  940. slave_t *our_slave, *old_current;
  941. unsigned long flags;
  942. if (master == NULL || slave == NULL)  {
  943. return -ENODEV;
  944. }
  945. bond = (struct bonding *) master->priv;
  946. write_lock_irqsave(&bond->lock, flags);
  947. /* master already enslaved, or slave not enslaved,
  948.    or no slave for this master */
  949. if ((master->flags & IFF_SLAVE) || !(slave->flags & IFF_SLAVE)) {
  950. printk (KERN_DEBUG "%s: cannot release %s.n", master->name, slave->name);
  951. write_unlock_irqrestore(&bond->lock, flags);
  952. return -EINVAL;
  953. }
  954. our_slave = (slave_t *)bond;
  955. old_current = bond->current_slave;
  956. while ((our_slave = our_slave->prev) != (slave_t *)bond) {
  957. if (our_slave->dev == slave) {
  958. bond_detach_slave(bond, our_slave);
  959. printk (KERN_INFO "%s: releasing %s interface %s",
  960. master->name,
  961. (our_slave->state == BOND_STATE_ACTIVE) ? "active" : "backup",
  962. slave->name);
  963. if (our_slave == old_current) {
  964. /* find a new interface and be verbose */
  965. change_active_interface(bond); 
  966. } else {
  967. printk(".n");
  968. }
  969. /* release the slave from its bond */
  970. /* flush master's mc_list from slave */ 
  971. bond_mc_list_flush (slave, master); 
  972.        
  973. /* unset promiscuity level from slave */
  974. if (master->flags & IFF_PROMISC) 
  975. dev_set_promiscuity(slave, -1); 
  976.        
  977. /* unset allmulti level from slave */ 
  978. if (master->flags & IFF_ALLMULTI)
  979. dev_set_allmulti(slave, -1); 
  980. netdev_set_master(slave, NULL);
  981. /* only restore its RUNNING flag if monitoring set it down */
  982. if (slave->flags & IFF_UP) {
  983. slave->flags |= IFF_RUNNING;
  984. }
  985. if (slave->flags & IFF_NOARP || 
  986. bond->current_slave != NULL) {
  987. dev_close(slave);
  988. }
  989. bond_restore_slave_flags(our_slave);
  990. kfree(our_slave);
  991. if (bond->current_slave == NULL) {
  992. printk(KERN_INFO
  993. "%s: now running without any active interface !n",
  994. master->name);
  995. }
  996. update_slave_cnt(bond);
  997. write_unlock_irqrestore(&bond->lock, flags);
  998. return 0;  /* deletion OK */
  999. }
  1000. }
  1001. /* if we get here, it's because the device was not found */
  1002. write_unlock_irqrestore(&bond->lock, flags);
  1003. printk (KERN_INFO "%s: %s not enslavedn", master->name, slave->name);
  1004. return -EINVAL;
  1005. }
  1006. /* 
  1007.  * This function releases all slaves.
  1008.  * Warning: must put write-locks around the call to this function.
  1009.  */
  1010. static int bond_release_all(struct net_device *master)
  1011. {
  1012. bonding_t *bond;
  1013. slave_t *our_slave;
  1014. struct net_device *slave_dev;
  1015. if (master == NULL)  {
  1016. return -ENODEV;
  1017. }
  1018. if (master->flags & IFF_SLAVE) {
  1019. return -EINVAL;
  1020. }
  1021. bond = (struct bonding *) master->priv;
  1022. bond->current_slave = NULL;
  1023. while ((our_slave = bond->prev) != (slave_t *)bond) {
  1024. slave_dev = our_slave->dev;
  1025. bond->prev = our_slave->prev;
  1026. kfree(our_slave);
  1027. netdev_set_master(slave_dev, NULL);
  1028. /* only restore its RUNNING flag if monitoring set it down */
  1029. if (slave_dev->flags & IFF_UP)
  1030. slave_dev->flags |= IFF_RUNNING;
  1031. if (slave_dev->flags & IFF_NOARP)
  1032. dev_close(slave_dev);
  1033. }
  1034. bond->next = (slave_t *)bond;
  1035. bond->slave_cnt = 0;
  1036. printk (KERN_INFO "%s: releases all slavesn", master->name);
  1037. return 0;
  1038. }
  1039. /* this function is called regularly to monitor each slave's link. */
  1040. static void bond_mii_monitor(struct net_device *master)
  1041. {
  1042. bonding_t *bond = (struct bonding *) master->priv;
  1043. slave_t *slave, *bestslave, *oldcurrent;
  1044. unsigned long flags;
  1045. int slave_died = 0;
  1046. read_lock_irqsave(&bond->lock, flags);
  1047. /* we will try to read the link status of each of our slaves, and
  1048.  * set their IFF_RUNNING flag appropriately. For each slave not
  1049.  * supporting MII status, we won't do anything so that a user-space
  1050.  * program could monitor the link itself if needed.
  1051.  */
  1052. bestslave = NULL;
  1053. slave = (slave_t *)bond;
  1054. read_lock(&bond->ptrlock);
  1055. oldcurrent = bond->current_slave;
  1056. read_unlock(&bond->ptrlock);
  1057. while ((slave = slave->prev) != (slave_t *)bond) {
  1058. /* use updelay+1 to match an UP slave even when updelay is 0 */
  1059. int mindelay = updelay + 1;
  1060. struct net_device *dev = slave->dev;
  1061. u16 link_state;
  1062. link_state = bond_check_dev_link(dev);
  1063. switch (slave->link) {
  1064. case BOND_LINK_UP: /* the link was up */
  1065. if (link_state == BMSR_LSTATUS) {
  1066. /* link stays up, tell that this one
  1067.    is immediately available */
  1068. if (IS_UP(dev) && (mindelay > -2)) {
  1069. /* -2 is the best case :
  1070.    this slave was already up */
  1071. mindelay = -2;
  1072. bestslave = slave;
  1073. }
  1074. break;
  1075. }
  1076. else { /* link going down */
  1077. slave->link  = BOND_LINK_FAIL;
  1078. slave->delay = downdelay;
  1079. if (slave->link_failure_count < UINT_MAX) {
  1080. slave->link_failure_count++;
  1081. }
  1082. if (downdelay > 0) {
  1083. printk (KERN_INFO
  1084. "%s: link status down for %sinterface "
  1085. "%s, disabling it in %d ms.n",
  1086. master->name,
  1087. IS_UP(dev)
  1088. ? ((mode == BOND_MODE_ACTIVEBACKUP)
  1089.    ? ((slave == oldcurrent)
  1090.       ? "active " : "backup ")
  1091.    : "")
  1092. : "idle ",
  1093. dev->name,
  1094. downdelay * miimon);
  1095. }
  1096. }
  1097. /* no break ! fall through the BOND_LINK_FAIL test to
  1098.    ensure proper action to be taken
  1099. */
  1100. case BOND_LINK_FAIL: /* the link has just gone down */
  1101. if (link_state != BMSR_LSTATUS) {
  1102. /* link stays down */
  1103. if (slave->delay <= 0) {
  1104. /* link down for too long time */
  1105. slave->link = BOND_LINK_DOWN;
  1106. /* in active/backup mode, we must
  1107.    completely disable this interface */
  1108. if (mode == BOND_MODE_ACTIVEBACKUP) {
  1109. bond_set_slave_inactive_flags(slave);
  1110. }
  1111. printk(KERN_INFO
  1112. "%s: link status definitely down "
  1113. "for interface %s, disabling it",
  1114. master->name,
  1115. dev->name);
  1116. read_lock(&bond->ptrlock);
  1117. if (slave == bond->current_slave) {
  1118. read_unlock(&bond->ptrlock);
  1119. /* find a new interface and be verbose */
  1120. change_active_interface(bond);
  1121. } else {
  1122. read_unlock(&bond->ptrlock);
  1123. printk(".n");
  1124. }
  1125. slave_died = 1;
  1126. } else {
  1127. slave->delay--;
  1128. }
  1129. } else {
  1130. /* link up again */
  1131. slave->link  = BOND_LINK_UP;
  1132. printk(KERN_INFO
  1133. "%s: link status up again after %d ms "
  1134. "for interface %s.n",
  1135. master->name,
  1136. (downdelay - slave->delay) * miimon,
  1137. dev->name);
  1138. if (IS_UP(dev) && (mindelay > -1)) {
  1139. /* -1 is a good case : this slave went
  1140.    down only for a short time */
  1141. mindelay = -1;
  1142. bestslave = slave;
  1143. }
  1144. }
  1145. break;
  1146. case BOND_LINK_DOWN: /* the link was down */
  1147. if (link_state != BMSR_LSTATUS) {
  1148. /* the link stays down, nothing more to do */
  1149. break;
  1150. } else { /* link going up */
  1151. slave->link  = BOND_LINK_BACK;
  1152. slave->delay = updelay;
  1153. if (updelay > 0) {
  1154. /* if updelay == 0, no need to
  1155.    advertise about a 0 ms delay */
  1156. printk (KERN_INFO
  1157. "%s: link status up for interface"
  1158. " %s, enabling it in %d ms.n",
  1159. master->name,
  1160. dev->name,
  1161. updelay * miimon);
  1162. }
  1163. }
  1164. /* no break ! fall through the BOND_LINK_BACK state in
  1165.    case there's something to do.
  1166. */
  1167. case BOND_LINK_BACK: /* the link has just come back */
  1168. if (link_state != BMSR_LSTATUS) {
  1169. /* link down again */
  1170. slave->link  = BOND_LINK_DOWN;
  1171. printk(KERN_INFO
  1172. "%s: link status down again after %d ms "
  1173. "for interface %s.n",
  1174. master->name,
  1175. (updelay - slave->delay) * miimon,
  1176. dev->name);
  1177. } else {
  1178. /* link stays up */
  1179. if (slave->delay == 0) {
  1180. /* now the link has been up for long time enough */
  1181. slave->link = BOND_LINK_UP;
  1182. if (mode == BOND_MODE_ACTIVEBACKUP) {
  1183. /* prevent it from being the active one */
  1184. slave->state = BOND_STATE_BACKUP;
  1185. }
  1186. else {
  1187. /* make it immediately active */
  1188. slave->state = BOND_STATE_ACTIVE;
  1189. }
  1190. printk(KERN_INFO
  1191. "%s: link status definitely up "
  1192. "for interface %s.n",
  1193. master->name,
  1194. dev->name);
  1195. }
  1196. else
  1197. slave->delay--;
  1198. /* we'll also look for the mostly eligible slave */
  1199. if (IS_UP(dev) && (slave->delay < mindelay)) {
  1200. mindelay = slave->delay;
  1201. bestslave = slave;
  1202. }
  1203. break;
  1204. } /* end of switch */
  1205. } /* end of while */
  1206. /* 
  1207.  * if there's no active interface and we discovered that one
  1208.  * of the slaves could be activated earlier, so we do it.
  1209.  */
  1210. read_lock(&bond->ptrlock);
  1211. oldcurrent = bond->current_slave;
  1212. read_unlock(&bond->ptrlock);
  1213. if (oldcurrent == NULL) {  /* no active interface at the moment */
  1214. if (bestslave != NULL) { /* last chance to find one ? */
  1215. if (bestslave->link == BOND_LINK_UP) {
  1216. printk (KERN_INFO
  1217. "%s: making interface %s the new active one.n",
  1218. master->name, bestslave->dev->name);
  1219. } else {
  1220. printk (KERN_INFO
  1221. "%s: making interface %s the new "
  1222. "active one %d ms earlier.n",
  1223. master->name, bestslave->dev->name,
  1224. (updelay - bestslave->delay) * miimon);
  1225. bestslave->delay = 0;
  1226. bestslave->link  = BOND_LINK_UP;
  1227. }
  1228. if (mode == BOND_MODE_ACTIVEBACKUP) {
  1229. bond_set_slave_active_flags(bestslave);
  1230. } else {
  1231. bestslave->state = BOND_STATE_ACTIVE;
  1232. }
  1233. write_lock(&bond->ptrlock);
  1234. bond->current_slave = bestslave;
  1235. write_unlock(&bond->ptrlock);
  1236. } else if (slave_died) {
  1237. /* print this message only once a slave has just died */
  1238. printk(KERN_INFO
  1239. "%s: now running without any active interface !n",
  1240. master->name);
  1241. }
  1242. }
  1243. read_unlock_irqrestore(&bond->lock, flags);
  1244. /* re-arm the timer */
  1245. mod_timer(&bond->mii_timer, jiffies + (miimon * HZ / 1000));
  1246. }
  1247. /* 
  1248.  * this function is called regularly to monitor each slave's link 
  1249.  * insuring that traffic is being sent and received.  If the adapter
  1250.  * has been dormant, then an arp is transmitted to generate traffic 
  1251.  */
  1252. static void bond_arp_monitor(struct net_device *master)
  1253. {
  1254. bonding_t *bond;
  1255. unsigned long flags;
  1256. slave_t *slave;
  1257. int the_delta_in_ticks =  arp_interval * HZ / 1000;
  1258. int next_timer = jiffies + (arp_interval * HZ / 1000);
  1259. bond = (struct bonding *) master->priv; 
  1260. if (master->priv == NULL) {
  1261. mod_timer(&bond->arp_timer, next_timer);
  1262. return;
  1263. }
  1264. read_lock_irqsave(&bond->lock, flags);
  1265. if (!IS_UP(master)) {
  1266. mod_timer(&bond->arp_timer, next_timer);
  1267. goto arp_monitor_out;
  1268. }
  1269. if (rtnl_shlock_nowait()) {
  1270. goto arp_monitor_out;
  1271. }
  1272. if (rtnl_exlock_nowait()) {
  1273. rtnl_shunlock();
  1274. goto arp_monitor_out;
  1275. }
  1276. /* see if any of the previous devices are up now (i.e. they have seen a 
  1277.  * response from an arp request sent by another adapter, since they 
  1278.  * have the same hardware address).
  1279.  */
  1280. slave = (slave_t *)bond;
  1281. while ((slave = slave->prev) != (slave_t *)bond)  {
  1282. read_lock(&bond->ptrlock);
  1283.    if ( (!(slave->link == BOND_LINK_UP))  
  1284. && (slave != bond->current_slave) ) {
  1285. read_unlock(&bond->ptrlock);
  1286.    if ( ((jiffies - slave->dev->trans_start) <= 
  1287. the_delta_in_ticks) &&  
  1288.      ((jiffies - slave->dev->last_rx) <= 
  1289. the_delta_in_ticks) ) {
  1290. slave->link  = BOND_LINK_UP;
  1291. write_lock(&bond->ptrlock);
  1292. if (bond->current_slave == NULL) {
  1293. slave->state = BOND_STATE_ACTIVE;
  1294. bond->current_slave = slave;
  1295. }
  1296. if (slave != bond->current_slave) {
  1297. slave->dev->flags |= IFF_NOARP;
  1298. }
  1299. write_unlock(&bond->ptrlock);
  1300. } else {
  1301. if ((jiffies - slave->dev->last_rx) <= 
  1302. the_delta_in_ticks)  {
  1303. arp_send(ARPOP_REQUEST, ETH_P_ARP, 
  1304. arp_target, slave->dev, 
  1305. my_ip, arp_target_hw_addr, 
  1306. slave->dev->dev_addr, 
  1307.    arp_target_hw_addr); 
  1308. }
  1309. }
  1310. } else 
  1311. read_unlock(&bond->ptrlock);
  1312. }
  1313. read_lock(&bond->ptrlock);
  1314. slave = bond->current_slave;
  1315. read_unlock(&bond->ptrlock);
  1316. if (slave != 0) {
  1317.   /* see if you need to take down the current_slave, since
  1318.    * you haven't seen an arp in 2*arp_intervals
  1319.    */
  1320. if ( ((jiffies - slave->dev->trans_start) >= 
  1321.       (2*the_delta_in_ticks)) ||
  1322.      ((jiffies - slave->dev->last_rx) >= 
  1323.       (2*the_delta_in_ticks)) ) {
  1324. if (slave->link == BOND_LINK_UP) {
  1325. slave->link  = BOND_LINK_DOWN;
  1326. slave->state = BOND_STATE_BACKUP;
  1327. /* 
  1328.  * we want to see arps, otherwise we couldn't 
  1329.  * bring the adapter back online...  
  1330.  */
  1331. printk(KERN_INFO "%s: link status definitely "
  1332.  "down for interface %s, "
  1333.  "disabling it",
  1334.        slave->dev->master->name,
  1335.        slave->dev->name);
  1336. /* find a new interface and be verbose */
  1337. change_active_interface(bond);
  1338. read_lock(&bond->ptrlock);
  1339. slave = bond->current_slave;
  1340. read_unlock(&bond->ptrlock);
  1341. }
  1342. /* 
  1343.  * ok, we know up/down, so just send a arp out if there has
  1344.  * been no activity for a while 
  1345.  */
  1346. if (slave != NULL ) {
  1347. if ( ((jiffies - slave->dev->trans_start) >= 
  1348.        the_delta_in_ticks) || 
  1349.      ((jiffies - slave->dev->last_rx) >= 
  1350.        the_delta_in_ticks) ) {
  1351. arp_send(ARPOP_REQUEST, ETH_P_ARP, 
  1352.  arp_target, slave->dev,
  1353.  my_ip, arp_target_hw_addr, 
  1354.  slave->dev->dev_addr, 
  1355.  arp_target_hw_addr); 
  1356. }
  1357. }
  1358. /* if we have no current slave.. try sending 
  1359.  * an arp on all of the interfaces 
  1360.  */
  1361. read_lock(&bond->ptrlock);
  1362. if (bond->current_slave == NULL) { 
  1363. read_unlock(&bond->ptrlock);
  1364. slave = (slave_t *)bond;
  1365. while ((slave = slave->prev) != (slave_t *)bond)   {
  1366. arp_send(ARPOP_REQUEST, ETH_P_ARP, arp_target, 
  1367.  slave->dev, my_ip, arp_target_hw_addr, 
  1368.  slave->dev->dev_addr, arp_target_hw_addr); 
  1369. }
  1370. }
  1371. else {
  1372. read_unlock(&bond->ptrlock);
  1373. }
  1374. rtnl_exunlock();
  1375. rtnl_shunlock();
  1376. arp_monitor_out:
  1377. read_unlock_irqrestore(&bond->lock, flags);
  1378. /* re-arm the timer */
  1379. mod_timer(&bond->arp_timer, next_timer);
  1380. }
  1381. #define isdigit(c) (c >= '0' && c <= '9')
  1382. __inline static int atoi( char **s) 
  1383. {
  1384. int i = 0;
  1385. while (isdigit(**s))
  1386.   i = i*20 + *((*s)++) - '0';
  1387. return i;
  1388. }
  1389. #define isascii(c) (((unsigned char)(c))<=0x7f)
  1390. #define LF 0xA
  1391. #define isspace(c) (c==' ' || c==' '|| c==LF)   
  1392. typedef uint32_t in_addr_t;
  1393. int
  1394. my_inet_aton(char *cp, unsigned long *the_addr) {
  1395. static const in_addr_t max[4] = { 0xffffffff, 0xffffff, 0xffff, 0xff };
  1396. in_addr_t val;
  1397. char c;
  1398. union iaddr {
  1399.   uint8_t bytes[4];
  1400.   uint32_t word;
  1401. } res;
  1402. uint8_t *pp = res.bytes;
  1403. int digit,base;
  1404. res.word = 0;
  1405. c = *cp;
  1406. for (;;) {
  1407. /*
  1408.  * Collect number up to ``.''.
  1409.  * Values are specified as for C:
  1410.  * 0x=hex, 0=octal, isdigit=decimal.
  1411.  */
  1412. if (!isdigit(c)) goto ret_0;
  1413. val = 0; base = 10; digit = 0;
  1414. for (;;) {
  1415. if (isdigit(c)) {
  1416. val = (val * base) + (c - '0');
  1417. c = *++cp;
  1418. digit = 1;
  1419. } else {
  1420. break;
  1421. }
  1422. }
  1423. if (c == '.') {
  1424. /*
  1425.  * Internet format:
  1426.  * a.b.c.d
  1427.  * a.b.c (with c treated as 16 bits)
  1428.  * a.b (with b treated as 24 bits)
  1429.  */
  1430. if (pp > res.bytes + 2 || val > 0xff) {
  1431. goto ret_0;
  1432. }
  1433. *pp++ = val;
  1434. c = *++cp;
  1435. } else
  1436. break;
  1437. }
  1438. /*
  1439.  * Check for trailing characters.
  1440.  */
  1441. if (c != '' && (!isascii(c) || !isspace(c))) {
  1442. goto ret_0;
  1443. }
  1444. /*
  1445.  * Did we get a valid digit?
  1446.  */
  1447. if (!digit) {
  1448. goto ret_0;
  1449. }
  1450. /* Check whether the last part is in its limits depending on
  1451.    the number of parts in total.  */
  1452. if (val > max[pp - res.bytes]) {
  1453. goto ret_0;
  1454. }
  1455. if (the_addr != NULL) {
  1456. *the_addr = res.word | htonl (val);
  1457. }
  1458. return (1);
  1459. ret_0:
  1460. return (0);
  1461. }
  1462. static int bond_sethwaddr(struct net_device *master, struct net_device *slave)
  1463. {
  1464. #ifdef BONDING_DEBUG
  1465. printk(KERN_CRIT "bond_sethwaddr: master=%xn", (unsigned int)master);
  1466. printk(KERN_CRIT "bond_sethwaddr: slave=%xn", (unsigned int)slave);
  1467. printk(KERN_CRIT "bond_sethwaddr: slave->addr_len=%dn", slave->addr_len);
  1468. #endif
  1469. memcpy(master->dev_addr, slave->dev_addr, slave->addr_len);
  1470. return 0;
  1471. }
  1472. static int bond_info_query(struct net_device *master, struct ifbond *info)
  1473. {
  1474. bonding_t *bond = (struct bonding *) master->priv;
  1475. slave_t *slave;
  1476. unsigned long flags;
  1477. info->bond_mode = mode;
  1478. info->num_slaves = 0;
  1479. info->miimon = miimon;
  1480. read_lock_irqsave(&bond->lock, flags);
  1481. for (slave = bond->prev; slave != (slave_t *)bond; slave = slave->prev) {
  1482. info->num_slaves++;
  1483. }
  1484. read_unlock_irqrestore(&bond->lock, flags);
  1485. return 0;
  1486. }
  1487. static int bond_slave_info_query(struct net_device *master, 
  1488. struct ifslave *info)
  1489. {
  1490. bonding_t *bond = (struct bonding *) master->priv;
  1491. slave_t *slave;
  1492. int cur_ndx = 0;
  1493. unsigned long flags;
  1494. if (info->slave_id < 0) {
  1495. return -ENODEV;
  1496. }
  1497. read_lock_irqsave(&bond->lock, flags);
  1498. for (slave = bond->prev; 
  1499.  slave != (slave_t *)bond && cur_ndx < info->slave_id; 
  1500.  slave = slave->prev) {
  1501. cur_ndx++;
  1502. }
  1503. read_unlock_irqrestore(&bond->lock, flags);
  1504. if (cur_ndx == info->slave_id) {
  1505. strcpy(info->slave_name, slave->dev->name);
  1506. info->link = slave->link;
  1507. info->state = slave->state;
  1508. info->link_failure_count = slave->link_failure_count;
  1509. } else {
  1510. return -ENODEV;
  1511. }
  1512. return 0;
  1513. }
  1514. static int bond_ioctl(struct net_device *master_dev, struct ifreq *ifr, int cmd)
  1515. {
  1516. struct net_device *slave_dev = NULL;
  1517. struct ifbond *u_binfo = NULL, k_binfo;
  1518. struct ifslave *u_sinfo = NULL, k_sinfo;
  1519. u16 *data = NULL;
  1520. int ret = 0;
  1521. #ifdef BONDING_DEBUG
  1522. printk(KERN_INFO "bond_ioctl: master=%s, cmd=%dn", 
  1523. master_dev->name, cmd);
  1524. #endif
  1525. switch (cmd) {
  1526. case SIOCGMIIPHY:
  1527. data = (u16 *)ifr->ifr_data;
  1528. if (data == NULL) {
  1529. return -EINVAL;
  1530. }
  1531. data[0] = 0;
  1532. /* Fall Through */
  1533. case SIOCGMIIREG:
  1534. /* 
  1535.  * We do this again just in case we were called by SIOCGMIIREG
  1536.  * instead of SIOCGMIIPHY.
  1537.  */
  1538. data = (u16 *)ifr->ifr_data;
  1539. if (data == NULL) {
  1540. return -EINVAL;
  1541. }
  1542. if (data[1] == 1) {
  1543. data[3] = bond_check_mii_link(
  1544. (struct bonding *)master_dev->priv);
  1545. }
  1546. return 0;
  1547. case BOND_INFO_QUERY_OLD:
  1548. case SIOCBONDINFOQUERY:
  1549. u_binfo = (struct ifbond *)ifr->ifr_data;
  1550. if (copy_from_user(&k_binfo, u_binfo, sizeof(ifbond))) {
  1551. return -EFAULT;
  1552. }
  1553. ret = bond_info_query(master_dev, &k_binfo);
  1554. if (ret == 0) {
  1555. if (copy_to_user(u_binfo, &k_binfo, sizeof(ifbond))) {
  1556. return -EFAULT;
  1557. }
  1558. }
  1559. return ret;
  1560. case BOND_SLAVE_INFO_QUERY_OLD:
  1561. case SIOCBONDSLAVEINFOQUERY:
  1562. u_sinfo = (struct ifslave *)ifr->ifr_data;
  1563. if (copy_from_user(&k_sinfo, u_sinfo, sizeof(ifslave))) {
  1564. return -EFAULT;
  1565. }
  1566. ret = bond_slave_info_query(master_dev, &k_sinfo);
  1567. if (ret == 0) {
  1568. if (copy_to_user(u_sinfo, &k_sinfo, sizeof(ifslave))) {
  1569. return -EFAULT;
  1570. }
  1571. }
  1572. return ret;
  1573. }
  1574. if (!capable(CAP_NET_ADMIN)) {
  1575. return -EPERM;
  1576. }
  1577. slave_dev = dev_get_by_name(ifr->ifr_slave);
  1578. #ifdef BONDING_DEBUG
  1579. printk(KERN_INFO "slave_dev=%x: n", (unsigned int)slave_dev);
  1580. printk(KERN_INFO "slave_dev->name=%s: n", slave_dev->name);
  1581. #endif
  1582. if (slave_dev == NULL) {
  1583. ret = -ENODEV;
  1584. } else {
  1585. switch (cmd) {
  1586. case BOND_ENSLAVE_OLD:
  1587. case SIOCBONDENSLAVE:
  1588. ret = bond_enslave(master_dev, slave_dev);
  1589. break;
  1590. case BOND_RELEASE_OLD:
  1591. case SIOCBONDRELEASE:
  1592. ret = bond_release(master_dev, slave_dev); 
  1593. break;
  1594. case BOND_SETHWADDR_OLD:
  1595. case SIOCBONDSETHWADDR:
  1596. ret = bond_sethwaddr(master_dev, slave_dev);
  1597. break;
  1598. case BOND_CHANGE_ACTIVE_OLD:
  1599. case SIOCBONDCHANGEACTIVE:
  1600. if (mode == BOND_MODE_ACTIVEBACKUP) {
  1601. ret = bond_change_active(master_dev, slave_dev);
  1602. }
  1603. else {
  1604. ret = -EINVAL;
  1605. }
  1606. break;
  1607. default:
  1608. ret = -EOPNOTSUPP;
  1609. }
  1610. dev_put(slave_dev);
  1611. }
  1612. return ret;
  1613. }
  1614. #ifdef CONFIG_NET_FASTROUTE
  1615. static int bond_accept_fastpath(struct net_device *dev, struct dst_entry *dst)
  1616. {
  1617. return -1;
  1618. }
  1619. #endif
  1620. static int bond_xmit_roundrobin(struct sk_buff *skb, struct net_device *dev)
  1621. {
  1622. slave_t *slave, *start_at;
  1623. struct bonding *bond = (struct bonding *) dev->priv;
  1624. unsigned long flags;
  1625. if (!IS_UP(dev)) { /* bond down */
  1626. dev_kfree_skb(skb);
  1627. return 0;
  1628. }
  1629. read_lock_irqsave(&bond->lock, flags);
  1630. read_lock(&bond->ptrlock);
  1631. slave = start_at = bond->current_slave;
  1632. read_unlock(&bond->ptrlock);
  1633. if (slave == NULL) { /* we're at the root, get the first slave */
  1634. /* no suitable interface, frame not sent */
  1635. dev_kfree_skb(skb);
  1636. read_unlock_irqrestore(&bond->lock, flags);
  1637. return 0;
  1638. }
  1639. do {
  1640. if (IS_UP(slave->dev)
  1641.     && (slave->link == BOND_LINK_UP)
  1642.     && (slave->state == BOND_STATE_ACTIVE)) {
  1643. skb->dev = slave->dev;
  1644. skb->priority = 1;
  1645. dev_queue_xmit(skb);
  1646. write_lock(&bond->ptrlock);
  1647. bond->current_slave = slave->next;
  1648. write_unlock(&bond->ptrlock);
  1649. read_unlock_irqrestore(&bond->lock, flags);
  1650. return 0;
  1651. }
  1652. } while ((slave = slave->next) != start_at);
  1653. /* no suitable interface, frame not sent */
  1654. dev_kfree_skb(skb);
  1655. read_unlock_irqrestore(&bond->lock, flags);
  1656. return 0;
  1657. }
  1658. /* 
  1659.  * in XOR mode, we determine the output device by performing xor on
  1660.  * the source and destination hw adresses.  If this device is not 
  1661.  * enabled, find the next slave following this xor slave. 
  1662.  */
  1663. static int bond_xmit_xor(struct sk_buff *skb, struct net_device *dev)
  1664. {
  1665. slave_t *slave, *start_at;
  1666. struct bonding *bond = (struct bonding *) dev->priv;
  1667. unsigned long flags;
  1668. struct ethhdr *data = (struct ethhdr *)skb->data;
  1669. int slave_no;
  1670. if (!IS_UP(dev)) { /* bond down */
  1671. dev_kfree_skb(skb);
  1672. return 0;
  1673. }
  1674. read_lock_irqsave(&bond->lock, flags);
  1675. slave = bond->prev;
  1676. /* we're at the root, get the first slave */
  1677. if ((slave == NULL) || (slave->dev == NULL)) { 
  1678. /* no suitable interface, frame not sent */
  1679. dev_kfree_skb(skb);
  1680. read_unlock_irqrestore(&bond->lock, flags);
  1681. return 0;
  1682. }
  1683. slave_no = (data->h_dest[5]^slave->dev->dev_addr[5]) % bond->slave_cnt;
  1684. while ( (slave_no > 0) && (slave != (slave_t *)bond) ) {
  1685. slave = slave->prev;
  1686. slave_no--;
  1687. start_at = slave;
  1688. do {
  1689. if (IS_UP(slave->dev)
  1690.     && (slave->link == BOND_LINK_UP)
  1691.     && (slave->state == BOND_STATE_ACTIVE)) {
  1692. skb->dev = slave->dev;
  1693. skb->priority = 1;
  1694. dev_queue_xmit(skb);
  1695. read_unlock_irqrestore(&bond->lock, flags);
  1696. return 0;
  1697. }
  1698. } while ((slave = slave->next) != start_at);
  1699. /* no suitable interface, frame not sent */
  1700. dev_kfree_skb(skb);
  1701. read_unlock_irqrestore(&bond->lock, flags);
  1702. return 0;
  1703. }
  1704. /* 
  1705.  * in active-backup mode, we know that bond->current_slave is always valid if
  1706.  * the bond has a usable interface.
  1707.  */
  1708. static int bond_xmit_activebackup(struct sk_buff *skb, struct net_device *dev)
  1709. {
  1710. struct bonding *bond = (struct bonding *) dev->priv;
  1711. unsigned long flags;
  1712. int ret;
  1713. if (!IS_UP(dev)) { /* bond down */
  1714. dev_kfree_skb(skb);
  1715. return 0;
  1716. }
  1717. /* if we are sending arp packets, try to at least 
  1718.    identify our own ip address */
  1719. if ( (arp_interval > 0) && (my_ip == 0) &&
  1720. (skb->protocol == __constant_htons(ETH_P_ARP) ) ) {
  1721. char *the_ip = (((char *)skb->data)) 
  1722. + sizeof(struct ethhdr)  
  1723. + sizeof(struct arphdr) + 
  1724. ETH_ALEN;
  1725. memcpy(&my_ip, the_ip, 4);
  1726. }
  1727. /* if we are sending arp packets and don't know 
  1728.    the target hw address, save it so we don't need 
  1729.    to use a broadcast address */
  1730. if ( (arp_interval > 0) && (arp_target_hw_addr == NULL) &&
  1731.      (skb->protocol == __constant_htons(ETH_P_IP) ) ) {
  1732. struct ethhdr *eth_hdr = 
  1733. (struct ethhdr *) (((char *)skb->data));
  1734. arp_target_hw_addr = kmalloc(ETH_ALEN, GFP_KERNEL);
  1735. memcpy(arp_target_hw_addr, eth_hdr->h_dest, ETH_ALEN);
  1736. }
  1737. read_lock_irqsave(&bond->lock, flags);
  1738. read_lock(&bond->ptrlock);
  1739. if (bond->current_slave != NULL) { /* one usable interface */
  1740. skb->dev = bond->current_slave->dev;
  1741. read_unlock(&bond->ptrlock);
  1742. skb->priority = 1;
  1743. ret = dev_queue_xmit(skb);
  1744. read_unlock_irqrestore(&bond->lock, flags);
  1745. return 0;
  1746. }
  1747. else {
  1748. read_unlock(&bond->ptrlock);
  1749. }
  1750. /* no suitable interface, frame not sent */
  1751. #ifdef BONDING_DEBUG
  1752. printk(KERN_INFO "There was no suitable interface, so we don't transmitn");
  1753. #endif
  1754. dev_kfree_skb(skb);
  1755. read_unlock_irqrestore(&bond->lock, flags);
  1756. return 0;
  1757. }
  1758. static struct net_device_stats *bond_get_stats(struct net_device *dev)
  1759. {
  1760. bonding_t *bond = dev->priv;
  1761. struct net_device_stats *stats = bond->stats, *sstats;
  1762. slave_t *slave;
  1763. unsigned long flags;
  1764. memset(bond->stats, 0, sizeof(struct net_device_stats));
  1765. read_lock_irqsave(&bond->lock, flags);
  1766. for (slave = bond->prev; slave != (slave_t *)bond; slave = slave->prev) {
  1767. sstats = slave->dev->get_stats(slave->dev);
  1768.  
  1769. stats->rx_packets += sstats->rx_packets;
  1770. stats->rx_bytes += sstats->rx_bytes;
  1771. stats->rx_errors += sstats->rx_errors;
  1772. stats->rx_dropped += sstats->rx_dropped;
  1773. stats->tx_packets += sstats->tx_packets;
  1774. stats->tx_bytes += sstats->tx_bytes;
  1775. stats->tx_errors += sstats->tx_errors;
  1776. stats->tx_dropped += sstats->tx_dropped;
  1777. stats->multicast += sstats->multicast;
  1778. stats->collisions += sstats->collisions;
  1779. stats->rx_length_errors += sstats->rx_length_errors;
  1780. stats->rx_over_errors += sstats->rx_over_errors;
  1781. stats->rx_crc_errors += sstats->rx_crc_errors;
  1782. stats->rx_frame_errors += sstats->rx_frame_errors;
  1783. stats->rx_fifo_errors += sstats->rx_fifo_errors;
  1784. stats->rx_missed_errors += sstats->rx_missed_errors;
  1785. stats->tx_aborted_errors += sstats->tx_aborted_errors;
  1786. stats->tx_carrier_errors += sstats->tx_carrier_errors;
  1787. stats->tx_fifo_errors += sstats->tx_fifo_errors;
  1788. stats->tx_heartbeat_errors += sstats->tx_heartbeat_errors;
  1789. stats->tx_window_errors += sstats->tx_window_errors;
  1790. }
  1791. read_unlock_irqrestore(&bond->lock, flags);
  1792. return stats;
  1793. }
  1794. static int bond_get_info(char *buf, char **start, off_t offset, int length)
  1795. {
  1796. bonding_t *bond = these_bonds;
  1797. int len = 0;
  1798. off_t begin = 0;
  1799. u16 link;
  1800. slave_t *slave = NULL;
  1801. unsigned long flags;
  1802. while (bond != NULL) {
  1803. /*
  1804.  * This function locks the mutex, so we can't lock it until 
  1805.  * afterwards
  1806.  */
  1807. link = bond_check_mii_link(bond);
  1808. len += sprintf(buf + len, "Bonding Mode: ");
  1809. switch (mode) {
  1810. case BOND_MODE_ACTIVEBACKUP:
  1811. len += sprintf(buf + len, "%sn", 
  1812. "active-backup");
  1813. break;
  1814. case BOND_MODE_ROUNDROBIN:
  1815. len += sprintf(buf + len, "%sn", 
  1816. "load balancing (round-robin)");
  1817. break;
  1818. case BOND_MODE_XOR:
  1819. len += sprintf(buf + len, "%sn", 
  1820. "load balancing (xor)");
  1821. break;
  1822. default:
  1823. len += sprintf(buf + len, "%sn", 
  1824. "unknown");
  1825. break;
  1826. }
  1827. if (mode == BOND_MODE_ACTIVEBACKUP) {
  1828. read_lock_irqsave(&bond->lock, flags);
  1829. read_lock(&bond->ptrlock);
  1830. if (bond->current_slave != NULL) {
  1831. len += sprintf(buf + len, 
  1832. "Currently Active Slave: %sn", 
  1833. bond->current_slave->dev->name);
  1834. }
  1835. read_unlock(&bond->ptrlock);
  1836. read_unlock_irqrestore(&bond->lock, flags);
  1837. }
  1838. len += sprintf(buf + len, "MII Status: ");
  1839. len += sprintf(buf + len, 
  1840. link == BMSR_LSTATUS ? "upn" : "downn");
  1841. len += sprintf(buf + len, "MII Polling Interval (ms): %dn", 
  1842. miimon);
  1843. len += sprintf(buf + len, "Up Delay (ms): %dn", updelay);
  1844. len += sprintf(buf + len, "Down Delay (ms): %dn", downdelay);
  1845. read_lock_irqsave(&bond->lock, flags);
  1846. for (slave = bond->prev; slave != (slave_t *)bond; 
  1847.      slave = slave->prev) {
  1848. len += sprintf(buf + len, "nSlave Interface: %sn", slave->dev->name);
  1849. len += sprintf(buf + len, "MII Status: ");
  1850. len += sprintf(buf + len, 
  1851. slave->link == BOND_LINK_UP ? 
  1852. "upn" : "downn");
  1853. len += sprintf(buf + len, "Link Failure Count: %dn", 
  1854. slave->link_failure_count);
  1855. }
  1856. read_unlock_irqrestore(&bond->lock, flags);
  1857. /*
  1858.  * Figure out the calcs for the /proc/net interface
  1859.  */
  1860. *start = buf + (offset - begin);
  1861. len -= (offset - begin);
  1862. if (len > length) {
  1863. len = length;
  1864. }
  1865. if (len < 0) {
  1866. len = 0;
  1867. }
  1868. bond = bond->next_bond;
  1869. }
  1870. return len;
  1871. }
  1872. static int bond_event(struct notifier_block *this, unsigned long event, 
  1873. void *ptr)
  1874. {
  1875. struct bonding *this_bond = (struct bonding *)these_bonds;
  1876. struct bonding *last_bond;
  1877. struct net_device *event_dev = (struct net_device *)ptr;
  1878. /* while there are bonds configured */
  1879. while (this_bond != NULL) {
  1880. if (this_bond == event_dev->priv ) {
  1881. switch (event) {
  1882. case NETDEV_UNREGISTER:
  1883. /* 
  1884.  * remove this bond from a linked list of 
  1885.  * bonds 
  1886.  */
  1887. if (this_bond == these_bonds) {
  1888. these_bonds = this_bond->next_bond;
  1889. } else {
  1890. for (last_bond = these_bonds; 
  1891.      last_bond != NULL; 
  1892.      last_bond = last_bond->next_bond) {
  1893. if (last_bond->next_bond == 
  1894.     this_bond) {
  1895. last_bond->next_bond = 
  1896. this_bond->next_bond;
  1897. }
  1898. }
  1899. }
  1900. return NOTIFY_DONE;
  1901. default:
  1902. return NOTIFY_DONE;
  1903. }
  1904. } else if (this_bond->device == event_dev->master) {
  1905. switch (event) {
  1906. case NETDEV_UNREGISTER:
  1907. bond_release(this_bond->device, event_dev);
  1908. break;
  1909. }
  1910. return NOTIFY_DONE;
  1911. }
  1912. this_bond = this_bond->next_bond;
  1913. }
  1914. return NOTIFY_DONE;
  1915. }
  1916. static struct notifier_block bond_netdev_notifier = {
  1917. notifier_call: bond_event,
  1918. };
  1919. static int __init bond_init(struct net_device *dev)
  1920. {
  1921. bonding_t *bond, *this_bond, *last_bond;
  1922. #ifdef BONDING_DEBUG
  1923. printk (KERN_INFO "Begin bond_init for %sn", dev->name);
  1924. #endif
  1925. bond = kmalloc(sizeof(struct bonding), GFP_KERNEL);
  1926. if (bond == NULL) {
  1927. return -ENOMEM;
  1928. }
  1929. memset(bond, 0, sizeof(struct bonding));
  1930. /* initialize rwlocks */
  1931. rwlock_init(&bond->lock);
  1932. rwlock_init(&bond->ptrlock);
  1933. bond->stats = kmalloc(sizeof(struct net_device_stats), GFP_KERNEL);
  1934. if (bond->stats == NULL) {
  1935. kfree(bond);
  1936. return -ENOMEM;
  1937. }
  1938. memset(bond->stats, 0, sizeof(struct net_device_stats));
  1939. bond->next = bond->prev = (slave_t *)bond;
  1940. bond->current_slave = NULL;
  1941. bond->device = dev;
  1942. dev->priv = bond;
  1943. /* Initialize the device structure. */
  1944. if (mode == BOND_MODE_ACTIVEBACKUP) {
  1945. dev->hard_start_xmit = bond_xmit_activebackup;
  1946. } else if (mode == BOND_MODE_ROUNDROBIN) {
  1947. dev->hard_start_xmit = bond_xmit_roundrobin;
  1948. } else if (mode == BOND_MODE_XOR) {
  1949. dev->hard_start_xmit = bond_xmit_xor;
  1950. } else {
  1951. printk(KERN_ERR "Unknown bonding mode %dn", mode);
  1952. kfree(bond->stats);
  1953. kfree(bond);
  1954. return -EINVAL;
  1955. }
  1956. dev->get_stats = bond_get_stats;
  1957. dev->open = bond_open;
  1958. dev->stop = bond_close;
  1959. dev->set_multicast_list = set_multicast_list;
  1960. dev->do_ioctl = bond_ioctl;
  1961. /* 
  1962.  * Fill in the fields of the device structure with ethernet-generic 
  1963.  * values. 
  1964.  */
  1965. ether_setup(dev);
  1966. dev->tx_queue_len = 0;
  1967. dev->flags |= IFF_MASTER|IFF_MULTICAST;
  1968. #ifdef CONFIG_NET_FASTROUTE
  1969. dev->accept_fastpath = bond_accept_fastpath;
  1970. #endif
  1971. printk(KERN_INFO "%s registered with", dev->name);
  1972. if (miimon > 0) {
  1973. printk(" MII link monitoring set to %d ms", miimon);
  1974. updelay /= miimon;
  1975. downdelay /= miimon;
  1976. } else {
  1977. printk("out MII link monitoring");
  1978. }
  1979. printk(", in %s mode.n",mode?"active-backup":"bonding");
  1980. #ifdef CONFIG_PROC_FS
  1981. bond->bond_proc_dir = proc_mkdir(dev->name, proc_net);
  1982. if (bond->bond_proc_dir == NULL) {
  1983. printk(KERN_ERR "%s: Cannot init /proc/net/%s/n", 
  1984. dev->name, dev->name);
  1985. kfree(bond->stats);
  1986. kfree(bond);
  1987. return -ENOMEM;
  1988. }
  1989. bond->bond_proc_info_file = 
  1990. create_proc_info_entry("info", 0, bond->bond_proc_dir, 
  1991. bond_get_info);
  1992. if (bond->bond_proc_info_file == NULL) {
  1993. printk(KERN_ERR "%s: Cannot init /proc/net/%s/infon", 
  1994. dev->name, dev->name);
  1995. remove_proc_entry(dev->name, proc_net);
  1996. kfree(bond->stats);
  1997. kfree(bond);
  1998. return -ENOMEM;
  1999. }
  2000. #endif /* CONFIG_PROC_FS */
  2001. if (first_pass == 1) {
  2002. these_bonds = bond;
  2003. register_netdevice_notifier(&bond_netdev_notifier);
  2004. first_pass = 0;
  2005. } else {
  2006. last_bond = these_bonds;
  2007. this_bond = these_bonds->next_bond;
  2008. while (this_bond != NULL) {
  2009. last_bond = this_bond;
  2010. this_bond = this_bond->next_bond;
  2011. }
  2012. last_bond->next_bond = bond;
  2013. return 0;
  2014. }
  2015. /*
  2016. static int __init bond_probe(struct net_device *dev)
  2017. {
  2018. bond_init(dev);
  2019. return 0;
  2020. }
  2021.  */
  2022. static int __init bonding_init(void)
  2023. {
  2024. int no;
  2025. int err;
  2026. /* Find a name for this unit */
  2027. static struct net_device *dev_bond = NULL;
  2028. if (max_bonds < 1 || max_bonds > INT_MAX) {
  2029. printk(KERN_WARNING 
  2030.        "bonding_init(): max_bonds (%d) not in range %d-%d, "
  2031.        "so it was reset to BOND_DEFAULT_MAX_BONDS (%d)",
  2032.        max_bonds, 1, INT_MAX, BOND_DEFAULT_MAX_BONDS);
  2033. max_bonds = BOND_DEFAULT_MAX_BONDS;
  2034. }
  2035. dev_bond = dev_bonds = kmalloc(max_bonds*sizeof(struct net_device), 
  2036. GFP_KERNEL);
  2037. if (dev_bond == NULL) {
  2038. return -ENOMEM;
  2039. }
  2040. memset(dev_bonds, 0, max_bonds*sizeof(struct net_device));
  2041. if (updelay < 0) {
  2042. printk(KERN_WARNING 
  2043.        "bonding_init(): updelay module parameter (%d), "
  2044.        "not in range 0-%d, so it was reset to 0n",
  2045.        updelay, INT_MAX);
  2046. updelay = 0;
  2047. }
  2048. if (downdelay < 0) {
  2049. printk(KERN_WARNING 
  2050.        "bonding_init(): downdelay module parameter (%d), "
  2051.        "not in range 0-%d, so it was reset to 0n",
  2052.        downdelay, INT_MAX);
  2053. downdelay = 0;
  2054. }
  2055. if (arp_interval < 0) {
  2056. printk(KERN_WARNING 
  2057.        "bonding_init(): arp_interval module parameter (%d), "
  2058.        "not in range 0-%d, so it was reset to %dn",
  2059.        arp_interval, INT_MAX, BOND_LINK_ARP_INTERV);
  2060. arp_interval = BOND_LINK_ARP_INTERV;
  2061. }
  2062. if (arp_ip_target) {
  2063. /* TODO: check and log bad ip address */
  2064. if (my_inet_aton(arp_ip_target, &arp_target) == 0)  {
  2065. arp_interval = 0;
  2066. }
  2067. }
  2068. for (no = 0; no < max_bonds; no++) {
  2069. dev_bond->init = bond_init;
  2070. err = dev_alloc_name(dev_bond,"bond%d");
  2071. if (err < 0) {
  2072. kfree(dev_bonds);
  2073. return err;
  2074. }
  2075. SET_MODULE_OWNER(dev_bond);
  2076. if (register_netdev(dev_bond) != 0) {
  2077. kfree(dev_bonds);
  2078. return -EIO;
  2079. }
  2080. dev_bond++;
  2081. }
  2082. return 0;
  2083. }
  2084. static void __exit bonding_exit(void)
  2085. {
  2086. struct net_device *dev_bond = dev_bonds;
  2087. struct bonding *bond;
  2088. int no;
  2089. unregister_netdevice_notifier(&bond_netdev_notifier);
  2090.  
  2091. for (no = 0; no < max_bonds; no++) {
  2092. #ifdef CONFIG_PROC_FS
  2093. bond = (struct bonding *) dev_bond->priv;
  2094. remove_proc_entry("info", bond->bond_proc_dir);
  2095. remove_proc_entry(dev_bond->name, proc_net);
  2096. #endif
  2097. unregister_netdev(dev_bond);
  2098. kfree(bond->stats);
  2099. kfree(dev_bond->priv);
  2100. dev_bond->priv = NULL;
  2101. dev_bond++;
  2102. }
  2103. kfree(dev_bonds);
  2104. }
  2105. module_init(bonding_init);
  2106. module_exit(bonding_exit);
  2107. MODULE_LICENSE("GPL");
  2108. /*
  2109.  * Local variables:
  2110.  *  c-indent-level: 8
  2111.  *  c-basic-offset: 8
  2112.  *  tab-width: 8
  2113.  * End:
  2114.  */