ipv6: RFC 4884 partial support for SIT/GRE tunnels
authorEric Dumazet <edumazet@google.com>
Sun, 19 Jun 2016 04:52:06 +0000 (21:52 -0700)
committerDavid S. Miller <davem@davemloft.net>
Sun, 19 Jun 2016 05:11:39 +0000 (22:11 -0700)
When receiving an ICMPv4 message containing extensions as
defined in RFC 4884, and translating it to ICMPv6 at SIT
or GRE tunnel, we need some extra manipulation in order
to properly forward the extensions.

This patch only takes care of Time Exceeded messages as they
are the ones that typically carry information from various
routers in a fabric during a traceroute session.

It also avoids complex skb logic if the data_len is not
a multiple of 8.

RFC states :

   The "original datagram" field MUST contain at least 128 octets.
   If the original datagram did not contain 128 octets, the
   "original datagram" field MUST be zero padded to 128 octets.

In practice routers use 128 bytes of original datagram, not more.

Initial translation was added in commit ca15a078bd90
("sit: generate icmpv6 error when receiving icmpv4 error")

Signed-off-by: Eric Dumazet <edumazet@google.com>
Cc: Oussama Ghorbel <ghorbel@pivasoftware.com>
Signed-off-by: David S. Miller <davem@davemloft.net>
include/linux/icmpv6.h
include/uapi/linux/icmp.h
net/ipv4/ip_gre.c
net/ipv6/icmp.c
net/ipv6/sit.c

index 97ae98071a03168b6c98c1e72acf7e6353715480..57086e9fc64c6ce05bf66f632727ceb32250ad92 100644 (file)
@@ -18,7 +18,8 @@ typedef void ip6_icmp_send_t(struct sk_buff *skb, u8 type, u8 code, __u32 info,
                             const struct in6_addr *force_saddr);
 extern int inet6_register_icmp_sender(ip6_icmp_send_t *fn);
 extern int inet6_unregister_icmp_sender(ip6_icmp_send_t *fn);
-int ip6_err_gen_icmpv6_unreach(struct sk_buff *skb, int nhs, int type);
+int ip6_err_gen_icmpv6_unreach(struct sk_buff *skb, int nhs, int type,
+                              unsigned int data_len);
 
 #else
 
index 16fff055f734d06fb4659e6c04dc3039501056f2..fddd9d736284286a3af284624e4cc257a8abd0cc 100644 (file)
@@ -79,6 +79,7 @@ struct icmphdr {
                __be16  __unused;
                __be16  mtu;
        } frag;
+       __u8    reserved[4];
   } un;
 };
 
index ab4cff8e563dd1226af21cea650b3ccdbb122aa4..8eec78f53f9e540c64c0ab4c0f2ac01662c39bd3 100644 (file)
@@ -144,6 +144,7 @@ static void ipgre_err(struct sk_buff *skb, u32 info,
        const struct iphdr *iph;
        const int type = icmp_hdr(skb)->type;
        const int code = icmp_hdr(skb)->code;
+       unsigned int data_len = 0;
        struct ip_tunnel *t;
 
        switch (type) {
@@ -169,6 +170,7 @@ static void ipgre_err(struct sk_buff *skb, u32 info,
        case ICMP_TIME_EXCEEDED:
                if (code != ICMP_EXC_TTL)
                        return;
+               data_len = icmp_hdr(skb)->un.reserved[1] * 4; /* RFC 4884 4.1 */
                break;
 
        case ICMP_REDIRECT:
@@ -189,7 +191,8 @@ static void ipgre_err(struct sk_buff *skb, u32 info,
 
 #if IS_ENABLED(CONFIG_IPV6)
        if (tpi->proto == htons(ETH_P_IPV6) &&
-           !ip6_err_gen_icmpv6_unreach(skb, iph->ihl * 4 + tpi->hdr_len, type))
+           !ip6_err_gen_icmpv6_unreach(skb, iph->ihl * 4 + tpi->hdr_len,
+                                      type, data_len))
                return;
 #endif
 
index 867aebc3424881aa1872be27902ccdc0f5cd320f..fd11f5856ce8ef18b82db913058c99487cd6e431 100644 (file)
@@ -564,16 +564,22 @@ void icmpv6_param_prob(struct sk_buff *skb, u8 code, int pos)
  *  Either an IPv4 header for SIT encap
  *         an IPv4 header + GRE header for GRE encap
  */
-int ip6_err_gen_icmpv6_unreach(struct sk_buff *skb, int nhs, int type)
+int ip6_err_gen_icmpv6_unreach(struct sk_buff *skb, int nhs, int type,
+                              unsigned int data_len)
 {
        struct in6_addr temp_saddr;
        struct rt6_info *rt;
        struct sk_buff *skb2;
+       u32 info = 0;
 
        if (!pskb_may_pull(skb, nhs + sizeof(struct ipv6hdr) + 8))
                return 1;
 
-       skb2 = skb_clone(skb, GFP_ATOMIC);
+       /* RFC 4884 (partial) support for ICMP extensions */
+       if (data_len < 128 || (data_len & 7) || skb->len < data_len)
+               data_len = 0;
+
+       skb2 = data_len ? skb_copy(skb, GFP_ATOMIC) : skb_clone(skb, GFP_ATOMIC);
 
        if (!skb2)
                return 1;
@@ -588,12 +594,26 @@ int ip6_err_gen_icmpv6_unreach(struct sk_buff *skb, int nhs, int type)
                skb2->dev = rt->dst.dev;
 
        ipv6_addr_set_v4mapped(ip_hdr(skb)->saddr, &temp_saddr);
+
+       if (data_len) {
+               /* RFC 4884 (partial) support :
+                * insert 0 padding at the end, before the extensions
+                */
+               __skb_push(skb2, nhs);
+               skb_reset_network_header(skb2);
+               memmove(skb2->data, skb2->data + nhs, data_len - nhs);
+               memset(skb2->data + data_len - nhs, 0, nhs);
+               /* RFC 4884 4.5 : Length is measured in 64-bit words,
+                * and stored in reserved[0]
+                */
+               info = (data_len/8) << 24;
+       }
        if (type == ICMP_TIME_EXCEEDED)
                icmp6_send(skb2, ICMPV6_TIME_EXCEED, ICMPV6_EXC_HOPLIMIT,
-                          0, &temp_saddr);
+                          info, &temp_saddr);
        else
                icmp6_send(skb2, ICMPV6_DEST_UNREACH, ICMPV6_ADDR_UNREACH,
-                          0, &temp_saddr);
+                          info, &temp_saddr);
        if (rt)
                ip6_rt_put(rt);
 
index d7a36114eb50e66bd6f137a566ec2bc7ca93f382..cdd714690f95ee173d72d7bb77ea20fbeb405671 100644 (file)
@@ -484,6 +484,7 @@ static int ipip6_err(struct sk_buff *skb, u32 info)
        const struct iphdr *iph = (const struct iphdr *)skb->data;
        const int type = icmp_hdr(skb)->type;
        const int code = icmp_hdr(skb)->code;
+       unsigned int data_len = 0;
        struct ip_tunnel *t;
        int err;
 
@@ -508,6 +509,7 @@ static int ipip6_err(struct sk_buff *skb, u32 info)
        case ICMP_TIME_EXCEEDED:
                if (code != ICMP_EXC_TTL)
                        return 0;
+               data_len = icmp_hdr(skb)->un.reserved[1] * 4; /* RFC 4884 4.1 */
                break;
        case ICMP_REDIRECT:
                break;
@@ -536,7 +538,7 @@ static int ipip6_err(struct sk_buff *skb, u32 info)
        }
 
        err = 0;
-       if (!ip6_err_gen_icmpv6_unreach(skb, iph->ihl * 4, type))
+       if (!ip6_err_gen_icmpv6_unreach(skb, iph->ihl * 4, type, data_len))
                goto out;
 
        if (t->parms.iph.daddr == 0)