Bluetooth: Work around SCO over USB HCI design defect
authorNicolas Cavallari <nicolas.cavallari@green-communications.fr>
Wed, 5 Oct 2022 15:06:21 +0000 (17:06 +0200)
committerLuiz Augusto von Dentz <luiz.von.dentz@intel.com>
Mon, 12 Dec 2022 22:19:23 +0000 (14:19 -0800)
The USB interface between the host and the bluetooth adapter used for
SCO packets uses an USB isochronous endpoint with a fragmentation scheme
that does not tolerate errors.  Except USB isochronous transfers do
not provide a reliable stream with guaranteed delivery. (There is no
retry on error, see USB spec v2.0 5.6 and 8.5.5.)

To fragment a packet, the bluetooth HCI simply splits it in parts and
transfer them as-is.  The receiver is expected to reconstruct the packet
by assuming the first fragment contains the header and parsing its size
field.  There is no error detection either.

If a fragment is lost, the end result is that the kernel is no longer
synchronized and will pass malformed data to the upper layers, since it
has no way to tell if the first fragment is an actual first fragment or
a continuation fragment.  Resynchronization can only happen by luck and
requires an unbounded amount of time.

The typical symptom for a HSP/HFP bluetooth headset is that the
microphone stops working and dmesg contains piles of rate-limited
"Bluetooth: hci0: SCO packet for unknown connection handle XXXX"
errors for an indeterminate amount of time, until the kernel accidentally
resynchronize.

A workaround is to ask the upper layer to prevalidate the first fragment
header.  This is not possible with user channels so this workaround is
disabled in this case.

This problem is the most severe when using an ath3k adapter on an i.MX 6
board, where packet loss occur regularly, possibly because it is an USB1
device connected on an USB2 hub and this is a special case requiring
split transactions.

Signed-off-by: Nicolas Cavallari <nicolas.cavallari@green-communications.fr>
Signed-off-by: Luiz Augusto von Dentz <luiz.von.dentz@intel.com>
drivers/bluetooth/btusb.c

index a9e43425c35f836f967da2402dd75b2c3b96ce87..80f38991ad6fc4631f132be5b4f8c0b187f61e08 100644 (file)
@@ -977,6 +977,34 @@ static int btusb_recv_bulk(struct btusb_data *data, void *buffer, int count)
        return err;
 }
 
+static bool btusb_validate_sco_handle(struct hci_dev *hdev,
+                                     struct hci_sco_hdr *hdr)
+{
+       __u16 handle;
+
+       if (hci_dev_test_flag(hdev, HCI_USER_CHANNEL))
+               // Can't validate, userspace controls everything.
+               return true;
+
+       /*
+        * USB isochronous transfers are not designed to be reliable and may
+        * lose fragments.  When this happens, the next first fragment
+        * encountered might actually be a continuation fragment.
+        * Validate the handle to detect it and drop it, or else the upper
+        * layer will get garbage for a while.
+        */
+
+       handle = hci_handle(__le16_to_cpu(hdr->handle));
+
+       switch (hci_conn_lookup_type(hdev, handle)) {
+       case SCO_LINK:
+       case ESCO_LINK:
+               return true;
+       default:
+               return false;
+       }
+}
+
 static int btusb_recv_isoc(struct btusb_data *data, void *buffer, int count)
 {
        struct sk_buff *skb;
@@ -1009,9 +1037,12 @@ static int btusb_recv_isoc(struct btusb_data *data, void *buffer, int count)
 
                if (skb->len == HCI_SCO_HDR_SIZE) {
                        /* Complete SCO header */
-                       hci_skb_expect(skb) = hci_sco_hdr(skb)->dlen;
+                       struct hci_sco_hdr *hdr = hci_sco_hdr(skb);
 
-                       if (skb_tailroom(skb) < hci_skb_expect(skb)) {
+                       hci_skb_expect(skb) = hdr->dlen;
+
+                       if (skb_tailroom(skb) < hci_skb_expect(skb) ||
+                           !btusb_validate_sco_handle(data->hdev, hdr)) {
                                kfree_skb(skb);
                                skb = NULL;