Ubuntu 16.04 (Xenial) многократная блокировка процессора

Я преследовал эту проблему около 6 недель, с тех пор, как я перешел на Xenial. Первоначально думал, что это было случайно, но обнаружил с помощью последовательных USB-адаптеров спровоцировал проблему. Неважно, был ли он на плате USB2 или на дополнительной карте USB-E USB3. В результате появятся следующие сообщения на текстовой консоли и / или последовательной консоли (которые я включил в последовательный порт ob-board):

NMI watchdog: Watchdog detected hard LOCKUP on cpu 0
NMI watchdog: Watchdog detected hard LOCKUP on cpu 2
NMI watchdog: Watchdog detected hard LOCKUP on cpu 3
NMI watchdog: Watchdog detected hard LOCKUP on cpu 4
NMI watchdog: Watchdog detected hard LOCKUP on cpu 5
NMI watchdog: Watchdog detected hard LOCKUP on cpu 6
NMI watchdog: Watchdog detected hard LOCKUP on cpu 8
NMI watchdog: Watchdog detected hard LOCKUP on cpu 11

и т.п.

Машина имеет 16 ядер, и все они будут заблокированы в быстрой последовательности, требующей сброса.

Я использовал последнее ядро ​​(linux-image-4.4.0-72-generic). Я пробовал 4.8, но на меня повлияла ошибка MTU ( https://bugs.launchpad.net/ubuntu/+source/linux-hwe-edge/+bug/1679823). Я пробовал 4.10, но в этом есть какая-то ошибка KVM (я также использую несколько виртуальных машин на хосте).

Я попытался заменить память (даже если память ECC), заменить материнскую плату, заменить сетевые карты, но все безрезультатно. Я не смог найти никого, кто бы сообщал о множественной блокировке процессора, не связанной с конкретным процессом пользовательского пространства, поэтому решил, что у меня плохое оборудование.

1 ответ

Я следовал инструкциям по сборке собственного ядра для 4.8 ( https://wiki.ubuntu.com/Kernel/BuildYourOwnKernel) и собрал linux-image-4.8.0-53-generic. Это исправило мои блокировки, проблемы с MTU и отсутствие паники KVM. Так как я потратил 6 недель на устранение неполадок, надеюсь, кто-то найдет это полезным.

Другие вопросы по тегам