Ubuntu 16.04 (Xenial) многократная блокировка процессора
Я преследовал эту проблему около 6 недель, с тех пор, как я перешел на Xenial. Первоначально думал, что это было случайно, но обнаружил с помощью последовательных USB-адаптеров спровоцировал проблему. Неважно, был ли он на плате USB2 или на дополнительной карте USB-E USB3. В результате появятся следующие сообщения на текстовой консоли и / или последовательной консоли (которые я включил в последовательный порт ob-board):
NMI watchdog: Watchdog detected hard LOCKUP on cpu 0
NMI watchdog: Watchdog detected hard LOCKUP on cpu 2
NMI watchdog: Watchdog detected hard LOCKUP on cpu 3
NMI watchdog: Watchdog detected hard LOCKUP on cpu 4
NMI watchdog: Watchdog detected hard LOCKUP on cpu 5
NMI watchdog: Watchdog detected hard LOCKUP on cpu 6
NMI watchdog: Watchdog detected hard LOCKUP on cpu 8
NMI watchdog: Watchdog detected hard LOCKUP on cpu 11
и т.п.
Машина имеет 16 ядер, и все они будут заблокированы в быстрой последовательности, требующей сброса.
Я использовал последнее ядро (linux-image-4.4.0-72-generic). Я пробовал 4.8, но на меня повлияла ошибка MTU ( https://bugs.launchpad.net/ubuntu/+source/linux-hwe-edge/+bug/1679823). Я пробовал 4.10, но в этом есть какая-то ошибка KVM (я также использую несколько виртуальных машин на хосте).
Я попытался заменить память (даже если память ECC), заменить материнскую плату, заменить сетевые карты, но все безрезультатно. Я не смог найти никого, кто бы сообщал о множественной блокировке процессора, не связанной с конкретным процессом пользовательского пространства, поэтому решил, что у меня плохое оборудование.
1 ответ
Я следовал инструкциям по сборке собственного ядра для 4.8 ( https://wiki.ubuntu.com/Kernel/BuildYourOwnKernel) и собрал linux-image-4.8.0-53-generic. Это исправило мои блокировки, проблемы с MTU и отсутствие паники KVM. Так как я потратил 6 недель на устранение неполадок, надеюсь, кто-то найдет это полезным.