16.04 приостановить возобновление сбоя с диском NVME
Я борюсь 1 неделю с этим + прочитал ~100 статей и все еще не могу решить это.
Kubuntu 16.04 на ThinkPad P50 с двумя дисками NVME на raid1 + nvidia M1000M (с использованием nouveau). Поскольку grub не может установить на диски NVME в raid (ошибка, когда смещение вычислений), я загружаюсь с небольшого физического раздела первого диска, а затем использую другой зашифрованный раздел raid1 для / home и других.
Моя проблема в том, что приостановить не работает. Когда я пытаюсь: pm-suspend, или echo mem > /sys/power/state или systemclt suspend
Это работает (к сожалению, не всегда, но всегда с / sys / power / state), но когда я пытаюсь вернуться из режима ожидания, я даже получаю графический интерфейс, но он зависает. Я могу переключить ALT+CTRL+F1, войти в систему, а затем увидеть сбои raid1 и сумасшедшее количество прерываний, приводящих к увеличению LoadAverage до 10+. Дальнейшее изучение системного журнала показывает, что все компоненты вернулись из состояния ожидания, кроме основного диска, для которого у меня есть следующие ошибки:
Nov 19 11:08:47 arrakis kernel: [ 159.002849] thermal thermal_zone2: failed to read out thermal zone (-5)
Nov 19 11:09:16 arrakis kernel: [ 188.023836] nvme nvme0: I/O 135 QID 2 timeout, aborting
Nov 19 11:09:16 arrakis kernel: [ 188.024027] nvme nvme0: Abort status: 0x0
Nov 19 11:09:16 arrakis kernel: [ 188.055867] nvme nvme1: I/O 66 QID 1 timeout, aborting
Nov 19 11:09:16 arrakis kernel: [ 188.057419] nvme nvme1: Abort status: 0x0
Nov 19 11:09:46 arrakis mdadm[978]: Fail event detected on md device /dev/md4, component device /dev/nvme0n1p4
Nov 19 11:09:46 arrakis kernel: [ 218.041194] nvme nvme0: I/O 135 QID 2 timeout, reset controller
Nov 19 11:09:46 arrakis kernel: [ 218.041564] nvme nvme0: completing aborted command with status: fffffffc
Nov 19 11:09:46 arrakis kernel: [ 218.041569] blk_update_request: I/O error, dev nvme0n1, sector 123734032
Nov 19 11:09:46 arrakis kernel: [ 218.041594] md: super_written gets error=-5
Nov 19 11:09:46 arrakis kernel: [ 218.041599] md/raid1:md4: Disk failure on nvme0n1p4, disabling device.
Nov 19 11:09:46 arrakis kernel: [ 218.041599] md/raid1:md4: Operation continuing on 1 devices.
Nov 19 11:09:47 arrakis kernel: [ 219.065321] nvme nvme1: I/O 66 QID 1 timeout, reset controller
Nov 19 11:09:47 arrakis kernel: [ 219.065864] nvme nvme1: completing aborted command with status: fffffffc
Nov 19 11:09:47 arrakis kernel: [ 219.065869] blk_update_request: I/O error, dev nvme1n1, sector 123734032
Nov 19 11:09:47 arrakis kernel: [ 219.065894] md: super_written gets error=-5
Nov 19 11:09:47 arrakis kernel: [ 219.195902] nvme nvme1: async event result 00010000
Также / cat / proc / mdstat подтверждает, что один диск удален из raid1 (_U).
Пробные ядра: 4.8.2, 4.8, 4.6, по умолчанию (4.4). Опробованные параметры ядра: nomodeset (на самом деле он терпит неудачу с nouveau), noapic, nolapic (удален, не может загрузиться с этим), acpi_osi=Linux (также пусто).
И все та же проблема. BIOS обновлен до новейшей (текущей версии).
Должен ли я считать, что диски NVME еще не очень хорошо поддерживаются в Linux? Под Apple macosx suspend для nvme диск работает нормально, но у меня там только один - так что, может быть, это связано с mdadm / raid?
Пожалуйста помоги.
Спасибо михал
По запросу я добавляю логи.
Я выполнил pm-suspend в 9:24:41. После этого помогает пустой экран и только хард ресет.
м-suspend.log:
sob, 19 lis 2016, 10:45:11 CET: performing suspend
Initial commandline parameters:
nie, 20 lis 2016, 09:24:41 CET: Running hooks for suspend.
Running hook /usr/lib/pm-utils/sleep.d/000kernel-change suspend suspend:
/usr/lib/pm-utils/sleep.d/000kernel-change suspend suspend: success.
Running hook /usr/lib/pm-utils/sleep.d/000record-status suspend suspend:
/usr/lib/pm-utils/sleep.d/000record-status suspend suspend: success.
Running hook /usr/lib/pm-utils/sleep.d/00logging suspend suspend:
Linux arrakis 4.8.2-040802-generic #201610161339 SMP Sun Oct 16 17:41:46 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
Module Size Used by
ctr 16384 6
ccm 20480 3
vmnet 53248 13
fuse 98304 3
vmw_vsock_vmci_transport 28672 0
vsock 36864 1 vmw_vsock_vmci_transport
vmw_vmci 69632 1 vmw_vsock_vmci_transport
nls_utf8 16384 0
vmmon 86016 0
cifs 675840 0
dns_resolver 16384 1 cifs
fscache 61440 1 cifs
ipt_MASQUERADE 16384 7
nf_nat_masquerade_ipv4 16384 1 ipt_MASQUERADE
iptable_nat 16384 1
nf_conntrack_ipv4 20480 1
nf_defrag_ipv4 16384 1 nf_conntrack_ipv4
nf_nat_ipv4 16384 1 iptable_nat
nf_nat 28672 2 nf_nat_masquerade_ipv4,nf_nat_ipv4
nf_conntrack 114688 4 nf_conntrack_ipv4,nf_nat_masquerade_ipv4,nf_nat_ipv4,nf_nat
iptable_filter 16384 0
ip_tables 24576 2 iptable_filter,iptable_nat
x_tables 36864 3 ip_tables,iptable_filter,ipt_MASQUERADE
tun 28672 2
binfmt_misc 20480 1
dm_crypt 24576 1
algif_skcipher 20480 0
af_alg 16384 1 algif_skcipher
arc4 16384 2
dm_mod 114688 3 dm_crypt
intel_rapl 20480 0
x86_pkg_temp_thermal 16384 0
intel_powerclamp 16384 0
coretemp 16384 0
kvm_intel 192512 0
kvm 593920 1 kvm_intel
irqbypass 16384 1 kvm
crct10dif_pclmul 16384 0
iwlmvm 241664 0
crc32_pclmul 16384 0
mac80211 663552 1 iwlmvm
snd_hda_codec_realtek 86016 1
snd_hda_codec_generic 69632 1 snd_hda_codec_realtek
ghash_clmulni_intel 16384 0
uvcvideo 90112 0
videobuf2_vmalloc 16384 1 uvcvideo
videobuf2_memops 16384 1 videobuf2_vmalloc
videobuf2_v4l2 24576 1 uvcvideo
snd_seq_midi 16384 0
aesni_intel 167936 9
snd_seq_midi_event 16384 1 snd_seq_midi
videobuf2_core 40960 2 uvcvideo,videobuf2_v4l2
snd_rawmidi 32768 1 snd_seq_midi
snd_hda_intel 36864 3
aes_x86_64 20480 1 aesni_intel
lrw 16384 1 aesni_intel
iwlwifi 147456 1 iwlmvm
gf128mul 16384 1 lrw
snd_hda_codec 135168 3 snd_hda_intel,snd_hda_codec_generic,snd_hda_codec_realtek
glue_helper 16384 1 aesni_intel
ablk_helper 16384 1 aesni_intel
videodev 180224 3 uvcvideo,videobuf2_core,videobuf2_v4l2
cryptd 24576 4 ablk_helper,ghash_clmulni_intel,aesni_intel
efi_pstore 16384 0
rtsx_pci_ms 20480 0
snd_hda_core 81920 4 snd_hda_intel,snd_hda_codec,snd_hda_codec_generic,snd_hda_codec_realtek
nls_iso8859_1 16384 1
joydev 20480 0
media 40960 2 uvcvideo,videodev
thinkpad_acpi 86016 1
intel_cstate 20480 0
intel_rapl_perf 16384 0
serio_raw 16384 0
efivars 20480 1 efi_pstore
nvram 16384 1 thinkpad_acpi
snd_hwdep 16384 1 snd_hda_codec
memstick 20480 1 rtsx_pci_ms
snd_seq 65536 2 snd_seq_midi_event,snd_seq_midi
cfg80211 589824 3 iwlmvm,iwlwifi,mac80211
snd_pcm 110592 3 snd_hda_intel,snd_hda_codec,snd_hda_core
snd_seq_device 16384 3 snd_seq,snd_rawmidi,snd_seq_midi
snd_timer 32768 2 snd_seq,snd_pcm
mei_me 36864 0
rfkill 24576 6 thinkpad_acpi,cfg80211
snd 86016 17 snd_hda_intel,snd_hwdep,snd_seq,snd_hda_codec,snd_timer,thinkpad_acpi,snd_rawmidi,snd_hda_codec_generic,snd_seq_device,snd_hda_codec_realtek,snd_pcm
mei 102400 1 mei_me
shpchp 36864 0
battery 16384 0
ac 16384 0
soundcore 16384 1 snd
tpm_crb 16384 0
evdev 24576 25
parport_pc 28672 0
ppdev 20480 0
lp 20480 0
parport 49152 3 lp,parport_pc,ppdev
efivarfs 16384 1
autofs4 40960 2
ext4 589824 2
crc16 16384 1 ext4
jbd2 110592 1 ext4
fscrypto 28672 1 ext4
mbcache 16384 3 ext4
raid10 49152 0
raid456 110592 0
async_raid6_recov 20480 1 raid456
async_memcpy 16384 2 raid456,async_raid6_recov
async_pq 16384 2 raid456,async_raid6_recov
async_xor 16384 3 async_pq,raid456,async_raid6_recov
async_tx 16384 5 async_xor,async_pq,raid456,async_memcpy,async_raid6_recov
xor 24576 1 async_xor
raid6_pq 102400 3 async_pq,raid456,async_raid6_recov
libcrc32c 16384 1 raid456
crc32c_generic 16384 0
raid0 20480 0
multipath 16384 0
linear 16384 0
hid_generic 16384 0
usbhid 53248 0
hid 118784 3 hid_generic,usbhid
raid1 36864 1
md_mod 131072 7 raid1,raid10,multipath,linear,raid0,raid456
rtsx_pci_sdmmc 24576 0
mmc_core 147456 1 rtsx_pci_sdmmc
nouveau 1544192 6
mxm_wmi 16384 1 nouveau
i2c_algo_bit 16384 1 nouveau
ttm 98304 1 nouveau
drm_kms_helper 167936 1 nouveau
syscopyarea 16384 1 drm_kms_helper
crc32c_intel 24576 1
e1000e 245760 0
sysfillrect 16384 1 drm_kms_helper
psmouse 131072 0
sysimgblt 16384 1 drm_kms_helper
fb_sys_fops 16384 1 drm_kms_helper
ptp 20480 1 e1000e
pps_core 16384 1 ptp
drm 368640 15 nouveau,ttm,drm_kms_helper
nvme 28672 5
rtsx_pci 57344 2 rtsx_pci_sdmmc,rtsx_pci_ms
ahci 36864 0
nvme_core 53248 8 nvme
libahci 32768 1 ahci
thermal 20480 0
wmi 16384 2 mxm_wmi,nouveau
video 40960 2 thinkpad_acpi,nouveau
fjes 28672 0
button 16384 1 nouveau
total used free shared buff/cache available
Mem: 49367596 625024 47741464 17636 1001108 48157740
Swap: 8388604 0 8388604
/usr/lib/pm-utils/sleep.d/00logging suspend suspend: success.
Running hook /usr/lib/pm-utils/sleep.d/00powersave suspend suspend:
/usr/lib/pm-utils/sleep.d/00powersave suspend suspend: success.
Running hook /etc/pm/sleep.d/10_grub-common suspend suspend:
/etc/pm/sleep.d/10_grub-common suspend suspend: success.
Running hook /etc/pm/sleep.d/10_unattended-upgrades-hibernate suspend suspend:
/etc/pm/sleep.d/10_unattended-upgrades-hibernate suspend suspend: success.
Running hook /usr/lib/pm-utils/sleep.d/40inputattach suspend suspend:
/usr/lib/pm-utils/sleep.d/40inputattach suspend suspend: success.
Running hook /usr/lib/pm-utils/sleep.d/50unload_alx suspend suspend:
/usr/lib/pm-utils/sleep.d/50unload_alx suspend suspend: success.
Running hook /usr/lib/pm-utils/sleep.d/60_wpa_supplicant suspend suspend:
Selected interface 'p2p-dev-wlp4s0'
OK
/usr/lib/pm-utils/sleep.d/60_wpa_supplicant suspend suspend: success.
Running hook /usr/lib/pm-utils/sleep.d/75modules suspend suspend:
/usr/lib/pm-utils/sleep.d/75modules suspend suspend: not applicable.
Running hook /usr/lib/pm-utils/sleep.d/90clock suspend suspend:
/usr/lib/pm-utils/sleep.d/90clock suspend suspend: not applicable.
Running hook /usr/lib/pm-utils/sleep.d/94cpufreq suspend suspend:
/usr/lib/pm-utils/sleep.d/94cpufreq suspend suspend: success.
Running hook /usr/lib/pm-utils/sleep.d/95anacron suspend suspend:
/usr/lib/pm-utils/sleep.d/95anacron suspend suspend: success.
Running hook /usr/lib/pm-utils/sleep.d/95hdparm-apm suspend suspend:
/usr/lib/pm-utils/sleep.d/95hdparm-apm suspend suspend: not applicable.
Running hook /usr/lib/pm-utils/sleep.d/95led suspend suspend:
/usr/lib/pm-utils/sleep.d/95led suspend suspend: success.
Running hook /usr/lib/pm-utils/sleep.d/98video-quirk-db-handler suspend suspend:
Kernel modesetting video driver detected, not using quirks.
/usr/lib/pm-utils/sleep.d/98video-quirk-db-handler suspend suspend: success.
Running hook /usr/lib/pm-utils/sleep.d/99video suspend suspend:
kernel.acpi_video_flags = 0
/usr/lib/pm-utils/sleep.d/99video suspend suspend: success.
Running hook /etc/pm/sleep.d/novatel_3g_suspend suspend suspend:
/etc/pm/sleep.d/novatel_3g_suspend suspend suspend: success.
nie, 20 lis 2016, 09:24:42 CET: performing suspend
/ Вар / Журнал / системный журнал:
Nov 20 09:18:22 arrakis systemd[1]: Started CUPS Scheduler.
Nov 20 09:22:47 arrakis wpa_supplicant[1087]: wlp4s0: WPA: Group rekeying completed with 4e:5e:0c:70:fc:24 [GTK=CCMP]
Nov 20 09:24:23 arrakis systemd[1]: Started CUPS Scheduler.
Nov 20 09:24:23 arrakis org.kde.KScreen[1904]: kscreen: Primary output changed from KScreen::Output(Id: 67 , Name: "eDP-1" ) ( "eDP-1" ) to KScreen::Output(Id: 67 , Name: "eDP-1" ) ( "eDP-1" )
Nov 20 09:24:24 arrakis org.kde.KScreen[1904]: message repeated 15 times: [ kscreen: Primary output changed from KScreen::Output(Id: 67 , Name: "eDP-1" ) ( "eDP-1" ) to KScreen::Output(Id: 67 , Name: "eDP-1" ) ( "eDP-1" )]
Nov 20 09:24:41 arrakis systemd[1]: Started Run anacron jobs.
Nov 20 09:24:41 arrakis anacron[4221]: Anacron 2.3 started on 2016-11-20
Nov 20 09:24:41 arrakis anacron[4221]: Normal exit (0 jobs run)
Nov 20 09:24:41 arrakis systemd[1]: Stopped Run anacron jobs.
Nov 20 09:25:26 arrakis rsyslogd: [origin software="rsyslogd" swVersion="8.16.0" x-pid="915" x-info="http://www.rsyslog.com"] start
Nov 20 09:25:26 arrakis rsyslogd-2222: command 'KLogPermitNonKernelFacility' is currently not permitted - did you already set it via a RainerScript command (v6+ config)? [v8.16.0 try http://www.rsyslog.com/e/2222 ]
В 9:25:26 мы уже можем видеть сообщения после полной перезагрузки - так что ничего интересного в системном журнале. На этот раз у меня не было ошибок журнала диска NVME, у меня оно есть только при приостановке с использованием /sys/power/state (и тогда это почти успешно, потому что я могу вернуться к системе / графическому интерфейсу, но диски не возвращаются).
Также в логах X.org ничего странного - логи такие же, как для последующей корректной перезагрузки.
Что может быть не так? Почему pm-suspend убивает мой ноутбук, а echo mem > /sys/power/state почти нормально работает (кроме дисков?)
Спасибо,