Ubuntu 16.10 проблема с перегревом

Я недавно установил Ubuntu 16.10 и с тех пор Ubuntu перезагружается сам. выход: last | grep "Oct 31" является:

aegefel  tty7         :0               Mon Oct 31 15:15    gone - no logout
reboot   system boot  4.8.0-26-generic Mon Oct 31 15:14   still running
aegefel  tty7         :0               Mon Oct 31 15:02 - down   (00:04)
reboot   system boot  4.8.0-26-generic Mon Oct 31 15:02 - 15:06  (00:04)
aegefel  tty7         :0               Mon Oct 31 14:33 - crash  (00:28)
reboot   system boot  4.8.0-26-generic Mon Oct 31 14:33 - 15:06  (00:33)
aegefel  tty7         :0               Mon Oct 31 14:12 - crash  (00:20)
reboot   system boot  4.8.0-26-generic Mon Oct 31 14:12 - 15:06  (00:54)
aegefel  tty7         :0               Mon Oct 31 13:08 - crash  (01:04)
reboot   system boot  4.8.0-26-generic Mon Oct 31 13:08 - 15:06  (01:58)

Что приводит меня к убеждению, что это вызвано аварией

Я не знаю, с чем это связано, но это случилось, когда я пытался посмотреть фильм или сделал резервную копию

Как мне поступить?

РЕДАКТИРОВАТЬ 1

Команда more /var/log/syslog* дает мне:

Nov  6 18:18:17 aegefel-Akoya-E6424-MD99850 gnome-terminal-[2674]: Allocating size to GtkBox 0x55558d2b47b0 without calling gtk_widget_get_preferred_width/height(). How does the code know the size to allocate?
Nov  6 18:18:17 aegefel-Akoya-E6424-MD99850 gnome-terminal-[2674]: Allocating size to GtkBox 0x55558d2b47b0 without calling gtk_widget_get_preferred_width/height(). How does the code know the size to allocate?
Nov  6 18:18:31 aegefel-Akoya-E6424-MD99850 gnome-terminal-[2674]: Allocating size to GtkBox 0x55558d2b4120 without calling gtk_widget_get_preferred_width/height(). How does the code know the size to allocate?
Nov  6 18:18:31 aegefel-Akoya-E6424-MD99850 gnome-terminal-[2674]: Allocating size to GtkBox 0x55558d2b4120 without calling gtk_widget_get_preferred_width/height(). How does the code know the size to allocate?
Nov  6 18:18:36 aegefel-Akoya-E6424-MD99850 systemd[1]: Starting Stop ureadahead data collection...
Nov  6 18:18:36 aegefel-Akoya-E6424-MD99850 systemd[1]: Started Stop ureadahead data collection.

Тогда ничего не произошло в течение почти 1 минуты, поэтому я полагаю, что компьютер перезагрузился.

Команда ls -alt /var/crash дает мне на сегодня:

total 21672
drwxrwsrwt  2 root     whoopsie     4096 Nov  6 14:26 .
-rwxrwxrwx  1 root     whoopsie        0 Nov  6 14:26 .lock

РЕДАКТИРОВАТЬ 2

Это добавляется только тогда, когда мой процессор используется на 40% - 50% или более (мой процессор - Intel Core i5 6267U 2,9 ГГц)

РЕДАКТИРОВАТЬ 3

Команда sensors дает мне следующее:

coretemp-isa-0000
Adapter: ISA adapter
Physical id 0:  +37.0°C  (high = +100.0°C, crit = +100.0°C)
Core 0:         +34.0°C  (high = +100.0°C, crit = +100.0°C)
Core 1:         +36.0°C  (high = +100.0°C, crit = +100.0°C)

acpitz-virtual-0
Adapter: Virtual device
temp1:        +38.0°C  (crit = +98.0°C)

pch_skylake-virtual-0
Adapter: Virtual device
temp1:        +35.0°C  

Высокая температура равна критической. Может быть, мой ноутбук перегрелся, а у вентилятора нет времени на понижение температуры. Я попытался понизить высокую температуру, но это автоматически понизило критическое значение (критическое значение должно быть равно высокой)

РЕДАКТИРОВАТЬ 4

Здесь у вас есть

А вот и аварии с 20 ноября

РЕДАКТИРОВАТЬ 5

После некоторого теста, я думаю, что проблема в перегреве графического процессора. Фактически, мой ноутбук перезагружается только тогда, когда я пытаюсь посмотреть фильм, когда я тестировал несколько бесплатных игр на своем ноутбуке или когда я использовал Unreal Engine 4. Причина, по которой мой компьютер не перезагружался с Blender, заключается в том, что Blender использует по умолчанию процессор (не графический процессор). у меня есть Intel Iris Graphics 550 (Skylake GT3e)Любая идея?

2 ответа

Если вы действительно обеспокоены перезагрузкой из-за паники ядра, как следует из заголовка вашего поста, вы можете проверить файл /etc/sysctl.conf для директивы, аналогичной kernel.panic = n где n это число, указывающее, сколько секунд нужно отложить до перезагрузки даже в случае паники ядра. Исследования показывают, что он не должен перезагружаться по умолчанию.

Если вместо этого, как я подозреваю, вас больше интересует определение основной причины этих перезагрузок (мое мнение связано с некоторыми сбоями оборудования), вы захотите просмотреть события проверки компьютера, чтобы определить, какое оборудование работает со сбоями. Если у вас нет файла /var/log/mcelog Вам может потребоваться установить пакет mcelog, включив репозиторий Universe (если он еще не включен в ваших источниках) и выполнив команду sudo apt install mcelog Затем для продвижения вперед эти события будут записаны в /var/log/mcelog

Для ясности вот выдержка из man mcelog

X86  CPUs  report  errors  detected  by the CPU as machine check events
       (MCEs).  These can be data corruption detected in the  CPU  caches,  in
       main memory by an integrated memory controller, data transfer errors on
       the front side bus or CPU interconnect or other internal errors.   Pos‐
       sible  causes can be cosmic radiation, instable power supplies, cooling
       problems, broken hardware, or bad luck.

       Most errors can be corrected by the CPU by  internal  error  correction
       mechanisms. Uncorrected errors cause machine check exceptions which may
       panic the machine.

Более подробную информацию о формате файла mcelog можно найти здесь

Системы Linux обычно не перезагружаются из-за паники ядра по умолчанию, поэтому вы можете проверить файл /etc/sysctl.conf упоминалось ранее.

Источники:

http://www.techrepublic.com/blog/linux-and-open-source/auto-reboot-linux-after-a-kernel-panic/

http://packages.ubuntu.com/

"mce: [Аппаратная ошибка]: события проверки компьютера записаны" появляется в системном журнале. Что я должен делать?

http://mcelog.org/logfile.html

В зависимости от вашего mcelog, CPU 1 и 3 в вашей системе перегреваются. дросселирование вниз, охлаждение и дросселирование вверх (все это сделано для защиты процессора от перегрева). Основной причиной может быть плохое нанесение термического соединения между процессором и радиатором, неплотный радиатор, заблокированные вентиляционные отверстия или чрезмерно запыленное или неисправное охлаждающее оборудование (вентилятор?). Другая (маловероятная) возможность - сбой в возможностях термического обнаружения процессора.

Название этой темы не понятно.

В любом случае, если вам нужна помощь в расследовании сбоя системы, а все предыдущие комментарии оказались бесполезными, попробуйте следующее:

  1. Увеличьте многословность журнала ядра.
  2. Остановите ядро, чтобы автоматически перезагрузиться с крахом / паникой.
  3. Попробуйте выполнить удаленный вход (например, ssh) в вашу систему и проверьте логи.
  4. как указано @ user.dz, используйте, например, memtest86+ с http://www.memtest.org/ для глубокой проверки вашей оперативной памяти.
  5. Потому что вы сказали "... Это добавляется только тогда, когда мой процессор используется на 40% - 50% или более...", может быть проблема с блоком питания? Я имею в виду, что вашей системе требуется больше энергии, чем может дать ей блок питания.
Другие вопросы по тегам