Диагностика и исправление случайных сбоев Ubuntu без SysReq?

Я прочитал этот вопрос и попытался последовать совету выбранного ответа. Я также прочитал этот вопрос, но второй вопрос, который я считаю, не имеет отношения к моей проблеме. (Но я не уверен.)

Когда происходит сбой Ubuntu (или, возможно, только Unity), все перестает работать. Я должен полностью включить и выключить машину. Я не могу выполнить программную перезагрузку SysReq, потому что мне не удалось найти эквивалент ключа для моей модели клавиатуры / ноутбука.

Я могу предоставить журналы по запросу, но, честно говоря, я не знаю, какие из них будут полезны, или сколько из этих журналов будет полезно.

Мой компьютер - Dell Inspiron 11 3000 серии. Я считаю, что это моя модель, предполагаемая после перекрестной проверки спецификаций системы со списком, на который я ссылаюсь. На ПК установлена ​​новейшая версия LTS Ubuntu 14.04 Trusty Tahr.

Сначала я полагал, что это проблема, которая возникала только во время воспроизведения видео, но, хотя система не падает так часто, когда не воспроизводится видео, она все равно будет время от времени.

Я инженер-программист, поэтому у меня должен быть надежный компьютер. Недавно я решил открыть исходный код всего кода, не относящегося к клиенту моей компании, и изменил все свои серверы на Debian, а также установил Ubuntu на своей основной рабочей станции. В настоящее время компания использует программное обеспечение с открытым исходным кодом на всех своих машинах. Тем не менее, я буду вынужден вернуться в Windows, если не смогу решить эту проблему, и я действительно буду огорчен этим.

  1. Каковы простые шаги для начинающего пользователя Ubuntu для диагностики сбоев в Ubuntu?
  2. Обнаружив, какие ресурсы я могу использовать для устранения этих проблем?
  3. И, наконец, есть ли шанс, что я буду вынужден использовать проприетарное программное обеспечение для исправления этих проблем?

Благодарю.

3 ответа


Здесь недостаточно технических деталей, и могут быть сделаны только предложения.
Сначала вы должны определить, является ли это проблемой операционной системы из-за ошибок установки / конфигурации или аппаратного сбоя из-за неисправного оборудования.

В первом случае вы можете проверить системные журналы попробуйте:
Проверьте /var/log/ в терминале:

sudo nano /var/log/syslog

Если вы используете gnome, вы можете проверить с помощью графического интерфейса пользователя все журналы, используя инструмент "gnome-system-log", введите:

gnome-system-log

если он не установлен, введите:

sudo apt-get install gnome-system-log

Также попробуйте воспроизвести проблему, загрузившись в режиме восстановления, или попробуйте другую среду ОС или другую установку, или ssh в систему, чтобы увидеть, если это произойдет. Если это происходит, вероятно, аппаратная проблема, если нет, ищите подсказки в журналах ОС.
Если аппаратный сбой и после того, как вы проверили, что ОЗУ, жесткий диск, температура процессора в порядке.
Я предлагаю вам позвонить в техподдержку, даже лучше, если вы все еще в гарантии.

Напоминает мне похожую проблему, которая у меня была однажды со множеством случайных сбоев, хотя система Ubuntu, кажется, случайно "в порядке", просто чтобы обнаружить, что это произошло из-за неисправной оперативной памяти.
Похоже, здесь проблема с памятью, и проблемы с памятью трудно обнаружить.
Если вы еще не проверили их

Один из способов диагностики и проверки вашей оперативной памяти - тест памяти приложения.
Обычно его можно найти в меню загрузки с вашего Ubuntu LiveCD или любого другого живого компакт-диска с приложением memtest.

Когда появится меню загрузки, вы увидите опцию "Проверка вашей оперативной памяти",
Выберите:
[Тест памяти] или [MemTest86+]

Если у вас плохая память, вы получите хотя бы одну КРАСНУЮ строку в нижней половине окна приложения.
Также я предлагаю проверить каждую память по отдельности и в разные слоты, если вы не обнаружите ошибку памяти с обоими установленными.
Таким образом, вы определенно узнаете, неисправна ли одна память.

Я подозреваю, что ваш графический процессор перегревается. Давай проверим твои температуры.

sudo apt-get update
sudo apt-get install psensor

Пожалуйста, разместите скриншоты ваших временных.

на Убунту 22 апреля

со случайным сбоем, как указано выше,...

<короткий ответ>
отключите Intel-VT в настройках биоса

<длинный ответ>

tail -n 25 /var/log/syslogпоказал:

      kernel: [  551.300388] DMAR: DRHD: handling fault status reg 2
kernel: [  551.300402] DMAR: [INTR-REMAP] Request device [03:00.0] fault index 18 [fault reason 38] Blocked an interrupt request due to source-id verification failure

Нашел несколько статей производителей (например, Lenovo, HP), в которых обвиняется конфликт DMA между потоками, когда Intel-VT был включен в Ubuntu.

Другие вопросы по тегам