Прерывистый DNS "временный сбой в разрешении имени" на сервере Ubuntu 18.04 - как мне это отладить?
У меня есть несколько установок Ubuntu 18.04 LTS Server на одном хосте vSphere 6.7. Один запускает мой DHCP и DNS-сервер и надежно работает в течение многих лет, с 14 по 18 апреля.
Однако один из серверов внезапно получает моменты (несколько раз в день), когда он не может использовать DNS для разрешения адресов. Если вы что-то пропингуете из командной строки, вы получите "Временный сбой в разрешении имени". Это может длиться от 30 минут до 12 часов. В конце концов - без каких-либо изменений с моей стороны - он снова начнет работать, но в какой-то момент снова потерпит неудачу. Сброс хоста также может решить проблему на некоторое время.
Этот сервер был недавно установлен (около 2 недель назад) 18.04 из ISO и содержит все последние исправления. Я полагаю, что поскольку это значение по умолчанию означает, что оно использует разрешенные, а не интерфейсы, но я не знаю точно, поскольку я не следил за тем, как Ubuntu изменился в этой области. Я знаю, что этот хост получает свой адрес от DHCP и при перезагрузке он надежно подхватывает не только свой адрес, но и список DNS-серверов (systemd-resolver --status правильно отображает все IP-адреса DNS-серверов).
Что я не знаю, как это отладить? Что я должен искать?
Узнавать, когда это происходит, очень сложно - я замечаю это гораздо позже, когда понимаю, что его задания rsync для обновления других серверов данными о погоде не работают, и теперь я знаю по опыту, что это означает, что разрешение имен не работает. Есть ли больше отладочной информации, чем в системном журнале? Любые мысли о том, как я могу определить, когда это происходит, чтобы увидеть, есть ли соответствующие записи системного журнала? Кроме того, есть ли лучшая информация отладки из того, что делает разрешение имен (сокеты?), Когда я пытаюсь это сделать, и это терпит неудачу?
Стоит ли искать что-либо на самом DNS-сервере? Я - системный администратор, поэтому могу делать все, что мне нужно.