Настройка MySQL для SLURM

У меня возникли проблемы с тем, чтобы SLURM (для планирования заданий) работал с базой данных MySQL. Я использовал это как ссылку, но, возможно, я что-то неправильно понял. Если кто-то может сообщить мне, что я пропустил, это было бы здорово...

Это SLURM 21.08 на Ubuntu 22.10. Я использую MySQL 8.0.32.

Раньше я настраивал SLURM, чтобы завершение и учет сохранялись в файле. И это, казалось, работало нормально; контроллер был включен, и я выполнил одно или два задания в порядке.

Затем я переключился на MySQL. Мой/etc/slurm/slurm.confбыли обновлены эти значения:

       Job Completion Logging | MySQL
      JobCompLoc | slurm_complete_db
      JobCompHost | localhost
      JobCompPort | <blank>
      JobCompUser | slurm
      JobCompPass | ...some password...
 Job Accounting Storage | SlurmDBD
      AccountingStorageLoc | slurm_acct_db
      AccountingStorageHost | localhost
      AccountingStoragePort | <blank>
      AccountingStorageUser | slurm
      AccountingStoragePass | ...
      AccountingStoreFlags | job_script,job_env

И в/etc/slurm/slurmdbd.conf:

       AuthType=auth/munge
 DbdHost=xps8930
 DebugLevel=info
 StorageHost=xps8930
 StorageLoc=slurm_acct_db
 StoragePass=...
 StorageType=accounting_storage/mysql
 StorageUser=slurm
 LogFile=/var/log/slurm/slurmdbd.log
 PidFile=/run/slurmdbd.pid
 SlurmUser=slurm

Я создал две базы данных MySQL, пользователя с именем «slurm» и предоставил следующие привилегии:

      CREATE DATABASE slurm_complete_db DEFAULT CHARACTER SET utf8 COLLATE
utf8_unicode_ci ;
CREATE DATABASE slurm_acct_db DEFAULT CHARACTER SET utf8 COLLATE
utf8_unicode_ci ;
CREATE USER 'slurm'@'%' IDENTIFIED WITH caching_sha2_password BY '' ;
GRANT ALL ON slurm_complete_db.* TO 'slurm'@'%';
GRANT ALL ON slurm_acct_db.* TO 'slurm'@'%';

С помощью команды «show engine» я подтвердил, что поддержка InnoDB включена.

Поскольку базы данных пусты, я считаю, что моим следующим шагом должна быть настройка базы данных. Вslurm.conf, я назвал свое имя кластера «личным». Итак, я сделал это:

      $ sacctmgr add cluster personal
sacctmgr: error: slurm_persist_conn_open_without_init: failed to open
persistent connection to host:localhost:6819: Connection refused
sacctmgr: error: Sending PersistInit msg: Connection refused

slurmи работают (SLURM и MySQL находятся на одном компьютере):

      $ ps -aef | grep slurm
root        1407       1  0 09:42 ?        00:00:08 /usr/sbin/slurmd -D -s
root        1857       1  0 09:43 ?        00:00:03 /usr/sbin/slurmdbd -D -s

В/var/log/slurm/slurmdbd.log, Я вижу это:

      [2023-01-26T18:06:02.541] error: mysql_real_connect failed: 2003 Can't
connect to MySQL server on 'xps8930:3306' (111)
[2023-01-26T18:06:02.541] error: The database must be up when starting
the MYSQL plugin.  Trying again in 5 seconds.

В/var/log/slurm/slurmctld.log, У меня есть это:

      [2023-01-26T09:42:33.264] error: Configured MailProg is invalid
[2023-01-26T09:42:33.350] slurmctld version 21.08.5 started on cluster personal
[2023-01-26T09:42:36.121] error: slurm_persist_conn_open_without_init: failed to open persistent connection to host:localhost:6819:
Connection refused
[2023-01-26T09:42:36.121] error: Sending PersistInit msg: Connection refused
[2023-01-26T09:42:36.153] accounting_storage/slurmdbd:  clusteracct_storage_p_register_ctld: Registering slurmctld at port 6817 with slurmdbd
[2023-01-26T09:42:36.153] error: Sending PersistInit msg: Connection refused
[2023-01-26T09:42:36.154] error: Sending PersistInit msg: Connection refused
[2023-01-26T09:42:37.456] No memory enforcing mechanism configured.
[2023-01-26T09:42:39.924] error: mysql_real_connect failed: 2002 Can't connect to local MySQL server through socket '/var/run/mysqld/mysqld.sock' (2)
[2023-01-26T09:42:39.924] fatal: You haven't inited this storage yet.

Я не уверен, что мне делать дальше или какие шаги я пропустил. Я думаю, между и я должен сосредоточиться наslurmdbdпервый? Раз он работает, то либоslurmctldдолжен подойти, и/или я могу попытаться заставить его работать.

Извините, за длинную статью! Любой совет будет принят во внимание!

ПС: командаmunge -n | unmungeБыл успешен.

0 ответов

Другие вопросы по тегам