Проблемы с mpirun (openmpi)
Я локально установил две версии openmpi в моем кластере:
openmpi-1.8.1: когда я запускаю mpirun под этой версией, выдает ошибку:
librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device librdmacm: Fatal: unable to open RDMA device
openmpi-2.0.0: когда я запускаю mpirun под этой версией, он говорит мне:
mca_base_component_repository_open: shmem "/opt/openmpi-1.8.1/lib/openmpi/mca_shmem_posix" uses an MCA interface that is not recognized (component MCA v2.0.0 != supported MCA v2.1.0) -- ignored It looks like opal_init failed for some reason; your parallel process is likely to abort. There are many reasons that a parallel process can fail during opal_init; some of which are due to configuration or environment problems. This failure appears to be an internal failure; here's some additional information (which may only be relevant to an Open MPI developer): opal_shmem_base_select failed --> Returned value -1 instead of OPAL_SUCCESS
Обе версии устанавливаются локально в /opt и загружаются как модули. Кажется, openmpi-2.0.0 все еще использует зависимости openmpi-1.8.1, чего я не понимаю.
Я буду признателен за любую диагностику и / или советы по ее решению.
Заранее спасибо.
1 ответ
Вы не должны устанавливать их в том же месте, где их библиотеки конфликтуют друг с другом. openmpi 2.0.0 использует интерфейс MCA 2.1.0, openmpi 1.8.1 использует интерфейс MCA 2.0.0. Таким образом, вы должны установить библиотеки в отдельных местах