Проблемы с mpirun (openmpi)

Я локально установил две версии openmpi в моем кластере:

  • openmpi-1.8.1: когда я запускаю mpirun под этой версией, выдает ошибку:

    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    librdmacm: Fatal: unable to open RDMA device
    
  • openmpi-2.0.0: когда я запускаю mpirun под этой версией, он говорит мне:

    mca_base_component_repository_open: shmem "/opt/openmpi-1.8.1/lib/openmpi/mca_shmem_posix" uses an MCA interface that is not recognized (component MCA v2.0.0 != supported MCA v2.1.0) -- ignored
    
    It looks like opal_init failed for some reason; your parallel process is
    likely to abort.  There are many reasons that a parallel process can
    fail during opal_init; some of which are due to configuration or
    environment problems.  This failure appears to be an internal failure;
    here's some additional information (which may only be relevant to an
    Open MPI developer):
      opal_shmem_base_select failed
      --> Returned value -1 instead of OPAL_SUCCESS
    

Обе версии устанавливаются локально в /opt и загружаются как модули. Кажется, openmpi-2.0.0 все еще использует зависимости openmpi-1.8.1, чего я не понимаю.

Я буду признателен за любую диагностику и / или советы по ее решению.

Заранее спасибо.

1 ответ

Вы не должны устанавливать их в том же месте, где их библиотеки конфликтуют друг с другом. openmpi 2.0.0 использует интерфейс MCA 2.1.0, openmpi 1.8.1 использует интерфейс MCA 2.0.0. Таким образом, вы должны установить библиотеки в отдельных местах

Другие вопросы по тегам