1
1

Merge pull request #8067 from devreal/fix-ob1-spc

PML OB1: Fix potential overcounting of SPC sent/received message sizes and account for fin messages
Этот коммит содержится в:
bosilca 2020-10-05 22:26:24 -04:00 коммит произвёл GitHub
родитель 9779813cb6 1fdf05f634
Коммит 9f114c6afe
Не найден ключ, соответствующий данной подписи
Идентификатор ключа GPG: 4AEE18F83AFDEB23
2 изменённых файлов: 5 добавлений и 3 удалений

Просмотреть файл

@ -47,6 +47,7 @@
#include "ompi/mca/bml/base/base.h"
#include "opal/mca/pmix/pmix-internal.h"
#include "ompi/runtime/ompi_cr.h"
#include "ompi/runtime/ompi_spc.h"
#include "pml_ob1.h"
#include "pml_ob1_component.h"
@ -708,6 +709,7 @@ int mca_pml_ob1_send_fin( ompi_proc_t* proc,
if( OPAL_LIKELY( 1 == rc ) ) {
MCA_PML_OB1_PROGRESS_PENDING(bml_btl);
}
SPC_RECORD(OMPI_SPC_BYTES_SENT_MPI, (ompi_spc_value_t)sizeof(mca_pml_ob1_fin_hdr_t));
return OMPI_SUCCESS;
}
mca_bml_base_free(bml_btl, fin);

Просмотреть файл

@ -252,7 +252,7 @@ int mca_pml_ob1_recv_request_ack_send_btl(
des->des_cbfunc = mca_pml_ob1_recv_ctl_completion;
rc = mca_bml_base_send(bml_btl, des, MCA_PML_OB1_HDR_TYPE_ACK);
SPC_RECORD(OMPI_SPC_BYTES_RECEIVED_MPI, (ompi_spc_value_t)size);
SPC_RECORD(OMPI_SPC_BYTES_SENT_MPI, (ompi_spc_value_t)sizeof(mca_pml_ob1_ack_hdr_t));
if( OPAL_LIKELY( rc >= 0 ) ) {
return OMPI_SUCCESS;
}
@ -456,8 +456,8 @@ static int mca_pml_ob1_recv_request_put_frag (mca_pml_ob1_rdma_frag_t *frag)
/* send rdma request to peer */
rc = mca_bml_base_send (bml_btl, ctl, MCA_PML_OB1_HDR_TYPE_PUT);
/* Increment counter for bytes_put even though they probably haven't all been received yet */
SPC_RECORD(OMPI_SPC_BYTES_PUT, (ompi_spc_value_t)frag->rdma_length);
/* Increment counter for bytes sent by MPI */
SPC_RECORD(OMPI_SPC_BYTES_SENT_MPI, (ompi_spc_value_t)(sizeof (mca_pml_ob1_rdma_hdr_t) + reg_size));
if (OPAL_UNLIKELY(rc < 0)) {
mca_bml_base_free (bml_btl, ctl);
return rc;