me gustaria saber como interpretar Std. Pair Dist.
(distancias de pares estandarizados) de summary()
salida de R MatchIt
paquete.
El mantenedor @Noha dijo aquí que «La diferencia promedio entre pares está en la columna de distribución estándar de pares». Por supuesto que asumo que tiene razón. Pero lo interpreto mal.
Vea la última columna en la siguiente salida de ejemplo que se generó con method="nearest", distance="glm"
:
Means Treated Means Control Std. Mean Diff. Var. Ratio eCDF Mean eCDF Max Std. Pair Dist.
distance 0.011647 0.011643 0.000624 1.009227 0.000007 0.004008 0.000678
geschlechtm 0.304609 0.312625 -0.017417 NaN 0.008016 0.008016 0.113211
geschlechtw 0.695391 0.687375 0.017417 NaN 0.008016 0.008016 0.113211
alter 69.082164 69.058116 0.002490 0.952987 0.005572 0.014028 0.164750
pflege 0.280561 0.262525 0.024109 1.077771 0.003674 0.010020 0.120543
Vale, veamos. ¿No es el promedio solo el mean()
?
Pero calculando el mean()
en los datos coincidentes me da resultados diferentes de la tabla de resumen (por cierto: es código de Python porque uso MatchIt
a través de pitones rpy2
paquete):
>>> df.Vm001.distance.mean()
0.011644758037430517
>>> df.Vm001.alter.mean()
69.07014028056112
Preguntas
- ¿Cómo se calcula este valor?
- ¿Qué significa este valor? O ¿cómo debe interpretarse?
1 respuesta
Este valor se calcula como el promedio de la distancia entre unidades dentro de un par en la covariable dada. Es más fácil pensar en esto con coincidencias 1:1. Considere un par emparejado y tome la diferencia entre la unidad tratada en el valor de la covariable de ese par y la unidad de control en el valor de la covariable de ese par. Luego toma el valor absoluto de esta diferencia para convertirla en una distancia. Luego tome el promedio de estas distancias en todos los pares. Cuando standardize = TRUE
(el valor predeterminado), el promedio se estandariza de la misma manera que las diferencias de medias estandarizadas.