(Supongamos una distribución multinomial con un tamaño de solo uno, por lo que una distribución categórica: ya sea perro, gato o caimán).
He realizado pruebas multinomiales de dos muestras varias veces últimamente, y me siento cómodo tratándolas como una prueba de razón de verosimilitud de modelos de regresión logística multinomial anidados que tienen una intersección y luego otro parámetro (vector) para la pertenencia al grupo en el más modelo complejo. Luego pruebo los modelos anidados.
Creo que algo similar se aplica en la configuración de una muestra para probar si todos los parámetros de probabilidad de la distribución multinomial son iguales.
Bajo la hipótesis nula, todas las probabilidades son iguales, por lo que la regresión logística nula es solo un softmax aplicado a cero. Tal modelo está anidado en un modelo que no tiene un intercepto pero tiene un parámetro para cada uno. $y$ Salir. Como estos están anidados, se aplica la misma prueba de razón de verosimilitud.
Cuando traté de simular esto en R, mi código no se pudo compilar, aparentemente por un tecnicismo relacionado con la regresión a cero, por lo que no he podido probar esto.
set.seed(2022)
N <- 1000
y <- t(rmultinom(N, 1, c(1/3, 1/3, 1/3)))
M1 <- nnet::multinom(y ~ 1)
M0 <- nnet::multinom(y ~ 0)
lmtest::lrtest(M1, M0)
En el caso de dos muestras, he obtenido excelentes resultados haciendo algo como esto. ¿Tiene sentido para el caso de una muestra?
(Eventualmente depuraré mi código o encontraré un paquete diferente al nnet
eso me permite retroceder solo del cero, por lo que no quiero centrarme en el código).