Hola a todos. Estoy buscando averiguar cómo la función Predict calcula los intervalos de confianza. Sé que hay preguntas similares, pero tengo problemas para conceptualizar ecuaciones más largas sin representación numérica (una de las razones por las que me encanta programar, ¡simplemente apesto!).
Mi pregunta de dos partes es realmente cómo calculó Predict el intervalo de confianza de, digamos, los $ 3.5 a continuación. Los límites inferior y superior tienen deltas diferentes, así que sé que el margen de error es diferente. Intenté buscar en varias fórmulas para que el margen de error se agregara a eso y no pude descifrar esto o qué desviación estándar se estaba usando realmente (utilicé la población stdev sin éxito).
por último, si alguien pudiera proporcionar algún tipo de función de ejemplo para los límites cuando se dibuja en un gráfico. Hubo una muy buena respuesta aquí https://stats.stackexchange.com/questions/85560/shape-of-confidence-interval-for-predicted-values-in-linear-regression Todavía no tengo idea de cómo se ve implementado .
si cambiara los modelos a logístico (glm), ¿el CI se calcularía de manera similar? o lo romperían las suposiciones de error residual.
¡Gracias!
#fake example of giving someone money and how much a smile is returned
Money<-c(1,1,1,2,2,2,3,3,3,4,4,4,5,5,5,6,6,6,7,7,7,8,8,8)
Smile<-c(2.618684,3.004371,2.226206,3.218504,4.206926,5.361271,6.484110,5.412502,3.309511,7.934290,8.286108,8.421875,9.865312,10.163182,9.381625,12.789413,12.404028,12.002910,13.805863,11.978898,13.448826,17.288642,17.105757,16.648129
)
model<-lm(Smile~Money)
new.money=data.frame(Money=c(3,3.5,4.6,5.6))
prediction<-predict(model,new.money, interval="confidence") #start the prediction
prediction<-cbind(new.money,prediction)
print(prediction)
La salida es:
Money fit lwr upr
1 3.0 6.049064 5.555977 6.542151
2 3.5 7.051695 6.601570 7.501819
3 4.6 9.257482 8.844543 9.670421
4 5.6 11.262743 10.805119 11.720368