in

Prueba de significancia para un centroide de imagen

Tengo una matriz nxn. Cada celda contiene un valor. La matriz es esencialmente un mapa de calor. La hipótesis nula es que los mayores valores estarían en las líneas medias horizontal y vertical de la matriz. Digamos que n es impar. Entonces, las columnas de la matriz corresponderían a x = -(n-1)/2 : (n-1) / 2. Las filas corresponderían a y = -(n-1)/2 : (n-1) / 2. Y por lo tanto la columna del medio y la fila del medio corresponderían a x = 0 y y = 0, respectivamente. La hipótesis nula es que las celdas más calientes estarían cerca de x = 0 y y = 0. La hipótesis alternativa es que las celdas más calientes están fuera de ambas líneas medias, en otras palabras, desplazadas del origen.

Puedo usar un centroide ponderado para encontrar el centro de masa de la matriz. Pero, ¿qué tipo de prueba de significancia podría usar para confirmar la hipótesis alternativa?

Editar: Con respecto a la hipótesis nula. La hipótesis nula es la siguiente. Tomar triples (a,b,c) <-- [1, 100]^3. En otras palabras, para cada triple, a, b, c se toman de la distribución uniforme en [1, 100]. entonces, sea x = ab, yy = bc. Entonces, cuando se obtienen muchos triples aleatorios, se asignan x e y, y se grafican los resultados, en realidad tiene una distribución que favorece los cuadrantes superior izquierdo e inferior derecho, y aparece relativamente menos en los cuadrantes inferior izquierdo y superior derecho. A continuación se muestra un ejemplo.

Distribución nula

2 respuestas
2

Como no tienes una hipótesis nula bien definida $H_0$ (usted no conoce la distribución bajo $H_0$), no hay manera de calcular la probabilidad de la observación bajo $H_0$.

Podría estar muy lejos dependiendo de lo que realmente estés tratando de hacer. Tal vez puedas usar algún tipo de método de arranque. Es bastante difícil saber cómo hacer esto exactamente a menos que conozcamos su método de muestreo; tenemos que saber qué da lugar al error aleatorio en sus datos. De todos modos, lo intentaré haciendo algunas suposiciones sobre el diseño de su estudio.

Por lo que entiendo de la pregunta, a medida que aumenta la distancia del centroide ponderado desde el origen, la probabilidad de que el valor nulo sea verdadero disminuye. Si este es el caso, tal vez uno pueda hacer lo siguiente. Lo representaré como una matriz simple de 5×5 para facilitar la explicación.

tu conjunto de datos

  1. El centroide ponderado debe centrarse en el origen restando el valor x del centroide del valor x de todas las celdas y restando el valor y del centroide del valor y de todas las celdas. Esta es su distribución nula.

Centroide ponderado en cero (Distribución nula)

  1. Muestree aleatoriamente las celdas con reemplazo y calcule el centroide ponderado para el conjunto de datos remuestreado. Haga esto como mil veces y obtenga una distribución de valores centroides ponderados alrededor del origen y sus distancias al origen.

Distribución de centroides remuestreados
3) Encuentre la cantidad de veces que los centroides simulados estuvieron más alejados del origen que su centroide original. Divida este número por el número de iteraciones de remuestreo (¿quizás 1000?). Este es su valor p.

Esto supone que el error en sus datos proviene de los valores x e y que muestrea. También asumo que el centroide ponderado es un buen parámetro para probar su hipótesis. No estoy seguro si ese es el caso. Además, los valores de p podrían no ser la mejor manera de determinar la significancia estadística en este caso.

Elaborar más sobre su estudio podría ayudar a decidir qué tipo de remuestreo hacer.

¿Te ayudó la respuesta?

Subscribirse
Notificar por
guest
0 Comentarios
Inline Feedbacks
Ver todas las Respuestas

Problema relacionado con operadores de creación y aniquilación de dos osciladores desacoplados

Pregunta en un teorema sobre el proceso de difusión.