in

La mejor manera de normalizar para eliminar el efecto de una variable

Tengo una columna de cita previa que me da el número de veces que se cita una patente. Sin embargo, es obvio que se ve afectado por la antigüedad ya que cuanto más antigua es la patente, mayor es la probabilidad de que sea citada en comparación con una patente más nueva que se conceda años después. Por lo tanto, me gustaría normalizar la columna de cita previa por edad. Decidí que debería dividir el recuento de citas hacia adelante por la antigüedad de la patente. ¿Es esa la mejor manera? . He leído en alguna parte que podemos usar la transformación de registros, pero no estoy seguro. El pdf de la cita anterior se muestra si es útil. La cita directa generalmente sigue una distribución lognormal. ¿Alguien puede ayudar? Gracias
Distribución

1 respuesta
1

Dado que solo tiene el número total de citas en el momento T (por ejemplo, a partir de hoy), tiene sentido ajustar por la antigüedad de la patente para tener en cuenta el hecho de que las patentes más antiguas tenían más tiempo para recibir citas. Una complicación es que el número de citas que recibe una patente no es una función lineal del tiempo. Algunas patentes pueden recibir muchas citas desde el principio, otras pueden recibir muy pocas citas al principio y obtener más citas más tarde. Por lo tanto, idealmente necesitaría información de citas para cada año desde la publicación para poder comparar estas dos patentes. De acuerdo, si esta información no está disponible, dividir por edad es un enfoque razonable. Esta división por edad es un ajuste conceptual dado su conocimiento experto de que el número de citas depende de la edad. Por lo tanto, no está relacionado con la toma de registros. Puede tomar registros si lo desea, según su especificación de regresión.

¿Te ayudó la respuesta?

Subscribirse
Notificar por
guest
0 Comentarios
Inline Feedbacks
Ver todas las Respuestas

¿Tomás de Aquino sobre los hermafroditas?

¿Por qué los signos vocálicos de los idiomas indios no se consideran una combinación de caracteres en Unicode? [closed]