in

castigo vs refuerzo negativo

Tengo problemas para entender el refuerzo negativo porque, desde diferentes puntos de vista, parece un castigo.

Mi maestro dio el ejemplo de la alarma del cinturón de seguridad en el automóvil que suena cuando no se pone el cinturón de seguridad. Es refuerzo (porque somos alentador el uso del cinturón de seguridad) y negativo (porque somos quitando el sonido de tintineo cuando se usa el cinturón de seguridad).

Claro que tiene sentido, pero también se puede pensar de esta manera. Es positivo (porque somos agregando un sonido de tintineo que no estaba allí antes) y un castigo (porque estamos desalentador conducir sin cinturón de seguridad).

¿Cómo puedo diferenciar los dos? Podría ser útil enmarcarlo en un niño que hace algo que no queremos. Quitar los juguetes en respuesta al mal comportamiento, para disminuir el mal comportamiento… vs. solo permitir que se juegue con los juguetes cuando se está portando bien, para aumentar el buen comportamiento. ¿Cual es cual?

0

¿Te ayudó la respuesta?

Subscribirse
Notificar por
guest

0 Comentarios
Inline Feedbacks
Ver todas las Respuestas

Muestre que F1 = cos(x)^2 y F2 = sin(x)^2 es una base en el tramo lineal U =[F1, F2]

¿Cómo *formalizar matemáticamente* que un clasificador binario no tiene rendimiento predictivo?