#Sesgo #bias (en ingles)
Como se ha comentado anteriormente (link) ,en estadística se
usan muestras de datos para hacer estimaciones sobre el conjunto de datos
completo (población).
El sesgo es la tendencia de un modelo estadístico o
predictivo a sobrestimar o subestimar un parámetro. A menudo, esto se debe al
método utilizado para obtener la muestra o la forma en que se miden los
errores. Hay varios tipos de sesgos que se encuentran comúnmente en las
estadísticas. Aquí hay una breve descripción de dos de ellos.
Sesgo de selección: esto ocurre cuando la muestra se
selecciona de forma no aleatoria. En la ciencia de datos, un ejemplo puede ser
detener una prueba antes de que termine o seleccionar datos (manualmente) para
entrenar un modelo de aprendizaje automático que podría enmascarar los efectos reales.
Sesgo de confirmación: esto ocurre cuando la persona que
realiza el análisis tiene una suposición predeterminada sobre los datos. En
esta situación, puede haber una tendencia a dedicar más tiempo a examinar las
variables que probablemente apoyen este supuesto.

No hay comentarios:
Publicar un comentario