Gender shades: intersectional accuracy disparities in commercial gender classi cation

Buolamwini, Joy; Gebru, Timnit

Gender shades: intersectional accuracy disparities in commercial gender classi cation

dc.creator	Buolamwini, Joy
dc.creator	Gebru, Timnit
dc.date.accessioned	2026-01-23T18:59:15Z
dc.date.created	2018
dc.description.abstract	Recent studies demonstrate that machine learning algorithms can discriminate based on classes like race and gender. In this work, we present an approach to evaluate bias present in automated facial analysis algorithms and datasets with respect to phenotypic subgroups. Using the dermatologist approved Fitzpatrick Skin Type classi cation system, we characterize the gender and skin type distribution of two facial analysis benchmarks, IJB-A and Adience. We ndthat these datasets are overwhelmingly composed of lighter-skinned subjects (796% for IJB-A and 862% for Adience) and introduce a new facial analysis dataset which is balanced by gender and skin type. We evaluate 3 commercial gender classi cation systems using our dataset and show that darker-skinned females are the most misclassi ed group (with error rates of up to 347%). The maximum error rate for lighter-skinned males is 08%. The substantial disparities in the accuracy of classifying darker females, lighter females, darker males, and lighter males in gender classi cation systems require urgent attention if commercial companies are to build genuinely fair, transparent and accountable facial analysis algorithms.
dc.description.abstractenglish	Estudios recientes demuestran que los algoritmos de aprendizaje automático pueden discriminar según clases como raza y género. En este trabajo, presentamos un enfoque para evaluar el sesgo presente en algoritmos y conjuntos de datos de análisis facial automatizado con respecto a subgrupos fenotípicos. Utilizando el sistema de clasificación Fitzpatrick Skin Type, aprobado por dermatólogos, caracterizamos la distribución de género y tipo de piel de dos puntos de referencia de análisis facial, IJB-A y Adience. Descubrimos que estos conjuntos de datos están compuestos abrumadoramente por sujetos de piel más clara (796% para IJB-A y 862% para Adience) e introducimos un nuevo conjunto de datos de análisis facial que está equilibrado por género y tipo de piel. Evaluamos 3 sistemas comerciales de clasificación de género utilizando nuestro conjunto de datos y mostramos que las mujeres de piel más oscura son el grupo más mal clasificado (con tasas de error de hasta el 347%). La tasa de error máxima para los hombres de piel más clara es del 0,8%. Las disparidades sustanciales en la precisión de la clasificación de mujeres de piel más oscura, mujeres de piel más clara, hombres de piel más oscura y hombres de piel más clara en los sistemas de clasificación de género requieren atención urgente si las empresas comerciales quieren construir algoritmos de análisis facial realmente justos, transparentes y responsables.
dc.format.extent	15 páginas
dc.format.mimetype	text/html
dc.identifier.other	https://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf
dc.identifier.uri	https://hdl.handle.net/20.500.12010/38887
dc.language.iso	en_US
dc.publisher	Proceedings of Machine Learning Research
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.rights.local	Abierto (Texto Completo)
dc.subject	Visión artificial
dc.subject	Auditoría algorítmica
dc.subject	Clasificación de género
dc.subject.keyword	Artificial intelligence
dc.subject.keyword	Facial recognition
dc.subject.keyword	Machine learning
dc.subject.lemb	Inteligencia artificial
dc.subject.lemb	Reconocimiento facial
dc.subject.lemb	Aprendizaje automático
dc.title	Gender shades: intersectional accuracy disparities in commercial gender classi cation
dc.type.coar	http://purl.org/coar/resource_type/c_6501

Archivos

Bloque de licencias

Mostrando 1 - 1 de 1

Nombre:: license.txt
Tamaño:: 3.28 KB
Formato:: Item-specific license agreed upon to submission
Descripción:

Descargar

Colecciones

Introducción a los entornos digitales y nuevas tecnologías