Gender shades: intersectional accuracy disparities in commercial gender classi cation

dc.creatorBuolamwini, Joy
dc.creatorGebru, Timnit
dc.date.accessioned2026-01-23T18:59:15Z
dc.date.created2018
dc.description.abstractRecent studies demonstrate that machine learning algorithms can discriminate based on classes like race and gender. In this work, we present an approach to evaluate bias present in automated facial analysis algorithms and datasets with respect to phenotypic subgroups. Using the dermatologist approved Fitzpatrick Skin Type classi cation system, we characterize the gender and skin type distribution of two facial analysis benchmarks, IJB-A and Adience. We ndthat these datasets are overwhelmingly composed of lighter-skinned subjects (796% for IJB-A and 862% for Adience) and introduce a new facial analysis dataset which is balanced by gender and skin type. We evaluate 3 commercial gender classi cation systems using our dataset and show that darker-skinned females are the most misclassi ed group (with error rates of up to 347%). The maximum error rate for lighter-skinned males is 08%. The substantial disparities in the accuracy of classifying darker females, lighter females, darker males, and lighter males in gender classi cation systems require urgent attention if commercial companies are to build genuinely fair, transparent and accountable facial analysis algorithms.
dc.description.abstractenglishEstudios recientes demuestran que los algoritmos de aprendizaje automático pueden discriminar según clases como raza y género. En este trabajo, presentamos un enfoque para evaluar el sesgo presente en algoritmos y conjuntos de datos de análisis facial automatizado con respecto a subgrupos fenotípicos. Utilizando el sistema de clasificación Fitzpatrick Skin Type, aprobado por dermatólogos, caracterizamos la distribución de género y tipo de piel de dos puntos de referencia de análisis facial, IJB-A y Adience. Descubrimos que estos conjuntos de datos están compuestos abrumadoramente por sujetos de piel más clara (796% para IJB-A y 862% para Adience) e introducimos un nuevo conjunto de datos de análisis facial que está equilibrado por género y tipo de piel. Evaluamos 3 sistemas comerciales de clasificación de género utilizando nuestro conjunto de datos y mostramos que las mujeres de piel más oscura son el grupo más mal clasificado (con tasas de error de hasta el 347%). La tasa de error máxima para los hombres de piel más clara es del 0,8%. Las disparidades sustanciales en la precisión de la clasificación de mujeres de piel más oscura, mujeres de piel más clara, hombres de piel más oscura y hombres de piel más clara en los sistemas de clasificación de género requieren atención urgente si las empresas comerciales quieren construir algoritmos de análisis facial realmente justos, transparentes y responsables.
dc.format.extent15 páginas
dc.format.mimetypetext/html
dc.identifier.otherhttps://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf
dc.identifier.urihttps://hdl.handle.net/20.500.12010/38887
dc.language.isoen_US
dc.publisherProceedings of Machine Learning Research
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.localAbierto (Texto Completo)
dc.subjectVisión artificial
dc.subjectAuditoría algorítmica
dc.subjectClasificación de género
dc.subject.keywordArtificial intelligence
dc.subject.keywordFacial recognition
dc.subject.keywordMachine learning
dc.subject.lembInteligencia artificial
dc.subject.lembReconocimiento facial
dc.subject.lembAprendizaje automático
dc.titleGender shades: intersectional accuracy disparities in commercial gender classi cation
dc.type.coarhttp://purl.org/coar/resource_type/c_6501

Archivos

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
3.28 KB
Formato:
Item-specific license agreed upon to submission
Descripción: