Publicación:
Clasificación: árboles de decisión

dc.creatorSangüesa i Solé, Ramon
dc.date.accessioned2025-07-07T14:48:57Z
dc.date.available2025-07-07T14:48:57Z
dc.description.abstractLos árboles de decisión son un modelo de clasificación que se basa en encon- trar atributos discriminantes en el sentido de que generan particiones de cla- sificación bastante uniformes. La formulación original de los árboles de decisión puede remontarse hasta los árboles basados en clasificación y regresión propuestos por Breiman. Bá- sicamente, este tipo de árboles proceden de manera iterativa, seleccionando en cada paso el atributo más discriminante y dividiendo el conjunto de da- tos en dos particiones según el valor de corte elegido para este atributo. La formulación más conocida para clasificación es la de Quinlan y sus métodos de inducción de árboles de decisión descendente (top down) e iterativa. Una mejora posible de los árboles de decisión consiste en incorporar méto- dos de poda para impedir o recortar la generación de subárboles a los que les corresponden particiones con un porcentaje de error en clasificación no ad- misible. Como sucede con otros sistemas de clasificación, los árboles de decisión tie- nen problemas para tratar dominios en los que no se puede asegurar la linea- lidad de las hipersuperficies de separación entre las diferentes clases. Una posible extensión y mejora para este tipo de problemas es la que presentan los árboles de decisión multivariantes lineales de Utgoff (LMDT, Linear Multivariant Decision Trees). Finalmente, los árboles de decisión admiten una traducción fácil a reglas de decisión.spa
dc.description.abstractenglishDecision trees are a classification model based on finding discriminating attributes in the sense that they generate fairly uniform classification partitions. The original formulation of decision trees can be traced back to the classification and regression-based trees proposed by Breiman. Basically, such trees proceed iteratively, selecting at each step the most discriminating attribute and dividing the data set into two partitions according to the cutoff value chosen for this attribute. The best known formulation for classification is that of Quinlan and his top-down and iterative decision tree induction methods. A possible improvement of the decision trees consists of incorporating pruning methods to prevent or cut back the generation of subtrees to which partitions with an unacceptable classification error percentage correspond. As with other classification systems, decision trees have problems in dealing with domains where the linearity of the hypersurfaces separating the different classes cannot be assured. A possible extension and improvement for this type of problem is the Linear Multivariate Decision Trees (LMDT). Finally, decision trees can be easily translated into decision rules.spa
dc.format.extent54 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.otherhttps://openaccess.uoc.edu/bitstream/10609/138187/22/Data%20mining_M%C3%B3dulo%203_Clasificaci%C3%B3n%2C%20%C3%A1rboles%20de%20decisi%C3%B3n.pdf
dc.identifier.urihttps://hdl.handle.net/20.500.12010/37029
dc.language.isospaspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.localAbierto (Texto Completo)spa
dc.subjectArboles de decisiónspa
dc.subjectAprendizaje automáticospa
dc.subjectCiencia de datosspa
dc.subject.keywordDecision treesspa
dc.subject.keywordMachine learningspa
dc.subject.keywordData sciencespa
dc.subject.lembAprendizaje automáticospa
dc.subject.lembGestión de datosspa
dc.titleClasificación: árboles de decisiónspa
dc.type.coarhttp://purl.org/coar/resource_type/c_18wsspa
dspace.entity.typePublication

Archivos