Publicación: Clasificación: árboles de decisión
| dc.creator | Sangüesa i Solé, Ramon | |
| dc.date.accessioned | 2025-07-07T14:48:57Z | |
| dc.date.available | 2025-07-07T14:48:57Z | |
| dc.description.abstract | Los árboles de decisión son un modelo de clasificación que se basa en encon- trar atributos discriminantes en el sentido de que generan particiones de cla- sificación bastante uniformes. La formulación original de los árboles de decisión puede remontarse hasta los árboles basados en clasificación y regresión propuestos por Breiman. Bá- sicamente, este tipo de árboles proceden de manera iterativa, seleccionando en cada paso el atributo más discriminante y dividiendo el conjunto de da- tos en dos particiones según el valor de corte elegido para este atributo. La formulación más conocida para clasificación es la de Quinlan y sus métodos de inducción de árboles de decisión descendente (top down) e iterativa. Una mejora posible de los árboles de decisión consiste en incorporar méto- dos de poda para impedir o recortar la generación de subárboles a los que les corresponden particiones con un porcentaje de error en clasificación no ad- misible. Como sucede con otros sistemas de clasificación, los árboles de decisión tie- nen problemas para tratar dominios en los que no se puede asegurar la linea- lidad de las hipersuperficies de separación entre las diferentes clases. Una posible extensión y mejora para este tipo de problemas es la que presentan los árboles de decisión multivariantes lineales de Utgoff (LMDT, Linear Multivariant Decision Trees). Finalmente, los árboles de decisión admiten una traducción fácil a reglas de decisión. | spa |
| dc.description.abstractenglish | Decision trees are a classification model based on finding discriminating attributes in the sense that they generate fairly uniform classification partitions. The original formulation of decision trees can be traced back to the classification and regression-based trees proposed by Breiman. Basically, such trees proceed iteratively, selecting at each step the most discriminating attribute and dividing the data set into two partitions according to the cutoff value chosen for this attribute. The best known formulation for classification is that of Quinlan and his top-down and iterative decision tree induction methods. A possible improvement of the decision trees consists of incorporating pruning methods to prevent or cut back the generation of subtrees to which partitions with an unacceptable classification error percentage correspond. As with other classification systems, decision trees have problems in dealing with domains where the linearity of the hypersurfaces separating the different classes cannot be assured. A possible extension and improvement for this type of problem is the Linear Multivariate Decision Trees (LMDT). Finally, decision trees can be easily translated into decision rules. | spa |
| dc.format.extent | 54 páginas | spa |
| dc.format.mimetype | application/pdf | spa |
| dc.identifier.other | https://openaccess.uoc.edu/bitstream/10609/138187/22/Data%20mining_M%C3%B3dulo%203_Clasificaci%C3%B3n%2C%20%C3%A1rboles%20de%20decisi%C3%B3n.pdf | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12010/37029 | |
| dc.language.iso | spa | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
| dc.rights.local | Abierto (Texto Completo) | spa |
| dc.subject | Arboles de decisión | spa |
| dc.subject | Aprendizaje automático | spa |
| dc.subject | Ciencia de datos | spa |
| dc.subject.keyword | Decision trees | spa |
| dc.subject.keyword | Machine learning | spa |
| dc.subject.keyword | Data science | spa |
| dc.subject.lemb | Aprendizaje automático | spa |
| dc.subject.lemb | Gestión de datos | spa |
| dc.title | Clasificación: árboles de decisión | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_18ws | spa |
| dspace.entity.type | Publication |
