El siguiente trabajo presenta la aplicación y evaluación de técnicas de
minería de texto para la clasificación de noticias criminales, donde se
construyó un dataset de noticias criminales de diferentes medios de prensa
de la ciudad de Popayán, para identificar y caracterizar diferentes tipos de
delitos; además, se construyó un diccionario de palabras en español que
permite clasificar las noticias según el tipo de delito, basado en los algoritmos
de Clustering K-Means, K-Medoids, CLARA. Conjuntamente se
implementaron los algoritmos de clasificación supervisada Naive Bayes, Knn,
Support Vector Machine y Redes Neuronales, para los que se evaluó el
desempeño de la clasificación realizada.
The next paper presents the application and evaluation of text mining
techniques for the classification of criminal news, it was build a criminal news
dataset was constructed from different media outlets in the city of Popayán to
identify and characterize different types of crimes; In addition, a dictionary of
words in Spanish was constructed that allows to classify the news according
to the type of crime, based on the algorithms of Clustering K-Means, KMedoids,
CLARA. The Naive Bayes, K-nn, Support Vector Machine and
Neural Networks algorithms applied to monitor the performance of the
classification.