El Text Mining resume al conjunto de técnicas dedicadas a extraer información valiosa contenidas en grandes sets de datos de texto. Su aplicación creciente para el análisis de redes sociales y la gestión inteligente de documentación la ha posicionado como una de las áreas de data mining con mayor impacto actual y futuro.
En este curso vas a aprender las técnicas y herramientas más utilizadas para el tratamiento y clasificación de los datos no estructurados de texto y su implementación directa en todo tipo de aplicaciones productivas como la atención a redes sociales, el análisis político, el filtrado y clasificación de mails y mucho más.
A lo largo del curso se trabajará con elementos de texto provenientes de redes sociales (ej:twitter) a través de los cuales se presentarán las distintas etapas en la construcción de un modelo de clasificación.
El curso inicia explicando qué es el text mining, su importancia e impacto, sus limitaciones y complicaciones en su estado actual de desarrollo, discutiendo y analizando los criterios con los que debemos plantear la búsqueda de la relevancia entre los grandes volúmenes de datos proveniente del texto.
Se comenzará con prácticas dedicadas al análisis de las palabras y de la composición de frases mediante el estudio de las asociaciones, los atributos y el análisis de las estructuras morfológicas, semánticas y discursivas mediante PLN (Procesamiento del Lenguaje Natural). Se enseñarán técnicas de Smoothing para el ajuste de la dimensionalidad cuando existe insuficiencia de datos. Con los sets de datos de texto preparados se procederá a la asignación de significado mediante técnicas de clustering y de clasificación con Naive Bayes y K-means entre otras. Finalmente se realizará la evaluación de los modelos resultantes mediante las técnicas de test collections y precision recall.
A lo largo del curso también se introducirán diferentes herramientas para la extracción de datos de redes y web (Pahntom.JS y Casper.JS) y para el análisis de sentimientos (TextBlob), y se enseñarán a usar librerías de diccionarios de palabras basadas en Phyton.
Este curso es ideal para analistas dedicados a rubros de gestión de redes sociales y de análisis de documentos web.
Se requiere conocimientos sólidos en Data Mining y Técnicas de Clustering.
👉 Se recomienda hacer los cursos Data Mining Aplicado y Técnicas de Clustering.
Sin fechas programadas / Consulte a contacto@eant.tech o llamando al 11 5258 4500
Podés conocer más sobre la Escuela de Ciencia de Datos clickeando acá.
Suipacha 207 - Piso 1
Microcentro, Cdad de Buenos Aires, Argentina
contacto@eant.tech
+54 11 5258 4500