¡Hola! Bienvenida al curso de análisis cuantitativo de texto del verano de 2021:

  • Un syllabus con las sesiones y temas que veremos
  • El código que usaremos en las sesiones
  • Laboratorios y tareas



Acerca del curso

La idea de este curso es que las personas que los tomen puedan enfrentarse a los problemas más comunes de procesamiento, análisis y visualización de datos provenientes del lenguaje natural.

Es por eso que se utilizará el lenguaje humano como insumo para poder entender ciertos patrones del lenguaje. Algunas habilidades que se podrán adquirir de este curso son las siguientes:

  • Procesar textos de diversas fuentes digitales para usarlos como insumos de análisis.
  • Clasificar de manera sistemática documentos en categorías conocidas o desconocidas.
  • Identificar el sentimiento de ciertas palabras para conocer el tono de ciertos textos
  • Analizar qué tan parecidos son algunos textos





Fechas 📆, horarios ⏱ y costo 💸

El curso tiene una duración de 16 horas clase + asesoría para proyectos propios.

  • Sábados 21, 28 agosto y 4 y 11 de septiembre.

  • De 10 am a 2 pm (4 horas por sesión)

El curso tiene un costo de 3,000 pesos mexicanos en total (se emiten facturas).






🤓 Artículos académicos

John Wilkerson and Andreu Casas (2017), Large-Scale Computerized Text Analysis in Political Science: Opportunities and Challenges Annual Review of Political Science, 20:1, 529-544 enlace

Grimmer, J., & Stewart, B. (2013). Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts. Political Analysis, 21(3), 267-297. doi:10.1093/pan/mps028 enlace

🔥 El trabajo de Dan Berliner enlace









¿ Cómo instalo (y uso) R?

Para este curso vamos a trabajar, desde el principio, con código en R. Es necesario tener la última versión de este lenguaje, al momento de escribir este repositorio ésta es la versión 4.1.1.

Para instalarlo, es necesario entrar a The Comprehensive R Archive Network y seguir las instrucciones para cada sistema operativo.

MAC OSX

  • Basta con descargar el archivo .pkg de este link, descomprimir el archivo, abrir el archivo y seguir las instrucciones.

Windows

  • Basta con descargar el archivo .exe de este link, abrir el archivo y seguir las instrucciones.

Linux

En Terminal, escribir las siguientes dos líneas:

sudo apt-get update

sudo apt install r-base r-base-core r-recommended r-base-de


¿Cómo instalar RStudio?

Para instalar RStudio (plataforma que usaremos para el uso de R), es necesario acudir a esta página y seleccionar nuestro sistema operativo en el menú Installers for Supported Platforms.

Para Ubuntu, hay que correr estas líneas en Terminal:

sudo apt-get install gdebi-core

wget https://download2.rstudio.org/server/xenial/amd64/rstudio-server-1.3.1093-amd64.deb

sudo gdebi rstudio-server-1.3.1093-amd64.deb


¿Cómo instalo LaTeX?

Es importante tener LaTeX para crear documentos en PDF. Para instalarlo, hay que entrar a este sitio y seleccionar nuestro sistema operativo.






Textos, libros y materiales

Para aprender R

Hay, realmente, miles de materiales excelentes para aprender R. En mi experiencia éstos han sido los más útiles.

Para resolver (y buscar dudas)






RMarkdown y otras herramientas

En este curso se pretende que podamos presentar resultados en reportes profesionales y muy elegantes que puean ser leídos (y usados) por cualquiera. Así, usaremos Markdown “con sabor” a R para generar código y resultados.