Actividad 6. Análisis de los resultados

Actividad 6. Análisis de los resultados

Objetivo

Aprender técnicas estadísticas para el análisis de los resultados. 

Forma de trabajo

Grupal/ Equipos

Producto

Reporte de análisis que incluya las conclusiones retomando las dos notebooks trabajadas en jupyterlab.

Recursos

Los académicos de diversas áreas y los profesionistas se están apropiando rápidamente de las tecnologías del cómputo y las telecomunicaciones, gracias a la integración y nuevo enfoque que promovió esta área denominada TIC (Tecnologías de la Información y las Comunicaciones). Esta visión ha facilitado el uso de nuevas tecnologías para adquirir masivamente datos tradicionales y datos que antes no imaginábamos obtener fácilmente, procesar de manera automática y analizar con resultados muy prometedores; por ejemplo, el detalle en el comportamiento de compra, los desplazamientos espaciales de las personas a partir del GPS de sus celulares, los análisis de sentimientos e grupos de Whatsapp y Facebook. Esta facilidad trae consigo nuevas problemáticas en el análisis de datos y sus resultados

En este contexto, los análisis de datos requieren procesos tecnológicos más sofisticados, de los cuales es necesario conocer sus fundamentos; ya que se ha implementado y distribuido ampliamente herramientas que funcionan como cajas negras y que requieren entrenamiento altamente especializado y conocimientos teóricos complejos de otras disciplinas. Ahora es necesario implementar procesos de Extracción, Transformación, Integración y Entrega de datos, utilizar estrategias de limpieza o depuración de datos y algoritmos de Aprendizaje Máquina (ML, Machine Learning) y Redes neuronales.

Para realizar estas transformaciones es necesario explorar los datos a través de sus Funciones de densidad probabilística (PDF, por sus siglas en inglés) o con Histogramas de frecuencia, así como sus propiedades estadísticas.

Instrucciones:

El/la estudiante

  1. Revisará en clase guiada por el docente, la implementación y automatización de instrumentos de recolección de datos en sistemas informáticos y las herramientas para su análisis con software (análisis de textos, análisis estadístico y gráfico, etc.).
  2. Descargará con apoyo de su docente Jupyterlab del sitio: https://jupyter.org/
  3. Revisará con apoyo de su docente el funcionamiento del software. 
  4. Descargará los siguientes archivos de entrada y los almacenará en una carpeta con el nombre de la actividad. 
  5. Una vez que los archivos de entrada están correctamente almacenados ejecutará la Notebook en JupiterLab: EstadisticaDescriptiva.ipynb.
  6. Organizará con la ayuda de la Notebook anterior los datos y ejecutará los primeros tratamientos para su limpieza y preparación (formación de dataframes basada en objetivos de análisis).
  7. Realizará un Análisis Exploratorio de Datos (EDA, por sus siglas en inglés) usando el Notebook electrónico proporcionado en el punto 5 y considerando los dataframes basados en objetivos de análisis.
  8. Elaborará un reporte de los análisis y sus conclusiones, adaptando el Notebook electrónico proporcionado.
  9. Compartirá con su docente a través de la plataforma el reporte de análisis elaborado.