Actividad 6. Análisis de los resultados

Actividad 6. Análisis de los resultados
Objetivo
Aprender técnicas estadísticas para el análisis de los resultados.
Forma de trabajo
Grupal/ Equipos
Producto
Reporte de análisis que incluya las conclusiones retomando las dos notebooks trabajadas en jupyterlab.
Recursos
- Sitio Jupyterlab
- Jupyter Notebook práctica: “EstadisticaDescriptiva.ipynb.”.
- Datos de entrada:
Los académicos de diversas áreas y los profesionistas se están apropiando rápidamente de las tecnologías del cómputo y las telecomunicaciones, gracias a la integración y nuevo enfoque que promovió esta área denominada TIC (Tecnologías de la Información y las Comunicaciones). Esta visión ha facilitado el uso de nuevas tecnologías para adquirir masivamente datos tradicionales y datos que antes no imaginábamos obtener fácilmente, procesar de manera automática y analizar con resultados muy prometedores; por ejemplo, el detalle en el comportamiento de compra, los desplazamientos espaciales de las personas a partir del GPS de sus celulares, los análisis de sentimientos e grupos de Whatsapp y Facebook. Esta facilidad trae consigo nuevas problemáticas en el análisis de datos y sus resultados
En este contexto, los análisis de datos requieren procesos tecnológicos más sofisticados, de los cuales es necesario conocer sus fundamentos; ya que se ha implementado y distribuido ampliamente herramientas que funcionan como cajas negras y que requieren entrenamiento altamente especializado y conocimientos teóricos complejos de otras disciplinas. Ahora es necesario implementar procesos de Extracción, Transformación, Integración y Entrega de datos, utilizar estrategias de limpieza o depuración de datos y algoritmos de Aprendizaje Máquina (ML, Machine Learning) y Redes neuronales.
Para realizar estas transformaciones es necesario explorar los datos a través de sus Funciones de densidad probabilística (PDF, por sus siglas en inglés) o con Histogramas de frecuencia, así como sus propiedades estadísticas.
Instrucciones:
El/la estudiante
- Revisará en clase guiada por el docente, la implementación y automatización de instrumentos de recolección de datos en sistemas informáticos y las herramientas para su análisis con software (análisis de textos, análisis estadístico y gráfico, etc.).
- Descargará con apoyo de su docente Jupyterlab del sitio: https://jupyter.org/
- Revisará con apoyo de su docente el funcionamiento del software.
- Descargará los siguientes archivos de entrada y los almacenará en una carpeta con el nombre de la actividad.
- Automoviles.csv
- Clustering01
- Modislostuxtlas03.csv
- Mall.customers.csv
- Nota: Considerará que los datos de entrada son fundamentales para el funcionamiento de las notebook de esta actividad y posteriores.
- Una vez que los archivos de entrada están correctamente almacenados ejecutará la Notebook en JupiterLab: EstadisticaDescriptiva.ipynb.
- Organizará con la ayuda de la Notebook anterior los datos y ejecutará los primeros tratamientos para su limpieza y preparación (formación de dataframes basada en objetivos de análisis).
- Realizará un Análisis Exploratorio de Datos (EDA, por sus siglas en inglés) usando el Notebook electrónico proporcionado en el punto 5 y considerando los dataframes basados en objetivos de análisis.
- Elaborará un reporte de los análisis y sus conclusiones, adaptando el Notebook electrónico proporcionado.
- Compartirá con su docente a través de la plataforma el reporte de análisis elaborado.