Objetivo del ejercicio: Aprender a usar ChatGPT/Gemini para analizar un archivo de ventas, descubriendo patrones y generando estadísticas y tablas como si fueran un “Excel inteligente”, sin programar.
Archivo a usar: dataset_ventas.csv
Columnas: id, producto, categoria, region, fecha, ventas
Acción: Sube el archivo dataset_ventas.csv al chat de la IA.
Prompt sugerido:
Revisa el archivo dataset_ventas.csv.
Dime: número de filas y columnas, lista de columnas, tipo de dato de cada columna,
primeras 5 filas y si hay valores nulos o duplicados.
Resultado esperado: Descripción clara de la estructura y calidad inicial de los datos.
Acción: Pide que la columna fecha se reconozca como fecha.
Prompt sugerido:
Convierte la columna 'fecha' a tipo fecha (AAAA-MM-DD).
Agrega dos columnas nuevas: 'year' y 'mes'.
Indica cuántas fechas inválidas hay.
Resultado esperado: Columna de fecha corregida y dos nuevas variables (anio, mes).
Acción: Obtén medidas básicas de la columna ventas.
Prompt sugerido:
Dame un resumen descriptivo de la columna 'ventas':
mínimo, máximo, media, mediana, Q1, Q3, desviación estándar,
percentiles 5% y 95%, sesgo y curtosis.
Explica si los datos parecen simétricos o si hay valores extremos.
Resultado esperado: Tabla de estadísticos + interpretación de la distribución.
Acción: Pide tablas de agregados.
Prompt sugerido:
Calcula las ventas totales, promedio y conteo por 'categoria', por 'region' y por 'producto'.
Ordénalas de mayor a menor por ventas totales e indícame el Top 3 en cada caso.
Resultado esperado: Tres rankings con los mejores grupos en ventas.
Acción: Analiza ventas por mes.
Prompt sugerido:
Agrupa las ventas por 'mes' y muéstrame la tabla cronológica.
Describe si hay picos, caídas o una tendencia clara.
Resultado esperado: Tabla de ventas mensuales con un comentario sobre la tendencia.
Acción: Pide detección de valores extremos.
Prompt sugerido:
Detecta outliers en la columna 'ventas' usando el método IQR.
Dame Q1, Q3, el IQR, límites inferior y superior,
y las filas consideradas outliers.
Explica si parecen errores o ventas extraordinarias.
Resultado esperado: Tabla con outliers y explicación de su relevancia.
Acción: Solicita tabla tipo pivot.
Prompt sugerido:
Haz una tabla con 'categoria' en filas, 'region' en columnas y la suma de 'ventas' en los valores.
Señala qué combinación es la más fuerte y cuál la más débil.
Resultado esperado: Matriz categoría×región con oportunidades detectadas.
Acción: Contesta estas preguntas en un párrafo cada una:
¿Qué categoría o región es la más fuerte?
¿Dónde hay oportunidad de crecer?
¿Cómo ayudó la IA a hacer el análisis más rápido?
¿Qué limitaciones viste frente a Excel u otra herramienta?
Resumen de la estructura del dataset.
Estadísticos descriptivos de ventas con interpretación.
Ranking Top 3 por categoría, región y producto.
Tabla de ventas mensuales con tendencia.
Tabla de outliers con reflexión.
Pivot categoría×región con conclusiones.
Reflexión final de 5–8 líneas.