3. Proyectos y Datasets

Objetivo

Crear proyectos, subir datasets y validar integridad de datos antes del modelado.

Precondiciones

  1. Usuario con permisos de crear proyecto y subir datasets.

  2. Archivo fuente en formato CSV o Parquet.

Crear proyecto

  1. Abrir Projects.

  2. Click en Create Project.

  3. Definir: - Nombre del proyecto. - Descripcion opcional. - Alcance de visibilidad/team si aplica.

  4. Guardar y confirmar que aparece en el listado.

Subir dataset

  1. Abrir Datasets dentro del proyecto objetivo.

  2. Click en Upload Dataset.

  3. Seleccionar archivo y metadata opcional.

  4. Esperar estado de ingesta completado.

  5. Abrir detalle del dataset.

Validar calidad de datos

  1. Revisar inferencia de schema: - Nombres de columnas. - Tipos de datos. - Nulos por columna.

  2. Revisar conteo de filas y duplicados.

  3. Revisar preview para errores de parseo.

  4. Confirmar que fechas y delimitadores se interpretaron bien.

Checklist de validacion funcional

  1. Artifact de dataset creado y visible.

  2. Row count reportado coincide con lo esperado.

  3. Columnas criticas mantienen tipo correcto.

  4. Preview no presenta corrimiento/truncado.

  5. Reabrir detalle muestra metadata consistente.

Resultado esperado

  1. Proyecto y dataset listos para Builder y Experiments.

  2. Version de dataset visible y seleccionable.

Errores comunes y recuperacion

  1. Upload en estado infinito: - Reintentar con muestra menor. - Revisar logs de parser.

  2. Tipos mal detectados: - Re-subir archivo con headers/fechas normalizadas.

  3. Diferencia de filas: - Validar delimitador, comillas y filas mal formadas.

Imagenes

Lista de proyectos y flujo de creacion

Modulo de proyectos con creacion y seleccion.

Upload y registro de datasets

Registro de datasets con estado y metadata.