7. Privacy y SynthGen

Objetivo

Proteger datos sensibles con politicas de privacidad y generar datasets sinteticos utiles.

Flujo de Privacy

  1. Abrir Privacy.

  2. Crear o seleccionar politica.

  3. Asociar politica a dataset/sesion.

  4. Ejecutar deteccion y revisar entidades PII detectadas.

  5. Configurar accion por regla (mask/redact/hash/encrypt/generalize/suppress).

  6. Ejecutar transformacion y exportar dataset protegido.

Flujo de SynthGen

  1. Abrir SynthGen.

  2. Seleccionar dataset fuente y perfil de generacion.

  3. Configurar tamano objetivo y restricciones opcionales.

  4. Iniciar job de generacion.

  5. Descargar artifact sintetico al completar.

Checks de calidad y paridad

  1. Paridad de schema: - Conteo de columnas y nombres esperados.

  2. Paridad de privacidad: - Valores sensibles originales no expuestos.

  3. Paridad de utilidad: - Tendencias de distribucion utiles para modelado.

  4. Integridad: - Archivo legible y row count segun configuracion.

Checklist de validacion funcional

  1. Deteccion privacy devuelve hallazgos cuando hay PII.

  2. Transformacion genera artifact descargable.

  3. SynthGen termina en estado completed.

  4. Dataset generado puede cargarse en Datasets/Experiments.

  5. Estados de error entregan diagnostico util.

Resultado esperado

  1. Datos sensibles protegidos segun politica.

  2. Datos sinteticos usables para prototipos y pruebas.

Errores comunes y recuperacion

  1. Sin hallazgos PII cuando se esperan: - Revisar politica/reglas y columnas fuente.

  2. Falla de transformacion: - Reintentar con alcance de reglas mas acotado.

  3. Timeout de SynthGen: - Reducir tamano y reejecutar.

Imagenes

Politicas y ejecucion de Privacy

Modulo Privacy con ejecucion de politicas.

Generacion de datos sinteticos

Flujo de generacion y salida de SynthGen.