7. Privacy y SynthGen
Objetivo
Proteger datos sensibles con politicas de privacidad y generar datasets sinteticos utiles.
Flujo de Privacy
Abrir
Privacy.Crear o seleccionar politica.
Asociar politica a dataset/sesion.
Ejecutar deteccion y revisar entidades PII detectadas.
Configurar accion por regla (mask/redact/hash/encrypt/generalize/suppress).
Ejecutar transformacion y exportar dataset protegido.
Flujo de SynthGen
Abrir
SynthGen.Seleccionar dataset fuente y perfil de generacion.
Configurar tamano objetivo y restricciones opcionales.
Iniciar job de generacion.
Descargar artifact sintetico al completar.
Checks de calidad y paridad
Paridad de schema: - Conteo de columnas y nombres esperados.
Paridad de privacidad: - Valores sensibles originales no expuestos.
Paridad de utilidad: - Tendencias de distribucion utiles para modelado.
Integridad: - Archivo legible y row count segun configuracion.
Checklist de validacion funcional
Deteccion privacy devuelve hallazgos cuando hay PII.
Transformacion genera artifact descargable.
SynthGen termina en estado
completed.Dataset generado puede cargarse en Datasets/Experiments.
Estados de error entregan diagnostico util.
Resultado esperado
Datos sensibles protegidos segun politica.
Datos sinteticos usables para prototipos y pruebas.
Errores comunes y recuperacion
Sin hallazgos PII cuando se esperan: - Revisar politica/reglas y columnas fuente.
Falla de transformacion: - Reintentar con alcance de reglas mas acotado.
Timeout de SynthGen: - Reducir tamano y reejecutar.
Imagenes
Modulo Privacy con ejecucion de politicas.
Flujo de generacion y salida de SynthGen.