7. Privacy e SynthGen
Objetivo
Proteger dados sensiveis com politicas de privacidade e gerar datasets sinteticos com utilidade pratica.
Fluxo de Privacy
Abrir
Privacy.Criar ou selecionar politica.
Associar politica ao dataset/sessao.
Rodar deteccao e revisar entidades PII encontradas.
Configurar acao por regra (mask/redact/hash/encrypt/generalize/suppress).
Executar transformacao e exportar dataset protegido.
Fluxo de SynthGen
Abrir
SynthGen.Selecionar dataset fonte e perfil de geracao.
Configurar tamanho alvo e restricoes opcionais.
Iniciar job de geracao.
Baixar artifact sintetico apos conclusao.
Checks de qualidade e paridade
Paridade de schema: - Quantidade de colunas e nomes esperados.
Paridade de privacidade: - Valores sensiveis originais nao aparecem na saida.
Paridade de utilidade: - Tendencias de distribuicao permanecem uteis.
Integridade: - Arquivo legivel e row count conforme configuracao.
Checklist de validacao funcional
Deteccao privacy retorna achados quando existe PII.
Transformacao gera artifact baixavel.
SynthGen termina em estado
completed.Dataset sintetico pode ser carregado em Datasets/Experiments.
Erros retornam diagnostico acionavel.
Resultado esperado
Dados sensiveis protegidos conforme politica.
Dados sinteticos aptos para prototipo e testes.
Erros comuns e recuperacao
Nenhum achado PII quando esperado: - Revisar politica/regras e colunas fonte.
Falha de transformacao: - Reexecutar com escopo menor de regras.
Timeout no SynthGen: - Reduzir tamanho e tentar novamente.
Imagens
Modulo Privacy com execucao de politicas.
Fluxo de geracao e resultado do SynthGen.