7. Privacy e SynthGen

Objetivo

Proteger dados sensiveis com politicas de privacidade e gerar datasets sinteticos com utilidade pratica.

Fluxo de Privacy

  1. Abrir Privacy.

  2. Criar ou selecionar politica.

  3. Associar politica ao dataset/sessao.

  4. Rodar deteccao e revisar entidades PII encontradas.

  5. Configurar acao por regra (mask/redact/hash/encrypt/generalize/suppress).

  6. Executar transformacao e exportar dataset protegido.

Fluxo de SynthGen

  1. Abrir SynthGen.

  2. Selecionar dataset fonte e perfil de geracao.

  3. Configurar tamanho alvo e restricoes opcionais.

  4. Iniciar job de geracao.

  5. Baixar artifact sintetico apos conclusao.

Checks de qualidade e paridade

  1. Paridade de schema: - Quantidade de colunas e nomes esperados.

  2. Paridade de privacidade: - Valores sensiveis originais nao aparecem na saida.

  3. Paridade de utilidade: - Tendencias de distribuicao permanecem uteis.

  4. Integridade: - Arquivo legivel e row count conforme configuracao.

Checklist de validacao funcional

  1. Deteccao privacy retorna achados quando existe PII.

  2. Transformacao gera artifact baixavel.

  3. SynthGen termina em estado completed.

  4. Dataset sintetico pode ser carregado em Datasets/Experiments.

  5. Erros retornam diagnostico acionavel.

Resultado esperado

  1. Dados sensiveis protegidos conforme politica.

  2. Dados sinteticos aptos para prototipo e testes.

Erros comuns e recuperacao

  1. Nenhum achado PII quando esperado: - Revisar politica/regras e colunas fonte.

  2. Falha de transformacao: - Reexecutar com escopo menor de regras.

  3. Timeout no SynthGen: - Reduzir tamanho e tentar novamente.

Imagens

Politicas e execucao de Privacy

Modulo Privacy com execucao de politicas.

Geracao de dados sinteticos

Fluxo de geracao e resultado do SynthGen.