========================= 7. Privacy e SynthGen ========================= Objetivo ======== Proteger dados sensiveis com politicas de privacidade e gerar datasets sinteticos com utilidade pratica. Fluxo de Privacy ================ 1. Abrir ``Privacy``. 2. Criar ou selecionar politica. 3. Associar politica ao dataset/sessao. 4. Rodar deteccao e revisar entidades PII encontradas. 5. Configurar acao por regra (mask/redact/hash/encrypt/generalize/suppress). 6. Executar transformacao e exportar dataset protegido. Fluxo de SynthGen ================= 1. Abrir ``SynthGen``. 2. Selecionar dataset fonte e perfil de geracao. 3. Configurar tamanho alvo e restricoes opcionais. 4. Iniciar job de geracao. 5. Baixar artifact sintetico apos conclusao. Checks de qualidade e paridade ============================== 1. Paridade de schema: - Quantidade de colunas e nomes esperados. 2. Paridade de privacidade: - Valores sensiveis originais nao aparecem na saida. 3. Paridade de utilidade: - Tendencias de distribuicao permanecem uteis. 4. Integridade: - Arquivo legivel e row count conforme configuracao. Checklist de validacao funcional ================================ 1. Deteccao privacy retorna achados quando existe PII. 2. Transformacao gera artifact baixavel. 3. SynthGen termina em estado ``completed``. 4. Dataset sintetico pode ser carregado em Datasets/Experiments. 5. Erros retornam diagnostico acionavel. Resultado esperado ================== 1. Dados sensiveis protegidos conforme politica. 2. Dados sinteticos aptos para prototipo e testes. Erros comuns e recuperacao ========================== 1. Nenhum achado PII quando esperado: - Revisar politica/regras e colunas fonte. 2. Falha de transformacao: - Reexecutar com escopo menor de regras. 3. Timeout no SynthGen: - Reduzir tamanho e tentar novamente. Imagens ======= .. figure:: ../../_static/user-manual/common/privacy.png :alt: Politicas e execucao de Privacy :width: 90% Modulo Privacy com execucao de politicas. .. figure:: ../../_static/user-manual/common/synthgen.png :alt: Geracao de dados sinteticos :width: 90% Fluxo de geracao e resultado do SynthGen.