Temos muito conhecimento fundamentado para a garantia da qualidade de dados.
O ponto aqui é: O que é qualidade de dados?
Lhe apresento o DMBok (O Corpo de Conhecimento em Gerenciamento de Dados)
Para o DMBok a Qualidade de Dados é “o planejamento, implementação e controle das atividades que se aplicam na gestão da Qualidade técnicas dos dados, a fim de garantir que estejam aptos ao consumo e atendam às necessidades dos consumidores de dados”.
Como as expectativas sobre Data Quality nem sempre são verbalizadas e conhecidas, é necessária uma discussão contínua. A qualidade dos dados depende do contexto e dos requisitos do consumidor de dados.
Reflita sobre as seguintes dimensões da qualidade de dados para entender o porque de não precisarmos reinventar a roda.
1. Precisão
2; Completude
3. Consistência
4. Integridade
5. Razoabilidade
6. Pontualidade
7. Exclusividade ou desduplicação
8. Validade
9. Acessibidade
Alguns dos benefícios de uma governança de dados são:
1. Aumentar o valor dos dados organizacionais e as oportunidades de usá-los;
2. Reduzir riscos associados a dados de baixa qualidade;
3. Melhorar a eficiência e a produtividade organizacional;
4. Proteger e melhorar a reputação da organização;
5. Perfil de dados;
6. Padronização de dados;
7. Monitoramento de dados;
8. Limpeza de dados.
Alguns desses itens podem nos fazer declinar de projetos importantes, pois sabemos da importância da qualidade de dados como pré-requisitos, por exemplo projetos para IA, BI, Data Lake, etc.