Please enable / Bitte aktiviere JavaScript!
Veuillez activer / Por favor activa el Javascript![ ? ]

Data Wrangling: Limpeza de Dados



Limpeza de dados

Atividade cujo objetivo é eliminar as inconsistências sem alterar a veracidade do conjunto de dados de modo a gerar um conjunto de dados apropriado para análise.


Tipos de limpeza

A limpeza de dados pode ser realizada:

  • de forma manual (se a quantidade de dados for pequena) ou
  • de forma automática (para grandes quantidades de dados), onde desenvolve-se um programa que realize estas atividades.

Etapas de limpeza

  1. Realizar uma cópia do conjunto de dados a ser limpo. Isto é recomendado para evitar que qualquer alteração corrompa o conjunto de dados.
  2. Organizar os dados em uma estrutura conveniente.
  3. Aplicar cada tipo de correção e avaliar sua adequação:
    1. Corrigir dados faltantes;
    2. Corrigir dados duplicados;
    3. Corrigir dados inconsistentes; e
    4. Corrigir outros erros nos dados.

Tipos de problemas e soluções

Dados ausentes

As opções para tratamentos de dados ausentes podem incluir:

  • Exclusão de dado;
  • Associação de um valor padrão; ou
  • Aquisição de dados de outra fonte.


Para citar este artigo

REVISTABW. Data Wrangling: Limpeza de Dados.Revista Brasileira de Web: Tecnologia. Disponível em https://www.revistabw.com.br/revistabw/data-wrangling-limpeza-de-dados/. Criado em: 23/05/2018. Última atualização: 24/05/2018. Visitado em: 22/06/2018


Procurando mais conteúdos ? Utilize o campo de busca abaixo



Leia +



Você também deveria ler


O conteúdo da Revista Brasileira de Web é licenciado sob uma Licença Creative Commons Atribuição 3.0 Brasil, exceto quando especificado claramente em contrário. Este é um site de conteúdos diversos e dicas gerais e não substitui a consultoria de um profissional devidamente qualificado. Isto significa que os assuntos aqui abordados possuem caráter geral e podem não ser adequados no seu caso. Leia nossos Termos de Uso e Privacidade.