Data mining, como sua tradução literal já diz, é um conceito de mineração de dados, ou seja, procurar dados específicos, padrões, relacionamentos e outros dentro de grandes conjuntos de dados. Essa atividade tem crescido muito nos últimos anos, mas ainda enfrenta sérias dificuldades no Brasil devido à falta de interligação entre diferentes órgãos, inconsistência de dados, etc. No entanto, apesar de ainda significativamente "escondidas", encontramos algumas verdadeiras "data mines" (minas de dados) no Brasil:
- IBGE - http://www.ibge.gov.br: Site do Instituto Brasileiro de Geografia e Estatística, principal referência em dados sociais, econômicos e demográficos no Brasil. Para acessar a página de produtos do IBGE, muitos disponíveis para download (como, por exemplo, os dados dos censos demográficos), vá em http://www.ibge.gov.br/home/geociencias/default_prod.shtm
- Fundação SEADE - http://www.seade.gov.br: Possui grande quantidade de dados do estado de São Paulo que podem ser agrupados e manipulados, gerando tabelas e gráficos.
- DATASUS - http://www2.datasus.gov.br: Base de dados sobre saúde do SUS (Sistema Único de Saúde) do Brasil.
Caro leitor, participe! Se você sabe de mais algum bom site com grande quantidade de dados no Brasil (ou que tenha dados do Brasil) envie por meio de comentário na postagem.