Scrapping de notícias brasileiras.
A ideia desse projeto é conseguir reunir a maior quantidade possível de notícias do Brasil pelo maior período de tempo, tudo em uma só base de dados.
A maior dificuldade desse projeto, até o momento, é conseguir encontrar essas notícias antigas armazenadas em algum lugar. Sabemos que cada veículo de informação possui seu arquivo de notícias, mas nem sempre ele é facilmente acessível. Até o momento, apenas o arquivo do UOL foi mapeado.
Fique à vontade para fazer qualquer comentário, sugestão ou contribuir com o código desse projeto.
- UOL desde 2009