Para acessar o dataset original usado neste trabalho, basta acessar o link do Kaggle. Porém, isso não é recomendado já que o dataset tem tamanho maior que 100GB. Para este repositório, foi feito a conversão dos .dcm
para .png
desses dados do Kaggle e, então, feito uma redução de dimensão para 600x600 pixels.
Para que este projeto rode sem problemas, você deve usar este dataset. Você também pode usar outra versão do dataset, mas saiba que terá que modificar também o código para aceitar a nova versão.
Também há este outro link para baixar o dataset, mas para a reprodução deste projeto foi usado o link anterior, já que ele se encontra numa estrutura própria para ser embaralhado e servir de input para os modelos de redes neurais feitos no keras, usando data generators.
Você também precisa baixar os arquivos train_image_level.csv e train_study_level.csv, que são usados para saber de quais classes as imagens são.
Por favor, não esqueça de conferir a licensa deste dataset, que se encontra neste mesmo diretório, no arquivo LICENSE.md.