-
Notifications
You must be signed in to change notification settings - Fork 12
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Investigar Spiders Contracts para testar las Spiders. #24
Comments
antes he usado un también estuve testeando el pipeline https://github.com/proyectosdeley/proyectos_de_ley_scraper/tree/master/pdl_scraper tener tests para manolo_scaper sería un golazo. |
@aniversarioperu, genial. Voy a revisar el fake response y proponer un metodo para testear las spider de manolo. |
ok, si te encargas entonces me des-auto-asignaré 😄 |
@aniversarioperu, por ahora los unicos tests que tenemos son tests para los metodos |
Ahora que se esta en proceso de refactorizar las spiders y agregar items loaders para la recoleccion de datos. Nos vemos con la necesidad de testar las spider de una manera programatica.
Actualmente mi forma de testar una spider es:
Comparar el total de elementos de una fecha.
Escoger un item de la primera pagina y buscar este elemento en la base de datos.
Escoger un item de una pagina intermedia y buscar este elemento en la base de datos.
Escoger un item de la pagina final y buscar este elemento en la base de datos.
Cosas interesantes sobre los registros de visitas.
Hay "invarianza" en el total de visitas de una determinada fecha.
Hay "invarianza" en los items de una determinada fecha.
Si es que spider contracts no funciona para nuestro caso la idea seria usar pytest conectado a la base de datos y verificar que los registros estan en la base de datos.
Creo que se va necesitar agregar una comando para hacer crawling de una fecha especifica.
Link: Spider Contracts: http://doc.scrapy.org/en/latest/topics/contracts.html
The text was updated successfully, but these errors were encountered: