Skip to content

Latest commit

 

History

History
45 lines (30 loc) · 1.71 KB

File metadata and controls

45 lines (30 loc) · 1.71 KB

Juez Bot

Este proyecto tiene el objetivo de predecir las decisiones de la Comisión de Protección al Consumidor de INDECOPI

Estructura del repositorio

Este repositorio está dividido en tres secciones principales y una de exploración:

  1. Reading-Resolutions:
    • Para predecir las decisiones debemos recurrir a las resoluciones disponibles de INDECOPI las cuales se encuentran organizadas aquí.
    • Luego debemos realizar un primer procesamiento del documento donde convertimos de pdf a txt
    • Procedemos con todo el procedimiento de text mining de estas resoluciones, todo ello se encuentra en el archivo procesamiento de de documentos.
  2. Preprocesing-vectorization:
    • Lo siguiente es, a partir de lo anterior, estructura la data en tablas. Aquí vemos el resultado final de todas las resoluciones procesadas y organizadas por distintos años
    • Estas tabalas servirán de input para vectorizar bajo distintos métodos:
      • Binario
      • TF-IDF
      • Embeddings
  3. Modeling:
    • En esta sección procedemos a realizar los modelos de aprendizaje supervisado que nos permitirán predecir:
      • MLP
      • SVM
      • Random Forest
  4. Exploracion-data: Finalmente se tiene una sección de bonus que nos da un alcance de exploración de los datos.

Pre-requisitos

Todo el proyecto se encuentra hecho en Python 3.8.0 con el uso de las siguientes librerías:

  • pdfminer
  • xlwt

Autores

  • Diego Alvarado El hacker
  • Maria Paz Herrera La gfa
  • Diego Mayandia Barbitas

Programado con ❤️

#laFe