Una aplicación de escritorio moderna para extraer texto de archivos PDF, construida con Python y CustomTkinter.
- Interfaz moderna con tema oscuro/claro
- Selección múltiple de archivos PDF (procesamiento por lotes)
- Rango de páginas configurable (ej:
1-3, 5, 7-9) - Múltiples formatos de salida: TXT, Markdown, JSON
- Vista previa del texto extraído en tiempo real
- Barra de progreso animada durante la extracción
- Metadatos del PDF: título, autor, número de páginas
- Copiar al portapapeles con un clic
- Manejo de errores para PDFs protegidos o corruptos
Haz doble clic en install_and_run.bat
pip install -r requirements.txt
python pdf_extractor.py- Python 3.10+
- Las dependencias se instalan automáticamente
| Librería | Uso |
|---|---|
customtkinter |
Interfaz gráfica moderna |
PyMuPDF |
Motor principal de extracción |
pdfplumber |
Motor de extracción alternativo |
| Formato | Descripción |
|---|---|
.txt |
Texto plano |
.md |
Markdown con metadatos del PDF |
.json |
Estructura JSON con metadatos y contenido |