Skip to content

pachexyz/PDF-Text-Extractor

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PDF Text Extractor

Una aplicación de escritorio moderna para extraer texto de archivos PDF, construida con Python y CustomTkinter.

image image

✨ Características

  • Interfaz moderna con tema oscuro/claro
  • Selección múltiple de archivos PDF (procesamiento por lotes)
  • Rango de páginas configurable (ej: 1-3, 5, 7-9)
  • Múltiples formatos de salida: TXT, Markdown, JSON
  • Vista previa del texto extraído en tiempo real
  • Barra de progreso animada durante la extracción
  • Metadatos del PDF: título, autor, número de páginas
  • Copiar al portapapeles con un clic
  • Manejo de errores para PDFs protegidos o corruptos

🚀 Instalación y uso

Opción 1: Script automático (recomendado)

Haz doble clic en install_and_run.bat

Opción 2: Manual

pip install -r requirements.txt
python pdf_extractor.py

📋 Requisitos

  • Python 3.10+
  • Las dependencias se instalan automáticamente

📦 Dependencias

Librería Uso
customtkinter Interfaz gráfica moderna
PyMuPDF Motor principal de extracción
pdfplumber Motor de extracción alternativo

📄 Formatos de salida

Formato Descripción
.txt Texto plano
.md Markdown con metadatos del PDF
.json Estructura JSON con metadatos y contenido

About

Una aplicación de escritorio moderna para extraer texto de archivos PDF, construida con Python y CustomTkinter.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors