Este proyecto permite unir múltiples archivos PDF en un solo documento utilizando Python y la biblioteca PyPDF2
.
Asegúrse de tener instalado Python 3 en el sistema. Verificar con:
python3 --version
Para evitar conflictos con el sistema, se recomienda usar un entorno virtual.
Ejecuta los siguientes comandos en la terminal:
# 1. Navega a la carpeta del proyecto
cd /ruta/del/proyecto
# 2. Crea un entorno virtual
python3 -m venv venv
# 3. Activa el entorno virtual (Mac/Linux)
source venv/bin/activate
Cuando el entorno esté activo, verás el prefijo (venv)
en la terminal.
Una vez activado el entorno virtual, instala la biblioteca necesaria:
pip install PyPDF2
Este proyecto cuenta con dos versiones del script para combinar archivos PDF:
PDFUnion.py: Permite unir archivos PDF mediante una lista manual de archivos.
UnionPDF_glob.py: Usa la biblioteca glob para seleccionar automáticamente todos los archivos PDF dentro de la carpeta data/ sin necesidad de listarlos manualmente.
Para unir los archivos PDF, simplemente ejecuta:
python PDFUnion.py
Esto generará un archivo con los documentos combinados. Archivos de prueba document1.pdf, document2.pdf y document3.pdf en el proyecto, al ejecutar se deben de unir en uno solo como el ejemplo.
Ejemplo con UnionPDF_glob.py
python UnionPDF_glob.py
Este script buscará automáticamente todos los archivos .pdf dentro de la carpeta data/ y los combinará en un solo archivo.
Si terminas de trabajar y quieres salir del entorno virtual, usa:
deactivate
Si ves este error, asegúrate de que el entorno virtual está activado y PyPDF2
está instalado dentro de él:
source venv/bin/activate
pip install PyPDF2
Si pip install PyPDF2
falla debido a una restricción del sistema, usa un entorno virtual como se explica arriba.