pdf-split-merge

✂️ CLI Python para juntar e separar arquivos PDF com pikepdf.

📋 Descrição

PDF Split & Merge é uma ferramenta de linha de comando poderosa e simples para manipular arquivos PDF. Permite juntar múltiplos PDFs, extrair páginas específicas, dividir PDFs em arquivos individuais, comprimir e visualizar informações.

🚀 Características

✅ Merge: Juntar múltiplos PDFs em um único arquivo
✅ Split: Extrair páginas específicas ou ranges (1-5, 1,3,5, etc.)
✅ Extract All: Separar cada página em arquivo individual
✅ Info: Visualizar metadados e informações do PDF
✅ Compress: Otimizar e reduzir tamanho do PDF
✅ Suporte a ranges complexos de páginas
✅ Validação de páginas
✅ Progress feedback visual
✅ Tratamento robusto de erros
✅ CLI intuitiva com Click

🛠️ Stack

Linguagem: Python 3.11+
Biblioteca PDF: pikepdf
CLI Framework: Click
Testes: pytest + pytest-cov
Linter: ruff
Formatter: black

📦 Instalação

Com Make

make install

Sem Make

pip install -r requirements-dev.txt

🎯 Uso

Comandos Disponíveis

python src/pdf_tool.py --help

1. Merge (Juntar PDFs)

# Juntar dois PDFs
python src/pdf_tool.py merge file1.pdf file2.pdf -o merged.pdf

# Juntar múltiplos PDFs
python src/pdf_tool.py merge intro.pdf chapter1.pdf chapter2.pdf conclusao.pdf -o livro.pdf

# Juntar todos os PDFs do diretório
python src/pdf_tool.py merge *.pdf -o all.pdf

Saída:

🔗 Juntando 3 arquivos PDF...
[1/3] Adicionando: file1.pdf
[2/3] Adicionando: file2.pdf
[3/3] Adicionando: file3.pdf

✅ Merge concluído com sucesso!
📄 Arquivo: merged.pdf
📊 Total de páginas: 45

2. Split (Extrair Páginas)

# Extrair primeiras 5 páginas
python src/pdf_tool.py split input.pdf -p 1-5 -o first5.pdf

# Extrair páginas específicas
python src/pdf_tool.py split input.pdf -p 1,3,5,7,9 -o odd.pdf

# Extrair múltiplos ranges
python src/pdf_tool.py split input.pdf -p 1-10,20-30,40-50 -o selected.pdf

# Extrair uma única página
python src/pdf_tool.py split input.pdf -p 15 -o page15.pdf

Saída:

📄 Abrindo: input.pdf
📊 Total de páginas no PDF original: 100

✅ Split concluído com sucesso!
📄 Arquivo: selected.pdf
📊 Páginas extraídas: 41

3. Extract All (Separar Todas as Páginas)

# Extrair cada página em arquivo separado
python src/pdf_tool.py extract-all input.pdf

# Com prefixo customizado
python src/pdf_tool.py extract-all input.pdf --prefix chapter

# Em diretório específico
python src/pdf_tool.py extract-all input.pdf --output-dir pages/

Saída:

📄 Abrindo: input.pdf
📊 Total de páginas: 25
📁 Diretório de saída: /path/to/pages

[1/25] Criado: page_0001.pdf
[2/25] Criado: page_0002.pdf
...
[25/25] Criado: page_0025.pdf

✅ Extração concluída! 25 arquivos criados.

4. Info (Informações do PDF)

python src/pdf_tool.py info document.pdf

Saída:

📄 Informações do PDF: document.pdf

==================================================
📊 Total de páginas: 120

📋 Metadados:
   /Title: Meu Documento
   /Author: João Silva
   /CreationDate: 2025-01-15

🔢 Versão do PDF: 1.7
🔒 Criptografado: Não
💾 Tamanho do arquivo: 5.42 MB
==================================================

5. Compress (Comprimir PDF)

python src/pdf_tool.py compress large.pdf -o compressed.pdf

Saída:

📄 Comprimindo: large.pdf

✅ Compressão concluída!
📄 Arquivo original: 10.50 MB
📄 Arquivo comprimido: 7.20 MB
📊 Redução: 31.4%

📁 Estrutura do Projeto

pdf-split-merge/
├── src/
│   └── pdf_tool.py           # CLI principal com todos os comandos
├── tests/
│   └── test_pdf_tool.py      # Testes unitários
├── requirements.txt          # Dependências de produção
├── requirements-dev.txt      # Dependências de desenvolvimento
├── Makefile
├── Dockerfile
├── .github/workflows/ci.yml
└── README.md

🧪 Testes

# Rodar testes
make test

# Testes com cobertura
pytest tests/ -v --cov=src --cov-report=html

# Ver relatório de cobertura
open htmlcov/index.html

📊 Exemplos de Uso Prático

Caso 1: Preparar Contrato para Assinatura

# Extrair apenas as páginas que precisam de assinatura
python src/pdf_tool.py split contrato_completo.pdf -p 1,15,30 -o para_assinar.pdf

Caso 2: Dividir Livro por Capítulos

# Capítulo 1 (páginas 1-20)
python src/pdf_tool.py split livro.pdf -p 1-20 -o capitulo1.pdf

# Capítulo 2 (páginas 21-45)
python src/pdf_tool.py split livro.pdf -p 21-45 -o capitulo2.pdf

Caso 3: Criar PDF Master de Apresentações

python src/pdf_tool.py merge \
  intro.pdf \
  modulo1.pdf \
  modulo2.pdf \
  modulo3.pdf \
  conclusao.pdf \
  -o treinamento_completo.pdf

Caso 4: Otimizar PDFs Pesados

# Comprimir todos os PDFs de um diretório
for file in *.pdf; do
  python src/pdf_tool.py compress "$file" -o "compressed_$file"
done

Caso 5: Imprimir Páginas Específicas

# Criar PDF só com páginas ímpares
python src/pdf_tool.py split documento.pdf -p 1,3,5,7,9,11,13,15 -o impares.pdf

🐳 Docker

# Build da imagem
make docker-build

# Merge via Docker
docker run --rm -v $(pwd):/output pdf-split-merge \
  merge /output/file1.pdf /output/file2.pdf -o /output/merged.pdf

# Split via Docker
docker run --rm -v $(pwd):/output pdf-split-merge \
  split /output/input.pdf -p 1-5 -o /output/first5.pdf

# Info via Docker
docker run --rm -v $(pwd):/output pdf-split-merge \
  info /output/document.pdf

⚙️ Sintaxe de Ranges de Páginas

O parâmetro -p ou --pages aceita:

Formato	Exemplo	Descrição
Página única	`5`	Apenas página 5
Range	`1-10`	Páginas 1 a 10 (inclusive)
Múltiplas páginas	`1,3,5`	Páginas 1, 3 e 5
Ranges combinados	`1-5,10-15,20`	Páginas 1-5, 10-15 e 20

Importante: As páginas são 1-indexed (primeira página = 1).

🔍 Validações

A ferramenta valida automaticamente:

✅ Arquivos PDF existem
✅ Páginas estão dentro do range válido
✅ Ranges são válidos (start ≤ end)
✅ Pelo menos 2 arquivos para merge
✅ Sintaxe correta de ranges

📝 Limitações

Não remove senhas de PDFs criptografados (pikepdf requer senha)
Não processa formulários PDF interativos
Compressão depende do conteúdo (imagens já comprimidas não reduzem muito)
Extract all pode criar muitos arquivos (cuidado com PDFs de 1000+ páginas)

🗺️ Roadmap

Suporte a PDFs criptografados (com senha)
Rotacionar páginas
Adicionar marca d'água
Adicionar numeração de páginas
Converter imagens para PDF
Modo batch (processar múltiplos PDFs via config file)
Interface web simples (Flask)

💡 Dicas

Performance

Para processar muitos PDFs:

# Paralelizar com GNU parallel
parallel python src/pdf_tool.py compress {} -o compressed_{} ::: *.pdf

Automatização

Criar script de backup:

#!/bin/bash
# backup-pdfs.sh
python src/pdf_tool.py merge documents/*.pdf -o "backup_$(date +%Y%m%d).pdf"

Integração CI/CD

# .github/workflows/process-pdfs.yml
- name: Merge release documents
  run: |
    pip install pikepdf click
    python pdf_tool.py merge docs/*.pdf -o release.pdf

📄 Licença

MIT License - veja LICENSE

🤝 Contribuindo

Faça fork do projeto
Crie uma branch para sua feature (git checkout -b feature/nova-feature)
Commit suas mudanças (git commit -m 'Adiciona nova feature')
Push para a branch (git push origin feature/nova-feature)
Abra um Pull Request

🐛 Reportar Bugs

Encontrou um bug? Abra uma issue com:

Versão do Python
Comando executado
Erro completo
PDF de exemplo (se possível)

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.github/workflows		.github/workflows
src		src
tests		tests
.env.example		.env.example
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
pyproject.toml		pyproject.toml
requirements-dev.txt		requirements-dev.txt
requirements.txt		requirements.txt

License

oridestomkiel/pdf-split-merge

Folders and files

Latest commit

History

Repository files navigation

pdf-split-merge

📋 Descrição

🚀 Características

🛠️ Stack

📦 Instalação

Com Make

Sem Make

🎯 Uso

Comandos Disponíveis

1. Merge (Juntar PDFs)

2. Split (Extrair Páginas)

3. Extract All (Separar Todas as Páginas)

4. Info (Informações do PDF)

5. Compress (Comprimir PDF)

📁 Estrutura do Projeto

🧪 Testes

📊 Exemplos de Uso Prático

Caso 1: Preparar Contrato para Assinatura

Caso 2: Dividir Livro por Capítulos

Caso 3: Criar PDF Master de Apresentações

Caso 4: Otimizar PDFs Pesados

Caso 5: Imprimir Páginas Específicas

🐳 Docker

⚙️ Sintaxe de Ranges de Páginas

🔍 Validações

📝 Limitações

🗺️ Roadmap

💡 Dicas

Performance

Automatização

Integração CI/CD

📄 Licença

🤝 Contribuindo

🐛 Reportar Bugs

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages