Alle innlegg
|Også tilgjengelig på:EN

PDF-Komprimierungs-API – PDF-Dateigröße reduzieren

PDF-Dateigröße mit der MaraDocs Optimierungs-API reduzieren. Intelligente Komprimierung, erhaltene Qualität. Keine lästige Neukodierung.

Martin Kurtz
APIPDFKomprimierungDokumentenverarbeitungEntwickler
PDF-Komprimierungs-API – PDF-Dateigröße reduzieren

Große PDFs – Ermittlungsakten, Gutachten, gescannte Dokumente – verursachen Probleme bei E-Mail-Limits, verlangsamen die Speicherung und machen das Dokumentenmanagement träge. In unserer Kanzlei konnte ein einzelnes Gutachten 30 MB groß sein. Eine PDF-Komprimierungs-API, die die Dateigröße bei erhaltener Lesbarkeit reduziert, würde das Teilen und Archivieren erheblich erleichtern.

Warum eine eigene PDF-Komprimierungslösung Wochen dauert

Wer das selbst aufbauen möchte, stellt schnell fest, dass Ghostscript, qpdf und pikepdf PDFs verkleinern können – aber man muss Komprimierungsstufen wählen, verschiedene PDF-Strukturen berücksichtigen und Qualitätsverluste vermeiden. Bild-Downsampling, Schrifteinbettung und Stream-Komprimierung haben jeweils ihre eigenen Abwägungen. Eine zuverlässige PDF-Komprimierungs-API mit konsistenten Ergebnissen zu bauen erfordert Experimente.

Wie die MaraDocs PDF-Komprimierungs-API das in Minuten löst

Die MaraDocs API bietet pdf.optimize für intelligente Komprimierung. Ein PDF hochladen, validieren, dann optimieren. Das Ergebnis ist typischerweise deutlich kleiner bei erhaltener Qualität – die API übernimmt Bild-Downsampling, Stream-Komprimierung und Schrifteinbettung intern. Kein Ghostscript zu installieren, keine Parameter anzupassen, kein Rätselraten bei Qualität vs. Größe. Ein Aufruf und man erhält ein optimiertes Handle, das für E-Mail, Archivierung oder den nächsten Verarbeitungsschritt bereit ist.

PDF-Komprimierungs-Workflow: Hochladen, Validieren, Optimieren

PDF hochladen, auf Viren und Format validieren, dann pdf.optimize aufrufen. Die API wendet intelligente Komprimierung an – Bild-Downsampling, Stream-Optimierung – und gibt ein optimiertes Handle zurück. Es kann heruntergeladen oder an Komposition, E-Mail-Anhang-Verarbeitung oder Archivierung weitergegeben werden. Optimierung passt natürlich als letzter Schritt vor der Auslieferung in jede Pipeline. Dateien bleiben im Workspace; kein erneutes Hochladen zwischen Validierung und Optimierung.

Get your API key in under a minute

Register for a free account and get your API key in under a minute. Of course we'll provide you with some developer credits.

Try MaraDocs API now →

Was MaraDocs unterscheidet: Workspaces, Webview und deutsches Datenschutzrecht

Die meisten Dokumenten-APIs zwingen zum Hochladen, Verarbeiten, Herunterladen und erneuten Hochladen für den nächsten Schritt. Bei MaraDocs bleiben Dateien im Workspace. Mit OCR, Komposition oder E-Mail-Verarbeitung verketten – das optimierte PDF-Handle fließt direkt zur nächsten Operation. Kein erneutes Hochladen, weniger Roundtrips.

Wenn die Komprimierungsqualität manuell geprüft werden muss – oder ein Vorher-Nachher-Vergleich gewünscht wird – kann app.maradocs.io für manuelle Prüfung geöffnet werden. Nutzer erhalten volle manuelle Kontrolle, wenn die Automatisierung an ihre Grenzen stößt.

Die gesamte Verarbeitung erfolgt in Deutschland (Maramia GmbH), verschlüsselt im Ruhezustand und während der Übertragung. Workspaces verfallen nach 7 Tagen. Keine Daten verlassen die EU. Für datenschutzsensible Dokumenten-Workflows ist das relevant.

TypeScript-Code zur PDF-Größenreduzierung

API-Referenz: data/upload, pdf/validate, pdf/optimize, data/download/pdf

import { MaraDocsClient } from "@maramia/maradocs-sdk-ts";
import { okPdf } from "@maramia/maradocs-sdk-ts/models/pdf";

const client = new MaraDocsClient({ workspaceSecret: workspace_secret });

// Hochladen, validieren, optimieren, herunterladen
const uploaded = await client.data.upload(pdfFile);
const validated = await client.pdf.validate({
  unvalidated_file_handle: uploaded.unvalidated_file_handle,
});
const pdfHandle = okPdf(validated);

const optimized = await client.pdf.optimize({ pdf_handle: pdfHandle });

const blob = await client.data.downloadPdf({ pdf_handle: optimized.pdf_handle });

Python-Code zur PDF-Komprimierung

API-Referenz: data/upload, pdf/validate, pdf/optimize, data/download/pdf

import requests
import time

API_URL = "https://api.maradocs.io/v1"
headers = {"Authorization": f"Bearer {WORKSPACE_SECRET}"}

def poll(url, job_id):
    while True:
        r = requests.get(f"{url}/{job_id}", headers=headers).json()
        if r["status"] == "complete":
            return r["response"]["response"]
        time.sleep(1)

# 1. Hochladen, 2. Validieren
upload = requests.post(f"{API_URL}/data/upload", headers=headers, files={"file": (...)}).json()
val = requests.post(f"{API_URL}/pdf/validate", headers=headers,
    json={"unvalidated_file_handle": upload["unvalidated_file_handle"]}).json()
pdf_handle = poll(f"{API_URL}/pdf/validate", val["job_id"])["pdf_handle"]

# 3. Optimieren
opt = requests.post(f"{API_URL}/pdf/optimize", headers=headers, json={"pdf_handle": pdf_handle}).json()
optimized = poll(f"{API_URL}/pdf/optimize", opt["job_id"])

# 4. Herunterladen
pdf_resp = requests.get(f"{API_URL}/data/download/pdf", headers=headers,
    params={"pdf_handle": optimized["pdf_handle"]})
with open("compressed.pdf", "wb") as out:
    out.write(pdf_resp.content)

Zusammenfassung und nächste Schritte

Eine PDF-Komprimierungs-API, die die Dateigröße bei erhaltener Qualität reduziert, ist verfügbar. MaraDocs übernimmt die Optimierung als Teil eines umfassenderen Dokumenten-Workflows. Weitere verwandte Anwendungsfälle: PDF-Verarbeitung, E-Mail-Verarbeitung und Bild auf leere Seite.


Jetzt ausprobieren: MaraDocs API | TypeScript SDK


Abonner på nyhetsbrevet nå

Hold deg oppdatert og motta de siste nyhetene, artikler og ressurser via e-post.