OCR-API – Durchsuchbare PDFs aus Bildern und Scans erstellen

Die MaraDocs OCR-API erstellt durchsuchbare PDFs mit Textebene. Das Originaldokument bleibt erhalten – Text ist auswählbar und durchsuchbar. Nicht nur extrahierter Text.

16. Februar 2026•Martin Kurtz

APIOCRPDFTexterkennungEntwickler

Gescannte Dokumente und Fotos enthalten Text, der weder auswählbar noch durchsuchbar ist. Viele OCR-APIs geben nur extrahierten Text zurück, nicht das Originaldokument mit einer unsichtbaren Textebene. Man möchte dasselbe PDF – gleiches Layout und gleiche Darstellung – aber mit auswählbarem, durchsuchbarem Inhalt. Das ist es, was eine ordentliche OCR-API für durchsuchbare PDFs leisten sollte.

Warum eine eigene durchsuchbare PDF-OCR-Lösung Wochen dauert

Wer das selbst aufbauen möchte, stellt schnell fest, dass Tesseract, EasyOCR oder Cloud-OCR nur Klartext und Begrenzungsrahmen zurückgeben. Um eine durchsuchbare PDF zu erstellen, muss der Text unsichtbar über dem Originalbild oder der Original-PDF eingeblendet werden. Das erfordert die Koordination von Koordinatensystemen, Schriften, Kodierungen und PDF-Struktur. Verschiedene Sprachen, Schriften und Layouts erhöhen die Komplexität. Eine robuste OCR-API, die das eigene Dokument intakt lässt, erfordert erheblichen Entwicklungsaufwand.

Wie die MaraDocs OCR-API das in Minuten löst

Die MaraDocs API führt OCR durch und gibt eine PDF mit unsichtbar eingeblendeter Textebene aus. Man erhält das Originaldokument – Layout, Bilder, Darstellung – mit auswählbarem und durchsuchbarem Text. Keine separate Textdatei. Keine abgespeckte Version. Dasselbe Dokument, verbessert.

OCR-Workflow: Validieren, OCR, Optimieren

Für Bilder: validieren, dann img.ocrToPdf. Für PDFs: validieren, dann pdf.ocrToPdf (optional nach pdf.orientation zum vorherigen Korrigieren gedrehter Seiten). Das High-Level flow.ocrImg und flow.ocrPdf kombinieren Ausrichtung, OCR und Optimierung in einem Aufruf. Der Output ist immer ein PDF-Handle – dasselbe Dokument mit einer unsichtbaren Textebene –, das heruntergeladen oder an Komposition, Komprimierung oder E-Mail-Workflows weitergegeben werden kann. Die Pipeline bleibt serverseitig; kein erneutes Hochladen zwischen den Schritten.

Get your API key in under a minute

Register for a free account and get your API key in under a minute. Of course we'll provide you with some developer credits.

Try MaraDocs API now →

Was MaraDocs unterscheidet: Workspaces, Webview und deutsches Datenschutzrecht

Die meisten Dokumenten-APIs zwingen zum Hochladen, Verarbeiten, Herunterladen und erneuten Hochladen für den nächsten Schritt. Bei MaraDocs läuft OCR im eigenen Workspace. Mit Dokumentextraktion, Komposition oder Komprimierung verketten – das PDF-Handle direkt zur nächsten Operation weitergeben. Kein erneutes Hochladen, weniger Roundtrips.

Wenn OCR-Ergebnisse manuell korrigiert werden müssen – falsch erkannte Zeichen, komplexe Layouts oder qualitativ minderwertige Scans – kann app.maradocs.io für manuelle Prüfung und Bearbeitung geöffnet werden. Nutzer erhalten volle manuelle Kontrolle, wenn die Automatisierung an ihre Grenzen stößt.

Die gesamte Verarbeitung erfolgt in Deutschland (Maramia GmbH), verschlüsselt im Ruhezustand und während der Übertragung. Workspaces verfallen nach 7 Tagen. Keine Daten verlassen die EU. Für datenschutzsensible OCR-Workloads ist das relevant.

TypeScript-Code zum Erstellen durchsuchbarer PDFs mit OCR

API-Referenz: data/upload, img/validate, pdf/validate, img/ocr/to/pdf, pdf/ocr/pdf, data/download/pdf

import { MaraDocsClient } from "@maramia/maradocs-sdk-ts";
import { okImg } from "@maramia/maradocs-sdk-ts/models/img";
import { okPdf } from "@maramia/maradocs-sdk-ts/models/pdf";

const client = new MaraDocsClient({ workspaceSecret: workspace_secret });

// High-Level: hochladen, validieren, vollständige Pipeline, herunterladen
const pdfHandle = await client.flow.ocrImg(imageFile);
const blob = await client.data.downloadPdf({ pdf_handle: pdfHandle });

// Low-Level: Bild – hochladen, validieren, OCR, herunterladen
const uploaded = await client.data.upload(imageFile);
const validated = await client.img.validate({ unvalidated_file_handle: uploaded.unvalidated_file_handle });
const imgHandle = okImg(validated);
const ocrPdf = await client.img.ocrToPdf({
  img_handle: imgHandle,
  options: { embed_in_blank_page: { size: { width: 210, height: 297 }, position: "center" } },
});
const blob2 = await client.data.downloadPdf({ pdf_handle: ocrPdf.pdf_handle });

// PDF: hochladen, validieren, ocrToPdf, herunterladen
const pdfUploaded = await client.data.upload(pdfFile);
const pdfValidated = await client.pdf.validate({ unvalidated_file_handle: pdfUploaded.unvalidated_file_handle });
const pdfOcr = await client.pdf.ocrToPdf({ pdf_handle: okPdf(pdfValidated) });
const blob3 = await client.data.downloadPdf({ pdf_handle: pdfOcr.pdf_handle });

Python-Code für OCR zu durchsuchbarer PDF

API-Referenz: data/upload, img/validate, img/ocr/to/pdf, pdf/ocr/pdf, data/download/pdf

# pip install python-decouple requests
"""OCR an image to a searchable PDF using MaraDocs. Set ACCOUNT_SECRET in .env or environment."""

import sys
import time
from pathlib import Path

import requests
from decouple import config

API_URL = "https://api.maradocs.io/v1"


def create_workspace() -> dict:
    """Create a workspace and return auth headers."""
    r = requests.post(
        f"{API_URL}/workspace",
        headers={"Authorization": f"Bearer {config('ACCOUNT_SECRET')}"},
        json={"subaccount": None},
    )
    ws = r.json()
    return {"Authorization": f"Bearer {ws['workspace_secret']}"}


def upload_file(path: Path, auth: dict) -> dict:
    """Upload a file via two-step flow (signed URL + S3 POST). Returns unvalidated_file_handle."""
    data = path.read_bytes()
    resp = requests.post(
        f"{API_URL}/data/upload",
        headers={**auth, "Content-Type": "application/json"},
        json={"name": path.name, "size": len(data)},
    ).json()
    requests.post(
        resp["post_url"],
        data=resp.get("post_header", {}),
        files={"file": (path.name, data, "image/png")},
    )
    return resp["unvalidated_file_handle"]


def run_job(path: str, payload: dict, auth: dict, timeout: int = 60) -> dict:
    """Run a job and poll until complete. Returns the result (unwraps response if present)."""
    url = f"{API_URL}/{path}"
    r = requests.post(url, headers=auth, json=payload).json()
    job_id = r["job_id"]
    start = time.time()
    while time.time() - start < timeout:
        poll_r = requests.get(f"{url}/{job_id}", headers=auth)
        if poll_r.status_code == 200:
            return poll_r.json()
    raise TimeoutError(f"Job {path} timed out")


def download_pdf(pdf_handle: str, auth: dict) -> bytes:
    """Request signed URL and fetch PDF bytes."""
    r = requests.post(
        f"{API_URL}/data/download/pdf",
        headers=auth,
        json={"pdf_handle": pdf_handle},
    )
    info = r.json()
    dl = requests.get(info["url"], headers=info.get("headers", {}))
    return dl.content


def main() -> None:
    img_path = Path(sys.argv[1]) if len(sys.argv) > 1 else Path("photo.png")
    auth = create_workspace()
    handle = upload_file(img_path, auth)
    validate = run_job("img/validate", {"unvalidated_file_handle": handle}, auth)
    img_handle = validate["response"]["img_handle"]
    ocr_result = run_job("img/ocr/to/pdf", {"img_handle": img_handle}, auth)
    pdf_handle = ocr_result.get("pdf_handle") or ocr_result.get("response", {}).get("pdf_handle")
    Path("searchable.pdf").write_bytes(download_pdf(pdf_handle, auth))
    print("searchable.pdf created")


if __name__ == "__main__":
    main()

Zusammenfassung und nächste Schritte

Eine OCR-API, die durchsuchbare PDFs erstellt – das Originaldokument mit unsichtbarer Textebene – ist verfügbar. MaraDocs erhält das ursprüngliche Layout und fügt auswählbaren, durchsuchbaren Text hinzu. Weitere verwandte Workflows: Dokumentenscanner, PDF-Verarbeitung und Bild auf leere Seite.

Useful links

Jetzt ausprobieren: MaraDocs API | TypeScript SDK

Jetzt Newsletter abonnieren

Bleiben Sie mit uns auf dem Laufenden und erhalten Sie die neuesten Nachrichten, Artikel und Ressourcen per E-Mail.