Automatische PDF-Rotation – API zum Ausrichten von PDF- und Bildseiten
Falsch gedrehte PDF- und Bildseiten mit der MaraDocs Ausrichtungserkennungs-API korrigieren. Textbasierte Erkennung, automatische Korrektur, keine manuelle Rotation.
Gescannte oder fotografierte Dokumente kommen häufig verkehrt herum oder seitlich gedreht an. Manuelle Rotation skaliert nicht, wenn hunderte Dokumente verarbeitet werden. Eine automatische PDF-Rotations-API, die die Ausrichtung anhand des tatsächlichen Inhalts erkennt – nicht nur aus EXIF-Daten – und sie korrigiert, würde einen mühsamen Schritt aus der Verarbeitungspipeline entfernen.
Wer Akten, Scans oder Fotos in großen Mengen verarbeitet, weiß: Falsche Ausrichtung kostet Zeit.
Warum eine eigene automatische PDF- und Bildseitenausrichtungs-Lösung Wochen dauert
Wer das selbst aufbauen möchte, stellt schnell fest, dass Ausrichtungserkennung meist bedeutet: OCR ausführen, Textrichtung analysieren, Rotation ableiten. Tesseract, EasyOCR oder Cloud-OCR-Dienste können dabei helfen – aber man muss sie integrieren, verschiedene Sprachen berücksichtigen und Ergebnisse auf 0°/90°/180°/270°-Rotationen abbilden. PDFs erfordern seitenweise Verarbeitung. Eine zuverlässige API zur Dokumentausrichtungserkennung zu bauen kostet Integrationszeit und Feinabstimmung.
Wie die MaraDocs API zur automatischen PDF-Rotation das in Minuten löst
Die MaraDocs API bietet pdf.orientation und img.orientation. Beide nutzen textbasierte Analyse zur Bestimmung der korrekten Ausrichtung – zuverlässiger als EXIF, das häufig falsch oder nicht vorhanden ist. Bei PDFs wird jede Seite analysiert; bei Bildern das gesamte Bild. Die API gibt das gedrehte Ergebnis sowie seitenweise Winkel mit Konfidenzwerten zurück. Keine OCR-Pipeline zu pflegen, kein Model-Hosting, keine Sprachkonfiguration. Ein API-Aufruf und man erhält ein korrigiertes Handle für den nächsten Schritt.
Workflow zur Dokumentausrichtung: Validieren, Ausrichten, Verketten
PDF oder Bild hochladen, auf Viren und Format validieren, dann orientation aufrufen. Die API analysiert jede Seite (oder das gesamte Bild bei Einzelseiteneingaben) und gibt ein gedrehtes Handle zurück. Dieses Handle lässt sich direkt in OCR, Komposition oder Optimierung weiterleiten – Ausrichtung fügt sich als ein Schritt in jede Pipeline ein. Die Datei muss zwischen den Schritten nicht erneut hochgeladen werden; das gedrehte Ergebnis bleibt im Workspace.
Get your API key in under a minute
Register for a free account and get your API key in under a minute. Of course we'll provide you with some developer credits.
Try MaraDocs API now →Was MaraDocs unterscheidet: Workspaces, Webview und deutsches Datenschutzrecht
Die meisten Dokumenten-APIs zwingen zum Hochladen, Verarbeiten, Herunterladen und erneuten Hochladen für den nächsten Schritt. Bei MaraDocs bleiben Dateien im Workspace. Nach der Ausrichtungserkennung wird das gedrehte Handle direkt an OCR, Komposition oder Optimierung weitergegeben – kein erneutes Hochladen. Handles fließen; Daten bleiben serverseitig.
Wenn die Ausrichtungserkennung unsicher ist – kontrastarme Scans, handschriftliche Notizen oder gemischte Sprachen – kann app.maradocs.io für manuelle Prüfung und Korrektur geöffnet werden. Nutzer erhalten volle manuelle Kontrolle, wenn die Automatisierung an ihre Grenzen stößt.
Die gesamte Verarbeitung erfolgt in Deutschland (Maramia GmbH), verschlüsselt im Ruhezustand und während der Übertragung. Workspaces verfallen nach 7 Tagen. Keine Daten verlassen die EU. Für datenschutzsensible Dokumentenverarbeitung ist das relevant.
TypeScript-Code für automatische PDF-Rotation
API-Referenz: data/upload, pdf/validate, img/validate, pdf/orientation, img/orientation, data/download/pdf
import { MaraDocsClient } from "@maramia/maradocs-sdk-ts";
import { okPdf } from "@maramia/maradocs-sdk-ts/models/pdf";
const client = new MaraDocsClient({ workspaceSecret: workspace_secret });
// Hochladen und validieren
const uploaded = await client.data.upload(pdfOrImageFile);
const pdfVal = await client.pdf.validate({ unvalidated_file_handle: uploaded.unvalidated_file_handle });
const pdfHandle = okPdf(pdfVal);
// PDF-Ausrichtung
const oriented = await client.pdf.orientation({ pdf_handle: pdfHandle });
// Ergebnis herunterladen
const blob = await client.data.downloadPdf({ pdf_handle: oriented.rotated_pdf_handle });
// Für Bilder: client.img.validate + client.img.orientation verwenden
Python-Code für Dokumentausrichtungserkennung
API-Referenz: data/upload, pdf/validate, pdf/orientation, img/orientation, data/download/pdf
import requests
import time
API_URL = "https://api.maradocs.io/v1"
headers = {"Authorization": f"Bearer {WORKSPACE_SECRET}"}
def poll(url, job_id):
while True:
r = requests.get(f"{url}/{job_id}", headers=headers).json()
if r["status"] == "complete":
return r["response"]["response"]
time.sleep(1)
# 1. Hochladen, 2. Validieren
upload = requests.post(f"{API_URL}/data/upload", headers=headers, files={"file": (...)}).json()
val = requests.post(f"{API_URL}/pdf/validate", headers=headers,
json={"unvalidated_file_handle": upload["unvalidated_file_handle"]}).json()
pdf_handle = poll(f"{API_URL}/pdf/validate", val["job_id"])["pdf_handle"]
# 3. Ausrichtung
orient = requests.post(f"{API_URL}/pdf/orientation", headers=headers, json={"pdf_handle": pdf_handle}).json()
oriented = poll(f"{API_URL}/pdf/orientation", orient["job_id"])
# 4. Herunterladen
pdf_resp = requests.get(f"{API_URL}/data/download/pdf", headers=headers,
params={"pdf_handle": oriented["rotated_pdf_handle"]})
with open("rotated.pdf", "wb") as out:
out.write(pdf_resp.content)
Zusammenfassung und nächste Schritte
Eine API zur automatischen PDF-Rotation und Dokumentausrichtungserkennung ist verfügbar. MaraDocs verarbeitet Bilder und PDFs mit textbasierter Analyse. Weitere verwandte Workflows: Dokumentenscanner, PDF-Verarbeitung und Texterkennung.
Jetzt ausprobieren: MaraDocs API | TypeScript SDK
Abonner på nyhetsbrevet nå
Hold deg oppdatert og motta de siste nyhetene, artikler og ressurser via e-post.