Ratgeber

ZUGFeRD-PDF auslesen: Warum der XML-Anhang entscheidend ist.

Bei ZUGFeRD ist das PDF nur eine Ebene. Die maschinenlesbare Rechnung steckt in der eingebetteten XML.

PDFXML-AnhangExtraktionStatus

Ablauf in der Praxis

1. PDF annehmen

Die Datei wird als PDF erkannt und gegen Größen- und Upload-Regeln geprüft.

2. Anlagen durchsuchen

Es wird geprüft, ob eine eingebettete XML-Rechnung vorhanden ist.

3. XML extrahieren

Die XML wird separat verarbeitet, statt nur den sichtbaren PDF-Text zu lesen.

4. Status erklären

Der Nutzer sieht, ob eine strukturierte Rechnung gefunden wurde oder nur ein normales PDF vorliegt.

Typische Fehlerbilder

FehlerbildWahrscheinliche UrsacheSaubere Reaktion
Nur PDF-Text ausgelesenOCR oder Text-Extraktion wurde mit E-Rechnungsprüfung verwechselt.Eingebettete XML als maßgebliche Datenquelle verwenden.
Mehrere XML-AnhängePDF enthält mehrere Anlagen oder alte Testdateien.Rechnungs-XML anhand Name, MIME-Typ und Struktur auswählen.
Anhang vorhanden, aber defektPDF-Anlage lässt sich nicht vollständig extrahieren.Keinen grünen Status vergeben und Originaldatei prüfen lassen.

PDF-Text reicht nicht

OCR oder sichtbarer PDF-Text kann nützlich sein, aber für strukturierte E-Rechnungsprüfung ist die eingebettete XML maßgeblich.

Was ein Tool tun sollte

Das Tool sollte den Anhang erkennen, sicher extrahieren, die XML separat prüfen und im Ergebnis deutlich machen, ob eine strukturierte Rechnung gefunden wurde.

Wenn keine XML gefunden wird

Dann sollte die Datei nicht als erfolgreiche ZUGFeRD-/Factur-X-Rechnung angezeigt werden. Ein verständlicher Hinweis ist besser als ein falscher grüner Status.

Häufige Fragen

Ist jede PDF mit Rechnung eine E-Rechnung?

Nein. Ohne strukturierte Daten ist sie für maschinelle E-Rechnungsprüfung nicht ausreichend.

Was passiert, wenn kein XML-Anhang da ist?

Dann sollte ein Hinweis erscheinen, dass keine strukturierte Rechnungs-XML gefunden wurde.