PDF Dateien defekt und können nicht repariert werden

goforit1973 · 23. Mai 2020

Hallo,

habe gerade festgestellt, dass alle pdf Dateien vom gleichen Ordner auf meiner QNAP defekt sind.

Ich kann diese Dateien auch nicht mehr reparieren. Als Firmware habe ich die aktuellste Version drauf und habe ein TS 670 pro.

Weiß jemand weiter?

danke.

killershead · 23. Mai 2020

kannst du die noch kopiern oder ist der Zugriff total verweigert?
Hast du ein Backup?
funktionieren die seit dem Update nicht mehr?

goforit1973 · 23. Mai 2020

kann sie kopieren (habe sie auf den Desktop kopiert)
habe dann eine pdf reparatur im Internet probiert, ohne Erfolg (Aussage war, Datei ist leer, jedoch hat die Datei 2-3MByte Größe)
habe versucht sie mit diversen Programmen zu öffnen (Adobe Reader, Acrobat, Apple Viewer, Google Drive), ohne Erfolg
meine Backups sind scheinbar auch korrupt (habe 1 Backup in der Cloud, 1 auf externer Festplatte und eins auf einem weiteren Qnap); scheinbar ist das schon länger her (sind alte Dateien von 2005, hatte sie nicht mehr gebraucht)
ob das am letzten Update gelegen hat, kann ich jetzt nicht nachvollziehen
das ist echt sch..., da ist auf qnap dann schwer zu vertrauen

Crazyhorse · 23. Mai 2020

Moment, von 2005.

Da kann es auch möglich sein, das kein aktueller Reader die mehr lesen kann.

Das ist bei den großen digitalen Archiven ein gigantisches Problem.

Mal ein XP in ner VM aufsetzen und mit einem Reader aus der Zeit probieren.

Denn 15 Jahre sind für IT eine lange Zeit.

mue64 · 23. Mai 2020

Wenn du ein neueres MS-Word hast, versuche mal aus Word heraus die pdf Datei zu öffnen. Vielleicht bekommst du zumindest den Text ohne genaue Formatierung.

goforit1973 · 23. Mai 2020

mue64 habe über Word und der Online Konvertierung versucht die Datei zu öffnen, es kommt die gleich Fehlermeldung, aber danke für den Hinweis

Crazyhorse danke für den Hinweis, leider habe ich kein WinXP und VM; ich dachte pdf/A sind zum Archivieren und zur Langzeitablage

Ich habe es auch auf Mint19 ausprobiert, leider kein Erfolg

Ich habe es jetzt mit einem Adobe Acrobat Reader X aus dem Jahr 2010 versucht, gleiches Ergebnis. Die Datei scheint wirklich Schrott zu sein. Und das alle Dateien im Ordner.

Habe die Fehlermeldung von Adobe REader X angehängt.pasted-from-clipboard.png

killershead · 23. Mai 2020

Zitat von goforit1973

habe versucht sie mit diversen Programmen zu öffnen (Adobe Reader, Acrobat, Apple Viewer, Google Drive), ohne Erfolg

Auch schon PDF-Analyse Programme versucht? Das du mal n Wert bekommst ob's zu fixen ist? Weil lese da gerade nur PDF Viewer.

Ruhig mal nach Shareware in dem Fall suchen. Und eine Test version versuchen. Hab schon das ein oder andere mal für die Datenrettung von Wichtigen Daten geld ausgegeben und es nicht bereut.

Zitat von goforit1973

das ist echt sch..., da ist auf qnap dann schwer zu vertrauen

Muss nicht unbedingt an der NAS liegen. Prüfe auf jeden Fall auch noch deine Festplatten, ob die noch iO sind. Nicht das du nachher noch bei den Platten n Fehler drin hast.

goforit1973 · 23. Mai 2020

killershead danke für den Hinweis. Habe mal eine Online pdf Analyse laufen lassen:

Ergebnis von Free pdf documents analyser:

PDF Syntax error : No /Root object! - Is this really a PDF?

Habe andere pdf analyser auch drüber laufen lassen: Ergebnis: is not a pdf doc.

Ich habe meine Daten nur auf der NAS, die Festplatte am Rechner ist für mich nur der Ort für die Programme.

Hier nochmals ein genauer Report:

Code

PDF Checker 1.5.0  Copyright 2018-2019 Datalogics, Inc. All Rights Reserved

Sat May 23 12:40:28 2020

JSON Profile: everything.json

Input Document: h.pdf



<<=CHECKER_SUMMARY_START=>>
general:unable-to-open
sizeInBytes:0
<<=CHECKER_SUMMARY_END=>>

Optimization Assessment    Document is appropriately optimized

General Results    Errors:        Cannot be opened/not valid PDF    Information:        None    Checks Completed:        unable-to-open (triggered abort)    Checks Aborted:        born-digital        claims-pdfa-conformance        claims-pdfe-conformance        claims-pdfua-conformance        claims-pdfvt-conformance        claims-pdfx-conformance        contains-owner-password        contains-signature        damaged        image-only        password-protected        pdf-v2        xfa-type

Userdata Results    Errors:        None    Information:        None    Checks Completed:        None    Checks Aborted:        contains-annots        contains-annots-not-for-printing        contains-annots-not-for-viewing        contains-annots-without-normal-appearances        contains-embedded-files        contains-metadata        contains-optional-content        contains-private-data        contains-transparency

Fonts Results    Errors:        None    Information:        None    Checks Completed:        None    Checks Aborted:        fontdescriptor-missing-capheight        fontdescriptor-missing-fields        uses-base14fonts-not-embedded        uses-fonts-fully-embedded        uses-fonts-not-embedded

Objects Results    Errors:        None    Information:        None    Checks Completed:        None    Checks Aborted:        contains-javascript-actions        contains-thumbnails

Cleanup Results    Errors:        None    Information:        None    Checks Completed:        None    Checks Aborted:        suboptimal-compression

Image Results    Errors:        None    Information:        None    Checks Completed:        None    Checks Aborted:        alternate-images
    Color Images    Errors:        None    Information:        None    Checks Completed:        None    Checks Aborted:        image-depth        resolution-too-high        resolution-too-low        uses-jpeg2000-compression
    Grayscale Images    Errors:        None    Information:        None    Checks Completed:        None    Checks Aborted:        resolution-too-high        resolution-too-low        uses-jpeg2000-compression
    Monochrome Images    Errors:        None    Information:        None    Checks Completed:        None    Checks Aborted:        resolution-too-high        resolution-too-low        uses-jbig2-compression

Alles anzeigen

mue64 · 23. Mai 2020

Hast du bei älteren und jüngeren pdf schon mal getestet, ob die alle noch funktionieren? Hattest du mal eine HD im Raid ersetzen müssen und da Probleme gehabt? etc.

Lässt sich der Zeitraum eingrenzen, wann das Problem entstanden sein könnte?

eol75 · 23. Mai 2020

Ich persönlich würde das NAS fast schon fast als Verursacher ausschließen.

Das würde nicht "zielgerichtet" nur PDF Dateien zerstören, und auch nicht nur in einem Unterverzeichnis, und auch nicht nur so alte Kamellen.

Erscheint mir abwegig.

Hattest Du in der Vergangenheit mal einen Trojanerbefall, der die Dateien (vielleicht schon vor langer Zeit) befallen/verschlüsselt haben könnte, ohne dass Du es direkt bemerkt hast?

killershead · 23. Mai 2020

Mal so ganz doof gefragt.. haben die Datein noch die Endung .pdf? Oftmals liegts an Kleinigkeiten und ist ein Ausschlussverfahren bei der Fehlersuche.

Aber liest sich so, als wäre der Inhalt der Pdf's noch da, nur die Grundsubstanz des Pdf ist beschädigt und daher kann das kein Programm nutzen. Aber jetzt hast du wenigstens die Analyse und kannst mit der vllt mal den Support von nem PDF restore Dienst bemühen.

Viel Erfolg damit und wenn's Lösungen gibt ruhig einmal hier niederschreiben. Vllt hat in Zukunft jmd das gleiche Problem.

goforit1973 · 23. Mai 2020

mue64 sonst habe ich aktuell keine Probleme mit Dateien, hatte aber vor Jahren mal das gefühlt, dass Dateien "verschwanden", konnte ich aber nicht mehr nachvollziehen. Ich hatte mal das gesamte RAID verschlüsselt und habe es dann wieder entschlüsselt. Ja, ich hatte mal ein HD Fehler, hatte ich ausgestauscht, ist aber schon lange her.

eol75 an einen Malware Befall kann ich mich nicht erinnern. Hatte bei Windows auch immer Kaspersky als Virenprogramm und bei Mac in der Tat keines ebenso bei Linux. Hatte aber noch nie Probleme. Trojaner die Dateien verschlüsseln hatte ich nicht, aber wieso dann die alten pdfs in einem Verzeichnis?

killershead ja, die Dateien haben noch die Endung .pdf

allen vielen Dank für die Hinweise

eol91 · 24. Mai 2020

Zitat von goforit1973

Datei ist leer, jedoch hat die Datei 2-3MByte Größe

Hallo,

hast du die Dateien mal mit einem stinknormalen einfachen Texteditor angeschaut - und zum Vergleich ggf. auch eine PDF-Datei (vorzugsweise aus gleicher Quelle), die in Ordnung ist?

Bei 2 bis 3 MB langt dafür sogar der simple Notepad.

In einer PDF-Datei findest du normalerweise direkt am Anfang einen String wie "%PDF-1.5", der m.W. die PDF-Version (1.3. bis 1.6?) beinhaltet, und am Ende "%%EOF".

Der weitere Inhalt hängt stark davon ab, mit welchem Programm die PDF-Datei erzeugt wurde und was sie beinhaltet: reine Texte z.B. aus Word findest du z.B. gut gut erkennbaren XML-Strukturen lesbar vor, Bilder sehen nach Zeichensalat aus und wenn ein Kennwortschutz drauf ist, kannst du eh kaum was herauslesen.
In meinen jetzt eben exemplarisch durchgesehehen drei PDF-Dateien aus sehr verschiedenen Quellen finde ich auch häufig die Zeichenketten "obj" und "endobj" sowie "stream" und "endstream", auch das dürfte aber von Inhalt und erzeugendem Programm abhängen.

Deine Dateien sind entweder inhaltlich so stark korrumpiert oder sogar vollständlich überschrieben, dass kein Programm sie noch als PDF erkennt, oder aber es sind ohnehin ganz andere Dateitypen und die Endung PDF ist falsch.

Falls Letzteres: suche im Inhalt nach "copyright" - nicht wenige Firmen bauen auch die Bezeichnung des Programms in die Dateien mit ein, so konnte man früher zumindest endlungslose Dateien mit recht hoher Erfolgsquote erkennen und zuordnen ... es ist immerhin eine Chance.

MfG

Digedag64

goforit1973 · 24. Mai 2020

eol91 danke für den Hinweis. Habe ich probiert, aber irgendwie scheint kein Inhalt zu sein. Im Notizeditor wird nichts angezeigt. Die pdf Dateien waren Scans, vielleicht deswegen?

eol91 · 24. Mai 2020

Hi, zumindest die erwähnten Zeichenketten am Anfang und Ende müssten drin sein. Die Scans - also Bilder - würden sich dazwischen in scheinbarem Zeichensalat wiederfinden.

Mich irritiert hier allerdings noch dein "Notizeditor" - hast du dich nur verschrieben und meinst in Wirklichkeit einen einfachen Texteditor (unter Windows notepad.exe oder NotePad++ o.ä., unter Linux beispielsweise nano, unter MacOS müssen Mac-User helfen) oder hast du stattdessen tatsächlich irgendein (spezielles) Tool für Notizen versucht? Die verwenden i.d.R. wiederum eigene Formate, das hilft uns hier nicht weiter.

Falls Letzteres: ich meinte wirklich einfache Texteditoren! Öffne die Dateien damit und schau nach dem Inhalt.

Falls nur vertippt: Wenn deine Dateien offenbar leer sind ("irgendwie scheint kein Inhalt zu sein" ist nur eine sehr vage und unpräzise Rückmeldung), wurden die Inhalte allem Anschein nach vollständig mit Leerzeichen überschrieben. Noch wahrscheinlicher ist jedoch m.E., dass das schon beim Scannen passiert ist, also dass die PDF-Dateien bereits dabei fehlerhaft erzeugt wurden - hattest du sie denn seinerzeit zumindest in Stichproben geprüft?

Wie auch immer es passiert ist: wenn die Dateien ohnehin nur 2 bis 3 Millionen von Leerzeichen enthalten (keinerlei erkennbarer Inhalt bei 2 bis 3 MB Dateigröße), kannst daraus mit keinem Tool der Welt sinnvolle Inhalte wiederherstellen. Löschen und - wenn die Bilder bzw. Dokumente noch verfügbar sind - neu einscannen stehen an.

chef1 · 30. Mai 2020

Zitat von goforit1973

sind alte Dateien von 2005

und

Zitat von goforit1973

dachte pdf/A sind zum Archivieren und zur Langzeitablage

Wie passt dies zusammen? Von wann war Dein Programm zum Erstellen? Konnte dieses bereits PDF/A? So weit ich mich erinnere, wurde bis 2005 mit PDF/A-Draft gearbeitet. Die erste Verabschiedung des ersten Standards aus dieser Standardfamilie wurde m.W. erst im Herbst 2005 verabschiedet. Weiß jetzt nicht, wie lange es gedauert hat, bis die ersten Werkzeuge die Erstellung und Validierung von PDF/A unterstützt haben. Konnte dies deine damalige Software bereits? Und wie hast Du damals überprüft, dass die Ergebnisse (PDF-Dateien) standardkonformes PDF/A sind?

Zitat von goforit1973

Die pdf Dateien waren Scans, vielleicht deswegen?

Als ich mich das letzte Mal mit PDF/A befasste, ist schon einige Jahre her, war mir kein Scanner und kein Scanprogramm bekannt, die standardkonformes PDF/A erzeugten, egal welchen dieser Standards. Müsste damals etwa 3-4 Standards aus dieser Standardfamilie gegeben haben. Für solch eine Langzeitarchivierung war es daher immer notwendig, diese auch auf Standardkonformität zu prüfen und ggf. nachzubessern. Die Situation könnte inzwischen besser sein. Aber Du hast ja geschrieben, diese 2005 erstellt zu haben! Da bin ich mir ziemlich sicher, dass sie schon damals nicht standardkonform waren.

Was haben also PDF/A-Validatoren damals gesagt? Und was sagen diese jetzt zu den gleichen Dateien?

goforit1973 · 30. Mai 2020

Danke für den Hinweis. Dann waren es scheinbar normale pdfs. Aber ich gehe davon aus, dass die hoffentlich länger lesbar sind als nur 15 Jahre. Gibt es irgendeine Lösung, die Dateien wieder lesbar zu machen oder kann ich diese abschreiben. Die Dateien scheinen keinen Inhalt mehr zu haben, obwohl die Größe der Datei dieses eher vorgaugelt.

eol91 · 30. Mai 2020

Hallo nochmal,

auf meine Fragen aus Beitrag #15 bist du nicht eingegangen, daher kann ich auch anderes Resümee ziehen als vorige Woche: sollten deine Dateien tatsächlich nur aus Leerzeichen bestehen, ist das vermutlich schon bei der Erzeugung passiert und du kannst daraus keinerlei anderweitige Inhalte mehr wiederherstellen.

MfG

Frank

goforit1973 · 31. Mai 2020

Hallo,

Zitat von Digedag64

Mich irritiert hier allerdings noch dein "Notizeditor" - hast du dich nur verschrieben und meinst in Wirklichkeit einen einfachen Texteditor (unter Windows notepad.exe oder NotePad++ o.ä., unter Linux beispielsweise nano, unter MacOS müssen Mac-User helfen) oder hast du stattdessen tatsächlich irgendein (spezielles) Tool für Notizen versucht? Die verwenden i.d.R. wiederum eigene Formate, das hilft uns hier nicht weiter.

mit dem Editor habe ich den klassischen Editior im MAC OS X gemeint. Bei Mac heißt er "Textedit".

Zitat von Digedag64

dass das schon beim Scannen passiert ist, also dass die PDF-Dateien bereits dabei fehlerhaft erzeugt wurden - hattest du sie denn seinerzeit zumindest in Stichproben geprüft?

hatte ich damals gemacht, da bin ich mir sicher. Ich hatte auch schonmal die Dateien benötigt und hatte keine Probleme

Zitat von Digedag64

Wie auch immer es passiert ist: wenn die Dateien ohnehin nur 2 bis 3 Millionen von Leerzeichen enthalten (keinerlei erkennbarer Inhalt bei 2 bis 3 MB Dateigröße), kannst daraus mit keinem Tool der Welt sinnvolle Inhalte wiederherstellen. Löschen und - wenn die Bilder bzw. Dokumente noch verfügbar sind - neu einscannen stehen an.

tja, da scheinen die Dateien verloren zu sein. Die urspünglichen Bilder habe ich nicht mehr; mache keine "doppelte Buchhaltung". Mir erscheint, dass beim QNAP Dateisystem Dinge verloren gehen können. Dies ist sehr unbefriedigend, wenn man versucht das Papier los zu bekommen und das meiste digital abspeichern möchte.

Danke für die Hilfe.

Mavalok2 · 31. Mai 2020

Zitat von goforit1973

mit dem Editor habe ich den klassischen Editior im MAC OS X gemeint.

Ah, eine wichtige Information: Mac. War es beim Erstellen auch schon ein Mac? Und könnte es sein, dass es damals noch kein MacOS X sondern Version 9 oder gar 8 war? MacOS 8 und 9 hat keine Datei-Erweiterungen/Endung verwendet, da der Dateityp in der Resource Fork gespeichert wurde, die aber beim Kopieren auf Windows / Linux verloren geht. Kann es sein, dass dies überhaupt kein PDF sondern ein Bildformat ist? Und dass die Dateierweiterung versehentlich auf PDF (zu Beginn oder auch später) hinzugefügt wurde? Dem MacOS 9 ist ja egal was da steht, Windows und MacOS X aber dann nicht mehr. Wenn das Dokument anno dazumal als Bild gescannt wurde und einfach mit PDF als Erweiterung beschriftet wurde kannst Du noch ewig versuchen dies mit einem PDF-Programm zu öffnen.

Versuch mal diverse Endungen von Bilddateien. Bei der Größe würde ich jpg schon mal eher ausschließen, zumindest bei einem 1-seitigen Dokument. Auch für ein 1-seitiges gescanntes PDF ist 2-3 MB eigentlich zu groß. Von da her müsste es wohl entweder mehrseitig sein oder es sind Bilder in unkomprimierten Format. Wenn Mac, dann sehr wahrscheinlich PICT oder TIFF bzw. TIF. Schon länger nicht mehr mit PICT gearbeitet. Kann dies unter MacOS X überhaupt noch geöffnet werden? TIFF auf jeden Fall schon. Ansonsten musst Du Dir noch ein entsprechendes Programm suchen.

Zitat von goforit1973

scheinbar ist das schon länger her (sind alte Dateien von 2005, hatte sie nicht mehr gebraucht)

Ist 2005 wirklich das Erstellungsdatum der Dokumente oder nur das Datum, an dem Sie auf das NAS kopiert wurden. Und selbst wenn die Dokumente 2005 erstellt wurden, wie alt war denn das verwendete Programm? Konnte ja schließlich mit einem Programm auch dem Jahre 1990 erstellt worden sein. Somit hätte das Dokument ein 30 Jahre altes Format.

15 Jahre stellt auch für ein "normales" nicht Langzeitarchivierung gedachtes PDF-Dokument keine Probleme dar. Bei der Langzeitarchivierung geht es unter anderem vor allem um die Farbechtheit und diverse andere Feinheiten im Grafiksektor. Für ein Textdokument, insbesondere wenn es nur gescannt und nicht umgewandelt worden ist, eigentlich irrelevant. Öffnen kann man die Dokument deshalb trotzdem.

PDF Dateien defekt und können nicht repariert werden

dr_mike 24. Mai 2020

Vulnerabilities in Squid

Multiple Vulnerabilities in QuFirewall

Vulnerability in Media Streaming Add-on

Multiple Vulnerabilities in QTS, QuTS hero, and QuTScloud (PWN2OWN 2023)

Probleme mit Schreibgeschwindigkeit auf QNAP TS-412

Qnap TS-133 Plex Server Stromverbrauch reduzieren

RAID5 Offline (mdadm -AfR ausführen?)

Systemprozess getbarcode, was ist das?

Zu hohe RAM Auslastung! Wie finde ich den Schuldigen?

Screenshots erstellen und im Forum einbinden (Windows)

(Betriebs)- System vs. Systemvolume - Hinweise zum Verständnis

QuDedup: Backup Job neu verlinken - Ein Ritt ins Verderben

[QUICK HOW-TO] Apps manuell auf ein anderes Volume verschieben

[QUICK HOW TO] QNAP Disks unter Windows mit UFS Explorer auslesen

Kodi-Headless Server als Docker-Container

Hardware Praxis – „Hör mal wer da surrt“: Ein Erfahrungsbericht aus dem IT-Alltag

Hardware Praxis – Tipps zum Einbau einer neuen Festplatte: Ergänzung

Foren Update im Juli / August geplant

IT-Geschichten – Die verrückte Tastatur