PDF Dateien defekt und können nicht repariert werden

  • Hallo,


    habe gerade festgestellt, dass alle pdf Dateien vom gleichen Ordner auf meiner QNAP defekt sind.

    Ich kann diese Dateien auch nicht mehr reparieren. Als Firmware habe ich die aktuellste Version drauf und habe ein TS 670 pro.


    Weiß jemand weiter?


    danke.

    • kannst du die noch kopiern oder ist der Zugriff total verweigert?
    • Hast du ein Backup?
    • funktionieren die seit dem Update nicht mehr?
    • kann sie kopieren (habe sie auf den Desktop kopiert)
    • habe dann eine pdf reparatur im Internet probiert, ohne Erfolg (Aussage war, Datei ist leer, jedoch hat die Datei 2-3MByte Größe)
    • habe versucht sie mit diversen Programmen zu öffnen (Adobe Reader, Acrobat, Apple Viewer, Google Drive), ohne Erfolg
    • meine Backups sind scheinbar auch korrupt (habe 1 Backup in der Cloud, 1 auf externer Festplatte und eins auf einem weiteren Qnap); scheinbar ist das schon länger her (sind alte Dateien von 2005, hatte sie nicht mehr gebraucht)
    • ob das am letzten Update gelegen hat, kann ich jetzt nicht nachvollziehen
    • das ist echt sch..., da ist auf qnap dann schwer zu vertrauen
  • Moment, von 2005.


    Da kann es auch möglich sein, das kein aktueller Reader die mehr lesen kann.


    Das ist bei den großen digitalen Archiven ein gigantisches Problem.


    Mal ein XP in ner VM aufsetzen und mit einem Reader aus der Zeit probieren.


    Denn 15 Jahre sind für IT eine lange Zeit.

  • Wenn du ein neueres MS-Word hast, versuche mal aus Word heraus die pdf Datei zu öffnen. Vielleicht bekommst du zumindest den Text ohne genaue Formatierung.

  • mue64 habe über Word und der Online Konvertierung versucht die Datei zu öffnen, es kommt die gleich Fehlermeldung, aber danke für den Hinweis

    Crazyhorse danke für den Hinweis, leider habe ich kein WinXP und VM; ich dachte pdf/A sind zum Archivieren und zur Langzeitablage


    Ich habe es auch auf Mint19 ausprobiert, leider kein Erfolg


    Ich habe es jetzt mit einem Adobe Acrobat Reader X aus dem Jahr 2010 versucht, gleiches Ergebnis. Die Datei scheint wirklich Schrott zu sein. Und das alle Dateien im Ordner.




    Habe die Fehlermeldung von Adobe REader X angehängt.pasted-from-clipboard.png

    Einmal editiert, zuletzt von goforit1973 ()

  • habe versucht sie mit diversen Programmen zu öffnen (Adobe Reader, Acrobat, Apple Viewer, Google Drive), ohne Erfolg

    Auch schon PDF-Analyse Programme versucht? Das du mal n Wert bekommst ob's zu fixen ist? Weil lese da gerade nur PDF Viewer.


    Ruhig mal nach Shareware in dem Fall suchen. Und eine Test version versuchen. Hab schon das ein oder andere mal für die Datenrettung von Wichtigen Daten geld ausgegeben und es nicht bereut.


    das ist echt sch..., da ist auf qnap dann schwer zu vertrauen

    Muss nicht unbedingt an der NAS liegen. Prüfe auf jeden Fall auch noch deine Festplatten, ob die noch iO sind. Nicht das du nachher noch bei den Platten n Fehler drin hast.

  • killershead danke für den Hinweis. Habe mal eine Online pdf Analyse laufen lassen:

    Ergebnis von Free pdf documents analyser:

    PDF Syntax error : No /Root object! - Is this really a PDF?


    Habe andere pdf analyser auch drüber laufen lassen: Ergebnis: is not a pdf doc.


    Ich habe meine Daten nur auf der NAS, die Festplatte am Rechner ist für mich nur der Ort für die Programme.


    Hier nochmals ein genauer Report:

  • Hast du bei älteren und jüngeren pdf schon mal getestet, ob die alle noch funktionieren? Hattest du mal eine HD im Raid ersetzen müssen und da Probleme gehabt? etc.

    Lässt sich der Zeitraum eingrenzen, wann das Problem entstanden sein könnte?

  • Ich persönlich würde das NAS fast schon fast als Verursacher ausschließen.

    Das würde nicht "zielgerichtet" nur PDF Dateien zerstören, und auch nicht nur in einem Unterverzeichnis, und auch nicht nur so alte Kamellen.

    Erscheint mir abwegig.


    Hattest Du in der Vergangenheit mal einen Trojanerbefall, der die Dateien (vielleicht schon vor langer Zeit) befallen/verschlüsselt haben könnte, ohne dass Du es direkt bemerkt hast?

  • Mal so ganz doof gefragt.. haben die Datein noch die Endung .pdf? Oftmals liegts an Kleinigkeiten und ist ein Ausschlussverfahren bei der Fehlersuche.


    Aber liest sich so, als wäre der Inhalt der Pdf's noch da, nur die Grundsubstanz des Pdf ist beschädigt und daher kann das kein Programm nutzen. Aber jetzt hast du wenigstens die Analyse und kannst mit der vllt mal den Support von nem PDF restore Dienst bemühen.


    Viel Erfolg damit und wenn's Lösungen gibt ruhig einmal hier niederschreiben. Vllt hat in Zukunft jmd das gleiche Problem.

  • mue64 sonst habe ich aktuell keine Probleme mit Dateien, hatte aber vor Jahren mal das gefühlt, dass Dateien "verschwanden", konnte ich aber nicht mehr nachvollziehen. Ich hatte mal das gesamte RAID verschlüsselt und habe es dann wieder entschlüsselt. Ja, ich hatte mal ein HD Fehler, hatte ich ausgestauscht, ist aber schon lange her.


    MOK24 an einen Malware Befall kann ich mich nicht erinnern. Hatte bei Windows auch immer Kaspersky als Virenprogramm und bei Mac in der Tat keines ebenso bei Linux. Hatte aber noch nie Probleme. Trojaner die Dateien verschlüsseln hatte ich nicht, aber wieso dann die alten pdfs in einem Verzeichnis?


    killershead ja, die Dateien haben noch die Endung .pdf


    allen vielen Dank für die Hinweise

  • Datei ist leer, jedoch hat die Datei 2-3MByte Größe

    Hallo,

    hast du die Dateien mal mit einem stinknormalen einfachen Texteditor angeschaut - und zum Vergleich ggf. auch eine PDF-Datei (vorzugsweise aus gleicher Quelle), die in Ordnung ist?


    Bei 2 bis 3 MB langt dafür sogar der simple Notepad.

    In einer PDF-Datei findest du normalerweise direkt am Anfang einen String wie "%PDF-1.5", der m.W. die PDF-Version (1.3. bis 1.6?) beinhaltet, und am Ende "%%EOF".

    Der weitere Inhalt hängt stark davon ab, mit welchem Programm die PDF-Datei erzeugt wurde und was sie beinhaltet: reine Texte z.B. aus Word findest du z.B. gut gut erkennbaren XML-Strukturen lesbar vor, Bilder sehen nach Zeichensalat aus und wenn ein Kennwortschutz drauf ist, kannst du eh kaum was herauslesen.
    In meinen jetzt eben exemplarisch durchgesehehen drei PDF-Dateien aus sehr verschiedenen Quellen finde ich auch häufig die Zeichenketten "obj" und "endobj" sowie "stream" und "endstream", auch das dürfte aber von Inhalt und erzeugendem Programm abhängen.


    Deine Dateien sind entweder inhaltlich so stark korrumpiert oder sogar vollständlich überschrieben, dass kein Programm sie noch als PDF erkennt, oder aber es sind ohnehin ganz andere Dateitypen und die Endung PDF ist falsch.


    Falls Letzteres: suche im Inhalt nach "copyright" - nicht wenige Firmen bauen auch die Bezeichnung des Programms in die Dateien mit ein, so konnte man früher zumindest endlungslose Dateien mit recht hoher Erfolgsquote erkennen und zuordnen ... es ist immerhin eine Chance.


    MfG

    Digedag64

  • Digedag64 danke für den Hinweis. Habe ich probiert, aber irgendwie scheint kein Inhalt zu sein. Im Notizeditor wird nichts angezeigt. Die pdf Dateien waren Scans, vielleicht deswegen?

  • Hi, zumindest die erwähnten Zeichenketten am Anfang und Ende müssten drin sein. Die Scans - also Bilder - würden sich dazwischen in scheinbarem Zeichensalat wiederfinden.


    Mich irritiert hier allerdings noch dein "Notizeditor" - hast du dich nur verschrieben und meinst in Wirklichkeit einen einfachen Texteditor (unter Windows notepad.exe oder NotePad++ o.ä., unter Linux beispielsweise nano, unter MacOS müssen Mac-User helfen) oder hast du stattdessen tatsächlich irgendein (spezielles) Tool für Notizen versucht? Die verwenden i.d.R. wiederum eigene Formate, das hilft uns hier nicht weiter.


    Falls Letzteres: ich meinte wirklich einfache Texteditoren! Öffne die Dateien damit und schau nach dem Inhalt.


    Falls nur vertippt: Wenn deine Dateien offenbar leer sind ("irgendwie scheint kein Inhalt zu sein" ist nur eine sehr vage und unpräzise Rückmeldung), wurden die Inhalte allem Anschein nach vollständig mit Leerzeichen überschrieben. Noch wahrscheinlicher ist jedoch m.E., dass das schon beim Scannen passiert ist, also dass die PDF-Dateien bereits dabei fehlerhaft erzeugt wurden - hattest du sie denn seinerzeit zumindest in Stichproben geprüft?

    Wie auch immer es passiert ist: wenn die Dateien ohnehin nur 2 bis 3 Millionen von Leerzeichen enthalten (keinerlei erkennbarer Inhalt bei 2 bis 3 MB Dateigröße), kannst daraus mit keinem Tool der Welt sinnvolle Inhalte wiederherstellen. Löschen und - wenn die Bilder bzw. Dokumente noch verfügbar sind - neu einscannen stehen an.

  • sind alte Dateien von 2005

    und

    dachte pdf/A sind zum Archivieren und zur Langzeitablage

    Wie passt dies zusammen? Von wann war Dein Programm zum Erstellen? Konnte dieses bereits PDF/A? So weit ich mich erinnere, wurde bis 2005 mit PDF/A-Draft gearbeitet. Die erste Verabschiedung des ersten Standards aus dieser Standardfamilie wurde m.W. erst im Herbst 2005 verabschiedet. Weiß jetzt nicht, wie lange es gedauert hat, bis die ersten Werkzeuge die Erstellung und Validierung von PDF/A unterstützt haben. Konnte dies deine damalige Software bereits? Und wie hast Du damals überprüft, dass die Ergebnisse (PDF-Dateien) standardkonformes PDF/A sind?

    Die pdf Dateien waren Scans, vielleicht deswegen?

    Als ich mich das letzte Mal mit PDF/A befasste, ist schon einige Jahre her, war mir kein Scanner und kein Scanprogramm bekannt, die standardkonformes PDF/A erzeugten, egal welchen dieser Standards. Müsste damals etwa 3-4 Standards aus dieser Standardfamilie gegeben haben. Für solch eine Langzeitarchivierung war es daher immer notwendig, diese auch auf Standardkonformität zu prüfen und ggf. nachzubessern. Die Situation könnte inzwischen besser sein. Aber Du hast ja geschrieben, diese 2005 erstellt zu haben! Da bin ich mir ziemlich sicher, dass sie schon damals nicht standardkonform waren.


    Was haben also PDF/A-Validatoren damals gesagt? Und was sagen diese jetzt zu den gleichen Dateien?

  • Danke für den Hinweis. Dann waren es scheinbar normale pdfs. Aber ich gehe davon aus, dass die hoffentlich länger lesbar sind als nur 15 Jahre. Gibt es irgendeine Lösung, die Dateien wieder lesbar zu machen oder kann ich diese abschreiben. Die Dateien scheinen keinen Inhalt mehr zu haben, obwohl die Größe der Datei dieses eher vorgaugelt.

  • Hallo nochmal,

    auf meine Fragen aus Beitrag #15 bist du nicht eingegangen, daher kann ich auch anderes Resümee ziehen als vorige Woche: sollten deine Dateien tatsächlich nur aus Leerzeichen bestehen, ist das vermutlich schon bei der Erzeugung passiert und du kannst daraus keinerlei anderweitige Inhalte mehr wiederherstellen.


    MfG

    Frank

  • Hallo,

    Mich irritiert hier allerdings noch dein "Notizeditor" - hast du dich nur verschrieben und meinst in Wirklichkeit einen einfachen Texteditor (unter Windows notepad.exe oder NotePad++ o.ä., unter Linux beispielsweise nano, unter MacOS müssen Mac-User helfen) oder hast du stattdessen tatsächlich irgendein (spezielles) Tool für Notizen versucht? Die verwenden i.d.R. wiederum eigene Formate, das hilft uns hier nicht weiter.

    mit dem Editor habe ich den klassischen Editior im MAC OS X gemeint. Bei Mac heißt er "Textedit".


    dass das schon beim Scannen passiert ist, also dass die PDF-Dateien bereits dabei fehlerhaft erzeugt wurden - hattest du sie denn seinerzeit zumindest in Stichproben geprüft?

    hatte ich damals gemacht, da bin ich mir sicher. Ich hatte auch schonmal die Dateien benötigt und hatte keine Probleme



    Wie auch immer es passiert ist: wenn die Dateien ohnehin nur 2 bis 3 Millionen von Leerzeichen enthalten (keinerlei erkennbarer Inhalt bei 2 bis 3 MB Dateigröße), kannst daraus mit keinem Tool der Welt sinnvolle Inhalte wiederherstellen. Löschen und - wenn die Bilder bzw. Dokumente noch verfügbar sind - neu einscannen stehen an.

    tja, da scheinen die Dateien verloren zu sein. Die urspünglichen Bilder habe ich nicht mehr; mache keine "doppelte Buchhaltung". Mir erscheint, dass beim QNAP Dateisystem Dinge verloren gehen können. Dies ist sehr unbefriedigend, wenn man versucht das Papier los zu bekommen und das meiste digital abspeichern möchte.


    Danke für die Hilfe.

  • mit dem Editor habe ich den klassischen Editior im MAC OS X gemeint.

    Ah, eine wichtige Information: Mac. War es beim Erstellen auch schon ein Mac? Und könnte es sein, dass es damals noch kein MacOS X sondern Version 9 oder gar 8 war? MacOS 8 und 9 hat keine Datei-Erweiterungen/Endung verwendet, da der Dateityp in der Resource Fork gespeichert wurde, die aber beim Kopieren auf Windows / Linux verloren geht. Kann es sein, dass dies überhaupt kein PDF sondern ein Bildformat ist? Und dass die Dateierweiterung versehentlich auf PDF (zu Beginn oder auch später) hinzugefügt wurde? Dem MacOS 9 ist ja egal was da steht, Windows und MacOS X aber dann nicht mehr. Wenn das Dokument anno dazumal als Bild gescannt wurde und einfach mit PDF als Erweiterung beschriftet wurde kannst Du noch ewig versuchen dies mit einem PDF-Programm zu öffnen.

    Versuch mal diverse Endungen von Bilddateien. Bei der Größe würde ich jpg schon mal eher ausschließen, zumindest bei einem 1-seitigen Dokument. Auch für ein 1-seitiges gescanntes PDF ist 2-3 MB eigentlich zu groß. Von da her müsste es wohl entweder mehrseitig sein oder es sind Bilder in unkomprimierten Format. Wenn Mac, dann sehr wahrscheinlich PICT oder TIFF bzw. TIF. Schon länger nicht mehr mit PICT gearbeitet. Kann dies unter MacOS X überhaupt noch geöffnet werden? TIFF auf jeden Fall schon. Ansonsten musst Du Dir noch ein entsprechendes Programm suchen.


    scheinbar ist das schon länger her (sind alte Dateien von 2005, hatte sie nicht mehr gebraucht)

    Ist 2005 wirklich das Erstellungsdatum der Dokumente oder nur das Datum, an dem Sie auf das NAS kopiert wurden. Und selbst wenn die Dokumente 2005 erstellt wurden, wie alt war denn das verwendete Programm? Konnte ja schließlich mit einem Programm auch dem Jahre 1990 erstellt worden sein. Somit hätte das Dokument ein 30 Jahre altes Format.

    15 Jahre stellt auch für ein "normales" nicht Langzeitarchivierung gedachtes PDF-Dokument keine Probleme dar. Bei der Langzeitarchivierung geht es unter anderem vor allem um die Farbechtheit und diverse andere Feinheiten im Grafiksektor. Für ein Textdokument, insbesondere wenn es nur gescannt und nicht umgewandelt worden ist, eigentlich irrelevant. Öffnen kann man die Dokument deshalb trotzdem.