QNAP BESCHÄDIGT POWERPOINT PPT DATEIEN

  • Hallo,


    ich habe ein massives Problem und hoffe, hier eine Hilfestellung zu erhalten.


    Auf meinem ein Jahr alten 209 II Pro (Raid 1) habe ich alle meine wichtigen Dokumente transferiert.
    Irgendwann habe ich bemerkt, dass einige Powerpoint Dokumente, mit denen ich Jahreproblemlos gearbeitet habe, sich plötzlich nicht mehr öffnen ließen.
    Über die Monate sind es immer mehr Dateien geworden, die beschädigt wurden.


    Alle Recovery-Versuche blieben erfolglos. Diverse PCs habe ich eingesetzt, diverse Applikationen in diversen Versionen (Office 95 - 2007), Reader only, etc.
    Die Dateien lassen sich defeinitiv nicht mehr öffnen oder repaireren. Ich erhalte folgende Fehlermeldung:
    >> Powerpoint konnte die Gliederung aus "d:\Beispielname.ppt" nicht lesen. Für diesen Dateityp wurde kein Textkonvertierungsprogramm installiert"<<


    Inzwischen habe ich in diesem Forum einen absolut identischen Fall gefunden, jedoch ohne Lösung: http://forum.qnapclub.de/viewtopic.php?f=27&t=1650


    Derzeit wandele ich alle meine PPT-Dateien in Zip-Archive um. Das hindert eine Beschädigung, da mein NAS an den ZIP Dateien nichts ändert.
    Übrigens: dieses Problem habe ich nur mit Powerpoint-Dateien


    Kann mir bitte jemand helfen?`Der Support in Taiwan war überfordert!


    Danke & Grüße aus München

  • Doc Genau das ist meine Absicht. Weisste doch. 8-)


    Werde das vorgehen mal beschreiben:


    Habe einfach mal eine Defekte Datei angefordert, und werde da mal den Header, Footnotes und Hex kontrollieren.
    Das ist jedoch nicht mein Fachgebiet, darum werde ich das weitergeben.
    Habe noch 'nen Kumpel, der sich auf Data Recovery spezialisiert hat...
    Eventuell finden wir hier heraus, wie die Datei beschädigt ist (Header und co), Reparieren diese (wenn möglich).


    Danach machen wir uns mal auf die Suche nach QNAP und PPT Problem.
    Was ich jetzt schon sagen kann ist, das PPT eh nicht für eine Langzeitarchivierung gedacht ist. Bei PDF gibt es ja deshalb auch PDF/A (Langzeitarchivierung mit Fehlerkorrektur). Natürlich schliesse ich auch Kopierfehler nicht aus, da ich die Netzwerkumgebung der beiden User nicht kenne. Und genau das gilt es herauszufinden. Eine AW mit Analyse wird folgen. :thumb:

  • So, das ging definitiv schneller als geplant, jedoch kann ich jetzt darüber Berichten, warum es wirklich mit PowerPoint Dateien manchmal zu Speicherfehlern kommen kann.


    Zuerst aber mal möchte ich das kurze aber aufklärende überprüfen Schildern. (Zwar via Apfel aber nachvollziehbar) ;)
    Ich habe von Oktay1000 2 rar dateien bekommen. Die Präsentation ist identisch, jedoch die eine Datei defekt, die andere unbeschädigt.
    Die eine Datei heisst jetzt einfach mal: beschädigt.ppt und die andere unbeschädigt.ppt.


    Check1 - (Beide müssten eine unterschiedliche Checksum haben, da eine Datei beschädigt ist.):

    Code
    openssl md5 unbeschädigt.pptMD5(unbeschädigt.ppt)= 792e704386c8b2e33e535f09cfd8d2de


    Code
    openssl md5 beschädigt.pptMD5(beschädigt.ppt)= c9622a86fc16a72ed60524785bcdb4f4


    Check2 - (Compare und DIFF der 2 PowerPoint Dateien)

    Code
    Ergebnis ist, das die unbeschädigte Datei 1:1 exakt identisch mit der beschädigten ist, jedoch in diesen Fall ab 132C00 (HEX)Jetzt mal Hex to Ascii: R...der (Header) fehlt.... Einige Windowsentwickler wissen dies. (auch ehemalige) *grins*;) Das heisst aber schon einmal, das der Inhalt, ob Bilder, etc. in dieser PowerPoint Datei den "schaden" überlebt haben. Bzw. der eigentliche Inhalt (die Präsentation) der Powerpoint Datei geblieben ist.


    Copy&Paste
    Da es sich nur um den Header der Powerpoint Datei handelt kann dieser in diesen Fall einfach via HexEditor (bei mir 0xED) von der unbeschädigten in die beschädigte PowerPoint Datei kopiert werden. (Aufpassen, das dieser dann auch bei an der richtigen Stelle beginnt).


    Check3 - (Noch einmal beide Dateien via MD5 Checksum prüfen, diese Checksum müsste jetzt übereinstimmen)

    Code
    openssl md5 unbeschädigt.pptMD5(unbeschädigt.ppt)= 792e704386c8b2e33e535f09cfd8d2de


    Code
    openssl md5 beschädigt.ppt
    MD5(beschädigt.ppt)= 792e704386c8b2e33e535f09cfd8d2de


    Check4 - (Kopieren Simulieren...)
    Um das ganze ordentlich abzurunden, bastelte ich mir einfach mal ein Shell script, das Die unbeschädigte und reparierte Datei 1000x zum NAS kopiert, und vom NAS auf meinen Client. Die Dateien heissen 1-1000.ppt und 1-1000repaired.ppt.
    Danach überprüfte ich auch da noch einmal die MD5 Checksum aller Daten auf Client und NAS.
    Fazit: Die Powerpoint Dateien waren alle in Ordnung.


    Check5 - Fehlersuche via Google ist Dein Freund ;)
    - Mir ist aufgefallen, das es seltsamerweise sehr viele Anwendungen gibt, die PowerPoint Dateien reparieren können.
    - Nach langer suche bin ich dabei auf das hier gestossen:
    Recover Powerpoint Files:
    http://office.microsoft.com/en…point/HA011168781033.aspx
    Prevent Powerpoint Files:
    http://office.microsoft.com/en…point/HA011168771033.aspx
    Referenz aus MS:
    http://www.echosvoice.com/recovering.htm


    Hervorheben möchte ich jetzt aus dem Prevent Powerpoint Files mal folgendes:

    Zitat


    Preventing your PowerPoint files from becoming corrupted is not really difficult. Turn off Allow fast saves, and then use some common sense: don’t save to or work from removable media, make sure you use Save and Save As frequently, and maintain your hard drive regularly. And remember that zipping PowerPoint files before sending them can be used as an added precaution.


    Für mich heisst das jetzt jedenfalls soviel, das es ein doch nicht so ganz unbekanntes Thema bei M$ ist, und das es schon mal vorkommen kann, dass beim Speichern einer PowerPoint Datei und insbesondere beim kopieren auf Datenträgern jeglicher Art Fragmente verloren gehen können. Leider scheinbar ein grosses Manko der Langzeitarchivierung (am besten wenn dann mit eingebauter Fehlerkorrektur).


    Ich würde daraus den Usern empfehlen, sich die PowerPoint Dateien vor dem Kopieren zu Komprimieren. Zum beispiel mit WinRAR, da rar glaube eine Fehlerkorrektur hat, oder man aber die Checksums nach den kopieren des Clients und des Datenträgers vergleicht. Eventuell kann hier aber ein waschechter Windowsuser etwas besseres empfehlen. (I hope)


    Hoffe, das dieser Thread für alle Interessenten doch noch etwas Aufschlussreich war. ;)


    Grüsse, David


    P.S.: Ich brauche gerade erst einmal eine Mütze schlaf, und muss auch gleich wieder raus. ;)

  • Wow, ich bin nur durch Zufall hier drauf gestoßen, da ich Privat kein Powerpoint habe.
    Aber für Arbeit ist das ein Thema, dass ich mal weitergeben werde.


    Vielen Dank für die ausführlichen Tests und Informationen!

  • Hi,


    was mich da stutzig macht: in unserem Firmennetz gehen alle ppt's auf den Server, der allerdings ein MS-Server ist. Es gibt dort solche Verluste und Beschädigungen nicht - ich mache das seit Jahren so, und habe noch nie eine kaputte pst-Datei gehabt.


    Also muss das ganze doch ein SAMBA-"Fehler" sein, oder? Was geht denn da schief?

  • Denkbar wäre ein Samba Fehler auch. Was ich auch zuerst vermutete.
    Selbst einen Netzwerkfehler wenn man über WLAN oder LAN kopiert würde ich nicht aussschliessen, da ich auch Kundenumgebungen kenne, die PowerPoint Dateien direkt auf einen Share ablegen. Die haben auch noch nie Probleme damit gehabt.


    Seltsam ist hier nur, warum ausgerechnet nur der Header verloren gegangen ist. Und zwar ziemlich genau der Header. Bei einen Netzwerkfehler würde ich dann irgendwo innerhalb der Datei auch andere Differenzen haben. (Das wäre dann zumindest Plausibel was passiert wäre).... Natürlich könnte es auch sein, das Samba einfach die Header zerstört.
    Bei dem 1000 mal hin und her kopieren hatte ich ebenfalls keine Fehler. Und das habe ich gerade noch einmal über AFP, SMB, NFS ausprobiert. (Wieder Client NAS und MD5 Checksum). Das Ergebnis ist, das alle Dateien i.O. sind.


    Ich habe auch die PowerPoint Dateien auf dem NAS geöffnet, editiert, gespeichet. Alles 1:1 geblieben. (Was man ja eigentlich nicht machen sollte lt. M$).
    Das Problem ist ja auch noch, das PowerPoint Dateien im Prinzip auch Containerdaten sind, in dem die Bilder, etc. für die Präsentation auch mitgespeichert werden. Und dachte, da wäre etwas nicht in Ordnung... Teste aber immer noch mit den gleichen Daten von Oktay.


    Doc: So langsam verstehe ich die ganze Sache auch nicht mehr. Deshalb die idee mit den Komprimieren (iss ja auch so empfohlen für das Mailen, schaden kann es nix). Wäre prima, wenn Du da auch noch ein bissl testen könntest, denn so langsam raucht mein Köpfchen und wir können weiterhin nur vermuten. ;) Werde da aber jetzt auch noch dran bleiben, und noch ein paar Sachen Testen. :thumb:


    EDIT: Was mir noch eingafallen ist, @Oktay kannst Du mal Deine Datei auf Read Only Stellen, diese noch mal auf das NAS kopieren? Überprüfen, ob wieder der Header beschädigt ist?

  • Hi,


    ist das vielleicht so, dass MS in den ppt-Headern Datasreams ablegt? Die werden ja u.U. beim kopieren auf nicht-NTFS-Laufwerke geshreddert. Allerdings müste das Problem dann auch auf FAT-PArtitionen auftreten, denn da werden beim speichern ja auch die Streams entfernt.


    Mit welchen Power-Point-Versionen ist denn das Problem aufgetreten? Tritt es auch auf, wenn die Datei zuvor in pps umbenannt wird?


    EDIT:


    Hi oktay,


    kannst du mal versuchen, die Datei in *.zip umzubenennen und dann nachschauen, ob in dem zip die ppt dann drin ist?

    Einmal editiert, zuletzt von christian () aus folgendem Grund: Doppelte Beiträge sind zu vermeiden, siehe Forenregeln!

  • Hallo zusammen,


    @ Terz: Das Problem der "Beschädigungen" tritt ja nicht immer auf, d.h. es ist reiner Zufall, welche Datei wann beschädigt wird. Ich kann auch nicht sagen, ob es beim Speichern auf dem Server oder beim öffnen der Detei passiert. Sicher ist nur, dass Dateien, die z.B. 10x geöffnet wurden beim 11x sich nicht öffnen lassen, obwohl weder Veränderungen noch Speicherungen vorgenommen wurden.


    @ Doc HT: nein, nachdem ich die Datei in zip umgewandelt habe sind folgene Dateien auf Ebene 1 zu sehen:
    1. Ordner "_rels", darin die Datei ".rels"
    2. Datei "[Content_Types].xml"
    3. Datei tableStyles.xml
    Jedoch ist dies auch der exakt gleiche Inhalt wie auch bei der unbeschädigten Datei (auch identische Größen)


    p.s., mit den genannten Recovery-Tools komme ich leider auch nicht weiter. Aber das ist nicht mein Hauptproblem. Wichtiger ist: wie stelle ich sicher, dass nicht noch mehr PPT-Dateien beschädigt werden? Derzeit beste Lösung: PPT-zippen. Ursache füt Beschädigung der PPT-Dateien ist leider nicht bekannt

  • eol1: ja, habe ich gelesen. Es ist kein Kompatibilitätsproblem unter den Versionen.
    -----------------------


    Bisher habe ich folgendes gelernt:
    1) Die Dateien werden inhaltlich NICHT beschädigt
    2) (ich vermute, dass) irgendwo in der Datei die Checksum der Datei (zum Zeitpunkt der Speicherung) hinterlegt wird.
    3) MS Office prüft standardmäßig die Checksum beim öffnen der Dateien.
    4) Stimmt die Checksum-Prüfung während des Öffnungsvorgang mit der in dem in der Datei hinterlegten Wert nicht überein, verweigert PPT (aber z.B. auch Word) die Öffnung (--> MEIN PROBLEM!)
    5) Zwei Fälle kommen in Betracht: Entweder wird der in der Datei hinterlegte Checksum Wert modifiziert oder der Inhalt wird modifiziert, sodass eine Abweichung zustande kommt.
    6) Terz hat nachgewiesen, dass der Inhalt, nämlich der Header verändert wird.


    Was da genau passiert kann ich leider nicht sagen. Ich kann nur noch einmal sagen, dass jemand hier im Forum das exakt selbe PRoblem geschildert hat (http://forum.qnapclub.de/viewtopic.php?f=27&t=1650)

  • EDIT: Während ich hier schreibe habt Ihr beide schon einmal gepostet. Ich lösche darum meinen kompletten Text, und Poste hier nur den md5check. ;) (Seid am gleichen dranne, wärend ich hier einen md5 check bastelte...)


    Habe hier was Für Dich gebastelt:


    Downloaden auf den Desktop oder so entpacken.
    In das Verzeichnis legst Du eine test.ppt Datei ab. (diese sollte auch test.ppt heissen).
    Dann öffnest Du die check.bat mit den NOTEPAD (kein Wordpad oder Word).
    Da änderst Du die alle -> Z:\share (In Dein Netzlaufwerk ab).


    Das Ding Kopiert jetzt die test.ppt 1000x auf das NAS (speichert diese als test1-1000.ppt)
    Danach erstellt es einen MD5 Hash für alle *.ppt die sich auf den NAS befinden und speichert diese als: logNAS.txt.
    Und serstellt einen MD5 Hash für die lokale test.ppt (das ist dann die logLocal.txt Datei).


    Die beiden Dateien (die Logs) kannst Du einfach Zippen und hier hochladen, oder Du kontrollierst diese selbst. (Würde aber gerne auch noch einmal ein Blick drauf werfen).
    Spätestens dann wissen wir, ob es beim Konvertieren oder beim kopieren liegt. :thumb:
    Ich dachte um 11 schon das gleiche vor euren Posts. ;) (Also wie DOC... Das beim öffnen (da da konvertiert wird) ein Fehler passiert) Die bastelei hat etwas aufgehalten, da ich windows doch nicht mehr so gewohnt bin. ;)

  • Nochmal was zum Header der ppt-Dateien:


    Der Anfang muss wohl immer "D0 CF 11 E0 A1 B1 1A E1" lauten, das codiert wohl ein ppt, falls das was hilft.

  • Header zur Identifizierung = D0 CF 11 E0 A1 B1 1A E1
    Signatur oder auch TagInfos = 52 00 6F 00 6F 00 74 00 20 00 45 00 6E 00 74 00 72 00 79 00 (Root Entry - Case Sensitive Unicode)
    Mehr auf: http://msdn.microsoft.com/en-us/library/cc313105.aspx


    Lasse aber mal Zeit für den MD5 Check. ;) Denn wenn der HASH bei 1000 Kopien noch passt. (Identisch mit Original). Dann wissen wir ja schon einmal, das es nicht beim kopieren passiert, und die Daten 1:1 dem original entsprechen.

  • Hallo,


    anbei die Protokolle der Test. Ich habe keine Auffälligkeiten entdeckt.


    Ich bin mir nicht sicher, ob die Ursachen für dieses Problem gefunden werden. Da zudem PPT an sich als Typ für eine Langzeitarchivierung nicht gut geeignet ist, werde ich nun doch stärker dazu übergehen und meine PPT-Dokumente in einzelne RAR Archive packen. In diesem Zusammenhang noch eine Frage: Kennt einer von Euch einen Weg, autmatisch einzelne Ordner und Unterordner durchsuchen und PPT-Dokumente in jeweils einzelne RAR-Archive packen zu lassen, wobei die Archive so benannt werden wie die PPT-Dateien heißen? Wäre nett wenn Euch da etwas einfällt.


    Viele Grüße
    Oktay

  • Hi Oktay,


    vielen Dank für den Test, und Sorry dafür, das Du jetzt unangenehme 1-1000 Dateien auf den NAS hattest.... Ging aber so am einfachsten. ;)
    Habe mir die Logs mal angeschaut, und muss dann damit auch leider meinen Post dementieren.


    - Die PowerPoint Datei, die 1000 mal auf das NAS kopiert wurde entspricht 1:1 deinen Lokalen Original. Einen Fehler vom NAS aus, Übertragungsfehler, etc. können wir damit schon einmal ausschliessen, sonst hätten wir zumindest einen MD5 Hash dabei, der nicht identisch mit dem der Lokalen Datei ist.


    - Es ist zwar aufwendig aber nie verkehrt, zumindest Präsentationen, wenn man diese nicht benötigt zu komprimieren. Nötig ist es nicht, jedoch empfohlen... (Beim Mailen) Und ein gutes DMS macht dies eh automatisiert. (Also verkehrt ist es nicht)... Ich würde es nicht machen, wenn dies nicht automatisch funktionieren würde. Ausser beim Mailen (Das ist aber bei mir auch automatisiert).


    - Der Fehler kommt eher vom Konvertieren vom "alten PPT" Format in das neue PowerPoint 2007 (Das macht PPT jedesmal vor dem öffnen erst dann versucht PPT die Datei zu "öffnen").


    Einen Tipp denen ich auch meinen Kunden gebe, wenn Office in der Firma eingesetzt wird, dann die Version nutzen, die alle haben, und nach und nach oder am besten alle Daten Konvertieren (in das neue Format). Also wenn 2K7 dann 2K7 ein Mixedmash geht meist in die "Hose". ;)


    Für das Komprimieren zu RAR:
    Einfach nach *.ppt (in Vista Suchen) diese einfach noch einmal in einen "Neuen Ordner" kopieren, dann hast Du diese schon einmal in einem Ordner. Glaube Winrar hat auch eine Funktion drinnen, das Du für jede Datei eine RAR erstellen kannst. Oder aber eine Batch würde weiterhelfen. ;)


    Für alle Leser:

    Code
    Um feststellen zu können, ob das NAS (ein Dienst, wie z.B. Samba) für Datenfehler oder Netzwerkfehler, etc. hat zuerst einmal mit irgend einem Tool einen Checksum "Hash" genieren und diese vergleichen. Undzwar die Daten, die auf dem NAS gespeichert wurden, mit eueren lokalen "Originalen".


    In diesem Falle würde ich jedoch einen Kopierfehler oder "Sambafehler" ausschliessen und auf einen Konvertierungsfehler plädieren.


    Doc: So let it be written!?

  • Vielen Dank an Terz und auch an eol1 für die Zeit die Ihr Euch genommen habt.
    Wenn ich irgendwann zufällig ein Muster erkenne oder sonstige Hinweise habe, werde ich mich noch einmal melden. Vielleicht kommen wir dann darauf, was das schief läuft...


    Viele Grüße
    Oktay