« Fichier texte corrompu » : différence entre les versions

De fablabo
Aller à :navigation, rechercher
ThomasB (discussion | contributions)
ThomasB (discussion | contributions)
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
===Comment récupérer le texte dans un document texte corrompu ?===
=== = Comment récupérer les éléments textuels dans un document texte corrompu ? ====


{{Projet
{{Projet

Version du 20 juin 2013 à 11:24

= Comment récupérer les éléments textuels dans un document texte corrompu ? =

réparation fichier corrompu

Contributeur·ice·s

User:[[contributeur::ThomasBLa propriété « Contributeur » (en tant que type de page) avec la valeur d’entrée « User:[[contributeur::ThomasB » contient des caractères non valides ou est incomplète et peut donc provoquer des résultats inattendus lors d’une requête ou d’un processus d’annotation.|ThomasB]]

Statut du projet

fonctionnel

License

GPL« GPL » n’est pas dans la liste (Je ne sais pas, Licence à définir par la suite, Creative commons, Creative Commons Attribution CC-by-sa-3.0 France, Creative Commons Attribution CC-by-3.0 France, Creative Commons Attribution CC-by-nd-3.0 France, Creative Commons Attribution CC-by-nc-nd-3.0 France, Creative Commons Attribution CC-by-nc-3.0 France, Creative Commons Attribution CC-by-nc-sa-3.0 France, Licences libres, ...) des valeurs autorisées pour la propriété « License ».

Inspiration

Fichiers source

Machines

Matériaux

Lien

[ ]


Description du projet

réparation fichier corrompu




Transformer le .docx en .zip

Les documents textes "complexes" tels que ceux utilisés avec libreOffice, mais aussi openOffice, word etc. sont en fait des paquets contenant plusieurs types de fichiers. En somme un fichier .odt ou ici .docx s'apparentent plus à un dossier qu'à un fichier. C'est le syndrome des poupées russes. Alors comment accéder au contenu disponible dans un fichier .docx ? Et bien tout simplement en le renommant en monFichier.zip.

Ouvrir le fichier document.xml

Qu'est ce que le XML ?

Récupérer le contenu textuel depuis le fichier document.xml

Processing ?

C'est fini !