Pourquoi PDF/A est-il important pour les implémentations SharePoint ?

Il n'y a pas une autre plate-forme dans les organisations qui est devenue aussi répandue que SharePoint. SharePoint Server n'est pas un produit final, mais une plate-forme d'application sur laquelle les systèmes DMS tels que le windream et les solutions spécifiques aux clients sont construits.

SharePoint et le cycle de vie du document

Les applications SharePoint gèrent le cycle de vie des documents corporatifs de la création à la révision, à la publication multiple, au stockage ou à la cession. SharePoint vous aide à garantir quel type de documents peut être créé, quels modèles doivent être utilisés, quelles métadonnées doivent être incluses, dans quels documents de structure doivent être sauvegardés en fonction de leur phase actuelle dans le cycle de vie, comment contrôler l'accès, comment les documents sont transmis aux processus suivants, quelles politiques doivent être appliquées aux tâches liées au document, quels événements doivent être enregistrés, quels documents doivent être conservés, protégés ou jetés. Les solutions SharePoint et SharePoint implémentent tous ces aspects de la gestion des documents. Les outils Microsoft Office tels que Word ou Outlook supportent le cycle de vie des documents avec des fonctions SharePoint spécifiques afin que les collaborateurs puissent bénéficier des avantages SharePoint tout en utilisant les outils auxquels ils sont habitués.

L'importance du format du document lui-même peut facilement être négligée au vu des améliorations louables de la productivité, collaboration et intégration transparente des applications SharePoint offre. Mais est-ce que le réflexe intuitif pour tout obtenir d'un seul fabricant résout tous les problèmes?

Et le format du document a de l'importance!

Dans le but d'assurer l'interopérabilité et l'accès à long terme au contenu du fichier, le secteur public et le secteur privé ont demandé depuis un certain temps que tout format de document utilisé soit normalisé, documenté et indépendant du fabricant afin d'assurer l'interopérabilité et la lisibilité à long terme. Une meilleure interopérabilité et l'élimination des formats de fichiers propriétaires réduisent le besoin de systèmes d'exploitation ouverts et de logiciels d'application ouverts. Les analyses de coûts confirment qu'à long terme, les formats de fichiers ouverts sont meilleurs pour prévenir les effets de verrouillage que les logiciels ouverts. Voilà pour la théorie – mais quel format de fichier est le plus approprié lorsqu’il est mis en pratique ?

Les formats PDF, PDF/A, ODF et OOXML affirment qu'ils sont bien documentés et indépendants du fabricant. Sommes-nous tous normalisés? Il ne fait aucun doute. Mais chacun de ces formats convient-il à toutes les phases du cycle de vie d'un document ? Et y a-t-il de bonnes raisons de changer le format pendant son cycle de vie ?

Posez ces questions au fabricant des systèmes de gestion et d'archivage des documents, on obtient la réponse : « Nous faisons en sorte que chaque document puisse être récupéré exactement de la manière dont il a été stocké ». Mais cela suffit-il? Cela ne suffit certainement pas si nous devons stocker le document sur une longue période. La question cruciale qui doit être posée est de savoir si nous pouvons présenter et lire correctement le document dans le futur, quel que soit le matériel, à ce moment-là le système d'exploitation et le logiciel.

Pour approfondir cette question, nous avons divisé le cycle de vie d'un document en deux phases, « Document de travail » et « Document final », et examiner les exigences relatives à l'échange de documents et à l'archivage à long terme. En fin de compte, nous arriverons à la conclusion que ODF et OOXML sont les mieux adaptés à la phase de « Document de Travail », tandis que PDF ou encore mieux PDF/A est le mieux adapté au « Document final ». Dans le cas de l'archivage à long terme PDF/A est en fait une nécessité.

Pour soutenir cette théorie, examinons les formats de fichier plus en détail :

PDF

PDF est connu dans le monde entier et présent dans presque tous les segments du marché. La plupart d’entre nous utilisent le terme « PDF » en conjonction avec des pièces jointes par courriel ou un document qui peut être téléchargé à partir d’un portail Web. Mais en fait, nous n'avons qu'une idée approximative de ce qu'elle est exactement. L'abréviation PDF signifie « Portable Document Format » et spécifie un format de fichier. PDF a été développé par Adobe Systems Inc. au début des années 90 comme format de fichier indépendant de la plate-forme. Basé sur l'expérience acquise avec son prédécesseur PostScript Adobe a fixé les objectifs suivants : activer l'échange et la présentation de documents électroniques, afficher graphiquement du texte et des images quelle que soit leur résolution, optimiser les documents pour le Web et offrir des fonctions interactives.

Le format PDF comme format de document électronique est attrayant pour plusieurs raisons. Le PDF est indépendant de la plate-forme. Un document PDF créé sous Windows peut être traité sur un serveur UNIX et consulté sur un ordinateur Macintosh. Le format PDF est basé sur la langue de description de la page PostScript établie et offre de nombreuses fonctions supplémentaires telles que l'accès direct aux pages, la compression, le chiffrement, la navigation interactive, les commentaires ou les formulaires. En outre, aujourd'hui PDF est le format le plus utilisé dans la production de réglage d'impression dans la pré-presse numérique. Des organisations privées, des autorités publiques et des institutions éducatives remanient leurs processus d’affaires en remplaçant leurs flux de travail sur papier par des processus d’échange d’information électronique.

L'une des principales raisons de la prolifération du PDF est le lecteur PDF par Adobe. Le logiciel PDF-Reader est gratuit depuis longtemps – les coûts ne s'appliquent que lors de la création ou de la manipulation de documents PDF. Depuis la première publication du format PDF, Adobe a encouragé d'autres fabricants à mettre en œuvre PDF avec leurs solutions. Le marché a répondu à ce signal avec un nombre significatif de fournisseurs indépendants offrant des logiciels et des composants PDF.

L'évolution réussie du PDF a considérablement renforcé la confiance dans ce format. La seule critique portée sur le format était qu'il s'agissait d'Adobe propriétaire, ce qui a entraîné une demande pour une norme acceptée au niveau international. Rien d'étonnant à ce que PDF ait évolué vers la norme ISOStandard (ISO 32000) pour l'échange électronique de documents. La première partie de la norme (PDF 1.7) a été publiée en 2008 ; la deuxième partie (PDF 2.0) est prévue pour l'automne 2011. La norme fournit également la base pour des normes ISO spécifiques à une application supplémentaire, avec les plus courantes étant PDF/X pour l'échange de documents – en particulier dans le secteur graphique, PDF/A pour l'archivage à long terme et PDF/VT pour l'impression en grand volume de documents transactionnels avec des données variables.

PDF/A

Les principaux initiateurs de la mise en œuvre d'une norme d'archivage pour les documents électroniques étaient AIIM (Association pour la gestion de l'information et des images), NPES (National Printing Equipment Association) et le Bureau Administratif des tribunaux américains (AO). Leur but était de définir un format standardisé pour les documents archivés électroniquement. Le résultat de cette initiative est la norme ISO-Norm 19005, qui définit un format de fichier basé sur PDF appelé PDF/A.

Ce format offre un mécanisme de présentation des documents électroniques de manière à ce que l'apparence visuelle reste intacte sur une longue période - indépendamment des outils et des systèmes utilisés pour leur création, stockage ou récupération. La norme ne définit pas la méthode, la signification ou le but de l'archivage. Au lieu de cela, il définit une norme pour les documents électroniques, qui garantira la reproduction authentique d'un document à l'avenir.

Le format PDF lui-même ne garantit pas la reproductibilité à long terme, pas plus que l'indépendance par rapport aux logiciels et aux périphériques de sortie. Pour soutenir ces deux principes, la norme PDF existante a dû être restreinte et étendue en même temps. Par conséquent, un document ne peut pas pointer directement ou indirectement vers une source externe. Un exemple à cet égard est une image externe. Certaines fonctions du PDF telles que la prise en charge du son et de la vidéo, par exemple, ne sont pas non plus autorisées. D'autre part, d'autres options telles que l'intégration de polices dans le document sont obligatoires. Essentiellement, la norme PDF/A définit et clarifie les propriétés sélectionnées de la référence PDF 1. - stipulant s’ils sont absolument nécessaires, recommandés, restreints ou interdits. La norme PDF/A (ISO 19005) est sérialisée, où la première partie (PDF 1. ) a été introduit en 2005 et la deuxième partie (PDF 1.7), basée sur la norme ISO 32000, sera publiée au printemps 2011.

ODF

Le format OpenDocument (ODF) est un format de document ouvert basé sur XML pour l'édition de texte, le traitement de feuilles de calcul et les présentations d'applications bureautiques. Le format repose sur d'autres normes ouvertes dans la mesure du possible, telles que les formats de contenu multimédia ou de polices. Initialement, le format ODF a été développé par Sun comme format de fichier pour les applications OpenOffice. Un comité technique d'OASIS a développé le format et l'a publié en 2005 en tant que format OpenDocument (ODF). La version 1.0 et 1.1 d'OpenDocument ont depuis été certifiées ISO 26300 et la version 1.2 est en ébauche depuis 2009.

OOXML

Le terme OOXML est une abréviation d'Open Office XML et il est également un standard ISO. Open Office XML a été développé par Microsoft et soumis pour normalisation à un groupe de travail d'Ecma International, où il a été publié en 2006 comme Ecma-376. En 2008, la norme a été publiée sous le nom de ISO 29500. L'ensemble du processus de normalisation a été compliqué, a pris des revers et a été couvert par des rapports d'irrégularités. Comme son nom l'indique, le format était destiné à créer des formats de fichiers propriétaires des produits MS Office tels que Word, Excel, PowerPoint disponible dans un format normalisé et accessible au public. La syntaxe XML largement utilisée a été utilisée pour sa base. Le processus de normalisation était de refléter les capacités existantes des documents propriétaires en XML, étendre les capacités individuelles, documenter et permettre l'interopérabilité entre les applications.

Lors de l'émergence d'OOXML, il y avait déjà plus de 400 millions d'utilisateurs qui ont produit environ 40 milliards de documents par an en utilisant les outils susmentionnés. En conséquence, OOXML n'a pas seulement dû refléter une quantité énorme de documents existants. mais il a aussi dû supporter un large éventail de nouvelles applications. Les exemples de telles applications sont la création automatique de documents à partir de données de processus métier, l'extraction de données à partir de documents et la réinsertion de ces données dans les applications métier, le traitement ciblé et automatisé des documents et bien d'autres encore.

Archivage à long terme et exigences légales

Le défi probablement le plus critique de l'ère numérique réside dans l'archivage à long terme. Nous sommes habitués à produire une quantité exponentiellement croissante de documents. À ce jour, sans grande considération, nous relions encore la sortie numérique aux outils que nous utilisons pour la créer. Notre expérience nous dit cependant qu'il peut être extrêmement difficile de reproduire visuellement de tels documents après 10 ou 20 ans. et même si c’est le cas – avec une perte significative d’informations sur le contenu. Préserver les investissements financiers et intellectuels dans ces documents devient une priorité urgente.

La puissance des formats de fichiers pose des problèmes importants aux archivistes : fonctions telles que le chiffrement, modifier dynamiquement le contenu et les dépendances des ressources externes telles que les polices ne sont pas gérables à long terme. Il fallait trouver une solution rapide et faute de solutions alternatives – les documents d’archives ont simplement été convertis en TIFF. Rien n'est mauvais avec le format TIFF en général, mais comme le terme “Tagged Image File Format” décrit si bien – c’est un format de fichier pour les images matricielles qui peut être étendu facilement en utilisant la plupart des fonctions propriétaires. TIFF n'offre pas de fonctions normalisées telles que la possibilité de recherche, l'intégration de métadonnées ou de signatures numériques. Les leçons apprises avec TIFF ont cependant contribué au développement du format PDF/A, qui a été développé comme une initiative par AIIM (Association pour la gestion de l'information et de l'image), NPES (National Printing Equipment Association) et l'Office Administratif des tribunaux américains (AO) pour traiter spécifiquement les exigences en matière d'archivage.

PDF/A satisfait à toutes les exigences importantes des archivistes, telles que le contenu statique, la reproductibilité prévisible et réelle des documents indépendamment de la plate-forme et du logiciel ; ainsi qu’aucune référence à la source externe, exempte de droits de cryptage et de brevet, de possibilité de recherche, d’intégration de métadonnées et de signatures numériques et plus encore. La vision du « papier numérique » s’est finalement concrétisée avec PDF/A. C'est les mêmes propriétés de PDF/A et le travail acharné de beaucoup de bénévoles, y compris l'initiation du centre de compétences PDF/A, qui a fait de PDF/A le de-facto-standard pour l'archivage. Les nombreuses recommandations, lignes directrices et exigences juridiques des autorités publiques et des gouvernements dans de nombreux pays du monde entier en sont la preuve.

Le gouvernement suisse s'est engagé dans le format PDF/A dans sa législation relative à l'échange de documents numériques. La même tendance peut être observée dans d'autres pays comme la France, l'Autriche, la Norvège, le Danemark, etc. où PDF/A est la norme pour le secteur public. Les archives nationales et nationales préfèrent également recevoir des documents au format PDF/A. Un signe clair que le format PDF/A a prévalu sont les nombreux projets du secteur privé. qui ne sont pas guidés par des exigences réglementaires, mais plutôt par une économie durable.

Interopérabilité et conversion

Les normes de document affirment qu'elles soutiennent l'interopérabilité. Qu'est-ce que cela signifie exactement? La seule chose qui complique le problème est le fait que des propriétés de format très différentes sont signifiées. Par exemple, le terme d'interopérabilité peut signifier que différents programmes d'application présentent le document de la même manière, ou cela peut signifier que les applications interprètent la structure et le contenu du document de manière identique. La qualité de l'interopérabilité devient évidente dès qu'un utilisateur veut convertir le document d'un format à un autre. Pourquoi?

La plupart des formats de document séparent la mise en page de la structure et du contenu du document, comme le font PDF, ODF et OOXML. Selon l'application, l'un ou l'autre aspect est plus important. Avec les documents de bureau par exemple, la structure et le contenu sont importants – tandis que pour imprimer la mise en page est plus importante. La phase du cycle de vie du document joue également un rôle. Au cours des premières phases des changements dans le document, il y a une demande de contenu et de structure – alors que dans les phases finales la demande se déplace vers la mise en page. Les formats de documents PDF, ODF et OOXML sont très différents par rapport aux aspects mentionnés. La force de ODF et OOXML se trouve dans la structure et le contenu, alors qu'avec PDF, la force est inversement dans la mise en page. Non pas que les formats ignoreraient catégoriquement les aspects opposés, mais ils les soutiennent plutôt à contrecœur. Cela n'a rien de surprenant si l'on considère que le PDF trouve ses racines dans l'industrie graphique. par opposition à ODF et OOXML, qui trouvent leur origine dans les applications de bureau.

Ces connaissances confirment la théorie selon laquelle PDF – et en particulier PDF/A – est le mieux adapté aux étapes finales des documents. Par contre, il est peu probable que l'on veuille utiliser le format PDF comme format pour l'édition de documents. Dans cette phase du cycle de vie, il est clair que ODF et OOXML sont mieux adaptés. La conséquence est évidente : les documents gérés dans SharePoint doivent être convertis en PDF/A s'ils doivent être archivés. La préparation à l’archivage et à l’échange de documents nécessite une conversion parfaite de ODF ou OOXML en PDF/A.

La plate-forme SharePoint est bien préparée pour cette tâche. En tant que plate-forme extensible, il peut être complété par un service de conversion de documents, parfois aussi appelé service de rendition, qui peut convertir les documents ODF ou OOXML automatiquement ou initiés par l'utilisateur en PDF/A et marquer les documents convertis avec un attribut « prêt à archiver », généralement sous la forme d'une signature électronique. Des processus automatisés supplémentaires permettent de contrôler le stockage des documents dans l'archive et de s'assurer que les documents sont intégrés de façon transparente aux fonctions de recherche de texte de SharePoint.

Pour garantir une image impeccable de la mise en page du document, le service de conversion de documents nécessite l'utilisation des applications bureautiques natives. Pour ODF, c'est OpenOffice et pour OOXML les applications Microsoft Office correspondantes. Une étude de l'Institut Fraunhofer FOKUS a montré que l'interopérabilité entre ODF et OOXML peut dans de nombreux cas être très difficile, voire impossible. Les ambiguïtés dans la description des normes entraînent dans de nombreux cas des représentations imprévisibles de la mise en page.

La conversion en PDF/A est nécessaire

La plateforme SharePoint s’est établie avec succès dans de nombreuses organisations, où elle améliore la productivité et la collaboration de « travailleurs de l’information ». Les applications SharePoint gèrent le cycle de vie des documents au sein des organisations, de la création au stockage. Le format du document joue un rôle important à cet égard, car les documents peuvent dépasser la durée de vie des systèmes de création, de manipulation et d'archivage utilisés. En tant que tel, le format doit être ouvert, documenté, non pas propriétaire et normalisé. Un format ouvert est plus économique à long terme que les plates-formes et applications ouvertes (Open Source). Cela peut être l'une des raisons du haut niveau d'acceptation de SharePoint et de Microsoft Office.

Mais tous les formats ne sont pas parfaits pour chaque phase durant le cycle de vie d'un document : ODF et OOXML sont recommandés pour la phase du « Document de Travail » alors que PDF/A est un « must » pour le « Document Final ». Par conséquent, le document doit être converti de ODF ou OOXML en PDF/A au moment où il passe d'une phase à l'autre. Pour cette tâche, il y a des applications professionnelles de conversion de documents qui sont intégrées en plus de SharePoint. Avec l'aide de la plateforme SharePoint, ces applications automatisent le processus de conversion et s'assurent que les recherches de texte de documents PDF/A seront transparentes pour l'utilisateur.

De nombreuses organisations ont déjà implémenté des solutions de convertisseur de documents, comme la plus grande compagnie d'assurance vie de Suisse avec plus de 700 consultants en assurances dans plus de 40 agences. Le scénario est le suivant: les documents Microsoft Office provenant de processus commerciaux – tant internes qu’à la société que de documents clients – sont gérés et archivés dans SharePoint Server. Dans le passé, TIFF était utilisé comme format de fichier pour l'archivage. La société est passée à PDF/A afin de rendre les documents consultables, d'appliquer des signatures numériques et de garantir la traçabilité. À la fin de votre étude, les documents sont convertis au format PDF/A et les métadonnées sont ajoutées avant de les stocker dans l'archive. Les utilisateurs contrôlent la conversion des documents directement depuis SharePoint où ils peuvent accéder aux documents PDF/A à partir de l'interface utilisateur standard. En même temps, les documents sont reproduits dans une archive autonome et robuste à long terme – également basée sur SharePoint – qui protège les documents contre les accès non autorisés. Une signature numérique est appliquée pour assurer l'authenticité des documents et éviter que ces documents ne soient modifiés ultérieurement.

Like what you see? Share with a friend.

Dr. Hans Bärfuss

Written by Dr. Hans Bärfuss

Dr. Hans Ba<unk> rfuss est le fondateur et directeur de PDF Tools AG. Il est délégué de la Swiss Standards Association (SNV) pour la norme ISO et contribue à standardiser les formats de fichiers et les signatures numériques. Il est l'un des initiateurs et fondateurs de l'Association PDF et Président du Chapitre Suisse.

« Gru<unk> ezi! » Comment pouvons-nous nous aider?

Phone