informations complémentaires

De la (non) accessibilité du format PDF

« Un fichier PDF (Portable Document Format) est-il accessible ? ». Combien de fois ai-je lu ou entendu cette question, combien se la posent sans jamais avoir la certitude que la réponse soit réelle ou définitive ? Combien apportent leurs réponses pleines de certitude marketing ? Trop assurément.

En fait la question de l’accessibilité de documents au format PDF d’Adobe ne m’apparait pas comme le fond du problème, ce n’est qu’un bruit de fond, un marronnier dont les seules fonctions semblent être la distraction des listes de discussion et l’augmentation (encore !) de la notoriété de ce fabuleux format (l’important n’est pas ce que l’on en dit mais d’en parler, la réclame fera le reste). Marronnier ou pas, je comprends bien que si je ne réponds pas à  minima à  la question primaire, une partie d’entre vous ne prendra même pas la peine de lire le reste, « on est pas venu pour se faire engueuler mais pour voir l’accessibilité du PDF exprimée ». Soit.

Un peu d’histoire

Au commencement, fut PostScript. Merveilleux langage de description de pages pour obtenir des impressions toujours plus à  la pointe. Ce langage a régné en maître pendant plusieurs décennies. Langage puissant, langage de spécialistes (retoucher un fichier PostScript à  la main reste un excellent souvenir !), langage verbeux. C’est là  que l’analyse du marché chez Adobe a été fantastique. Nous sommes au tout début des années 90. IP (Internet Protocole) – je n’ai pas dit le Web mais bien IP – occupe de plus en plus de place sur certains réseaux, les échanges de données s’intensifient dans un monde qui apparaît à  l’époque comme de plus en plus hétérogène, de SunOS à  OS2, de MS-Windows à  MacOS, d’OS2 à  TOS, etc. IP facilite cette diversité d’échanges. Les disquettes restent reines mais commencent à  percevoir une fin de règne. Certaines compagnies ou institutionnels aux États-Unis ou en Europe ont besoin de communiquer d’une cote à  une autre entre les deux coté le l’océan, de MS-Windows à  MacOS. Sans réelle solution, le papier semble incontournable. Et puis, il y a les habitudes, pouvoir annoter, commenter. Comment faire sans corrompre l’original ?
C’est là  que le génie intervient. Sortir un descendant de PostScript avec tous ses avantages en gommant les inconvénients… Plus compact, outillé (PDF Reader, PDF Writer, Exchange, Capture, etc.) et surtout avec une approche multi-plateformes. « Vous créez un PDF à partir de n’importe quelle application ou à partir d’un fichier PostScript sur n’importe quel OS et il pourra être lu et annoté sur n’importe quel OS. Créé à San Franscisco sur Mac par le studio de création et annoté par le bureau de New-York City avant validation.» Économie de temps, de budget, l’ère moderne s’ouvrait.

15 ans plus tard

Aujourd’hui – plus de 15 ans plus tard donc – les usages n’ont guère changé et le « PDF haute définition » est devenu incontournable dans l’activité pré-presse.

Le piège s’est bien refermé tout seul. L’innovation est devenue réflexe sans se soucier d’un environnement technologique en pleine mutation. Le PDF est devenu le format de fichier d’échange. Soit. Mais cela n’en fait à  aucun moment autre chose, cela ne lui confère aucun propriété d’universalité absolue car le format PDF paye très cher son héritage. PDF décrit, permet l’affichage (écran ou papier) mais ne s’intéresse qu’insuffisamment à  la sémantique de son contenu tout comme le faisait PostScript. Il sait intégrer une typographie mais ne sait pas décrire la structure d’un contenu, un titre, la spécificité d’un paragraphe, une citation, etc. Même s’il est aujourd’hui possible de lui adjoindre une structure, il reste sourd à  la sémantique. Il lit, écrit sans jamais vraiment comprendre. Voici dont son talon d’Achille.
J’entends les voix s’élever et mentionner l’intégration de balises XMLisées dans la version 1.7, cela ne résout en rien le problème, la situation est toujours la même. De plus, il me semble qu’il s’agit d’ajout de marqueurs spécifiques (tags) et non une réelle mise en œuvre XML (Extensible Markup Language). Qui a lu les 756 pages de « Document management – Portable document format – Part 1: PDF 1.7 » équivalent du document ISO 32000-1 et plus spécifiquement le chapitre 14 et le 14.9 « Accessibility Support » ? Peu j’imagine et c’est bien compréhensible. Un paragraphe dans le chapitre 14.8 a attiré mon attention. Ce paragraphe énonce une spécification de priorité des balises XML sur les marqueurs PDF lors d’un export vers XML 1.0. Ces spécifications semblent montrer une certaine ouverture du format mais pas réellement d’engagement visant à  intégrer nativement l’accessibilité dans le format.

Comment imaginer dans ses conditions une réelle accessibilité de ce format ? Fantasme, quête improbable. Puisse qu’il ne comprend pas, il est incapable de l’expliquer, de permettre un traitement lié à  sa structure ou sa sémantique. Que certains énoncent que la lecture par des aides techniques par des lecteurs éduqués de document simples – fabriqués par des contributeurs parfaitement formés – puisse donner des résultats acceptables. Parfait. Pour le reste, toujours rien de nouveau. En me lançant dans cet article, j’ai essayé d’avoir une vocalisation d’un document au format PDF distribué par Adobe « Créer des documents Adobe PDF accessibles avec Adobe Acrobat », charmant document de 115 pages. J’ai utilisé mon matériel de base (un ordinateur sous Linux, une Fedora11 avec Gnome avec la synthèse Festival installée). Un véritable calvaire pour obtenir la lecture à  partir du lecteur de Adobe, la synthèse n’a pas trouver d’information de langage et a décidé de lire ce document rédigé dans la langue de Molière avec de forts accents shakespeariens. Certains passages sont vite devenus incompréhensibles. Épuisé, je n’ai même pas tenté un document plus complexe non retravaillé par Adobe selon la méthode conseillée. Alors avec ou sans les tonnes de contraintes – pardon mode opératoire – afin de poser empiriquement des points de repères, le format PDF reste difficile d’accès. Quoi qu’il soit dit, il n’y a pas de séparation entre le fond et la forme, la création du PDF n’est qu’une copie, presque un photocopie de l’original. Fond et forme même combat. Ce point est à  compléter par la « non universalité » du PDF, tous les systèmes d’exploitation ne sont pas traités à  la même enseigne. Il me semble qu’un des fondamentaux de l’accessibilité est l’universalité (rappelez vous la devise de Tim Berners-Lee sur le sujet).

J’avoue avoir été étonné dès la fin des années 90 que Adobe ne se pose pas la question de l’utilisation du modèle XML(dans sa complétude) afin de palier à  ces problèmes qui n’auraient pu être qu’un défaut de jeunesse. Je pense qu’un xPDF (XMLised PDF) aurait raflé le marché sans aucune discussion possible. En même temps, en terme marketing que PDF ne deviennent qu’une DTD XML (cf. DocBook) ne semblait sans doute pas avoir un grand avenir en terme de chiffre d’affaire. Par contre un mariage DocBook et PDF… Cela aurait sans aucun doute représenté – à l’époque – une expression opérationnelle et brillante de SGML (Standard Generalized Markup Language). Je m’écarte du sujet (quoi que).

La tentation de l’exploit

Ainsi aujourd’hui d’aucun considère le format PDF comme incontournable. Pourquoi questionner la valeur des habitudes, la masse doit toujours avoir raison.

Une utilisation importante (omniprésente) et notre besoin de marronniers, de quêtes impossibles nous pousseraient-ils à  continuer sur la même voie, à  s’évertuer à  rendre accessible des formats, actions qui pourront difficilement l’être ? Je ne pense pas, le manque d’imagination, d’approche globale, sans doute. Ainsi la recherche de l’exploit semble justifier la perte de temps que représente la tentation de l’exploit. Il faut avouer que l’attitude de l’éditeur – Adobe – n’arrange rien à  la situation. Crier haut et fort (trop fort) son engagement sur l’accessibilité pousse à  y croire, à  les accompagner dans la quête. Si Adobe désire réellement permettre au format PDF de devenir un format d’implémentation native de l’accessibilité alors pourquoi ne pas travailler sur un un format nativement accessible (xPDF ?) qui combinerait enfin l’ensemble des qualité de PDF aux précieux avantages amenés par l’accessibilité.

Mais d’autres entretiennent le mythe. Organiser des sessions de formation « comment produire des documents PDF accessibles » me semble une attitude plus que raisonnable mais tend à  maintenir la situation. D’ailleurs, parle t-on ici de tous les documents ? Ou principalement les documents issus de produits logiciels d’un éditeur basé à Redmond ? Tout cela dans quel contexte ? Vu de loin le titre de la formation peut vite arriver à  laisser entendre « PDF = accessibilité ». J’entends les arguments qui énoncent avec force la nécessité de faire quelque chose pour une situation de fait. Et ? Quelle est la bonne attitude ? Supporter le PDF pour services rendus à  la communauté ? Considérer que toute situation de fait doit le rester ? Alors sans doute faut-il le dire une fois : grand merci à  tous ceux qui luttent tous les jours à  appliquer du plâtre sur une jambe de bois, à  tous ceux qui tentent désespérément de rendre l’usage du PDF moins inaccessible. Bravo, mais où va t-on ?

Échanges & distribution, une réponse aux besoins

Le PDF n’est pas un format natif de document. De fait la solution est évidente mais pas nécessairement immédiate à mettre en œuvre, quoique… Choisissons parmi l’ensemble des formats disponibles ceux qui portent nativement la capacité à être accessible et désignons les comme des formats de distribution des contenus. C’est aussi simple que cela. Remplacer – pour la diffusion – le format PDF par un choix plus large et plus efficace.

La création du format PDF n’est pas native sur la grande majorité des outils que nous utilisons (je mets de côté Open-office sous Linux !), les solutions choisies n’ont donc pas nécessairement à  l’être non plus mais elle devront le plus possible être ouvertes et évidentes. Des exemples ? Oui :

  • HTML, nous consultons en grande partie les informations à  partir d’un site. Pourquoi donner accès avant tout à  un PDF ;
  • ODT, ce format permet un accès assez évident à  l’information, encore faut-il l’accepter ;
  • XML Daisy (maintenant outillé).

Ces réponses sont justes mais incomplètes ou insuffisantes car produire ces formats pourrait in fine donner le même résultat discutable que produit le PDF aujourd’hui. Il est, dans tous les cas, nécessaire d’éduquer afin de produire des contenus potentiellement accessibles, d’utiliser les outils pour tirer partie de toute leur puissance et ingéniosité – et cesser ainsi d’utiliser nos ordinateurs comme de vulgaires machines à  écrire uniquement destinées à  être des intermédiaires entre nous et les imprimantes.

Pour un contenu quasi équivalent, je préfèrerai voir les formations « produire du PDF accessible » devenir « produire du contenu accessible ». J’y reviendrai dans un article séparé.

Réponses incomplètes car la chaîne de production des contenus continue à  respecter le schéma de la machine à  écrire : beaucoup produisent des documents (et non des contenus) comme des objets finis et figés alors que ceci devraient être sémantisés et disponibles pour un ensemble d’usages.

Un exemple ne semble particulièrement éloquent, la production d’un catalogue produit. Généralement celui-ci doit finir sous forme de papier avant d’aller grossir la pile de papier recyclé. Mais de plus en plus, nous pouvons le retrouver en ligne sous forme de fichier PDF peu exploitable. Qu’est ce que ce catalogue ? Un ensemble d’éléments textuels et visuels ordonnés. Ces éléments sont produits soit à  partir d’une base produit, soit à  partir d’un ensemble d’éléments issus de traitements de texte et d’images. Donc, qu’ils soient issus d’un flux XML ou d’un import, ils vont arriver dans un outil de PAO tel que Adobe InDesign pour ensuite être exporté en tant que « PDF haute définition » pour l’imprimeur. Et alors ? Et alors, si l’on considère un professionnel utilisant inDesign correctement, il va sémantiser son contenu (c’est tellement plus rapide ensuite…) et à  partir de là , il peut produire un export XML de qualité. Fichier XML qui peut produire à  son tour un HTML de bonne qualité. Tout cela dans un processus automatisé. Exit le format PDF pour la distribution sur le Web d’un catalogue. Je ne cite pas ici directement l’export à  partir de la base produits, j’ai peur de finir enfermé pour hérésie ! Ce petit scénario montre à  quel point – avec un peu de bonne volonté – industrialisation, économie d’échelle, qualité et accessibilité font bon ménage.

Donc, c’est possible, c’est facile ? Oui mais…

La force des habitudes

Il existe deux freins majeurs à  cette mise en œuvre : la force des habitudes, nous avons tous horreur de changer nos habitudes. Cela « fonctionne bien comme cela », « il y a tellement de PDF déjà en ligne », etc. réactions compréhensibles mais pas très raisonnées. Peut importe, il suffit de se reprendre et accepter de travailler pour atteindre ses objectifs. Le mieux vivre technologique est-il une longue ligne droite ?? Non cela ressemble à  un long chemin tortueux pas toujours très lisible ou compréhensible. Virer de bord ne devrait pas être un souci. Utiliser au mieux les outils à  notre disposition devrait être notre credo, la situation existe à  chaque instant mais le temps est nécessairement devenu une notion très relative. Nous accédons à  l’information en quelques fragments de secondes et plus de 10 ans après son apparition un format tel que PNG (Portable Network Graphic) n’occupe toujours pas une place de choix malgré ses nombreuses qualités.

Le second frein est un peu plus gênant, je le qualifierais de réflexe marketing ou le syndrome de la marque. PDF est le fruit d’un éditeur phare Adobe qui promet un peu plus chaque année que promis juré le format va encore gagner en accessibilité. Alors, oui Adobe a réalisé des efforts notables, oui des ingénieurs ont tenté de se rapprocher d’un modèle XML mais à  l’impossible nul n’est tenu et l’accessibilité des document PDF reste toujours plus que relative. Ainsi, nous les croyons, nous voulons croire à  la toute puissance de la technologie souveraine o๠rien ne devrait être impossible. Nous nous laissons porter par ce doux rêve. Il est plus aisé de se laisser porter par ces chimères que d’accepter de repenser nos modèles, de trouver par nous mêmes la solution. Nous nous transformons en doux consommateurs repus de promesses et de faux semblants, nous cessons d’être acteurs (producteurs de contenus ou éditeurs) pour se réfugier dans le temple de la consommation.

Il est fondamental d’abandonner cette facilité et savoir choisir nos outils, les formats en relation directe avec nos besoins, nos objectifs et sans doute le plus profitable pour tous. Souvent, à  ce moment du monologue arrive l’argument économique qui voudrait que parce que tout cela vient d’une grande marque, d’un grand éditeur, cela coûte moins cher. Encore un leurre, exactement comme penser que la fabrication à  façon pourrait être une bonne réponse. L’ensemble des expériences montrent que l’ensemble des coûts de licence (ou de développement) associés aux adaptations logicielles, puis matérielles et enfin organisationnelles représentent des coûts globaux importants (parfois insurmontables lorsque l’on touche à  l’organisation) pour des résultats qui sont rarement à  la hauteur des attentes et des solutions qui ont rarement des durées de vie très importantes.

Que la raison l’emporte

Il me semble que les solutions raisonnées qui partent des besoins opérationnels en recherchant l’interopérabilité normale d’un ensemble de solutions simples (et non simplistes) fournissent des solutions pérennes, industrielles, évolutives et économiquement sensées. Mais pour cela, il est nécessaire de penser, de structurer, d’urbaniser l’ensemble. Et c’est là que le bas blesse il est plus évident de se laisser porter par les apparences et choisir une solution évidente et marquetée. En cas d’échec, ce ne sera pas la responsabilité de celui qui aura fait ce choix mais de l’inadéquation de la promesse faite par l’éditeur…

Les promesses n’engagent que ceux qui les écoutent

Télécharger cet article au format XML Daisy 3.0

Un commentaire pour “3”

  1. Bonjour,

    Je rejoins votre avis sur l’utilisation du format PDF.
    Dans la pratique je déplore aussi son utilisation massive par les services administratifs de nombreux organismes (institutionnels, associatifs, politiques…) pour mettre facilement et rapidement en ligne des documents rédigés avec Word et simplement sauvegardés au format PDF.

    Amicalement,
    Monique

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *