Migrer 1,2 million d’articles chez Arc XP : derrière le changement de CMS de L’Express

Quand l'hebdomadaire L'Express quitte le groupe Altice en 2020, tous ses projets de nouvel outil de publication de contenu tombent à l'eau. Le CMS maison est obsolète, plus aucun développeur ne sait travailler dessus et le titre prend du retard. Basculer d'outil devient urgent et crucial. Nous avons interviewé Anna Sillard, Directrice produit, qui nous raconte le choix de la solution américaine Arc XP, comment elle a été implémentée à L'Express et comment on déménage 1,2 million d'articles, l'air de rien.

Quel est le contexte de l’Express aujourd’hui ?

Anna Sillard

Nous avons quitté le groupe Altice en 2020, et là, on sort tout juste d’une année de migration technique à 360 ! Chez Altice, nous étions en train d’aller vers une fusion des choix technologiques, mais quand on s’est séparés, nous avons dû nous poser la question des outils : lesquels on maintenait, lesquels on développait. L’une de nos décisions a été de choisir des outils en Saas pour externaliser la plupart des évolutions et développements.

Par exemple, nous sommes passés d’un CRM maison vers Selligent, ça a été la première brique. Côté pub, nous avons abandonné notre ad-server en propre pour passer sur celui de Prisma, en juillet 2022.

Et côté CMS, nous avions à l’époque « Ocari » — un CMS complètement maison, développé en 2012-2013 par les équipes de L’Express. Ocari était en Symfony 1, totalement obsolète aujourd’hui. Cette techno n’est quasiment plus connue par les développeurs du marché, on avait beaucoup de mal à recruter. Surtout, dans le cadre de notre fusion avec Altice, Ocari allait être abandonné pour que l’on migre sur un CMS groupe, appelé Cléo, qui devait servir BFM, Libération et L’Express. Cléo était une copie moderne d’Ocari mais en React. 

Donc depuis 2018, le Ocari de L’Express était complètement à l’arrêt, avec plus aucun développement effectué dessus, ni aucune évolution. Ce qui fait que des choses basiques, comme un moteur de recherche dans les applications mobiles par exemple, était impossible. Notre CMS n’était pas capable de gérer des requêtes sur la base des contenus, ou encore incapable de créer des pages tag sur un thème, des choses complètement obligatoires aujourd’hui ! Mais nous prenions notre mal en patience, car nous avions Cléo en ligne de mire… Et puis on a quitté le groupe Altice, Cléo n’allait plus arriver, il a fallu se reposer la question d’un nouveau CMS urgemment.

Comment avez-vous fait le choix d’Arc XP ?

Nos confrères de Libération, qui étaient plus avancés que nous sur la migration de Cléo, ont aussi été interrompus en plein vol. De leur côté, ils ont vite fait le choix de passer sur Arc XP. Le Parisien aussi l’avait fait avant. 

Dans ce cadre, le choix d’Arc semblait être une voie facile, mais on a voulu regarder sérieusement 3 solutions : 

  • Eidos, mais l’outil nous a semblé vieillissant. On s’est pas dit qu’on allait vers l’avenir en prenant Eidos, notamment sur le plan web to print ;
  • Sirius, le CMS du Monde, mais on aurait été le 1er client externe du groupe, ça nous a fait un peu peur.
  • Et bien sûr Arc XP.

Notre problématique principale, c’était d’avoir un CMS qui gère toute la publication web mais aussi d’être le point d’entrée de toute la rédaction (dont la rédaction print) pour rédiger tous les articles qui sont ensuite envoyés vers toutes les plateformes (site, app, la version print (on utilise XMS de 4D Concept)). Et puis toute la galaxie de redistribution du contenu autour : Google showcase, nos newsletters…

Écran d’accueil de l’outil Arc XP

Comment s’est déroulé le projet, concrètement ?

Nous avons signé le contrat avec Arc en décembre 2021. Le chantier a donc concrètement démarré en janvier 2022. 

Dès le départ, on avait identifié deux problématiques :

  • bosser en anglais sur des sujets compliqués  
  • travailler en décalage horaire avec les États-Unis, ça voulait dire des réunions qui terminent tard…

Mais à l’inverse de Libération et du Parisien qui ont souffert de collaborer avec les équipes américaines directement, nous avons été leur 1er client français à passer par un intégrateur, dans notre langue. Nous avons collaboré avec code.store, qui est une agence française qui emploie des développeurs basés dans les pays de l’Est, en Russie, en Ukraine. Mais notre chef de projet, Lucas Baron, — qui était vraiment top top top ! —, est français. C’est lui qui faisait l’interface avec les équipes américaines d’Arc. Donc nous, l’équipe de L’Express, on n’a jamais parlé à Arc pendant l’année de set-up. C’est seulement depuis le lancement du site en décembre 2022 que code.store nous a lâché la main, et qu’on est en contact direct avec eux. Cette manière de fonctionner a été très très confortable.

Au niveau coût, cela représente quoi ?

Bien sûr, c’est L’Express qui prend en charge le coût de l’intégrateur code.store. 

Côté Arc, on a payé 9 mois de licence avec une facturation limitée, à un tarif très faible, pendant l’installation. Je donne un conseil à mes confrères : attention à bien penser, au moment de la signature du contrat, à la période de migration car par défaut, Arc propose 6 mois, et après 6 mois, l’éditeur doit payer plein tarif. Nous, on avait négocié 9 mois mais on a quand même dû renégocier ensuite !

Ensuite, c’est une facturation au dimensionnement des serveurs, et au nombre de briques que l’on utilise. Par exemple, la brique « Composer », c’est là où on rédige les articles, c’est la base. On a pris aussi « Page Builder » pour les homes, les homes de rubrique… 

On a donc payé code.store en plus, mais on n’a pas de TMA car on a complètement repris la main sur nos développements.

En interne, qui a travaillé sur ce projet de migration de CMS ?

Nous étions 3 à intervenir côté L’Express : le CTO Olivier Lajeunesse, la Directrice marketing Emilie Ruaux et moi, en tant que Directrice produit, j’ai été le pilote opérationnel de ce projet. Aussi parce que je suis la personne avec le plus d’historique, j’étais celle qui connaissait le mieux Ocari. Aucun de nos développeurs n’a travaillé sur le projet pendant toute l’année 2022 de set-up. On les a juste ré-embarqués à la fin, pour la passation de connaissance entre code.store et nous. 

Nous avons été accompagnés par Virginie Clève pour gérer les problématiques SEO. Ses conseils ont été très précieux : elle avait déjà vécu une migration, elle connaissait les subtilités des pages livrées par Arc. Il y avait notamment des bouts de pages à retravailler pour être bien optimisés côté SEO…

Vue de la page d’édition d’un article dans « Composer » d’Arc XP

Comment bénéficiez-vous des évolutions et mises à jour de la plateforme Arc ?

Concernant les mises à jour, on est dans une roadmap mondiale, donc toute demande d’évolution passe par une étude à l’échelle mondiale. Nous sommes donc repassés dans un calendrier d’évolution lent. Par exemple, on sait qu’en ce moment Arc travaille sur les lives vidéos en temps réel, qui est une problématique qui ne nous intéresse pas.

Mais côté européen, on s’est structurés avec Le Parisien, Libération et 2 titres belges, pour se voir tous les trimestres et échanger sur nos problématiques Arc, comparer les réponses que l’on obtient de nos Customer Success Managers respectifs, et se coordonner sur nos demandes d’évolution. Au départ, c’était plutôt une initiative Libération/Le Parisien à laquelle on s’est greffés. 

Ça nous permet de challenger les réponses qu’Arc peut nous faire, par exemple sur la problématique des redirections. Par défaut, Arc gère assez mal les 301, et propose plutôt des 302. Du coup Libération a pu nous passer un bout de code pour corriger ! Une entraide hyper bénéfique.

Qu’avez-vous géré en interne côté L’Express ?

Nous avons dû refaire 100% du front, mais nous avons décidé de ne pas changer la maquette, pour s’économiser ce risque planning-là, notamment de validation. Nos pages avaient 2 ans à peine, elles convenaient encore, on les a reprises telles quelles. 

Aussi, la logique SaaS de notre nouvelle stack technique n’est pas respectée à 100% : on a quand même une petite couche à part, hébergée en local, qui est liée à l’envoi des newsletters, à l’audio, et si on voulait travailler sur des lives, il faudrait qu’on passe par une solution externe. On a donc du développer une petite brique de notre côté, qui permet de gérer ce que ne fait pas Arc.

Qu’est-ce que vous n’avez pas fait pendant cette refonte, et qui sont des évolutions à venir ?

Pour cette refonte, comme je le disais, on est restés iso maquette, donc il y a des features qui existent et que l’on n’a pas utilisées parce qu’on ne les avait pas en front : 

  • Les pages tag, les pages Auteur… 
  • Les longs formats, et l’implémentation des vidéos.

Pour la rédaction aussi, on n’a pas voulu changer la manière de travailler des journalistes. Mais en théorie, Arc permet, avec sa brique WebSked, de faire évoluer la façon de distribuer le contenu, en laissant par exemple le journaliste proposer un article pour telle newsletter, telle mise en avant… C’est tout une logique de workflow et de collaboration dans Arc, qui est très avancée, et dont pour l’instant nous n’avons fait qu’une mise en place très sage.

Il y aussi tout le travail de la “coquille” de l’article, où l’on renseigne les métadonnées : nombre de signes, gestion des illustrations… que pour l’instant nous n’avons pas poussé au maximum.

Vue de l’écran « Liste des articles » dans « Composer »

Qu’est-ce que ça a changé pour vous ?

En termes de temps, c’est beaucoup plus rapide de sortir un projet avec Arc. Par exemple, on a lancé il y a quelques semaines notre journée portes ouvertes, qui impliquait de petites modifications comme le CTA dans le header, l’ajout d’une bottom bar… eh bien la mise à jour de ces éléments, on l’a faite en 1000 fois moins de temps qu’avant !

Par contre, il y a une spécificité chez Arc qu’on est en train de découvrir et à laquelle il va falloir s’adapter en termes de développement ! Sur notre ancien CMS Ocari, on pouvait tirer autant de branches qu’il y avait de features en développement. Sur Arc, on n’a qu’une seule interface de preprod, on ne peut donc pas tester 3 features qui auraient été développées sur 3 branches différentes : un essai chasse l’autre. On va donc devoir se cadencer pour tester les projets les uns après les autres. 

Notre espoir : Le Parisien est en train de se coordonner avec Arc pour avoir 3 instances, correspondant à leurs 3 squads métier (abonnement, éditorial, monétisation/bizdev) donc ils auraient 3 preprod.

Est-ce que vous avez profité de la migration pour faire avancer d’autres projets ?

Oui, on a fait beaucoup de ménage ! On a mené un énorme nettoyage de la base images, notamment en supprimant des centaines de milliers de photos, certaines dont on n’avait plus les droits suite à différents contrats qui se sont arrêtés. 

Idem sur la base de contenus, on a supprimé d’anciennes dépêches Reuters que nous ne pouvions plus avoir en ligne.

Et aussi, on a supprimé plein de petits contenus qui n’ont pas de valeur pour Google. En fait, on a supprimé tous les contenus de moins de 800 signes !

Qu’est-ce qui a été le plus difficile dans cette migration ?

Clairement, la partie redirection a été la plus affreuse à gérer. En faisant une petite inspection générale de ce qui tournait côté serveur, on a découvert 800 000 redirections unitaires sous le tapis ! On a franchement dû rationaliser, sachant que Arc limite de base le nombre de redirections 301 à 100. Oui, cent ! 

Le Parisien nous a beaucoup aidés sur cette question, on a notamment pu gérer des redirections par API. Mais quand on a découvert cette règle des 100, c’est sûr qu’on a un peu transpiré !

Et puis après le lancement, on a découvert 200 000 autres redirections qui n’avaient pas été gérées durant le projet… Évidemment, on était dans l’incapacité humaine de vérifier tout ce qu’on faisait. 

Finalement, on a migré 1,2 million d’articles. On n’a pas importé 200 000 articles, dont 125 000 qui faisaient moins de 800 caractères.

Comment la rédaction s’est-elle approprié le nouvel outil ?

La rédaction est très contente, l’adoption a été quasi immédiate. Je m’attendais à avoir une formation de 2 semaines à gérer, à organiser des ateliers, à faire le service après-vente pendant des semaines…! On s’est mis en binôme avec un journaliste pilote côté rédac. On a fait des grandes présentations avant la sortie… mais le jour du lancement, on n’a quasiment pas eu de demandes d’aide ou d’assistance. Libération nous avait fait le même retour : ça avait été très simple.

Il y a simplement une chose qui n’a pas été gérée et qui aurait été un souhait de la rédaction technique : quand un article part au print, s’il y a une correction côté maquette, alors la correction ne remonte pas dans Arc. Donc en phase de bouclage, des infos se perdent.

Quel projet ! Bon et vous, ça va ?

Maintenant ça va. Mais en décembre 2022, ce qui a été dur c’est qu’on avait la satisfaction d’avoir lancé le projet, mais c’est aussi le moment où on a découvert plein de trucs qui n’avaient pas été faits parfaitement. Google a commencé son crawl, et on a découvert beaucoup de sujets à gérer vite, il a fallu donner un dernier coup de collier… Maintenant ça va mieux, le gros est absorbé. Et on peut recommencer à évoluer !

Recommanderiez-vous Arc à d’autres éditeurs ?

Je dirais oui, même si je n’ai pas encore beaucoup de recul.

Et parce que je sais qu’on va me poser la question : avez-vous un deal de communication avec Arc ? 

Non, aucun !