Skip links

Comment réaliser un profilage d’audience ?

Petit disclaimer

Cet article, initialement publié sur LinkedIn début 2018 et révisé en janvier 2021, est le fruit de plusieurs mois de réflexions et de travaux empiriques visant à perfectionner la traditionnelle recherche de mots-clefs lors de la phase de planification stratégique en référencement naturel. Elle est d’ailleurs toujours en perfectionnement, comme vous pouvez le remarquer…

C’est cette méthodologie qui est en grande partie appliquée au cours de notre prestation de profilage d’audience et qui est livrée ici, dans son intégralité, en toute transparence.

Quelle chance, n’est-il pas ?

Vous vendez des produits ou des services sur le web ?

Alors il y a fort à parier que vous êtes, ou avez été confronté à la question suivante (si ce n’est pas le cas, votre survie tient du miracle) :

“Comment connaître les besoins de mes clients ?”

Problématique somme toute très classique puisque l’on est tous passés par là, que ce soit pour élaborer nos campagnes marketing ou, plus prosaïquement, pour confectionner notre business plan.

Et pourtant

Chez nous, à Azincourt, on ne compte plus le nombre de fois où nos clients :

❌ Étaient minés d’idées préconçues ;

❌ Se reposaient sur des études, des analyses ou des documents obsolètes ;

❌ Se trouvaient assez mal conseillés, et suivaient une stratégie de bric et de broc ;

❌ Croulaient sous les données, les chiffres, les statistiques, mais étaient incapables de les exploiter ;

❌ Ou n’avaient en fait, tout bêtement, aucune véritable idée sur les besoins réels de leurs clients ou de leurs prospects !

Inutile d’ajouter que sans ces quelques connaissances préalables, ça rame sévère, on brûle du temps et de l’argent en vain, les désillusions s’accumulent façon boule de neige…

🔺 Savoir ce que veut son client, ce dont il a besoin en priorité, c’est pourtant la base.

Plutôt que de vous tenir encore la guibole trois heures avec nos propos liminaires, on vous propose de rentrer dans le vif du sujet.

🔺 On vous présente ici notre méthodologie de profilage d’audience pour vous aider à mieux comprendre les besoins de vos prospects ou de vos clients !

Alors attention, cette méthodologie n’est pas magique.

Elle requiert du travail, de la patience et un esprit de synthèse, ainsi qu’un investissement budgétaire supplémentaire si vous voulez aller plus loin (et faire tout comme nous).

Elle ne remplace pas non plus vos études marketing, vos analyses, vos audits, vos sondages, vos questionnaires – bref, tous les documents dont vous disposez déjà, et que vous actualisez sans doute fréquemment.

Toutefois, il s’agit d’un complément redoutable à toutes ces données, qui vous permettra de les voir sous un jour nouveau, et de vous guider sur la bonne voie pour construire…

✅ Votre stratégie commerciale ;

✅ Vos campagnes marketing ;

✅ Vos campagnes d’acquisition d’audience ;

✅ Votre stratégie de contenu.

Ce qui n’est déjà pas si mal, n’est-il pas ?

On s’y met ?

À qui diable s'adresse cet article ?

À tout le monde ! Si, si, vraiment.

Et puisqu’il nous faut préciser :

  • D’abord aux curieux, qui auraient une certaine appétence pour les sujets liés au webmarketing et à la stratégie de contenus ;
  • Pour les chefs d’entreprise, les directeurs, les PDG, qui s’interrogeraient sur leur stratégie commerciale ;
  • Pour les chargés de marketing, qui auraient besoin de données ou de chiffres corolaires pour construire leurs campagnes ;
  • Pour les professionnels du contenu, rédacteurs, copywriter ou content strategist, qui ont besoin de billes pour affiner leurs textes et ciseler leurs discours.

Cet article est bizarre ! Pourquoi n'y a-t-il pas tout le contenu sur cette page ?

Une vilaine facétie de notre part : nous avons en effet écrit cet article sur notre modèle de contenu interactif.

Si vous n’aimez pas naviguer de nœud en nœud, sachez que nous avons participé à la rédaction d’un ouvrage, “Réussir sa stratégie de contenu“, publié aux éditions Eyrolles et disponible ci-dessous (on vous épargne le lien d’affiliation) :

Vous y retrouverez un chapitre de notre conception consacré à l’analyse sémantique et au profilage d’audience. Bonne lecture !

Qu’est-ce que c’est, un profilage d’audience ?

Précisons d’abord que le “profilage” existe déjà, et qu’il est par ailleurs encadré par la CNIL et le RGPD.

Dans ce premier cas, le profilage consiste à utiliser les données concernant ses utilisateurs de façon à construire automatiquement différents profils, et leur servir en vis-à-vis des contenus adaptés.

Inutile d’ajouter qu’il s’agit là d’un moyen très utile pour optimiser sa conversion

Et il est probable que l’on se dirige de plus en plus, dans les années à venir, vers l’utilisation de cette typologie d’outils : sur votre site web, une offre de service et un contenu calé sur les besoins de tel ou tel utilisateur auront toujours beaucoup plus d’impact qu’un contenu “neutre” passe-partout.

Bref, nous ne sommes pas là pour verser dans la futurologie.

Le profilage utilisateur a néanmoins (pour l’heure) un inconvénient majeur :

🔺 Pour que ça fonctionne, il faut que l’entreprise récolte suffisamment de données en amont.

Que faire quand on démarre de zéro, ou que l’on a pas encore les compétences, les infrastructures, les outils ou le budget pour s’y coller ?

Le profilage d’audience tel qu’on le conçoit, et tel que nous allons le décrire ici, est une réponse à cette question (et non pas “la” réponse, soyons modestes).

Il s’agit d’une méthodologie semi-automatisée, puisque nous allons d’une part utiliser un panel d’outils pour nous faciliter la tâche, et d’autre part employer notre matière grise pour synthétiser l’ensemble.

Le profilage d’audience répond à deux questions principales :

  1. Qui sont vos visiteurs, vos prospects, vos clients ;
  2. Quels sont leurs besoins et leurs attentes vis-à-vis de vos services ou de vos produits.

Pour ce faire, il sera nécessaire d’utiliser plusieurs sources de données afin de construire des modèles tendanciels fidèles à la réalité.

Pourquoi tendanciels ?

Parce que l’on aura beau y passer un temps fifou et brasser des océans de données, ce ne sera jamais complètement le reflet du réel.

Mais des tendances, ça fait très bien le boulot aussi.

Quel genre de données utilise-t-on ?

Nous y reviendrons, mais basiquement, tout ce qui peut être utile pour construire un ou des profils vraisemblables de vos clients.

Il peut donc s’agir de requêtes Search, de statistiques d’audience, de données sur le comportement navigationnel, d’écoute des plateformes sociales, des pratiques d’achats, d’analyse des sentiments, de questionnaires ou de documents marketing internes…

Pourquoi réaliser un profilage d’audience ?

Pas tout à fait convaincu par la chose ?

Nous avons dit en préambule qu’un profilage d’audience permettait d’identifier les besoins de vos clients par rapport à vos services ou à vos produits.

Nous allons voir plus loin comment faire ; néanmoins, sachez déjà qu’un profilage repose en grande partie (mais pas que !) sur les données Search (les expressions tapées par les internautes sur les moteurs de recherche, notamment Google).

S’il est vraiment besoin de le rappeler, Google, c’est environ 90% des parts de marché des moteurs de recherche en France, en 2020.

C’est également près de 7 milliards de requêtes chaque jour, dont 500 millions sont nouvelles.

Vous voyez la mine d’or qui se dissimule là-dessous ?

Ce serait drôlement intéressant de savoir ce que tapent les internautes, non ?

De connaître ce qui les intéresse en priorité ?

D’identifier leurs éventuels freins, ou au contraire leurs souhaits vis-à-vis de tel service ou de tel produit ?

Et d’obtenir ainsi une vision d’ensemble stratégique sur votre marché ?

Inutile de sacrifier un taureau aux mânes du numérique : ces données sont trouvables et exploitables, pour peu que l’on y passe du temps.

C’est précisément ce que l’on va vous montrer dans ce billet.

Le profilage d’audience, c’est donc la même chose qu’une recherche de mots-clefs en SEO ?

Pas du tout, la méthodologie comme les objectifs n’ont rien à voir.

  1. Le profilage d’audience vise à comprendre et à identifier les besoins de vos internautes.
  2. La recherche de mots-clefs, en SEO, consiste à identifier les expressions à potentiel d’audience les plus prometteuses pour générer du trafic.

Et puisque l’on en est à causer SEO et “mots-clefs”, ajoutons que les choses ont sacrément changé sur le sujet.

Saviez-vous que les mots-clefs ont aujourd’hui beaucoup, beaucoup moins d’importance que l’intention de recherche de l’utilisateur ?

Non ? Alors faisons un petit historique rapide.

Depuis le rachat de Freebase en 2007 et le lancement de Colibri en 2013, Google n’est plus un simple index de résultats de recherches où les mots d’une requête sont séparés de leur contexte : le moteur est devenu un graphe où les informations sont reliées les unes aux autres par des relations sémantiques complexes.

Mieux encore, l’on parle même aujourd’hui de moteur de réponse, voire de moteur d’assistance, rien que ça !

Dans les faits, Google ne se fonde plus sur des mots-clefs pour interroger les contenus, mais sur les intentions de recherche des internautes.

En d’autres termes : les résultats affichés à l’utilisateur, lorsqu’il effectue une recherche, sont le fruit d’une interprétation sémantique, et donc d’une interprétation de son intention de recherche.

🔺 Ainsi, les pages que Google présente à l’internaute répondent à son besoin, et non aux mots-clefs contenus dans sa requête.

Et s’il était besoin d’une preuve supplémentaire, vous la trouverez du côté de l’algorithme BERT

En résumé, un profilage d’audience est donc plus que jamais nécessaire pour cibler au plus juste les besoins de vos internautes !

Quoi ? Attendez, les mots-clefs sont devenus inutiles ?

Non, ce n’est pas ce que nous disons !

Nous indiquons simplement qu’ils ont dorénavant beaucoup moins d’importance que par le passé…

D’ailleurs, tenez, on a des statistiques intéressantes à vous montrer.

Une étude de ahrefs datant de 2016 (de 2016 !) établissait déjà la faible corrélation entre visibilité et mot-clef pour différents leviers stratégiques :

étude ahref 2016

Encore une fois, cela date de 2016 ! Il y a des siècles, à l’échelle du web ! Imaginez un peu aujourd’hui…

Par conséquent, tous les articles qui vous donnent des conseils comme :

🚫 “Optimisez vos mots-clefs”.

🚫 “Les mots-clefs sont une nécessité absolue pour le référencement des pages”.

🚫 “Les bons mots-clefs vous permettront d’avoir un meilleur SEO”.

🚫 “Une stratégie de mots-clefs est essentielle en 2021”.

Sont pour ainsi dire sclérosés dans un passé déjà révolu (et pour rester dans des termes à peu près polis).

Et le suivi des positions alors ?

Bien qu’une fraction d’agences ou de référenceurs persistent à effectuer un strict suivi des positions pour jauger de la réussite d’une campagne d’acquisition, nous pensons que cette méthodologie est obsolète, et ce depuis quelques années déjà.

Si le sujet vous intéresse, nous avons consacré un article à la problématique du suivi des positions en SEO.

De la requête à “l’intention utilisateur”

Les définitions varient, mais l’on peut traditionnellement déterminer trois grands types de requêtes tapées sur un moteur de recherche :

  • Informationnelle, où les utilisateurs cherchent à se renseigner à propos de quelque chose. L’utilisateur ne sait pas où peut se trouver l’information recherchée. Un parcours de navigation typique induit donc la consultation de plusieurs sites / pages de résultats de recherche.
  • Navigationnelle, où les utilisateurs savent déjà ce qu’ils recherchent. Il peut s’agir d’une marque ou d’un site déjà identifié par l’internaute.
  • Transactionnelle, où l’utilisateur s’inscrit dans une démarche de conversion (produit ou service).

Certains opèrent une quatrième distinction, les requêtes commerciales, où un internaute recherche des informations en rapport avec un produit ou un service (il s’agit donc d’une subdivision de la catégorie “Informationnelle”).

Quelle que soit la typologie de requête, chacune fait l’objet d’une interprétation sémantique de la part du moteur de recherche, l’objectif n’étant plus de proposer, dans les résultats de recherche, des pages comportant les mots-clefs de la requête, mais des pages apportant une réponse précise au besoin de l’utilisateur.

La distinction est peut-être subtile, mais les effets produits sont résolument différents.

🔺 Ainsi, les mots d’une requête ont maintenant moins d’importance que l’intention de recherche en elle-même.

Cette constatation entraîne plusieurs conséquences notables.

La première d’entre elles est relative à la recherche d’expressions à potentiel d’audience et de conversion : il ne s’agit plus de se reposer sur un réservoir de mots-clefs que l’on peut ensuite injecter au sein des contenus d’un site mais d’articuler les contenus eux-mêmes autour des intentions utilisateurs définies lors du profilage d’audience.

Cela rend obsolète (ou rendra en tout cas, à terme, définitivement caduque) la méthode suivant laquelle il fallait créer une page par expression-clef comme il était parfois d’usage lors de la phase de conception d’arborescence.

Corollaire logique de cette observation, ce sont également les fondamentaux de la rédaction web qui sont remis en question : comment optimiser au plus près un texte pour un moteur de recherche ?

Les fantasmes sur les prétendues densités de mots-clefs au sein d’un contenu n’ont plus cours, de même que l’utilisation répétée d’une expression-clef est devenue contre-productive.

En ce sens, l’étude de ahref sur les principaux facteurs de ranking est très claire, les mots-clefs ont une importance toute relative dans le processus de visibilité d’une page dans les résultats de recherche, ce qui nous ramène, une fois de plus, vers l’intention utilisateur et la manière dont celle-ci est désormais traitée par le moteur de recherche.

Quelles peuvent être les intentions des internautes ?

Eh bien, disons qu’il y a deux acceptions sur le sujet.

Les premiers considèrent qu’une intention de recherche est ce qui pousse l’internaute à effectuer une recherche en ligne.

Par conséquent, il existerait quatre grands types d’intentions : informatives, navigationnelles, commerciales et transactionnelles (soit celles décrites ci-dessus). Il s’agit certainement du moyen employé par Google pour analyser les requêtes sur son moteur, à en juger sa communication là-dessus :

Chez Azincourt, nous avons une acception plus large de cette définition, puisque nous y intégrons aussi une notion sémantique : par exemple, si un certain nombre de personnes recherchent des informations sur un produit en telle taille ou en telle couleur, nous considérons qu’il s’agit de requêtes transactionnelles, mais des requêtes transactionnelles ventilées dans deux groupes d’intentions : Taille, et Couleur.

Profilage d’audience de l’Office Français de la Biodiversité

Premier exemple avec l’OFB (ex AFB – l’Agence Française de la Biodiversité), que nous avons accompagné sur un segment bien particulier : le profilage de son audience.

Bon, à l’époque (en 2019), on appelait ça “modélisation des intentions utilisateurs” et il n’y avait que la partie Search, mais cela devrait déjà vous permettre de voir à quoi ça ressemble.

Avant de rentrer dans le vif du morceau, nous vous invitons à consulter la page dédiée du portfolio, où nous expliquons succinctement les objectifs du projet.

Pour les flemmards, les voici résumés :

  • L’AFB souhaitait centraliser l’ensemble de ses sites en un seul portail (projet de création / refonte de site).
  • Pour ne pas se tromper, ils souhaitaient connaître les besoins de leurs utilisateurs en la matière afin de réaligner leur offre informationnelle.

Outils utilisés

  • SEMRush.
  • 1.fr.
  • outils-atypicom.fr/atypiword/
  • Tropes.

Pour les curieux, la boîte à outils est ici.

Synthèse du profilage

🔷 Des questionnements très… basiques

Hormis quelques acharnés déficients du ciboulot, nous serons tous d’accords pour dire que nous vivons des temps d’urgence climatique : l’environnement change, et pas en bien.

Pourtant, beaucoup de questions relatives à la biodiversité sont extrêmement simplistes, en fréquence d’apparition comme en volume de recherche.

C’est normal, il faut bien commencer quelque part lorsque l’on s’y intéresse, mais nous nous attendions à un peu plus de diversité dans les interrogations, ou du moins à un pool de requêtes / questions plus spécifiques.

La majorité des recherches liées à la biodiversité sont ainsi réunies dans trois grands pôles :

  • Qu’est-ce que c’est ?
  • À quoi ça sert ?
  • Comment la protéger ?

Autant dire la base… mais pour autant, l’ex AFB n’était guère visible dessus !

🔷 Des disparités importantes parmi les cibles

On l’a dit, l’objectif à terme de l’AFB / OFB était de fusionner l’ensemble de ses sites en un seul portail.

Par conséquent, le futur portail regroupe quantité d’informations diverses qui concernent plus ou moins de près la biodiversité dans son ensemble.

Parmi les sites fusionnés, il y avait ainsi le site consacré à la biodiversité marine, le site de l’ONCFS…

… Et force est de constater, dans ce dernier cas par exemple, que les internautes de l’ONCFS sont à mille lieues des problématiques liées à la biodiversité.

On ne dit pas que les chasseurs ne s’intéressent pas à ces questions ; on dit juste que l’immense majorité de leurs préoccupations sont autres.

Parmi ces dernières, par exemple :

  • Des interrogations liées aux périodes de chasse (quand peut-on chasser ?)
  • Celles liées au permis de chasse (combien ça coûte, comment peut-on le passer…)
  • Des questions spécifiques concernant le gibier.

Une belle gageure pour articuler l’ensemble de l’offre informationnelle sur le futur portail !

🔷 Des besoins géolocalisés

La géolocalisation était un élément récurent parmi les requêtes des internautes.

En d’autres termes : la majorité prend toujours soin de géolocaliser son besoin lorsqu’elle recherche une information un peu plus spécifique quant à la biodiversité.

Ce qui donnait par exemple les structures de requêtes suivantes : besoin + ville / département / région / pays.

Une dimension dont il fallait nécessairement tenir compte pour structurer le futur portail de l’OFB…

Quelques graphiques pour la forme

On commence par un premier graphique récapitulatif quant aux principaux besoins exprimés par les internautes lors de leurs recherches sur la biodiversité.

On se concentre ici sur le générique, les recherches plus spécifiques sont pour l’heure écartées :

Second graphique avec une synthèse des besoins pour le site de l’ONCFS (Office national de la chasse et de la faune sauvage, au cas où).

On remarque instantanément les deux plus gros besoins en la matière : des renseignements quant aux permis de chasse, et aux périodes de chasse.

Troisième graphique, qui est une représente sous forme de “nuage” (dirions-nous plutôt “empreinte”) des occurrences les plus fréquemment utilisées chez les utilisateurs pour l’ONCFS.

Dit autrement, quels mots reviennent le plus souvent chez eux ?

Dernier graphique, qui synthèse quant à lui les besoins utilisateurs collectés au travers du site de l’ex AFB grâce à la fonctionnalité de Site Search de Google Analytics.

Des données en or, puisqu’elles permettent de connaître à la source les besoins de ses internautes lorsqu’ils effectuent une recherche sur le site !

Profilage d’audience d’une banque

Second exemple avec un profilage d’audience réalisé pour une banque (non, on ne dira pas laquelle). Vous retrouverez d’ailleurs certains exemples issus de ce profilage au fil de l’exposé de notre méthodologie.

Oui, vous avez raison, ça change de l’environnement, on passe du tout au tout.

Bref, l’objectif était le suivant : identifier les besoins clients en matière de crédit renouvelable afin d’adapter la production des contenus d’une future plateforme.

Outils utilisés

  • SEMRush.
  • 1.fr.
  • ScreamingFrog.
  • Google Analytics.
  • Keyhole.
  • outils-atypicom.fr/atypiword/
  • Tropes.

Pour les curieux, la boîte à outils est ici.

Synthèse du profilage

🔷 Des besoins fragmentés

L’analyse de l’ensemble des besoins liés au crédit renouvelable et à la marque a mis en évidence une importante fragmentation des besoins (une trentaine en l’espèce).

Sincèrement, on s’attendait à moins. On est quand même dans de la thématique assez ciblée.

Cela dit, c’est très intéressant, car c’est un signe évident de l’étendue des interrogations, des profils et des besoins spécifiques des internautes à ce sujet.

🔷 Une prédominance de certains besoins

Certains besoins émergent davantage que d’autres en termes de fréquence :

  • D’abord des demandes liées à la résiliation (très nombreuses…) ;
  • Des recherches liées aux remboursements ;
  • Aux assurances ;
  • Aux garanties ;
  • Aux fonctionnalités inhérentes à la carte bancaire ;
  • Etc.

🔷 Un fort besoin de réassurance

Les données complémentaires au profilage initial ont indiqué un fort besoin de réassurance de la part des utilisateurs.

Le crédit renouvelable, c’est en effet assez sensible, et beaucoup d’internautes ont tendance à l’associer (à tort, c’est un peu différent, et encadré par la loi) à du crédit revolving.

D’où une forte défiance qui dégouline ici et là au travers des contenus analysés…

Quelques graphiques pour la forme

On va essayer de vous proposer des graphiques un peu différent de l’exemple précédent.

Commençons par un premier exemple, avec le cycle de vie d’un client de ce service, et les besoins afférents :

Poursuivons avec un comparatif des sociétés proposant une offre de service renouvelable.

Les besoins sont exprimés ici en occurrences :

Dernier graphique d’illustration, les différents besoins (en fréquence) couplés avec les volumes de recherche :

Par quoi commencer pour effectuer un profilage d’audience ?

On se refait un petit disclaimer (on ne saurait trop insister) :

La méthodologie de profilage d’audience qui est ici proposée ne se prétend pas exhaustive ni miraculeuse.

Elle repose principalement sur l’analyse et le traitement d’expressions utilisateurs issues de Google Suggest, avec une adjonction de différentes sources de données complémentaires pour venir préciser ou écarter les hypothèses initiales.

À première vue, utiliser des mots-clefs pour construire des intentions et des profils utilisateurs, cela contredit tout ce qui a été exposé jusqu’ici, comme quoi les mots-clefs ont aujourd’hui beaucoup moins d’importance qu’autrefois.

Néanmoins, les expressions issues de Google Suggest constituent un formidable matériau de base à partir duquel il est possible de dessiner les principales typologies d’intentions par rapport à des produits ou des services donnés, et c’est ce levier que cette méthode cherche principalement ici à exploiter.

Attendez, si je suis bien, une expression = une intention ?

C’est un peu plus compliqué que ça.

On objectera d’abord qu’il est toujours difficile, malgré toute la bonne volonté du monde, d’attribuer très exactement une expression à une intention de recherche ; d’ailleurs, une même expression peut correspondre à plusieurs intentions !

Chez Azincourt, dans notre travail de classification, nous recourons souvent à deux catégories, une intention primaire et secondaire (plus l’intention globale : requête informationnelle, transactionnelle…).

Cela permet un peu plus de flexibilité dans l’approche tout en évitant de perdre un temps colossal à régler des points de détail.

Bon, une clarification s’impose peut-être avant tout développement supplémentaire quant à la question des expressions utilisateurs.

Pour rappel, les expressions suggérées par Google Suggest sont issues des requêtes les plus recherchées par les internautes par rapport à un mot-clef ou une expression.

Le découpage de ces expressions par champs lexicaux ou associations d’occurrences permet donc d’obtenir une première indication sur ce qui est le plus recherché par l’utilisateur, et par conséquent de définir ses principales intentions.

➡️ Par exemple, si des mots comme “bleu”, “rouge” ou “noir” reviennent fréquemment parmi les expressions des internautes, on peut affirmer sans trop de peine qu’une certaine fraction d’utilisateurs recherchent un produit avec la caractéristique “couleur”…

Ceci étant dit, passons à la suite et voyons les grandes phases de notre méthodologie :

La méthodologie ici exposée est donc découpée en cinq étapes différentes :

  1. Déterminer les expressions initiales à partir des services / produits que vous vendez.
  2. Récolter les expressions utilisateurs à partir de ces expressions.
  3. Analyser ces expressions et identifier les typologies d’intentions, et ce afin de déterminer les besoins de vos prospects / clients.
  4. Analyser les données corolaires et enrichissement de vos résultats préalables avec lesdites données.
  5. Structurer votre offre commerciale.

Vaste programme !

Cela va prendre un peu de temps, mais le jeu en vaut clairement la chandelle.

Étape n°1 : Déterminer vos expressions initiales

Cette première phase désigne la création d’une liste exhaustive d’expressions à partir des produits ou des services vendus sur votre site.

Nous vous remettons ci-dessous les phases méthodologiques :

Alors, pourquoi faire une liste exhaustive ?

Parce qu’il est nécessaire de prendre en compte tous les cas de figure possibles pour balayer au maximum les différentes requêtes (et donc les différents besoins) exprimés par vos internautes.

Euh... Pardon ?

Bon, prenons un exemple bête : imaginons que vous vendez des chaussures.

Si vous vous concentrez uniquement sur des expressions de type “chaussure femme” et ignorez complètement les expressions “chaussure homme”, vous allez vous priver d’une sacrée partie de votre audience, vous ne croyez pas ?

Vous avez donc saisi l’idée : prenez l’intégralité de vos produits ou de vos services, et traduisez-les en requêtes Google !

Si cela peut vous aider, voici quelques questions afin de vous guider dans la construction de votre liste initiale :

  • Quel est le secteur d’activités de mon site ?
  • Que propose / Que vend mon site ?
  • Quelles requêtes sont susceptibles de taper les utilisateurs pour me trouver ?
  • Quelles requêtes sont susceptibles de taper les utilisateurs pour convertir ?

Si le site propose plusieurs types de produits ou de services – ce qui est généralement le cas, nous sommes d’accord – le plus simple est encore de créer des groupes d’expressions afin de bien segmenter la liste initiale.

Vous n’y voyez goutte ? Illustrons nos propos avec un exemple concret.

➡️ Voici un extrait de la liste initiale que nous avons bâtie pour l’Agence de la Transition Écologique (ADEME) :

La mission se concentrait sur des cibles professionnelles (d’où les catégories “Monde agricole” et “Entreprise”).

Il s’agissait donc de lister :

  • Les expressions génériques relatives à l’ADEME, et qui témoignent d’un public “sachant” (un internaute recherchant “subvention ADEME” connaît déjà l’organisme : cela peut nous aider à affiner le profil d’audience en fonction d’un entonnoir de conversion).
  • Les expressions non génériques, relatives à la transition écologique, et qui concernent elles un public “non sachant” (qui ne connaît pas l’ADEME, ou qui n’y a pas encore pensé lors de sa phase de recherche initiale).

À ce stade, nous risquons de collecter des doublons (notamment avec “ADEME“, “Aide ADEME“, “Subvention ADEME“…) mais qu’importe, mieux vaut des doublons que l’on nettoiera plus tard plutôt que de risquer de passer à côté d’un élément important.

Pfiou... C'est encore un peu nébuleux.

➡️ D’accord, alors prenons un autre exemple plus simple.

Supposons que vous avez un e-commerce de vente d’outils de bricolage. On peut commencer par lister des expressions très génériques :

  • Matériel bricolage
  • Outil bricolage
  • Site de vente bricolage

Vous vendez également tout un tas d’outils, par exemple des perceuses :

  • Perceuse visseuse
  • Perceuse sans fil
  • Perceuse circulaire

Ou encore, des tournevis :

  • Tournevis électrique
  • Tournevis étoile
  • Tournevis aimanté

Vous voyez le principe ?

Tout ça va rejoindre votre liste initiale.

Votre visage se décompose peut-être à la lueur de cet exemple : oui, c’est exact, plus vous vendez de choses, plus la liste d’expressions initiales va être conséquente.

Nous n’avons jamais dit qu’un profilage d’audience serait une sinécure !

Étape n°2 : Récolter les expressions tapées par les internautes sur Google

Cette phase est relative à la collecte des expressions tapées par les internautes dans Google.

Pour rappel :

Vous connaissez sans doute Google Suggest, cette fonctionnalité qui affiche, lorsque vous commencez à taper quelque chose dans la barre de recherche, différentes suggestions pour compléter votre requête initiale.

En réalité, Google ne vous montre pas tout ; ce fieffé coquin ne vous délivre qu’une partie des requêtes tapées par ses utilisateurs. Heureusement, il existe des outils gratuits pour récupérer l’intégralité des expressions, ou presque :

  • keywordtool.io, l’un des plus connus, et qui vous permet même d’obtenir d’autres Suggest (Bing, Amazon…).
  • Ubersuggest, une alternative aux fonctionnalités identiques.
  • answerthepublic.com, avec de jolis graphiques, pour récupérer des questions (mais keywordtool.io le fait aussi !).

Si vous avez un peu de budget, cela vaut le coup d’investir dans un outil tel que SEMRush, Yooda Insight ou SERPStat, lesquels vous donnent accès à un plus large panel de données.

Bref, passons aux choses sérieuses.

Dans cette phase, l’objectif sera de récupérer, pour chacune des expressions initiales, les requêtes utilisateurs au sein d’un des outils mentionnés.

➡️ Comme une image vaut parfois mille mots, raccrochons-nous à un exemple tangible, avec un profilage d’audience que nous avons effectué pour l’Office Français pour la Biodiversité :

Dans cet extrait, les expressions initiales sont sur fond noir, les expressions utilisateur ont été collées en-dessous, sans aucune considération de nettoyage ou de tri particulier pour l’instant.

J'ai un peu de mal à saisir...

D’accord, alors raccrochons-nous à notre exemple de magasin de bricolage et voyons ce que ça peut donner sous un tableur :

Comme vous le voyez, une fois encore, pour chacune des expressions de notre liste initiale, nous avons collecté les requêtes tapées par les internautes dans Google.

Là encore, elles ont été copiées / collées dans un fichier Excel sans aucun tri particulier.

Au secours, je n'ai quasiment aucune donnée !

Si vous êtes dans une thématique très spécifique (de “niche” dirions-nous vulgairement), il est très possible que vous n’obteniez que peu de résultats, voire aucun.

Il n’y a malheureusement pas grand-chose à faire : cela signifie que l’audience (donc vos prospects / clients) n’est pas assez nombreuse pour générer des données probantes.

🔺 D’où l’utilité, toutefois, de compléter vos données Search (ce que nous sommes en train de traiter) avec des données complémentaires !

Les expressions que vous collectez peuvent retourner des résultats décontextualisés de vos produits.

Par exemple, vous vous apercevez qu’une certaine fraction d’internautes recherchent des caractéristiques que vous ne vendez pas, ou qu’ils recherchent une information hors de propos (des images, une vidéo…).

Le premier réflexe serait de les supprimer ; ce serait une erreur.

Il est en effet important d’obtenir un portrait aussi fidèle que possible de vos besoins clients, même si ces besoins ne rentrent pas tout à fait, ou pas du tout dans votre scope.

🔺 Cela vous permettra d’obtenir des statistiques précises, et non biaisées par l’absence de tel groupe a priori hors sujet.

Bien sûr, on ne vous dit pas de vous mettre à vendre des bonsaïs si vous ne vendez que des fleurs, ni de créer des images ou des vidéos si c’est ce que recherchent une petite partie de vos prospects ou de vos clients (à moins que cela ne rentre en adéquation avec votre propre stratégie de développement !).

🔺 Mais conserver l’ensemble des données vous permettra de connaître les pluralités de besoins concernant votre propre offre de services ou de produits.

Ceci fait, et au terme de l’exercice, un grand nombre d’expressions utilisateurs devraient avoir été collectées, réparties au sein d’un fichier Excel par exemple, lui-même subdivisé en plusieurs onglets calqués sur les sous-groupes préalablement établis.

Eh bien, c’est à partir de ces listes de données que seront construits les besoins de vos clients.

Étape n°3 : Définir les besoins client

On attaque ici le plus dur, le cœur du sujet : l’identification et la définition des besoins de vos internautes.

Nous sommes ici :

Jusqu’ici, nous avons construit une liste d’expressions à partir desquelles travailler, nous avons récolté l’ensemble des expressions utilisateur associées, et il nous faut désormais les trier et les catégoriser.

Vous connaissez certainement tout un tas d’outils à visée “sémantique” en SEO (on le met entre guillemets car, dans le sens véritable du terme, ils n’ont pas grand chose à voir avec la sémantique telle qu’étudiée en linguistique).

Tous ces outils (1.frVisibilis, SEOQuantum…) sont très utiles pour obtenir des indicateurs et des statistiques sur les possibilités d’optimisation d’un contenu.

🔺 Toutefois, il n’en existe aucun à notre connaissance, et à l’heure actuelle, qui fasse exactement ce que nous allons faire maintenant.

D’après nos propres tests, c’est SEOQuantum qui se rapproche le plus de notre méthodologie d’exploitation des données Search ; SEOQuantum utilise néanmoins les résultats des SERP (Search Engine Result Page) pour procéder à l’analyse des groupes thématiques, et non les requêtes des internautes en elles-mêmes.

🔺 D’où, certainement, les divergences que nous observons entre les données SEOQuantum et les nôtres… Qui sont habituellement plus précises.

Mais restons positifs ! Ces outils sont assez nouveaux, et toujours en phase de peaufinement. Qui sait ce que ça donnera dans les années à venir ?

Quoi qu’il arrive, on vous rappelle quand même qu’aucun logiciel au monde ne saurait, pour l’instant, se suppléer au cerveau humain, et donc à la logique et à la réflexion. Le meilleur “outil”, c’est vous !

⏩ Refermons ici cette parenthèse et avançons.

Nous avons testé plusieurs méthodes depuis ces dernières années, chacune avec plus ou moins de rapidité et de précision. Nous allons en voir trois :

  1. La méthode 100% manuelle, très précise mais très coûteuse en temps. C’est celle qui nous utilisions autrefois.
  2. La méthode de segmentation par occurrences, moins précise mais plus rapide.
  3. Une méthode semi-automatique, avec recours à un outil d’analyse sémantique. C’est la méthode que nous employons aujourd’hui, et qui est un bon compromis entre les méthodes n°1 et n°2.

Méthode n°1 : identification manuelle des besoins

C’est simple : vous devrez passer en revue l’ensemble de vos listes d’expressions, et opérer pour chacune d’elles un tri logique :

🔺 Quelle est la grande catégorie d’intention (informationnel, navigationnel…) ? Quelle est l’intention principale (taille, couleur, forme, prix…) ?

➡️ Comme d’habitude, prenons un exemple.

Nous avons travaillé avec un client spécialisé dans les pâtes alimentaires, pour qui nous avons réalisé un profilage d’audience. Voici un extrait de la phase d’identification des besoins :

Pour être francs, nous nous sommes appuyés sur notre outil d’analyse sémantique pour grandement accélérer la classification des expressions, mais l’on pourrait très bien imaginer effectuer un travail similaire “à la main”.

Les expressions ont donc été attribuées à une catégorie d’intention principale, puis “rangées” dans des groupes thématiques secondaires afin de préciser leur nature.

Une fois encore, c’est vous qui déterminez qui est quoi : nous sommes en 100% manuel.

J'aimais bien l'exemple des tournevis !

Très bien, alors repartons sur les tournevis.

Si, par exemple, vous trouvez « tournevis carré leroy merlin » et « tournevis carré castorama », c’est qu’a priori, une partie des utilisateurs veulent acheter leur outil auprès d’un magasin de bricolage bien connu.

On pourrait donc les ranger dans un groupe “Marques”.

À noter que certaines expressions peuvent être rangées dans plusieurs groupes à la fois, par exemple : « tournevis 8×175 castorama »… D’où l’utilité, aussi, de proposer deux sous-groupes d’intentions.

On n’oublie pas de préciser à côté le nombre d’occurrences qui reviennent, cela nous permettra de faire des statistiques :

Bref, n’oubliez pas que la finalité, c’est d’identifier les besoins de vos clients.

Un tableau, des statistiques, c’est bien, mais un graphique c’est quand même beaucoup mieux pour la lisibilité.

➡️ Reprenons notre exemple de pâtes, vous allez voir, c’est tout de suite plus sympa :

  • Nb. d'expressions

Méthode n°2 : segmentation par occurrences

Cette seconde méthode repose sur l’utilisation d’outils de compteur d’occurrences pour trouver les besoins de vos clients.

Concrètement, ces outils permettent de connaître quels sont les termes les plus fréquents, ou quels termes sont le plus souvent associés entre eux.

C’est un bon moyen pour avoir une idée rapide des principaux besoins pour le produit ou le service de votre choix, mais cette méthode manque de précision, surtout si vous coupez au plus court.

À noter que certains outils tels que SEMRush ou SEOQuantum proposent automatiquement un tel découpage par occurrences. Pour cette raison, cette méthode est quelque peu obsolète, sauf si vous n’avez vraiment aucun budget et que vous souhaitez vous cantonner à des outils 100% gratuits.

En parlant d’outils de compteur d’occurrences gratuits, citons…

Ils font tous à peu près la même chose, choisissez celui avec lequel vous êtes le plus à l’aise.

Passons à la suite. Que faire avec ces outils et nos listes de requêtes ?

Eh bien, chacune d’elles devra être moulinée via un compteur de mots afin d’en déterminer les principales occurrences.

➡️ Reprenons l’exemple de nos pâtes.

Nous cherchons à déterminer, pour le groupe “Sauces”, laquelle est la plus recherchée afin d’orienter ensuite notre offre sur le site. Carbonara ? Bolognaise ? Pesto ?

Ce sont visiblement les pâtes carbonara qui remportent ce match, et de loin : le terme revient 211 fois, tandis que les termes “pâtes” et “carbonara” sont associés ensemble 210 fois parmi les 811 requêtes utilisateurs de ce groupe.

Assez peu étonnant lorsque l’on considère les volumes de recherche mensuels :

Bien, qu’est-ce que l’on fait une fois cette opération effectuée ?

🔺 Eh bien, l’objectif sera ensuite de ranger chaque occurrence dans une catégorie d’intention.

Ainsi, si l’on retrouve parmi la liste le mot-clef “coût”, on le rangera dans la catégorie d’intention “Prix“, et l’on additionnera sa fréquence au nombre de fréquence du mot-clef “Prix”.

Problématique identique si l’on retrouve le mot-clef “tarif” dans la liste des occurrences.

Autre exemple, si l’on trouve le mot-clef “conseil” dans la liste des occurrences, on le rangera dans la catégorie d’intention “Demande d’information“, avec addition de sa fréquence au nombre de fréquences existantes.

Ce long travail de catégorisation permet donc, peu à peu, de définir les principales intentions utilisateurs par rapport à une liste de requêtes (et donc de trouver les besoins de vos internautes, ça, vous l’aurez compris).

➡️ Exemple avec un graphique (toujours avec nos sauces pour pâtes). Quels sont donc les principaux besoins lorsque les internautes requêtent quelque chose comme “pâtes + sauce” ?

  • Occurrences

Pour les quatre grandes typologies d’intentions :

  • Occurrences

Quant à savoir qui des sauces carbonara, bolognaise et compagnie tire son épingle du jeu, on peut imaginer un découpage subsidiaire comme suit :

  • Occurrences

Méthode n°3 : recours à un outil d’analyse sémantique

Dernière méthode qui, selon nous, offre un bon compromis entre les deux méthodologies précitées : l’utilisation d’un outil d’analyse sémantique pour déterminer les besoins de vos clients.

De “vrais” outils d’analyse sémantique exploitables pour du profilage, il n’y en a malheureusement pas cent.

Si vous ne souhaitez pas vous prendre la cabeza outre mesure, vous pouvez très bien utiliser les statistiques fournies par l’outil que vous utilisez (SEMRush par exemple, puisqu’il propose un découpage par occurrences, ou encore SEOQuantum). À défaut d’être exhaustif, vous pourrez au moins avoir un aperçu à peu près global de l’univers thématique dans lequel vous travaillez, pour peu que vous retraitiez les données en aval.

Néanmoins, dans notre exemple, nous allons travailler avec un outil 100% gratuit : Tropes (notez qu’il en existe d’autres, faites donc un tour du côté de notre boîte à outils).

Tropes est un logiciel d’analyse sémantique de textes qui existe depuis 1994. Et s’il est utile de le préciser : non, ce n’est pas un outil SEO ou de rédaction web.

🔺 C’est un vrai logiciel d’analyse sémantique, avant tout destiné à des chercheurs ou à des linguistes.

Tropes est toutefois très intéressant : son noyau d’analyse sémantique se fonde sur une logique de résolution de problèmes qui fait largement appel à l’Intelligence artificielle et qui fut un précurseur des algorithmes de certains moteurs de recherche.

De quoi titiller quelque peu notre intérêt

Vous l’aurez compris, la fonction première de Tropes est ici quelque peu détournée puisque ce ne sont pas des textes, mais des listes d’expressions qui sont analysées afin d’en déterminer rapidement les univers sémantiques. Ces univers sémantiques seront ensuite transformés en intentions (et donc en besoins).

Ainsi, puisque la fonction de l’outil a été détournée, les résultats présentés sont à prendre avec précaution et requièrent une prise de recul de votre part.

🔺 En d’autres termes : il faudra prévoir un petit moment en amont pour personnaliser Tropes à l’aide de scénarios, ou en aval pour nettoyer les données.

Euh... J'ai été voir l'interface et, comment dire...

… Oui, c’est assez austère, c’est ça ?

On vous l’avait dit, c’est un outil assez ancien et qui n’a visiblement que peu évolué d’un point de vue graphique.

Il faut également savoir que Tropes est assez complexe à manipuler et nécessite quelques bonnes heures d’apprentissage, manuel (de 172 pages) à côté, pour mieux s’imprégner de ses fonctions : le mode “scénario” par exemple, qui vous permettra d’affiner grandement votre analyse, s’avère rapidement un indispensable si l’on veut mener un véritable travail de fond.

Il est même possible de réaliser des exports à destination de Gephi, et donc de représenter vos données sous forme de graphes (ce qui s’avère souvent précieux pour mieux se représenter les proportions).

Exemple avec l’ADEME (normalement, cette carte est interactive, il est possible de zoomer et de cliquer sur les groupes) :

… Assez utile quand on brasse des dizaines de milliers de requêtes, n’est-ce pas ?

Il n’est pas impossible que nous fassions un jour un gros tutoriel pour Tropes.

Mais cela mériterait un article à part entière, qui pour l’heure ne rentre pas dans celui-ci !

Tout comme la méthode des occurrences, chacune des listes de requêtes devra être analysée sous Tropes.

Le logiciel accepte l’ouverture de nombreux types de fichiers (PDF, Word, PPT, txt…), par convention nous utiliserons des listes d’expressions sous format TXT afin d’éviter d’éventuelles erreurs de formatage.

L’ouverture d’un fichier sous Tropes donne immédiatement lieu à l’analyse du texte. Trois éléments en particulier vont nous intéresser :

Sous Tropes, l’univers de référence correspond au contexte global du texte.

Il s’agit d’une fonction qui affiche dans un ordre décroissant les Univers de référence (disons, les univers thématiques) des mots du texte.

Les univers de référence regroupent dans des classes d’équivalents (pour simplifier, des mots de la même famille) les principaux mots/thèmes du texte qui a été analysé. Il y a deux niveaux d’univers de référence : le premier affiche le contexte général et le second affiche le contexte détaillé.

Les références utilisées constituent une fonction qui affiche les substantifs utilisés dans le texte regroupés en classes d’équivalents et organisés selon leur fréquence dans un ordre décroissant, c’est-à-dire la plus haute fréquence en premier.

Chaque ligne contient le nombre d’occurrences du terme, suivi du terme en question. En cliquant sur une ligne, le contenu de la classe apparaît dans l’écran central. Les mots qui composent la classe apparaissent en bleu.

Dernier élément qui peut être intéressant, les relations, qui est une fonction affichant les relations de co-occurrence entre les classes d’équivalents. Elle les affiche triées par fréquence décroissante.

Chaque ligne contient le nombre d’occurrences et la relation correspondante. Cette fonction permet notamment de répondre à la question : sur quoi porte le texte ?

🔺 Concrètement, ce sont les univers de référence qui vont nous permettre d’avoir une idée des typologies d’intentions pour une liste d’expressions utilisateurs.

Les références nous donnent des statistiques quant aux mots les plus fréquemment utilisés (unigram), et les relations les associations d’occurrences les plus fréquentes (bigram).

La consultation du premier univers de référence suffit dans la plupart des cas. Il est toutefois nécessaire de vérifier, dans l’écran de droite, quels mots-clefs ont été attribués aux différents univers en question pour s’assurer de leur cohérence.

Une fois encore, comme la fonction originelle de l’outil a été détournée, les univers de référence présentent souvent des anomalies qu’il nous faut par la suite corriger – si nous n’avons pas du tout paramétré Tropes en amont !

Si vous êtes dans ce dernier cas, vous allez devoir effectuer un travail de modification et / ou de fusion des univers de référence afin d’obtenir des typologies d’intentions viables et utiles.

Il s’agira, dans ce cas, d’additionner les fréquences des univers de référence fusionnés afin d’obtenir une estimation des différentes forces d’intentions. Attention cependant à ne pas mélanger les univers de référence de premier ou de second niveau : seul l’un des deux doit servir de base à l’analyse !

Au bout du compte, et comme nous l’avons vu dans les deux autres méthodes, il est toujours intéressant de tirer une synthèse globale et graphique des principaux besoins de vos internautes.

➡️ Exemple avec un client du secteur bancaire, qui voulait débroussailler les besoins en matière de crédit renouvelable (analyse sous Tropes + données retraitées sous Excel) :

  • Nb. d'expressions

Étape n°4 : Consolider les besoins

Maintenant que l’on a nos principaux besoins, on va les corroborer avec des données supplémentaires.

Il s’agit de la quatrième étape de notre méthodologie :

À quoi ça peut servir ?

C’est vrai, ça, on a déjà tout ce dont on a besoin, non ?

🔺 Eh bien… Oui et non.

Si les requêtes issues du Search constituent un socle important à partir duquel construire les profils d’audience, il ne s’agit toutefois pas de la seule source de données utilisable !

Ainsi, lorsque cela s’avère possible, nous utilisons des données corolaires afin de compléter les profils préalablement ébauchés et ouvrir de nouvelles perspectives :

  • Réseaux sociaux (écoute sociale) ;
  • Forums / blogs (scrapping des contenus + analyse des sentiments) ;
  • Recherches internes & statistiques d’audience (Google Analytics ou tout autre outil de mesure) ;
  • Tendances de recherche (Google Trends, SEMRush…) ;
  • Données issues de plateformes ecommerce (avis produits par exemple) ;
  • Toute autre source disponible ou que l’on veut bien nous communiquer (études de marché, sondages, A/B tests internes…).

Ces différents jeux de données permettent d’affiner les profils utilisateurs et de vérifier, en outre, la véracité des intentions précédemment identifiées lors de l’étape de définition des besoins.

En d’autres termes, avec tout ça, on minimise grandement les risques de se planter… Et comme nous vous le disions, cela permet aussi d’ouvrir de nouvelles perspectives très intéressantes !

Croisement des besoins avec Google Analytics

D’accord, prenons un premier exemple ; nous avons réalisé un profilage d’audience pour un cabinet de stratégie et de conseil auprès des entreprises.

Après identification des besoins, lesquels étaient fortement géolocalisés, nous avons mis en parallèle les données d’audience issues de Google Analytics afin de vérifier si tout concordait en termes de génération de trafic.

Dit autrement : l’audience générée sur le site est-elle le reflet des besoins identifiés en amont ?

Réponse en image :

À gauche les requêtes géocalisées, à droite les statistiques d’audience Google Analytics sur la période 2020.

Tout va bien, on est raccord… Et les disparités constatées sur Google Analytics sont autant d’opportunités à saisir !

Inclure les tendances de recherche

L’ajout des tendances de recherche au sein du profilage permet :

  • D’identifier d’éventuels phénomènes de saisonnalité par rapport à nos besoins ;
  • De pouvoir adapter notre stratégie commerciale / éditoriale ;
  • Et, par conséquent, de proposer aux internautes l’offre du site au bon moment. Tout est affaire de timing !

Les tendances de recherche sont des données que vous pouvez obtenir gratuitement via Google Trends (elles existent aussi sous SEMRush, c’est celles que nous exploitons). Elles permettent de connaître la fréquence à laquelle un terme a été tapé dans Google.

➡️ C’est nébuleux ? Reprenons notre cabinet de stratégie et de conseil aux entreprises.

Nous avons compilé l’ensemble des tendances de recherche pour les besoins en RH, et voici le résultat :

Même chose pour les besoins en stratégie d’entreprise :

Sans le moindre doute possible, il existe clairement différents moments de l’année où il apparaît plus judicieux de communiquer sur les services en RH ou en stratégie d’entreprise…

Si l’on a fait correctement notre travail, l’ensemble des tendances de recherche devraient normalement s’aligner (plus ou moins) sur la courbe de génération d’audience de notre site… Encore une manière de s’assurer de la véracité de notre analyse !

Si ce n’est pas le cas, soit le site n’est pas visible sur tel groupe de besoins (ou est visible sur d’autres non identifiés), soit nous avons loupé quelque chose lors de la première phase (constituer notre liste d’expressions initiales).

Ici, tout va bien, les fluctuations sont acceptables :

Si cela vous intéresse, nous avons écris un gros article sur l’exploitation des tendances de recherche pour créer ce que nous appelons du “contenu prédictif“.

Scrapping et analyse de contenus

Revenons à notre client du secteur bancaire.

S’agissant d’un sujet potentiellement sensible (le crédit renouvelable), nous avons jugé opportun d’analyser deux sets de contenus :

  • Des blogs ou des forums utilisateurs abordant ce sujet ;
  • Les contenus sociaux, notamment Twitter.

Globalement, ça partait plutôt mal :

… Observation liminaire corroborée par une analyse du sentiment d’une dizaine de forums, avec chacun plusieurs pages où de nombreux intervenants s’épanchaient sur tout le bien dont ils pensaient de cette typologie de service bancaire :

Quand on se retrouve avec des termes comme “déclin”, “solitude”, “tuer”, “terreur” ou “ruiné”, on sait d’ores et déjà que l’on va devoir sacrément intervenir en amont pour rassurer ses prospects ou ses clients…

À noter que ces données ont été corroborées d’autre part par les besoins identifiés en amont, où les requêtes liées à la résiliation du crédit constituaient la majorité du volume de requêtes.

Ça a l'air génial ! Comment on fait tout ça ?

Pour ça, on vous renvoie à la rubrique consacrée aux outils, où vous retrouverez une liste (non exhaustive) d’outils ou de logiciels vous permettant d’affiner votre profilage d’audience.

Beaucoup de ces outils mériteraient à eux seuls des tutoriels pour bien les exploiter, chose que nous avons prévu de faire… quand nous le pouvons, auquel cas nous mettrons à jour la page concernée.

En attendant, vous avez déjà de nombreuses pistes pour optimiser vos profils d’audience !

Étape n°5 : Structuration de l’offre

Si vous êtes là, c’est que vous avez tenu le coup tout le long de notre impitoyable pavé de texte : félicitations !

Dernière étape, et non des moindres : la structuration de votre offre.

Comme nous vous l’affirmions en amont, un profilage d’audience digne de ce nom doit pouvoir vous aider à construire votre stratégie commerciale, votre stratégie marketing, ou encore vos campagnes d’acquisition.

Un exemple tout bête : jusque-là, vous avez beaucoup investi sur les citrouilles, tant en termes de campagne de communication que d’offre produit sur votre site (du jus de citrouille, de la citrouille panée, de la citrouille frite, de la citrouille en yaourt…).

Or, il apparaît que ce produit est finalement assez peu recherché, et que vos clients préfèrent les poireaux. Est-ce que cela vaut le coup de s’acharner sur les citrouilles ?

Bien sûr, le profilage tel que nous le façonnons, ici, chez Azincourt, nous aide beaucoup à poser les bases d’une stratégie de contenus.

➡️ Par exemple…

  1. Identifier des sujets à fort potentiel pour l’utilisateur et pour l’entreprise ;
  2. Les répartir de façon optimisée dans un calendrier éditorial (quel sujet traiter, et quand) ;
  3. Déterminer le ton et la ligne éditoriale la plus efficace ;
  4. Construire des arborescences optimisées autant pour l’utilisateur que pour le moteur de recherche ;
  5. Structurer les pages et les contenus, en désignant par exemple quels éléments doivent être particulièrement mis en avant au sein des textes.

Par exemple, dans le premier cas, nous avons pu facilement identifier, trier et catégoriser plus de 300 sujets pour notre client spécialisé dans le conseil d’entreprise :

Autant d’articles, de dossiers de fond et autres formes de contenus qu’il sera par la suite possible d’exploiter facilement !

Attendez, juste une question... Comment on sait qu'on ne se plante pas à faire tout ça ?

Question légitime, surtout si l’on constate des différences ou des anomalies avec, par exemple, des études marketing commandées auprès d’agences ou menées en interne.

Bien que nous nous fondions sur les requêtes des utilisateurs (donc le reflet à un instant T de différents besoins exprimés sur le moteur de recherche) complétées de plusieurs sources de données afin d’obtenir des profils aussi exhaustifs que possible, il arrive parfois, en effet, d’observer des divergences.

Tout l’enjeu va ensuite consister à déterminer le pourcentage d’anomalies acceptable.

S’il ne s’agit que de quelques menues différences, on peut considérer que l’un ou l’autre des documents souffre d’une petite marge d’erreur pour x ou y raison (échantillonnage trop faible par exemple), rien de bien méchant.

Si, en revanche, les différences sont nombreuses et flagrantes, cela vaut le coup d’approfondir la question, en complétant notamment vos recherches initiales de nouvelles analyses.

Chez Azincourt, nous avons réalisé de nombreux profilages, et nous n’avons jamais rencontré ce dernier cas de figure ; les anomalies (car il y en a, parfois) trouvent toujours une explication tangible après échange et discussion avec nos clients.

Généralement, il nous manque des éléments de compréhension ; et cela se résume bien souvent à cela.

Vous avez dit plusieurs fois que "le moteur de recherche est le reflet des besoins des internautes". Ça veut dire quoi ?

En substance, c’est assez simple : puisque Google est devenu un moteur de réponse, ses résultats sont une réponse à un besoin de l’utilisateur.

Et son besoin s’exprime par… une requête.

Donc, normalement, si on a bien fait notre travail, lorsque l’on recherche quelque chose sur Google, les résultats qui sont affichés correspondent aux principaux besoins des utilisateurs pour tel ou tel service / produit.

Il s’agit d’ailleurs d’un moyen assez efficace pour vérifier que l’on a pas fait n’importe quoi lors de notre profilage d’audience.

C’est ce que nous vous proposons de découvrir dans notre chapitre “Google, reflet des besoins utilisateurs”.

Google, reflet des besoins de l’utilisateur

Lorsque l’on a terminé son profilage d’audience, il est toujours utile de corroborer de manière empirique si les besoins utilisateurs qui ont été identifiés sont bien le reflet des résultats de recherche moteur pour le service ou le produit concerné.

En d’autres termes, est-ce que les résultats de recherche naturels comportent bien des traces des principaux besoins de vos utilisateurs ?

Avant de mettre à jour notre article sur le profilage d’audience, nous avions pris pour exemple des terrasses pour piscine ; nous vous disions à l’époque que les principaux besoins en la matière étaient relatifs aux matériaux.

En d’autres termes, les internautes recherchaient des terrasses en bois, en béton, en pierre…

Pour rappel :

  • Nb. d'expressions

Bien, ça, c’était en 2018, autant dire il y a des siècles à l’échelle Google.

Les choses ont un peu évoluées depuis – ce sera justement intéressant de faire le comparatif des résultats de recherche…

Quoi qu’il en soit, les sites visibles en première page des résultats de recherche naturels ne sont pas là par hasard : le moteur les considère comme particulièrement pertinents par rapport à la demande utilisateur.

Il s’agira donc de comparer les résultats retournés en première page par rapport aux besoins que l’on a identifiés.

Ci-dessous, l’ancien extrait (de 2018, donc) des résultats de recherche pour la requête “terrasse piscine” :

Voici maintenant à quoi ressemblent les résultats pour la même requête (“terrasse piscine”), en 2021.

Vous allez voir, ça fait tout drôle :

Pfiou. Vous avez de la chance, on vous a épargné les Ads.

On pourrait être extrêmement méchants, faire tout un tas de remarques sur l’évolution des résultats et dire que ça devient drôlement compliqué pour le SEO, mais on va se cantonner à notre profilage.

Sur les résultats de 2018, il est intéressant de constater que le premier résultat de recherche comporte en titre “Quel matériau pour ma plage de piscine”, et que le deuxième résultat est relatif à des revêtements pour abords de piscine, donc des matériaux, ce qui corrobore de prime abord les besoins préalablement définis.

Nous avions également remarqué, à l’époque, que pour l’expression “terrasse piscine”, c’était essentiellement le bois qui primait parmi les requêtes.

Les résultats de recherche comportaient-ils la trace de ce besoin ?

À ce stade de notre démonstration, nous avions volontairement étendu l’affichage des résultats de recherche à 100 résultats afin d’obtenir une vision globale, et calculé le nombre de fois où l’occurrence “bois” revenait parmi les résultats :

Le résultat était éloquent puisque “bois” revenait 63 fois parmi les 100 premiers résultats naturels, ce qui validait l’hypothèse selon laquelle les matériaux, et plus particulièrement le bois, rentraient au cœur des besoins utilisateurs pour les terrasses de piscine.

Qu’en est-il en 2021 ?

Premier constat : ça n’a pas énormément évolué du côté des besoins. On retrouve toujours la notion de matériaux, à en juger le premier résultat de recherche et les suivants (regardez d’ailleurs la meta description du dernier résultat).

On s’est également amusés à compter le nombre d’occurrences de “bois” :

Hormis l’arrivée de l’occurrence “plage”, nous sommes plutôt raccord avec nos besoins identifiés en 2018, vous ne trouvez pas ?

(D’où l’intérêt de les réactualiser de temps en temps)

On notera par ailleurs, dans les résultats de recherche, deux éléments intéressants :

  • La présence d’une GMap, qui n’est pas là par hasard (n’y aurait-il pas un besoin géolocalisé ? Ah… si).
  • Des photos de piscine (ce que nous avions à l’époque rangé dans la grande catégorie “Avis”), avec des filtres par matériaux. Comme par hasard.

Bref, ce simple exercice d’étude des résultats de recherche montre bien que Google, ce n’est rien d’autre que le miroir des besoins des internautes !

Conclusion

Bravo, vous savez maintenant comment réaliser un profilage d’audience dans les règles de l’art !

Vous vous en êtes certainement aperçu à la lecture de ce (très) long article, les différentes étapes du profilage requièrent une sacrée dose de travail ; on vous avait prévenu dès le départ, on n’a pas rien sans rien.

Peut-être vous posez-vous d’ailleurs la question de l’automatisation.

On vous l’a indiqué en préambule de notre méthodologie : nous ne connaissons pas, à l’heure actuelle, d’outil qui fasse exactement l’ensemble du travail que nous vous avons présenté. Automatiser ou faciliter certaines étapes, oui. L’ensemble du processus, non.

L’étape de consolidation des besoins exclue de toute façon un process 100% automatique, puisqu’il nécessite d’aller grapiller des données ailleurs, lesquelles ne sont pas toujours accessibles via une API…

Mais comme nous vous le disions ailleurs, l’outil le plus important, c’est votre cerveau… En attendant une solution miraculeuse qui débarquerait sur le marché pour réaliser le même travail que l’on vient de vous montrer !

Le profilage d’audience que vous avez construit pour votre entreprise devrait en tout cas vous permettre d’y voir plus clair sur les attentes réelles de vos prospects ou de vos clients.

Mais quoi qu’il arrive, ce ne sont que les fondations, les premières briques. C’est certes très important, mais ça ne fait pas tout !

🔺 Il vous reste encore à construire votre stratégie commerciale / marketing / éditoriale / [insérez ici le nom que vous souhaitez] à partir de cette analyse !

En somme, ce n’est que le début du voyage.

Bon courage, vous en aurez besoin.

La boîte à outils du profilage d’audience

Énième mise en garde : cette page a pour vocation d’être fréquemment actualisée, avec liens internes vers des tutoriels que nous écrirons au fil du temps.

(Oui, nous avons pour ambition de faire de cet article l’un des piliers de notre site)

Ceci étant dit, passons à la suite !

Outils SEO à vocation "sémantique"

Parmi ceux que nous avons testés :

  • 1.fr : un très chouette outil d’enrichissement lexical, qui propose des suggestions d’expressions en fonction de la thématique de votre contenu.
  • SEOQuantum : outil très solide, qui passe au crible les résultats de recherche pour déterminer les besoins utilisateurs, et proposer ainsi des structures et des optimisations de contenus.
  • YourTextGuru : outil que nous avions testé à sa sortie, à l’époque (il y a certainement eu tout un tas d’améliorations depuis). Déjà fort pratique à l’époque puisqu’il générait des structures de contenus optimisés “prêts à l’écriture”. Il avait toutefois tendance à s’égarer lorsqu’on rentrait dans des thématiques un peu trop spécialisées.

Outils que nous n’avons pas testés :

  • Semji, aux fonctionnalités vraisemblablement similaires à SEOQuantum.
  • textfocus, même combat.
  • Visiblis, acteur historique du marché (en tout cas, nous l’avons connu très tôt), et que nous n’avons jamais pris la peine d’essayer – une erreur, certainement.

Outils SEO généralistes (et solubles dans les stratégies éditoriales)

  • SEMRush : difficile de ne pas en parler, c’est celui que nous utilisons presque quotidiennement… Construit au départ à des fins SEO, il est peu à peu devenu une énorme machine dédiée au webmarketing.
  • Yooda Insight : autre outil que nous avions essayé dès ses débuts. Nous le trouvions alors moins complet que SEMRush, mais cela a sans doute dû évoluer depuis.
  • SERPStat : a priori similaire aux deux précédents, nous ne l’avons pas essayé. Un jour peut-être.
  • Screaming Frog : le plus célèbre des crawlers SEO, que nous utilisons encore de temps en temps. La version gratuite permet de crawler jusqu’à 500 URL.

Outils de génération de contenu

Certains diront que l’on se saborde, mais il serait vain d’empêcher les curieux de se renseigner sur la question… Alors, autant encadrer la problématique.

Nous en avons testés quelques-uns, mais pas tous, loin de là (une foultitude d’outils de ce genre ont débarqué avec la vague GPT-3).

Outils pour obtenir des statistiques textuelles brutes

  • Alyze : outil que nous utilisions jadis pour obtenir différentes statistiques brutes sur un contenu, et qui a vraisemblablement été laissé en jachère un certain temps (ce qui explique que nous l’ayons délaissé il y a quelques années).
  • SEOScout, qui permet de procéder à des analyses statistiques, avec une surcouche d’analyse du sentiment (en anglais, beware).
  • wordcounter.net : outil de comptage d’occurrences.
  • textalyser.net : autre outil de comptage d’occurrences.
  • outils-atypicom.fr/atypiword/ : et… un autre outil de comptage d’occurrences.

Outils de collecte de mots-clefs / questions

  • Answer the public : que tout le monde doit connaître, nous ne nous épancherons donc pas sur la question. Pour les néophytes, cet outil permet de collecter des questions que se posent les internautes par rapport à un mot-clef donné.
  • AlsoAsked : une alternative à l’outil précédent.
  • keywordtool.io, l’un des plus connus pour collecter des mots-clefs, et qui vous permet même d’obtenir d’autres Suggest (Bing, Amazon…).
  • Ubersuggest, une alternative aux fonctionnalités identiques.

Outils d'analyse sémantique

Il n’y en a malheureusement pas 36 (exploitables pour du profilage, précision importante).

Citons d’abord Tropes, logiciel dont nous vous avons parlé dans notre article. La documentation de Tropes se trouve ici, et il existe de nombreuses ressources à droite à gauche.

Citons en outre Alceste, un logiciel (payant) destiné à l’analyse de données textuelles, que nous avions eu l’occasion de tester il y a quelques années maintenant.

Parmi ceux que nous n’avons pas testés (et qui sont pourtant sur notre todo… promis, dès qu’on a quelques heures / jours de libre pour faire joujou avec…) :

  • Iramuteq, une alternative à Alceste (gratuite et libre par ailleurs), spécialisé aussi dans l’analyse de données textuelles.
  • Calliope, a priori spécialisé dans l’extraction terminologique.
  • Voyant-Tools, open source, utilisable directement dans le navigateur, semble plutôt intéressant sur le papier.

Outils d'analyse du sentiment

  • Tropes, avec sa fonctionnalité de scénario, permet d’y pourvoir (au moins partiellement).
  • Comongo, que nous avions découvert lors du colloque Kontinüum de janvier 2020, spécialisé dans l’analyse du ressenti utilisateur. L’outil a suscité notre curiosité !

On connaît de nom, mais nous n’avons pas testé :

Outils dédiés à l'analyse d'audience

Les données d’audience sont d’excellents auxiliaires pour un profilage d’audience.

Toutefois, elles posent un certain “problème” : il n’est pas possible de collecter les données de façon rétroactive…

… c’est-à-dire qu’il est nécessaire “d’installer” ces outils sur son site, puis d’attendre quelques semaines / mois le temps de récupérer des données à analyser.

Citons donc pêle-mêle la solution d’AT Internet, Google Analytics, Matomo (anciennement Piwik), Xiti, Omniture (d’Adobe)…

Outils dédiés à l'analyse social media

À vrai dire, on est encore en phase de test. Donc… on essaie tout ce qui nous passe par la main.

  • Hootsuite : difficile de ne pas la citer, certainement la plus connue.
  • Sproutsocial, qui, hormis le nom vaguement rigolo pour un francophone, dispose de fonctionnalités très intéressantes (là tout de suite, on pense aux possibilités de comparatifs entre les différents canaux sociaux).
  • Keyhole, que l’on a essayé un certain temps. Plutôt intéressant, focalisé sur du hashtag, non limité au social, avec différentes statistiques et des possibilités d’export étendues.

On a pas essayé, mais c’est sur notre fameuse “to-do de trucs à tester un jour, peut-être” :

  • BuzzSumo, qui n’a pas l’air d’être à proprement un outil de social analytics, mais qui semble retourner des statistiques d’engagement pour une requête donnée.

Outils d'analyse du comportement

  • Hotjar, le plus connu peut-être, qui permet d’analyser finement le comportement des internautes sur son site.

Outils annexes