La data au service de la stratégie d’influence des marques Data Science & Tech

Les marques et les influenceurs

De plus en plus de marques utilisent la notoriété des influenceurs pour valoriser leurs produits mais également pour renforcer l’image qu’elles ont auprès des consommateurs. Red Bull travaille par exemple avec de nombreux sportifs de l’extrême – à l’instar de Thomas Pagès – pour mettre en avant ses produits. Par leurs prises de parole, les influenceurs impactent l’image des marques qu’ils relaient. Cet impact est largement positif, mais il existe ponctuellement des cas où leurs actions desservent la marque et sa perception par les consommateurs. On peut rappeler le cas de Tibo InShape, qui a publié différentes vidéos mettant en avant le service national universel sans mentionner que ce contenu était sponsorisé, impactant de fait l’image d’un service qu’il devait contribuer à promouvoir.

La problématique pour les marques est ainsi double : trouver des influenceurs proches du message qu’elles souhaitent transmettre mais également de qualité et de confiance. La qualité d’un influenceur se mesure à l’aune de son expertise sur le sujet d’intérêt pour la marque, du nombre d’individus dans sa communauté et de l’engagement de ces individus.

Cet article a pour objectif de présenter une approche méthodologique permettant d’adresser cette problématique de recherche d’influenceurs, à la fois pertinents sur une thématique donnée et qualitatifs pour les marques demandeuses. Nous décrivons ci-après cette approche dans le cas du thème – multi-marques – de la mobilité électrique et de la détection d’influenceurs qualitatifs sur le réseau social Twitter.

Etape 1 : Construction de l’univers sémantique de la mobilité

Dans un premier temps, il est nécessaire de construire une liste de « mots clés » définissant le thème de la mobilité électrique. Pour cela nous travaillons avec un expert sectoriel à la définition d’un premier ensemble de mots. Nous enrichissons ensuite cet ensemble en crawlant des contenus web en lien avec cette thématique. L’objectif est d’aboutir à un univers sémantique suffisamment riche et caractéristique de la mobilité électrique.

Etape 2 : Première sélection des utilisateurs de Twitter

Nous recherchons l’ensemble des personnes avec plus de 500 followers et ayant publié – au cours des deux semaines précédent la date de l’analyse – a minima un post contenant au moins deux mots clés appartenant à l’univers sémantique de la mobilité électrique.

Ces filtres permettent d’une part de s’assurer que les personnes identifiées se sont bien exprimées sur la thématique de la mobilité électrique : un mot unique peut se référer assez fréquemment à plusieurs univers sémantiques, et il est important d’avoir une condition plus forte. Ils permettent aussi de sélectionner des individus ayant une communauté significative.

Etape 3 : Sélection des utilisateurs actifs sur la thématique de la mobilité électrique

Nous disposons à l’issue de l’étape 2 d’un ensemble d’utilisateurs de Twitter aux communautés significatives et ayant eu de façon certaine une prise de parole sur la mobilité électrique.  Nous devons distinguer parmi eux ceux qui sont régulièrement actifs sur ce sujet de ceux qui se sont exprimés de manière occasionnelle sur cette thématique.

Pour cela nous appliquons une méthode dite de topic modeling à l’ensemble des tweets postés au cours des trois derniers mois par l’ensemble de ces utilisateurs. Le topic modeling est un algorithme de traitement des données textuelles, permettant de résumer l’information comprise dans un ensemble de documents – ici de verbatims – en un ensemble de sujets ou topics. L’application du topic modeling à l’ensemble des Tweets précités conduit à l’identification de 15 topics.

Méthode du Topic Modeling (source : researchgate.net)

Chaque topic est restitué par l’algorithme sous forme d’un ensemble de mots. A la lecture des différents mots regroupés au sein d’un même topic, un data-analyste interprète le topic et peut alors le labelliser : 4 topics parmi les 15 obtenus se réfèrent à la mobilité électrique. On décide de considérer uniquement comme utilisateurs actifs sur la mobilité électrique ceux dont les prises de paroles au cours des trois derniers mois relèvent majoritairement de l’un de 4 topics retenus.

Nous avons à ce stade identifié des utilisateurs, avec plus de 500 followers, s’exprimant régulièrement sur la mobilité électrique. En outre, nous avons également mis en évidence les 4 sujets conversationnels majeurs en lien avec notre thème de la mobilité électrique.

Exemple de topic

La liste de mots ci-dessus est l’un des topics obtenus après application du Topic Modeling à l’ensemble des tweets décrit précédemment. Nous devons interpréter ce topic pour lui donner un sens : au vu des mots présents, nous décidons de le nommer « rencontre in-out de Rennes, forum sur la mobilité électrique ».

Etape 4 : quantification de l’influence d’un utilisateur

Malgré de nombreux travaux réalisés, il n’existe pas de mesure « standard » pour quantifier l’influence d’une personne. Cela s’explique notamment par la diversité des influenceurs. On distingue par exemple des micro et macro influenceurs :  le premiers sont souvent associés à des sujets de niche, spécialisés, et disposent d’une communauté réduite mais très engagée alors que les seconds abordent des sujets plus larges, moins experts, mais sont suivis par un nombre important de followers.

Dans ce contexte, il est important de définir une métrique non biaisée par l’effet masse d’une communauté, et de quantifier l’activité d’une communauté au regard de sa taille : nous prenons en compte le nombre de retweet et les différentes mentions, en pénalisant ce score par la taille de la communauté.

Etape complémentaire : sélection des influenceurs « centraux »

En complément du score précédent, nous regardons les interactions entre les influenceurs associés à un même topic, en utilisant une représentation sous forme de graphe (le terme anglais : graph est souvent privilégié au terme français).

On désigne par graphe un ensemble de nœuds reliés par des arêtes. On parle de graphes orientés lorsque les arêtes ont un sens, lié à la nature de l’interaction. Dans notre cas, chaque nœud représente un influenceur et chaque arête représente une interaction entre deux influenceurs. Ainsi lorsqu’un utilisateur A actif sur un topic cite ou répond à une personne B associée au même topic, nous enregistrons cette activité via une arête orientée de A vers B, et définissons l’importance de l’arrête par la taille de la communauté de A. Si on reprend le topic « rencontre in-out de Rennes, forum sur la mobilité électrique », nous obtenons le graphe suivant :

Graphe représentant les interactions entre les individus du topic
« Rencontre in-out de Rennes, forum sur la mobilité électrique »

Nous mesurons alors l’importance de chaque personne au sein du graphe grâce à l’indicateur dit de « Page Rank ». Cette métrique créée par Larry Page, cofondateur de Google, permet notamment de quantifier la popularité d’une page – et dans notre cas d’un utilisateur – à l’aide du nombre de liens – interactions – entrants et sortants. Elle est définie par a formule suivante :

Avec i → j désignant toutes les interactions de i pointant vers j, rᵢ le page rank de la page i ,et dᵢ le nombre de liens – interactions – sortant le de la page – utilisateur – i. En appliquant cette méthode au graphe de chaque topic, nous mesurons la centralité de chaque influenceur au sein de son topic de rattachement.

Nous avons détecté à l’issue de cette dernière étape les topics caractérisant notre thématique initiale qu’est la mobilité électrique, des utilisateurs pertinents et influents sur chacun des topics, parmi lesquels nous sommes en mesure d’identifier des influenceurs clés car centraux.

L’identification des influenceurs, et ensuite ?

En appliquant cette approche méthodologique au thème de la mobilité électrique, nous avons identifié 4 sujets conversationnels forts au sein de cette thématique, et des influenceurs pertinents – actifs et visibles – pour chacun de ces 4 sujets. Au terme ce travail basé sur l’exploitation des données, il reste nécessaire d’organiser un échange avec les équipes métiers à l’origine de la demande, pour ajuster encore la liste des influenceurs définis. Une fois finalisée, cette liste donne lieu à la définition par la marque d’une stratégie de recrutement puis d’animation de ces influenceurs.

Credit photo : Diggity Marketing


Avatar de Simon Uzel
Simon Uzel

Diplômé d’un master en mathématiques appliqués, option science des données de l’université de Rennes, Simon a rejoint Equancy suite à son stage de fin d’étude en Septembre 2019. Il travaille aujourd’hui au sein de l’équipe Data intelligence, il a pu travailler dans l’univers du luxe mais également sur les réseaux sociaux et leurs représentations. Il accompagne aujourd’hui nos clients en tant que Data Scientist.