Converger vers une audience globale

Audience le mag
Deuxième partie de la trilogie d’articles consacrés à l’innovation technologique chez Médiamétrie.
Image

Après Collecter des données pour mesurer l’audience, voici la deuxième partie de la trilogie d’articles consacrés à l’innovation technologique chez Médiamétrie et ses applications opérationnelles pour enrichir la mesure d’audience et anticiper les évolutions à venir.

Téléviseur, ordinateur, smartphone, tablette, bientôt voiture, montre, et autres objets connectés : de plus en plus d’écrans et de réseaux permettent d’écouter la radio, de regarder un programme, une vidéo. A mesure qu’apparaissaient ces équipements, Médiamétrie a successivement développé des chaînes de traitement par écran permettant de transformer des données brutes en données d’audience. Ces chaînes ont donc cohabité en silo, chacune étant destinée au traitement de données issues d’une même source. Aujourd’hui, l’enjeu est de connaître l’audience globale d’une marque, d’une émission, quel que soit son mode de réception ; il faut donc pouvoir traiter des données hétérogènes provenant d’une diversité de sources. Ces recherches sont notamment menées au sein du DataLab créé par Médiamétrie il y a 18 mois et composé de datascientists, informaticiens et statisticiens, experts, entre autres, du traitement des données.

Faire converger les données

Lorsqu’une chaîne de traitement est mise en place pour une source de données, les traitements spécifiques qui sont appliqués aux données sont déterminés par cette source. Les données produites par plusieurs chaînes de traitements ne sont alors pas directement comparables entre elles.

Avec la multiplication des écrans, donc des sources, un traitement pour rapprocher les données à la sortie de chacune des chaînes est nécessaire afin de produire une vision globale.

Il existe plusieurs méthodes pour réaliser ce rapprochement : Par exemple, la fusion statistique des mesures. Cette méthode a été utilisée pour produire la mesure de l’internet global 3 écrans – ordinateur, mobile, tablette- dont les premiers résultats ont été publiés en avril 2015. Cette fusion statistique des mesures intervient en bout de chaîne de traitement et permet d’avoir une vision du trafic multi-devices, c’est-à-dire sur les 3 écrans.

Image

Aujourd’hui, Médiamétrie poursuit sa marche vers l’audience 4 écrans (TV, ordinateur, mobile, tablette). Pour pouvoir produire une mesure de référence du marché multi écrans, l’étape suivante consiste à traiter l’hétérogénéité de ces données issues de sources différentes en les faisant converger le plus en amont possible des chaines de traitement ; l’objectif étant de rendre les résultats directement comparables à la sortie de chacune des chaînes.

Le principe est le suivant : pour pouvoir analyser un événement donné – Mme X a consulté le site Y sur son smartphone pendant 5 minutes puis fait un achat via son ordinateur - les données recueillies (issues dans ce cas du smartphone et de l’ordinateur) doivent passer par les grandes étapes de la chaine de traitement. Les premières sont le formatage et le filtrage des données. Le formatage a pour but d’homogénéiser toutes les informations du trafic internet, quel que soit l’écran dont elles sont issues : chaque information du trafic internet mesuré (date, heure, équipement utilisé, url…) est décomposée, identifiée puis classée.

Une fois cette convergence technique réalisée, il faut filtrer les données selon des conventions admises par le marché, des règles ‘métier’ : par exemple exclure les Url d’images incluses dans un site, ou encore les publicités…

Vient ensuite l’étape d’intégration des données, par exemple l’individualisation du trafic. Cette étape permet de donner un sens aux données.

Puis les enrichir

Vient enfin l’étape d’enrichissement des données avec des informations de nomenclatures, de panels et de temps. L’harmonisation des nomenclatures utilisées par les chaînes de télévision avec celles des sites web est d’ailleurs l’un des défis à relever pour faire converger les mesures.

Image

Au total, la richesse et la volumétrie des données recueillies et traitées est considérable; du nombre de visites, de pages vues, du temps passé sur un site à une segmentation des audiences par sexe, âge, catégorie socio professionnelles, habitat … On entre là dans l’univers du Big Data et de ses 3 V : Volume, Vitesse et Variété.

Ainsi, en enrichissant les données des sources des 3 dimensions – panel, nomenclature et temps - un nombre de requêtes quasi infini, évalué à 10289, peut être formulé. A titre de comparaison, les cosmologues s’accordent pour estimer à 1080 le nombre d’atomes présents dans l’univers observable.

On comprend alors intuitivement que Médiamétrie fasse appel à l’approche big data et aux technologies qui lui sont propres, pour répondre à des questions aussi diverses que « Les CSP+ qui se connectent à des sites d’information achètent-ils leurs vacances de préférence sur un ordinateur fixe ou sur une tablette ? Le soir ou le matin ?

Pour pouvoir répondre à cette infinité de requêtes possibles, Médiamétrie a développé une solution innovante : un moteur de calculs à la demande permettant de répondre à des questions qui exploitent des données préalablement mises en cohérence.

De fait, « après l’approche de la consommation multi-écrans ou multi-devices, l’étape suivante est celle du cross-devices, explique Estelle Duval, directrice du département Internet de Médiamétrie. Il s’agit de mesurer comment un même individu passe de son ordinateur à sa tablette puis à son mobile au cours d’une même journée pour consulter un site d’information par exemple. Grâce à ses panels, Médiamétrie a la capacité de mesurer ces usages. Une fois ces chaînes de traitement et d’hybridation de données mises au point pour 3 écrans, l’ajout d’autres sources de données, comme celles fournies par des objets connectés, sera plus simple à intégrer. »

Rendez-vous prochainement pour le 3ème volet de la trilogie : Restit TV pour des résultats d’audience calculés à la volée.

Isabelle Repiton et Isabelle Lellouche Filliau

Calcul d’intervalle de confiance à 95%

Taille de l'échantillon ou d'une cible dans l'échantillon

n =

Proportion observée dans l'échantillon ou sur une cible dans l'échantillon

p =

%

Attention : ne s'applique qu'à une proportion. Le Taux Moyen est une moyenne de proportions et la Part d'audience un rapport de proportions.
Cet outil est donné à titre indicatif. Il ne saurait pouvoir s'appliquer sans autres précautions à des fins professionnelles.

Test de significativité des écarts entre deux proportions

Permet d'évaluer si la différence entre 2 proportions est significative au seuil de 95%

Proportion

Taille de l'échantillon

Échantillon 1

%

Échantillon 2

%

Attention : ne s'applique qu'à une proportion. Le Taux Moyen est une moyenne de proportions et la Part d'audience un rapport de proportions.
Cet outil est donné à titre indicatif. Il ne saurait pouvoir s'appliquer sans autres précautions à des fins professionnelles.

En complément
×
Dictionnaire
Les mots
des médias
Nouvelle
édition
+500
définitions
A
B
C
D
E
F
G
H
I