Analyse des log-level data dans la relation DSP-SSP
Les logs deviennent le langage de vérité entre acheteurs et vendeurs programmatiques
Dans la relation entre DSP, demand-side platform, plateforme utilisée par les acheteurs média pour acheter des impressions publicitaires de façon automatisée, et SSP, supply-side platform, plateforme utilisée par les éditeurs pour vendre leur inventaire, la confiance ne peut plus reposer uniquement sur les dashboards agrégés. Les chiffres de spend, d’impressions, de CPM, coût pour mille impressions, ou de ROAS, return on ad spend, ratio entre chiffre d’affaires attribué et dépenses publicitaires, sont nécessaires mais insuffisants. Ils indiquent ce qui a été livré, rarement comment la valeur s’est réellement formée dans la chaîne d’enchères.
Les log-level data, c’est-à-dire les données événementielles détaillées au niveau de chaque requête, enchère, impression, clic ou conversion, changent cette lecture. Elles permettent d’observer la mécanique fine du RTB, real-time bidding, enchères en temps réel permettant d’acheter une impression publicitaire au moment où elle devient disponible. Pour un annonceur ou une agence, analyser ces logs revient à passer d’une vision comptable du programmatique à une vision industrielle : qualité du supply path, duplication des requêtes, latence, niveaux de floor price, taux de bid, taux de win, frais technologiques, exposition au trafic invalide et cohérence de l’attribution.
L’enjeu est devenu central avec la complexification de la supply chain. Une même impression peut être proposée par plusieurs SSP, via plusieurs chemins, parfois avec des identifiants différents et des prix planchers variables. Les études de marché sur le programmatique ouvert montrent régulièrement des écarts significatifs entre budget brut annonceur et revenu net éditeur, avec des frais et pertes de transparence pouvant représenter 15 % à 35 % selon les configurations. Dans certains environnements, la duplication des bid requests peut atteindre 30 % à 60 % des appels reçus par un DSP sur un même domaine ou une même application. Sans analyse au niveau log, ces phénomènes restent invisibles ou dilués dans des moyennes.
Pour les professionnels du marketing, le sujet n’est donc pas purement technique. Les logs influencent directement la performance business : un chemin d’achat plus court peut réduire les frais, améliorer la win rate, diminuer la latence et accroître la qualité d’exposition. À l’inverse, une optimisation mal conduite peut réduire la couverture, concentrer les achats sur quelques SSP dominants ou exclure des inventaires premium dont la valeur est sous-estimée par les métriques de court terme. L’analyse des log-level data doit donc être structurée comme un dispositif de décision, pas comme un audit ponctuel réservé aux équipes adtech.
Ce que contiennent réellement les log-level data DSP-SSP
Une analyse rigoureuse commence par la compréhension des événements disponibles. Côté SSP, les logs décrivent généralement la mise à disposition de l’inventaire : bid request, identifiants de l’éditeur et du vendeur, domaine ou application, format, taille créative, device, contexte, géographie, floor price, consentement, identifiants utilisateurs disponibles, statut ads.txt ou app-ads.txt, chaîne d’approvisionnement via schain, et parfois signaux de qualité comme viewability historique ou catégories de contenu.
Côté DSP, les logs couvrent l’évaluation de la requête et la décision d’achat : réception de l’appel, éligibilité campagne, ciblage, fréquence, présence d’un identifiant, score de probabilité de conversion, prix d’enchère, décision de bidder ou non, valeur de bid, résultat de l’enchère, clearing price, impression servie, clic, post-view, conversion et coût final. Les plus avancés intègrent aussi les raisons de non-bid : budget cap atteint, fréquence dépassée, audience non reconnue, brand safety insuffisante, floor price trop élevé, absence de consentement ou latence excessive.
Cette granularité permet de reconstituer le cycle de vie d’une impression potentielle. Le funnel programmatique, c’est-à-dire la succession d’étapes allant de la disponibilité d’une opportunité d’impression à l’exposition puis à la conversion, peut être modélisé ainsi :
- Bid request reçue : le SSP transmet une opportunité d’enchère au DSP.
- Requête éligible : le DSP vérifie la compatibilité avec les campagnes, le ciblage, le consentement et les règles de qualité.
- Bid envoyé : le DSP décide de participer et transmet un prix.
- Bid gagné : l’enchère est remportée, selon une logique souvent first-price, où l’acheteur paie le prix de son enchère ou un prix proche après mécanismes de shading.
- Impression rendue : la création est effectivement servie et mesurable.
- Interaction ou conversion : clic, visite, achat, lead ou autre événement attribué.
Chaque rupture dans cette chaîne a une signification. Un faible bid rate peut refléter une mauvaise adéquation audience-inventaire, un problème d’identifiant ou des règles de qualité trop restrictives. Une win rate faible malgré un bid rate élevé peut signaler des floors trop agressifs, une concurrence forte ou une stratégie d’enchère mal calibrée. Un écart entre bid gagné et impression rendue peut révéler des problèmes de rendu, de timeout, de filtrage post-enchère ou de fraude. Un CPA, coût par acquisition, c’est-à-dire le coût nécessaire pour générer une conversion attribuée, ne peut être interprété correctement sans ces diagnostics intermédiaires.
Pourquoi les logs transforment la lecture de la supply path optimization
La supply path optimization, ou SPO, désigne l’ensemble des pratiques visant à choisir les chemins d’achat les plus efficaces entre acheteurs et inventaires. Historiquement, la SPO a souvent été réduite à une rationalisation des SSP : réduire le nombre de partenaires, privilégier les deals directs, supprimer les chemins jugés redondants. Cette approche est trop simpliste. Deux SSP peuvent proposer le même domaine, mais pas nécessairement la même qualité d’inventaire, le même accès aux impressions, les mêmes floors, la même latence, ni la même transparence de vendeur.
Les log-level data permettent de dépasser les moyennes agrégées en calculant des métriques par chemin d’achat : domaine, SSP, seat, seller_id, type de vendeur, environnement, format, device et deal. Un framework opérationnel peut s’organiser autour de six indicateurs :
- Taux de duplication : part des requêtes similaires observées via plusieurs SSP dans une fenêtre très courte, par exemple 100 à 500 millisecondes, sur le même domaine, format et contexte.
- Bid rate : part des requêtes sur lesquelles le DSP envoie une enchère. Il mesure l’attractivité ou l’éligibilité du supply.
- Win rate : part des enchères gagnées parmi les bids envoyés. Il renseigne sur la compétitivité du prix et la pression d’enchère.
- Coût total d’accès : différence entre coût média brut, frais technologiques, data fees et revenu net estimé côté éditeur lorsque l’information est disponible.
- Latence : temps entre la réception de la requête, la réponse du DSP et le rendu effectif. Au-delà de 100 à 150 millisecondes, certaines opportunités deviennent moins exploitables selon les environnements.
- Qualité post-impression : viewability, taux de complétion vidéo, invalid traffic, engagement, conversion et valeur client.
Un cas typique illustre l’intérêt de cette lecture. Une agence observe qu’un site premium est accessible via quatre SSP. Le dashboard indique des CPM moyens proches : 3,80 euros, 4,10 euros, 4,25 euros et 4,60 euros. Une analyse log révèle pourtant que le chemin à 3,80 euros concentre 45 % de requêtes dupliquées, une win rate de 3 %, un taux de rendu inférieur de 8 points et un taux de trafic invalide supérieur. Le chemin à 4,25 euros offre moins de volume brut, mais une meilleure viewability et un coût par visite qualifiée plus faible. La décision rationnelle n’est donc pas de choisir le CPM le plus bas, mais le chemin dont la contribution nette est la meilleure.
La SPO mature ne consiste pas à couper vite, mais à tester. Avant d’exclure un SSP ou un seller, il faut mesurer l’impact sur la couverture, la fréquence, le coût marginal, la performance et la diversité d’accès. Dans certains cas, supprimer un chemin redondant réduit les frais sans perte de reach. Dans d’autres, cela augmente la dépendance à un acteur, réduit l’accès à certaines impressions prioritaires ou dégrade la capacité à gagner des enchères sur des audiences rares.
Analyser les floors, le bid shading et la formation réelle du prix
Depuis la généralisation des enchères first-price, la formation du prix est devenue un sujet plus stratégique. Dans un modèle second-price, l’acheteur gagnant payait historiquement un prix proche de la deuxième meilleure enchère. Dans un modèle first-price, il paie davantage son propre bid, ce qui accroît le risque de surpaiement si la stratégie d’enchère n’est pas maîtrisée. Les DSP ont donc développé des mécanismes de bid shading, c’est-à-dire des modèles qui ajustent l’enchère proposée pour éviter de payer trop cher tout en maintenant la probabilité de gagner.
Les logs sont indispensables pour évaluer cette mécanique. Un dashboard agrégé peut montrer un CPM stable, mais masquer une hausse progressive des floors SSP ou une baisse de l’efficacité du shading. Les variables à suivre sont notamment le bid price, le clearing price, le floor price déclaré, la win rate par tranche de prix, le ratio clearing price sur bid price, et l’évolution de ces indicateurs par SSP et par domaine.
Un exemple simplifié : sur un format display 300x250, un DSP enchérit en moyenne à 2,40 euros CPM. Sur le SSP A, le clearing price moyen est de 2,05 euros et la win rate de 22 %. Sur le SSP B, le clearing price est de 2,35 euros et la win rate de 9 %. Si les performances post-impression sont identiques, le SSP A semble plus efficace. Mais si le SSP B donne accès à un inventaire plus visible, avec 68 % de viewability contre 52 %, l’arbitrage doit intégrer le coût par impression visible, pas seulement le CPM gagné. Le CPM visible se calcule en divisant le CPM par le taux de viewability : 2,05 euros à 52 % équivaut à environ 3,94 euros par mille impressions visibles, contre 3,46 euros pour 2,35 euros à 68 %. La conclusion s’inverse.
Les floors dynamiques compliquent encore l’analyse. Certains SSP ajustent les prix planchers selon la demande observée, le type d’acheteur, le deal, le format ou la valeur présumée de l’impression. Cette pratique peut améliorer le rendement éditeur, mais elle peut aussi créer une asymétrie d’information côté acheteur. Les log-level data permettent de repérer les hausses de floors non corrélées à une amélioration de qualité ou de performance. Pour les acheteurs experts, l’objectif n’est pas de faire baisser tous les floors, mais de payer plus cher uniquement lorsque le signal de valeur est démontrable.
Détecter la duplication, les chemins opaques et les risques de qualité média
La duplication des requêtes est l’un des problèmes les plus sous-estimés du programmatique ouvert. Elle se produit lorsqu’une même opportunité d’impression, ou une opportunité très proche, est envoyée à plusieurs SSP, puis transmise plusieurs fois au même DSP. Pour le DSP, cela augmente le volume de QPS, queries per second, nombre de requêtes reçues par seconde, et donc les coûts d’infrastructure. Pour l’acheteur, cela peut provoquer des enchères concurrentes contre lui-même, des signaux de prix bruités et une difficulté à contrôler la fréquence réelle.
Les logs permettent d’identifier des empreintes d’opportunités similaires : timestamp, domaine, emplacement, taille, device, adresse IP tronquée ou identifiant utilisateur lorsque le consentement le permet, user agent, seller_id et identifiant d’enchère. L’objectif n’est pas d’obtenir une correspondance parfaite, souvent impossible, mais de mesurer des clusters de forte probabilité de duplication. Lorsque 40 % des requêtes d’un domaine proviennent de chemins quasi redondants sans différence de performance, la rationalisation devient prioritaire.
Les risques de transparence se lisent aussi dans les champs schain, ads.txt et sellers.json. Ads.txt est un fichier publié par les éditeurs pour déclarer les vendeurs autorisés de leur inventaire web ; sellers.json est un fichier publié par les plateformes pour décrire les entités qui vendent via elles ; schain, supply chain object, documente la chaîne d’intermédiaires dans la bid request. Ces standards ne garantissent pas la qualité, mais ils fournissent une base de contrôle. Une requête sans schain complet, avec seller masqué ou revendeur non autorisé, doit être traitée différemment d’un chemin direct et déclaré.
La brand safety et la fraude doivent être rapprochées des logs, pas uniquement des rapports de vérification. L’IVT, invalid traffic, trafic invalide généré par des bots, fermes de clics, impressions non humaines ou pratiques frauduleuses, peut être analysé par source, domaine, seller, heure, device et type d’inventaire. Une anomalie typique est un taux de clic très élevé sur un inventaire à faible viewability, sans conversion ni engagement post-clic. Une autre est un volume nocturne disproportionné sur des applications peu connues, avec des taux de complétion vidéo artificiellement élevés. Les logs ne remplacent pas les partenaires de vérification, mais ils permettent de relier les alertes qualité aux chemins d’achat précis.
Relier les logs à la performance marketing, pas seulement à l’efficacité média
Le risque d’une analyse log-level est de devenir une optimisation technique déconnectée du business. Réduire la latence, augmenter la win rate ou couper des chemins redondants n’a de valeur que si ces décisions améliorent la contribution marketing. Il faut donc relier les logs aux KPI du funnel : reach qualifié, fréquence utile, visites, leads, ventes, nouveaux clients, marge et attribution. L’attribution désigne la méthode qui assigne une conversion à un ou plusieurs points de contact média ; elle est utile pour piloter, mais ne prouve pas nécessairement la causalité.
Un framework pertinent consiste à créer trois couches de lecture. La première est technique : requêtes, bid rate, win rate, latence, taux de rendu, erreurs créatives. La deuxième est média : CPM, visibilité, complétion vidéo, fréquence, couverture, environnement, brand safety. La troisième est business : CPA, ROAS, valeur de panier, taux de nouveau client, LTV, lifetime value, valeur économique attendue d’un client sur sa durée de relation avec la marque, et incrémentalité. L’incrémentalité mesure la performance réellement causée par l’exposition, par comparaison avec un scénario sans campagne.
Dans un cas e-commerce, deux chemins d’achat peuvent présenter le même CPA attribué de 18 euros. Le premier génère surtout des conversions post-view sur des visiteurs récents déjà exposés à du retargeting. Le second recrute davantage de nouveaux utilisateurs, avec un CPA identique mais une LTV à 6 mois supérieure de 25 %. Sans rattachement CRM ou au minimum un indicateur de nouveau client, l’analyse média conclurait à une équivalence. Avec une lecture business, le second chemin mérite une enchère plus agressive et une protection budgétaire.
La donnée log peut également améliorer les modèles d’attribution. Elle permet de contrôler l’exposition réelle, les impressions non rendues, la fréquence avant conversion, le délai entre exposition et achat, ou la qualité de l’inventaire dans les parcours. Mais il faut rester prudent : disposer d’un log détaillé ne signifie pas prouver l’impact. Les logs décrivent très bien ce qui s’est passé ; ils ne disent pas à eux seuls ce qui se serait passé sans campagne. Pour les décisions budgétaires majeures, les analyses log doivent être complétées par des tests de lift, des holdouts ou du MMM, marketing mix modeling, modélisation statistique agrégée permettant d’estimer la contribution des leviers marketing à partir de séries temporelles.
Gouvernance, confidentialité et conditions d’accès aux données
L’accès aux log-level data soulève des enjeux contractuels, techniques et réglementaires. Tous les DSP et SSP ne fournissent pas le même niveau de détail, ni la même fraîcheur. Certains logs sont accessibles quotidiennement via stockage cloud, d’autres via API, d’autres seulement sous forme agrégée. Les champs les plus sensibles, notamment les identifiants utilisateurs, l’adresse IP, les signaux de consentement ou les données de prix, peuvent être tronqués, hachés ou absents selon les accords.
Le RGPD impose une lecture stricte. Le RGPD, règlement général sur la protection des données, encadre la collecte, le traitement et le partage des données personnelles dans l’Union européenne. Les logs peuvent contenir des données personnelles ou des pseudonymes, même lorsqu’ils ne mentionnent pas directement un nom ou un email. La minimisation, la finalité explicite, la durée de conservation et le contrôle d’accès doivent être intégrés dès la conception. Une analyse de performance ne justifie pas nécessairement la conservation illimitée de logs bruts à granularité utilisateur.
Une gouvernance robuste doit définir les rôles. L’annonceur fixe les objectifs et les seuils économiques. L’agence ou le trading desk exploite les signaux pour optimiser l’achat. Le DSP fournit la logique de décision et les événements d’enchère. Le SSP documente les chemins de vente, les sellers et les règles de floor. Les équipes data assurent la normalisation, la déduplication et l’analyse statistique. Le juridique valide les finalités et les durées de conservation. Sans ce cadre, les logs deviennent un actif sous-utilisé ou un risque opérationnel.
La normalisation est souvent le point le plus difficile. Deux SSP peuvent nommer différemment un même champ, utiliser des identifiants de seller hétérogènes ou transmettre des timestamps avec des précisions différentes. Les deals peuvent être mal renseignés, les domaines canonisés de manière incohérente, les applications identifiées par bundle, nom commercial ou store ID. Avant toute analyse avancée, il faut construire un dictionnaire commun : champs obligatoires, formats, règles de mapping, hiérarchie domaine-app-éditeur-vendeur, nomenclature des formats et protocole de contrôle qualité.
La sécurité compte également. Les logs bruts doivent être stockés dans un environnement contrôlé, avec chiffrement, journalisation des accès, séparation des droits et politiques de purge. Les analyses n’ont pas toutes besoin du niveau utilisateur : beaucoup de diagnostics SPO peuvent être réalisés à un niveau agrégé par domaine, SSP, seller, heure et format. Le principe doit être simple : conserver la granularité nécessaire à la décision, pas plus.
Mettre en place une feuille de route d’analyse log-level
Pour industrialiser l’analyse, il est préférable d’éviter le grand projet monolithique. Une feuille de route pragmatique peut être organisée en quatre horizons. Le premier consiste à obtenir les logs essentiels : bid requests échantillonnées, bids, wins, impressions, coûts, domaines, SSP, seller_id, schain, formats, device, timestamps et signaux de qualité. Même un échantillon de 10 % à 20 % peut suffire pour détecter les principaux problèmes de duplication ou de pricing, à condition qu’il soit représentatif.
Le deuxième horizon est la construction d’un tableau de bord SPO réellement actionnable. Il doit permettre de comparer les chemins par CPM, win rate, bid rate, duplication, viewability, IVT, taux de rendu, conversions et coût par résultat. Les moyennes doivent être complétées par des distributions : un CPM moyen peut masquer des pics de clearing price ; une viewability moyenne peut cacher des inventaires très hétérogènes. Les seuils doivent être définis par objectif de campagne, car une campagne de reach vidéo et une campagne de conversion bas de funnel n’ont pas les mêmes arbitrages.
Le troisième horizon consiste à intégrer les décisions dans l’activation. Cela implique des allowlists et blocklists dynamiques, des ajustements d’enchères par chemin, des deals préférentiels, des exclusions de sellers opaques, des plafonds de fréquence plus cohérents et une adaptation des objectifs d’algorithme. Les logs doivent modifier la manière d’acheter, sinon l’analyse reste décorative. Une bonne pratique consiste à documenter chaque changement : hypothèse, périmètre, date, KPI attendu, groupe de comparaison et résultat.
Le quatrième horizon est l’expérimentation contrôlée. Par exemple, couper un chemin redondant sur 20 % du budget d’un domaine et mesurer l’impact sur la couverture, le CPM, la fréquence, les conversions et la qualité. Ou tester un floor plus élevé en private marketplace contre un open auction supposé équivalent. Ou encore comparer deux SSP sur un même deal éditeur en neutralisant l’audience et la création. Ces tests permettent de distinguer les corrélations observées dans les logs des effets réellement causés par les changements de supply path.
Conclusion : faire des logs un outil de négociation et de pilotage, pas un simple fichier technique
L’analyse des log-level data dans la relation DSP-SSP est devenue un levier de maturité programmatique. Elle permet de comprendre la formation du prix, d’identifier les chemins redondants, de contrôler la qualité média, de réduire les asymétries d’information et de relier l’achat automatisé à des objectifs business plus solides. Mais sa valeur dépend d’une condition : transformer les constats en décisions d’achat mesurables.
Une feuille de route actionnable peut tenir en sept étapes. Premièrement, contractualiser l’accès aux logs utiles dès la sélection des partenaires DSP et SSP. Deuxièmement, normaliser les champs pour comparer les chemins à périmètre constant. Troisièmement, mesurer la duplication, la transparence schain, les floors, la win rate et la qualité post-impression. Quatrièmement, relier ces indicateurs au CPA, au ROAS, à la marge et aux nouveaux clients. Cinquièmement, tester les optimisations SPO avec des groupes de contrôle plutôt que couper massivement. Sixièmement, intégrer les résultats dans les stratégies d’enchères, les deals et les exclusions. Septièmement, mettre en place une gouvernance RGPD, sécurité et conservation adaptée à la sensibilité des données.
Le point critique est d’éviter deux excès. Le premier consiste à rester dépendant de dashboards agrégés, qui simplifient trop la réalité de l’enchère. Le second consiste à croire que la granularité résout tout. Les logs donnent une vision précise du système, mais ils doivent être interprétés avec une méthode, des seuils économiques et des tests. Pour les annonceurs et agences avancés, l’avantage concurrentiel ne vient pas seulement de l’accès à la donnée brute ; il vient de la capacité à l’utiliser pour négocier mieux, acheter plus proprement et prouver plus rigoureusement la contribution du programmatique.