Calculatrice du rapport d'échantillonnage

Sommaire

1 Comprendre le rapport de l'échantillon

2 Qu'est-ce que le rapport d'échantillon Mismatch?

3 Détection des MRS

4 Interprétation des résultats

5 Exemples

Guide détaillé

Comprendre le rapport de l'échantillon

Introduction au rapport d'échantillonnage

Le Mismatch (SRM) est un concept critique dans la conception expérimentale, en particulier dans les essais A/B et l'analyse des données. Il se produit lorsque le rapport d'échantillons observé dans différents groupes expérimentaux s'écarte significativement du rapport prévu. Ce phénomène sert de système d'alerte rapide que quelque chose peut être mal avec votre conception d'expérience, la mise en œuvre, ou le processus de collecte de données.

Aperçu clé :

Selon les études des grandes entreprises technologiques, environ 6-10% des expériences en ligne connaissent naturellement un certain niveau de MRS. Cependant, lorsque les MRS se produisent plus fréquemment, elles justifient une enquête plus approfondie.

Pourquoi les MRS comptent dans la conception expérimentale

L'importance des MRS ne peut être surestimée dans le contexte de la validité expérimentale. Lorsque vous rencontrez un MRS, il indique habituellement que :

Votre processus de randomisation pourrait être défectueux- Une randomisation adéquate est essentielle pour des conclusions expérimentales valables.
Le biais de sélection peut être présent- Certains types d'utilisateurs pourraient être systématiquement exclus d'une variante.
Des questions techniques pourraient exister- Les erreurs de mise en œuvre peuvent affecter la façon dont les utilisateurs sont affectés ou suivis.
La collecte de données pourrait être incohérente- Les problèmes d'enregistrement ou de suivi pourraient créer des divergences.

MRS dans les essais A/B

Dans les tests A/B, SRM est particulièrement inquiétant car il peut invalider toute votre expérience. Considérez un scénario où vous testez une nouvelle conception de site Web:

Scénario prévu

Variante A: 50% de la circulation (5 000 visiteurs)
Variante B: 50% de la circulation (5 000 visiteurs)

Scénario SRM

Variante A: 60% du trafic (6 000 visiteurs)
Variante B: 40% du trafic (4 000 visiteurs)

Cette scission 60/40 au lieu de la 50/50 prévue pourrait indiquer que certains utilisateurs sont systématiquement exclus de la Variante B, peut-être en raison de problèmes de compatibilité du navigateur ou de défaillances de charge de page. Si tel est le cas, toute différence de taux de conversion pourrait être attribuable au biais de sélection plutôt qu'aux changements de conception réels.

Cadre statistique pour la détection des MRS

La détection des MRS nécessite une approche statistique, le plus souvent en utilisant le test d'indépendance Chi-Square. Ce test permet de déterminer si les différences observées en matière d'allocation sont dues au hasard ou si elles indiquent un problème systématique.

Chi-Square Essai pour les MRS

La formule calcule la différence entre les fréquences observées et les fréquences prévues:

[(observé - attendu)2 / attendu]

La valeur de p qui en résulte indique la probabilité de voir cette allocation par hasard :

Valeur p< 0.01: Strong evidence of SRM
Valeur de p >= 0,01 : Aucune preuve significative de MRS

Causes communes du rapport d'échantillon

Catégorie	Causes courantes
Attribution d'expériences	Algorithmes de randomisation, identifiants corrompus, seautage incorrect
Exécution expérimentale	Différents temps de démarrage pour les variations, délais d'exécution du filtre
Questions techniques	Erreurs JavaScript, pannes de chargement de page, problèmes de compatibilité du navigateur
Collecte de données	Trafic bot, erreurs de suivi, erreurs d'implémentation de l'analyse
Interférence externe	Liens directs partagés sur les réseaux sociaux, expériences recoupantes

Meilleures pratiques de manipulation des MRS

Détection précoce- Vérifiez SRM dès que votre expérience commence à courir
Surveillance régulière- Continuer à vérifier pendant toute la durée de l'expérience
Analyse sectorielle- Déterminer si SRM affecte des segments d'utilisateurs spécifiques (navigateurs, appareils)
Enquête sur les causes profondes- Examiner systématiquement les causes potentielles du tableau ci-dessus
Résultats- Tenir des registres des incidents et des résolutions de MRS pour référence future

MRS contre variation naturelle

Il est important de faire la distinction entre les MRS statistiquement significatifs et les variations naturelles dans la distribution des échantillons :

Variation naturelle

Petites différences dans la répartition (p. ex. 50,5% contre 49,5%) relèvent généralement de la variation statistique attendue.

Important MRS

De plus grandes différences statistiquement significatives (p. ex% vs 45%) indiquent probablement un problème sous-jacent.

Impact sur les décisions des entreprises

Ignorer les MRS peut entraîner des erreurs commerciales coûteuses. Considérez ces scénarios :

Faux positifs- La conclusion incorrecte d'une variation est meilleure quand ce n'est pas
Faux négatifs- Manque d'améliorations réelles dues à des données biaisées
Déchets- Apporter des changements sur la base des résultats d'essais non valides
Erreurs répétées- Propagation de conceptions d'expériences erronées dans les tests futurs

Conseil pratique :

Utiliser notre rapport d'échantillon Calculateur pour déterminer rapidement si votre expérience a une MRS statistiquement significative. Saisissez simplement votre ratio prévu, le ratio observé et la taille de l'échantillon pour obtenir une évaluation immédiate.

MRS avancé Considérations

Pour des modèles expérimentaux plus complexes, il faut tenir compte de ces facteurs supplémentaires :

Utilisateurs vs sessions- Toujours vérifier SRM au niveau de l'utilisateur d'abord, car l'analyse au niveau de la session peut être trompeuse
Essais multivariants- Appliquer les contrôles SRM à toutes les variantes individuellement
Analyse fondée sur le temps- Suivre les modèles de MRS au fil du temps pour détecter les problèmes qui pourraient apparaître après le lancement de l'expérience
Cohérence entre les plaques- Assurer une affectation cohérente entre les différentes plates-formes et appareils

Conclusion

Rapport de l'échantillon Le mismatch est plus qu'une simple anomalie statistique, c'est un indicateur critique de la santé expérimentale. En comprenant, en détectant et en s'adressant à SRM, vous pouvez assurer la validité de vos expériences et la fiabilité de vos décisions d'affaires. Rappelez-vous que même si un certain niveau de MRS se produit naturellement lors d'expériences, la MRS persistante ou importante nécessite des recherches et une résolution pour maintenir l'intégrité des données.

Concept

Qu'est-ce que le rapport d'échantillon Mismatch?

Ratio d'échantillonnage Le Mismatch (SRM) survient lorsque le rapport d'échantillonnage observé dans différents groupes diffère significativement du rapport prévu. Cela peut indiquer des problèmes de randomisation ou de collecte de données dans les expériences.

Points clés:

Indique les problèmes potentiels de randomisation
Peut affecter la validité de l'expérience
Doit être surveillé lors des essais A/B
Nécessite des tests statistiques

Guide

Détection des MRS

Chi-Square Essai

Méthode la plus courante

Essai Z

Pour les grands échantillons

Contrôle visuel

Évaluation initiale

Guide

Interprétation des résultats

Directives d'interprétation

Valeur p< α: Significant mismatch
Valeur de p ≥ α: Pas d'inadéquation significative
Considérer l'impact de la taille de l'échantillon
Vérifier le biais systématique

Exemples

Exemples courants

Exemple 1Aucune perturbation significative

Prévue : 0,5, observée : 0,48, n=1000
Résultat : Non significatif (p > 0,05)

Exemple 2Mismatch significatif

Prévue : 0,5, observée : 0,35, n=1000
Résultat significatif (p< 0.05)

Exemple 3Petit échantillon

Prévue : 0,5, observée : 0,45, n=100
Résultat : Non significatif (p > 0,05)

Calculer le rapport de l'échantillon