Les analyses croisées consistent à traiter simultanément deux questions pour mettre en évidence comment les réponses apportées à l'une coïncident ou dépendent des réponses apportées à l'autre.
Les analyses croisées consistent à traiter simultanément deux questions pour mettre en évidence comment les réponses apportées à l'une coïncident ou dépendent des réponses apportées à l'autre. On parle parfois de variable indépendante et de variable dépendante. Elles forment les deux termes d'une proposition :
Si l’âge est élevé, alors la satisfaction est haute. Si la profession est « cadre », alors l’hébergement le plus fréquent est « hôtel » etc.
Plus généralement, il s’agit de comparer chaque modalité de la question A en fonction de ses réponses à la question B.
Exemple : voir comment chaque tranche d’âge apprécie le goût d'une marque de jus d’orange.
Il s’agit de déterminer si les réponses à la question B (satisfaction vis à vis du goût) varient en fonction des réponses à la question A (tranche d’âge). On étudie alors donc le lien statistique (ou la relation) entre A et B.
N.B : on parle bien de « lien » statistique, de relation, et non pas d’influence de A sur B.
Ces tris conduisent à des tableaux souvent plus complexes et difficiles à analyser que de simples tris à plat : tableaux croisés, tableaux de moyennes etc. Ils nous donnent une première idée des variations ou des interdépendances entre les variables. Mais souvent, si l’on souhaite apporter une réponse plus scientifique et donc plus fiable, un test statistique sera nécessaire, comme nous allons le voir dans les sections à suivre.
Cette série de traitements est dépendante de la nature des questions (variables) à croiser. Comme on l’aura compris dès le début de ce chapitre, on ne fait pas de la statistique de la même manière selon que l’on traite des nombres ou des noms, selon qu’il s’agit de variables numériques ou nominales. Logiquement, les types de traitements diffèrent selon que l'on croise des réponses à des questions fermées (variables nominales) ou des réponses à des questions numériques.
Ainsi, trois méthodes de traitements croisés peuvent être employées selon le type des réponses enregistrées, le tableau récapitulatif ci-dessous en présente une synthèse :
Cas | Exemple | Traitement à mettre en œuvre | Test statistique validant la relation |
Fermée x Fermée | Sexe x Sport pratiqué | Tri croisé | Chi-deux |
Fermée x Numérique | Sexe x Objectif de salaire | Analyse de variance | Test de Fisher |
Numérique x Numérique | Âge x Objectif de salaire | Régression | Coefficient de corrélation |
Trois niveaux de conclusion
Au delà des résultats statistiques, et quelle que soit la nature des variables étudiées, une analyse croisée nécessite une interprétation en 3 niveaux :
- Existe t-il une relation entre les deux variables ?
- Si oui, cette relation est-elle moyenne, forte ou très forte ?
- Si oui, comment se traduit-elle dans les faits ?
Par exemple, il ne suffit pas de conclure que l’objectif de salaire varie en fonction de l’âge de la personne interrogée (1). Il faut ensuite préciser que cette relation est très forte, certaine à 99,5% (2) et qu’elle se traduit par le fait que les personnes âgées de 30 à 40 ans ont les prétentions salariales les plus fortes alors que les moins de 25 ans sont ceux qui l’objectif le plus bas (3).