FIABILITE DES DONNEES

fichier-programme-les-reponses-du-questionnaire-dinclusion-sont-elles-fiables-14052025041853.jpg
Publié le : 01/02/2022

1. Pourquoi s’interroger sur la fiabilité de nos données ?

Les données recueillies dans le questionnaire d’inclusion servent à estimer les risques de cancer et d’autres maladies associées aux différents secteurs de production et aux tâches agricoles. Pour certaines maladies, il est également crucial de tenir compte d’autres facteurs de risque comme le tabagisme pour les maladies respiratoires ou l’histoire reproductive pour le cancer de l’ovaire. Par exemple, en 2024, nous avons observé un excès de risque de cancer de l’ovaire associé au travail dans l’élevage de porcs, particulièrement en cas d’exposition pendant la puberté. Ces résultats reposent sur la qualité des informations données par les participantes (dans cet exemple : âge aux premières règles, travail en élevage de porcs). Les analyses de fiabilité permettent de vérifier si les personnes apportent les mêmes réponses à un même questionnaire lorsqu’elles répondent à deux moments différents. Si ce n’est pas le cas, cela signifie que la mémoire des personnes et la manière dont elles répondent sont variables. Dans ce cas, des erreurs peuvent se produire dans l’estimation des risques. La conséquence la plus fréquente est une sous-estimation des liens entre expositions et maladies. Il arrive aussi que des associations fausses apparaissent.

2. Comment avons-nous estimé la fiabilité des données du questionnaire d’inclusion ?

Le questionnaire d’inclusion a été envoyé par voie postale à deux reprises : la première fois en 2005-2006 et la deuxième fois en 2007, normalement réservée à ceux qui n’avaient pas répondu au premier envoi. Cependant, 739 personnes ont répondu par inadvertance aux deux envois, dans un délai qui était en moyenne de 15 mois. Il est donc possible de comparer les réponses données aux mêmes questions lors des deux remplissages et ainsi donner un niveau de fiabilité des données recueillies.

3. La fiabilité des données est-elle bonne dans la cohorte AGRICAN ?

  • Fiabilité des données socio-démographiques, d’habitudes de vie et de santé

La fiabilité des données était élevée ou presque parfaite pour les données de poids, de taille, pour le tabagisme et les données sur l’histoire reproductive (% de concordance > 90%). La fiabilité des données concernant les antécédents de maladies était modérée à élevée (% de concordance > 90%). Seules les données concernant la fréquence de consommation de certains aliments et d’alcool avaient une fiabilité faible à modérée (% de concordance : 30% à 70%). Cette moindre fiabilité peut aussi s’expliquer par des variations réelles des habitudes alimentaires à 15 mois d’écart.

Le graphique suivant présente la proportion de variables par niveau de fiabilité.

  • Fiabilité des données d’expositions professionnelles

Les pourcentages de concordance variaient de 70% à 100% pour les données d’exposition professionnelle. Les données concernant le type de cultures ou d’élevage menés tout au long de la vie avaient une fiabilité élevée, de même que les réponses sur l’utilisation de pesticides sur les animaux ou les cultures. La fiabilité d’autres tâches, plus ponctuelles ou spécifiques, comme les petites façons, le traitement de semences, le semis ou certaines tâches en élevage était plus modérée. La fiabilité des années de début et de fin de tâches était presque parfaite tandis que celle des tailles (nombre d’animaux, surfaces) était élevée à presque parfaite. 

Le graphique suivant présente la proportion de variables d’expositions professionnelles par niveau de fiabilité


4. Ces résultats sont-ils en cohérence avec d'autres études ?

Cette analyse a permis d’estimer la fiabilité des données déclarées dans le questionnaire d’inclusion, à la fois auprès d’hommes et de femmes, de personnes actives mais aussi à la retraite et donc plus âgées, de chefs d’exploitation et de salariés agricoles, et de tous niveaux d’études.

La plupart des précédentes études sur la fiabilité des questionnaires portaient sur des données générales comme les habitudes de vie ou les antécédents médicaux, auprès de patients ou en population générale. Très peu se sont intéressées à la fiabilité d’expositions professionnelles comme celle de l’utilisation de pesticides. Une analyse comparable à la nôtre a cependant été menée dans la cohorte américaine agricole (Agricultural Health Study, échantillon de 4,100 participants). Elle reposait sur une population composée majoritairement de chefs d’exploitation actifs, de sexe masculin avec un niveau de formation plus élevé (résumé en anglais de l’étude publiée par Blair 2002).

Dans notre analyse, les personnes interrogées à deux reprises varient peu dans leurs réponses sur leurs habitudes de vie, leurs données de santé et d’histoire reproductive. Ce constat est observé dans les autres études. En revanche, leurs réponses sont moins concordantes sur les données d’alimentation et de consommation d’alcool. La fiabilité des réponses était élevée voire même presque parfaite pour les expositions agricoles (cultures, élevages, tâches comme l’utilisation de pesticides sur animaux et sur culture, années de début et de fin de réalisation des tâches).

La bonne qualité des données recueillies par questionnaire est une force de notre cohorte. Elle permet d’avoir confiance dans l’évaluation des expositions agricoles des participants et dans les liens entre ces expositions et la santé. La fiabilité des dates recueillies est également cruciale pour estimer les expositions à des molécules pesticides spécifiques à l’aide de la matrice PESTIMAT. Cette matrice nécessite en effet de connaître avec précision les cultures et les années des tâches réalisées sur ces cultures.

Pour en savoir plus:

- Tual S, Lemarchand C, Giovannini J, Boulanger M, Meryet-Figuiere M, Talibov M, Clin B, Morello R, Baldi I, Lebailly P. Reliability of baseline self-reported information in the AGRICAN cohort. Cancer Causes Control. 2022 Feb;33(2):331-342

CONTACTEZ-NOUS
Numero Vert Agrican Web

Du lundi au vendredi, de 9h à 12h30 et de 13h30 à 17h