Aller au contenu

Corrélation et causalité


Messages recommandés

Evénement A : je joue de la trompette.

Evénement B : les flics viennent à mon domicile.

Ah ben voilà un bon exemple qui va permettre de bien expliquer :

fréquence de A : vous jouez de la trompette les jours pairs

malheureusement, par le plus grand des hasards, votre petite sœur a décidé de jouer de la batterie les jours impairs

donc, les flics se pointent tous les jours chez vous

résultat : aucune corrélation entre les jours ou vous jouez de la trompette et ceux ou les flics viennent

voilà, on a toujours une causalité, mais la corrélation n'est pas là à cause d'un autre évènement.

Lien vers le commentaire
résultat : aucune corrélation entre les jours ou vous jouez de la trompette et ceux ou les flics viennent

Dans votre exemple il y a bien une corrélation entre le fait que je joue de la trompette et le fait que les flics viennent les jours pairs (taux de corrélation de 100%).

voilà, on a toujours une causalité, mais la corrélation n'est pas là à cause d'un autre évènement.

Faux.

Il y a deux causalités (la trompette et la batterie) et deux taux de corrélations de 100 % (entre d’une part le fait que je joue de la trompette et la venue des flics les jours pairs et d’autre par le fait que ma sœur joue de la batterie et la venue des flics les jours impairs).

Lien vers le commentaire
Dans votre exemple il y a bien une corrélation entre le fait que je joue de la trompette et le fait que les flics viennent les jours pairs (taux de corrélation de 100%).

Comme on parlait de sciences sociales, on parle bien sûr de corrélation entre des choses mesurables hein, pas des fonctions fantasmées…

Lien vers le commentaire

Si je puis me permettre, au sens mathématique tous les évènements de l'Univers sont corrélés à tous les autres, à la nuance près que cette corrélation peut être plus ou moins grande (et qu'elle est dans la plupart des cas proche de 0, donc non intéressante).

Il s'ensuit que Le sage a raison de dire qu'une causalité implique une corrélation puisque de toute manière tout est corrélé. En revanche il a tort quand il insinue que cette corrélation est forcément élevée.

Prenons un exemple : demain, je me défenestre en glissant sur un canard de bain en plastique. Ce genre de choses arrive peu, il y a donc une corrélation faible (mais malgré tout existante même si il n'est pas très intéressant d'en parler) entre les canards en plastique et les accidents domestiques. Pourtant, il y a clairement causalité entre la présence de ce canard en particulier et de ma chute particulière.

Lien vers le commentaire
Si je puis me permettre, au sens mathématique tous les évènements de l'Univers sont corrélés à tous les autres, à la nuance près que cette corrélation peut être plus ou moins grande (et qu'elle est dans la plupart des cas proche de 0, donc non intéressante).

Il s'ensuit que Le sage a raison de dire qu'une causalité implique une corrélation puisque de toute manière tout est corrélé. En revanche il a tort quand il insinue que cette corrélation est forcément élevée.

Prenons un exemple : demain, je me défenestre en glissant sur un canard de bain en plastique. Ce genre de choses arrive peu, il y a donc une corrélation faible (mais malgré tout existante même si il n'est pas très intéressant d'en parler) entre les canards en plastique et les accidents domestiques. Pourtant, il y a clairement causalité entre la présence de ce canard en particulier et de ma chute particulière.

Voilà.

Une corrélation-n'est pas-un lien-logique bon sang de bois.

Lien vers le commentaire
Même si Kant, c'est l'ennemi. C'est être bien prétentieux que de se vouloir plus puriste que lui en ce domaine.

Ne dis pas de sottise, la notion de cause date d'avant les "sciences humaines". Aristote et toussa.

sans oublier le bouddhisme, voilà juste 3000ans!

par exemple

http://reunion-discussion.fr/ressources/in…&Itemid=455

Lien vers le commentaire
Tout simplement parce que vous avez arbitrairement décidé d’étendre l’étude à l’ensemble des rafales tirées de part le monde et à l’ensemble des morts de part le monde, ce qui n'était pas le cas dans mon exemple. […]

Je pense aussi que l'exemple de Jabial est très particulier : les morts par mitrailleuses sont très rares (rapportées au nombre de morts). Et donc, la corrélation n'est pas mesurable en pratique. Mais en théorie, je pense comme toi que causalité implique corrélation.

Même si un coefficient de corrélation ne mettra rien en évidence dans le cas de la mitrailleuse, il me semble d'une part que :

- plus le nombre de rafales est grand (respectivement petit), plus le nombre de morts tend à être grand grand (respectivement petit),

et que d'autre part :

- plus le nombre de morts que l'on considère est grand (respectivement petit), plus on tend à observer en regard un nombre élevé (respectivement moindre) de gens ayant reçu une rafale.

C'est-à-dire une corrélation. (Certes, en pratique, même en travaillant sur de gros échantillons, on ne verra rien, le nombre de rafales étant bien trop petit).

Je propose un exemple plus significatif :

Voici la causalité : si je me douche alors je suis mouillé.

Même si je peux être mouillé autrement que lors d'une douche (par la pluie par exemple), on va observer (sur un graphique ou par le calcul d'un coefficient de corrélation) une corrélation entre le nombre de fois où je me douche et le nombre de fois où je suis mouillé.

Bref, je te donne raison. Ça me semble évident. (J'avoue avoir un petit doute quand même, à cause de l'évidence justement.)

Lien vers le commentaire
En revanche il a tort quand il insinue que cette corrélation est forcément élevée.

Je n’ai jamais insinué ce genre de chose, j’ai même fait remarquer qu’un taux de corrélation de 100% n’impliquait pas forcement causalité.

Prenons un exemple : demain, je me défenestre en glissant sur un canard de bain en plastique. Ce genre de choses arrive peu, il y a donc une corrélation faible (mais malgré tout existante même si il n'est pas très intéressant d'en parler) entre les canards en plastique et les accidents domestiques. Pourtant, il y a clairement causalité entre la présence de ce canard en particulier et de ma chute particulière.

Si la causalité de votre chute c’est le canard de bain, il y a bien une corrélation entre votre chute et la présence de ce canard.

Il n’y a pas causalité sans corrélation.

Il y a un canard dans votre salle de bain et vous avez chuté ? Le canard n’est pas forcement la cause de votre chute.

Il peut y avoir corrélation sans causalité.

Bref, je te donne raison. Ça me semble évident. (J'avoue avoir un petit doute quand même, à cause de l'évidence justement.)

Apparemment ces notions de corrélation et de causalité ne sont pas si simple que ça, la preuve il y a déjà trois pages de débat :icon_up: , ce que je trouve dommage c’est que malgré la présence d’une vidéo didactique et de nombreux exemples certains s’entêtent, le point positif c’est que le débat n’a pas tourné à l’invective.

Lien vers le commentaire
Apparemment cette notion de corrélation et de causalité n’est pas si simple que ça, la preuve il y a déjà trois pages de débat :icon_up:

La corrélation est une notion statistique, persister à l'appliquer sur des mesures unitaires est une utilisation inutile, donc néfaste, de l'outil.

Lien vers le commentaire
La corrélation est une notion statistique, persister à l'appliquer sur des mesures unitaires est une utilisation inutile, donc néfaste, de l'outil.

Je suis bien d’accord, mais certains de mes interlocuteurs m’ont demandés de l'appliquer aussi sur des mesures unitaires, ceci afin de démontrer la pertinence de mes propos, une alternative aurait consisté à éluder ce type application, ce qui m’aurait sans doute été reproché.

Lien vers le commentaire
Je n’ai jamais insinué ce genre de chose, j’ai même fait remarquer qu’un taux de corrélation de 100% n’impliquait pas forcement causalité.

Et moi ce que je dis c'est qu'il peut y avoir un taux de corrélation négligeable (0.0[…]01%) et malgré tout une causalité directe.

Si la causalité de votre chute c’est le canard de bain, il y a bien une corrélation entre votre chute et la présence de ce canard.

Les statistiques n'ont vocation à s'appliquer que pour des cas généraux et pas sur un cas en particulier. Ici la corrélation n'est pas à rechercher entre MA chute et MON canard, ce qui n'aurait aucun sens, mais bien entre LES chutes en général et LES canards en plastique.

Lien vers le commentaire
Et moi ce que je dis c'est qu'il peut y avoir un taux de corrélation négligeable (0.0[…]01%) et malgré tout une causalité directe.

Je suis parfaitement d'accord.

Les statistiques n'ont vocation à s'appliquer que pour des cas généraux et pas sur un cas en particulier. Ici la corrélation n'est pas à rechercher entre MA chute et MON canard, ce qui n'aurait aucun sens, mais bien entre LES chutes en général et LES canards en plastique.
Je suis bien d’accord, mais certains de mes interlocuteurs m’ont demandés de l'appliquer aussi sur des mesures unitaires, ceci afin de démontrer la pertinence de mes propos, une alternative aurait consisté à éluder ce type application, ce qui m’aurait sans doute été reproché.
Lien vers le commentaire

C’est décourageant, vous venez de démontrer que vous n’avez strictement rien compris.

Donc on recommence :

Etudions les relations de causalité et la corrélation entre la présence de canard en plastique et les accidents domestiques

Admettons une corrélation entre la présence de canard en plastique et les accidents domestiques de 1%.

Sur 1000 accidents domestiques on observe la présence de 10 canards en plastique (faible taux de corrélation, ce qui fera plaisir à Rincevent :icon_up: ).

Un des accidents à pour cause un canard en plastique. >> Il y a causalité, il y a corrélation.

Neuf accidents ont pour cause « autre chose » que le canard en plastique >> Il y a corrélation mais pas causalité (dans ces neuf cas la causalité ce n’est pas le canard en plastique c’est « autre chose »)

Maintenant reprenons votre phrase « si l'on observe pas de corrélation, il n'y a nécessairement pas causalité. Or, bon sang, c'est une vaste connerie. »

Dans notre exemple cela impliquerai une corrélation de 0% (Sur 1000 accidents domestiques on observe la présence de 0 canard en plastique), allez expliquer maintenant que c’est « une vaste connerie » que d’affirmer qu’il n’y a pas de lien de causalité entre ces 1000 incidents domestiques et la présence de canard en plastique !

Lien vers le commentaire

Oulah, je vois plein de grosses erreurs de concept dans le débat: on dirait un article scientifique écrit pas un médecin :icon_up: .

C'est quoi un "taux de corrélation" ??? Si on exprime en pourcentage, je suppose que la notion sous-jacente est le coefficient de détermination R^2, qui quantifie la proportion de variation dans la variable réponse qui peut être attribuer à un ou plusieurs prédicteurs. Mais on l'utilise dans des cas où l'on a 2 variables continues, par exemple pour répondre à la question "Quel différence dans le succès reprodructif est attribuable à la taille ?"

L'exemple de l'accident domestique et du canard n'a rien à voir avec une corrélation, à mon avis la phrase "Admettons une corrélation entre la présence de canard en plastique et les accidents domestiques de 1%."

Dans un tel cas je ferais une étude en catégorisant les gens dans 4 catégories: 1) ceux qui ont un canard et n'on pas eu d'accident, 2) ceux qui ont un canard et qui on eu un accident, 3) ceux qui n'ont pas de canard et qui n'ont pas eu d'accident, 4) et ceux qui n'ont pas de canard et qui ont eu un accident. Avec une approche "odd ratio" on peut évaluer le risque relatif d'avoir un canard ET avoir un accident par rapport au groupe sans canard, et éventuellement en tirer une conclusion de causalité, mais cette conclusion devrait être étayer par une explication plausible (en l'occurence, on pourrait apporter une documentation, comme des vidéo montrant des personnes chutant à cause d'un canard).

Lien vers le commentaire
C'est quoi un "taux de corrélation" ??? Si on exprime en pourcentage, je suppose que la notion sous-jacente est le coefficient de détermination R^2, qui quantifie la proportion de variation dans la variable réponse qui peut être attribuer à un ou plusieurs prédicteurs.

On parle bien du coefficient de corrélation. On parle de coefficient de détermination quand on fait une reg lin.

corrélation

edit : bon, et je dois bien admettre, en théorie, l'argument du sage est pas complètement con : une causalité entraîne toujours une corrélation partielle.

Le problème, c'est qu'on peut calculer une corrélation partielle quand on a le terme général d'une fonction par rapport à tous ses paramètres.

Hors en sciences sociales, tout ce qu'on a, c'est une MESURE de la fonction en fonction du temps seulement, et pas de n'importe quel paramètres.

Donc non, on n'aura pas forcément une corrélation même quand on a une causalité.

Le sage, les liens que vous avez fait entre les jours de trompette et la venue des flics et les jours de batteries et la venue des flics sont des corrélations partielles.

Lien vers le commentaire
Et moi ce que je dis c'est qu'il peut y avoir un taux de corrélation négligeable (0.0[…]01%) et malgré tout une causalité directe.

Les statistiques n'ont vocation à s'appliquer que pour des cas généraux et pas sur un cas en particulier. Ici la corrélation n'est pas à rechercher entre MA chute et MON canard, ce qui n'aurait aucun sens, mais bien entre LES chutes en général et LES canards en plastique.

Pour illustrer: entre Bouddhisme et Libéralisme, corrélation improbable, je suis à vu de nez la seule sur ce forum!

et rare sont les bouddhistes qui se passionnent aussi pour l'économie, en tous cas personne ne fait de stats sur cette population!

Mais je peux vous expliquer très logiquement le lien de causalité qui fait qu'après des dizaines d'années à étudier le bouddhisme et l'appliquer, quand je m'intéresse à l'économie je tombe "par hasard" sur Catallaxia et me sens tout à fait libérale depuis…la nuit des temps?et incapable, en économie, d'être autre chose,( même si sur les sujets annexe, il y à parfois…un monde)

Donc, pour l'instant, entre bouddhisme et libéralisme, zéro corrélation, mais causalité directe!

Lien vers le commentaire

Reprenez la division en quatre catégories des personnes ayant eu un accident, ce que je dit c’est qu’on ne peut en aucun cas parler de lien de causalité entre le fait d’avoir un canard chez soi et un accident si l’on appartient à la quatrième catégorie (aucune corrélation).

Il y a corrélation uniquement pour la deuxième catégorie (ceux qui ont un canard et qui on eu un accident), mais il n’y a pas forcement un lien de causalité avec le canard pour chacun de ces accidents.

Ce n'est pas parce qu'il y a corrélation qu'il y a causalité.

Lien vers le commentaire
On parle bien du coefficient de corrélation. On parle de coefficient de détermination quand on fait une reg lin.

corrélation

Pas tout à fait…

Il faut lire aussi ça:

http://en.wikipedia.org/wiki/Coefficient_of_determination

Si on parle en %, on fait référence au coefficient de détermination, pas au coefficient de corrélation. Le premier est le second au carré, mais en fait il s'agit de 2 notions assez différentes à ne pas confondre. Du reste, le coefficient de détermination se calcul pour toute sorte de modèles, pas seulement le modèle linéaire, et donc est plus général que le coefficient de correlation linéaire.

Lien vers le commentaire

Définir une causalité c’est rendre un fait intelligible en répondant à la question "pourquoi ce fait a-t-il lieu ?

Si vous affirmez que vous êtes libérale parce que vous êtes bouddhiste il faut aussi qu’il y est corrélation entre le fait que vous soyez bouddhiste et le fait que vous soyez libéral, ce qui est semble t’il votre cas. (Un lien de causalité nécessite une corrélation)

Maintenant, ce n’est pas pour autant que tous les bouddhistes sont libéraux (corrélation ne signifie pas causalité).

Lien vers le commentaire
Pas tout à fait…

Il faut lire aussi ça:

http://en.wikipedia.org/wiki/Coefficient_of_determination

Oui vous avez raison, d’un strict point de vue statistique plutôt que d’utiliser des pourcentages dans nos exemples nous aurions du utiliser un coefficient, compris entre -1 et +1, 0 signifiant que les faits sont indépendants (non corrélés), -1 et +1 indiquant un fort degré de dépendance (une forte corrélation).

Je ne suis pas sur que cela aurait pour autant contribué à la clarté du débat et cela n’aurait de toute façon rien changé au raisonnement.

Lien vers le commentaire
Pour illustrer: entre Bouddhisme et Libéralisme, corrélation improbable, je suis à vu de nez la seule sur ce forum!

Oui enfin la c'est la correlation entre Bouddhiste et Francophone qui est faible, le forum est francophone en plus d'etre liberal.

Les bouddhistes sont surement pas moins liberaux que les autres.

Lien vers le commentaire

A partir du moment où il a des gens qui adhèrent au bouddhisme et au libéralisme il y a corrélation entre ces deux adhésions (que la corrélation soit faible, comme c’est apparemment le cas sur ce forum, ou élevée).

C’est la condition minimum nécessaire pour pouvoir prétendre établir un lien de causalité entre les deux.

Lien vers le commentaire
Oui vous avez raison, d’un strict point de vue statistique plutôt que d’utiliser des pourcentages dans nos exemples nous aurions du utiliser un coefficient, compris entre -1 et +1, 0 signifiant que les faits sont indépendants (non corrélés), -1 et +1 indiquant un fort degré de dépendance (une forte corrélation).

Non… :icon_up:

Bon ce fil me gonfle.

Lien vers le commentaire
C’est la condition minimum nécessaire pour pouvoir prétendre établir un lien de causalité entre les deux.
Pas tellement, dans l'établissement de modèles il importe de savoir avant l'étude quelles sont les grandeurs qui ont un lien de causalité, pour ensuite établir le lien statistique entre elles.

Par exemple dans l'industrie, si je cherche à affiner un modèle thermodynamique quelconque pour obtenir un produit à une certaine température, je vais chercher un physicien qui me fera l'inventaire de toutes les variables qui ont possible une influence sur ce que je cherche à contrôler. Très probablement, il ne me mettra pas l'âge du technicien qui pilote la machine car il estimera que cette variable n'aura pas de cause sur le résultat. Toutefois, si je regarde les variables sélectionnées, il est très probable qu'un bon nombre n'aura pas non plus de corrélation directe avec le résultat (en tout cas valable statistiquement, soit avec un R² > 0,8), tout simplement parce que dans notre univers c'est une combinaison de causes qui produit un effet, et pas chaque cause prise indépendamment.

La corrélation, c'est juste la traduction statistique de la cause la plus simple : est-ce que quand machin augmente, bidule augmente ou bidule diminue. Mais si on se rappelle que ça n'a un sens statistique que si la valeur absolue dépasse les 0,9, ça laisse beaucoup de calculs se terminer en queue de poisson avec pour seule conclusion : y a pas l'air d'avoir de lien entre machin et bidule.

En d'autres termes, c'est pas parce que la neige a une température qu'on dit "la neige est chaude". C'est pas parce que deux variables ont un coefficient de corrélation qu'on dit "elles sont corrélées".

Lien vers le commentaire
A partir du moment où il a des gens qui adhèrent au bouddhisme et au libéralisme il y a corrélation entre ces deux adhésions (que la corrélation soit faible, comme c’est apparemment le cas sur ce forum, ou élevée).

C’est la condition minimum nécessaire pour pouvoir prétendre établir un lien de causalité entre les deux.

Non. Il y a corrélation quand on observe que les bouddhistes adhèrent plus ou moins facilement en terme statistique au libéralisme.

Et même recevoir le Prix Nobel. Ta conception est tellement circulaire qu'elle en viendrait à dire que l'on ne peut parler de causalité entre tabagisme lourd et cancer de la gorge. :icon_up:

Splendide exemple qui va dans mon sens!

Le cancer de la gorge, comme tous les cancers, est une maladie multifactorielle. La tabac est un facteur de risque parmis d'autres, comme l'alcool. Il y a corrélation positive entre le tabac et le cancer de la gorge, pas de causalité.

Lien vers le commentaire
Non. Il y a corrélation quand on observe que les bouddhistes adhèrent plus ou moins facilement en terme statistique au libéralisme.

Vous écrivez « non » sous une phrase pour écrire… la même chose. Oui, une corrélation c’est une mesure statistique, dire qu’il y a corrélation revient à dire qu’il y a coïncidence. Cette coïncidence peut être occasionnelle ou rare (ex : quelques bouddhistes sont libéraux => Faible corrélation) ou systématique (ex : tous les bouddhistes son libéraux => Forte corrélation).

Splendide exemple qui va dans mon sens!

Le cancer de la gorge, comme tous les cancers, est une maladie multifactorielle. La tabac est un facteur de risque parmis d'autres, comme l'alcool. Il y a corrélation positive entre le tabac et le cancer de la gorge, pas de causalité.

On peut seulement affirmer que certains cancers de la gorge ont pour cause le tabagisme lourd.

Le fait que le cancer de la gorge soit d’origine multifactoriel ne change rien au raisonnement, si par exemple vous souhaitiez démontrer que les cancers de la gorge ont pour origines plusieurs causes il faudrait donc qu’il y est corrélation entre ces cancers et ces causes.

Il y a des expositions qui favorisent quasi systématiquement le développement de certains cancers ; une forte exposition aux fibres d’amiantes peut entraîner un cancer de la plèvre, une exposition à de forte dose de radiation peut entraîner un cancer de la thyroïde.

Parler de causalité entre cancer de la thyroïde et exposition aux radiations, nécessite corrélation entre ces cancers et ces expositions, parler de causalité entre cancer de la plèvre et exposition aux fibres d’amiantes nécessite corrélation entre ces cancers et ces expositions.

Lien vers le commentaire

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×
×
  • Créer...