Bézoukhov Posted July 20, 2018 Report Share Posted July 20, 2018 Dites les gars, vous faites quoi quand vous perdez 15% sur l’AUC en changeant le random state du train/test split ? (Mais que des gens ont entendu parler du premier AUC) Cette base de données est vraiment toute pourrie. Trop de risques d’overfit. Link to comment
Bézoukhov Posted July 20, 2018 Author Report Share Posted July 20, 2018 C'est les étapes suivantes ; c'est surtout le damage control en com' le truc :p. Après, je vais diffuser des résultats lundi en mettant en gros que ça a été fait sur un coin de table et attention à l'overfit. Link to comment
Mathieu_D Posted July 20, 2018 Report Share Posted July 20, 2018 T'as perdu 15% ou 15 points ? Si tu es passé de 85 à 70 d'AUC c'est vraiment la grosse catastrophe. Link to comment
Bézoukhov Posted July 20, 2018 Author Report Share Posted July 20, 2018 De 75% à 60% ouais :p . C'est pas tant la cata que ça parce qu'on est sur de l'analyse préliminaire à fond et que le data set est pourri, mais c'est relou ^^. Link to comment
Bézoukhov Posted July 20, 2018 Author Report Share Posted July 20, 2018 Une vieille régression logistique ; j'ai dit étude préliminaire :p. Mon objectif c'est surtout de dire aux mecs que les données sont insuffisantes et qu'il faut qu'ils bossent un peu. Link to comment
Bézoukhov Posted July 20, 2018 Author Report Share Posted July 20, 2018 Mmmh. Le forum est public ; c'est délicat à dire :p . Enfin, toute façon, y a 700 lignes pour 100 colonnes _o_. Link to comment
Mathieu_D Posted July 20, 2018 Report Share Posted July 20, 2018 Oulalala fait de la sélection de variables là avant la logistique. Ou pas de logistique. Ou regulariser à fond. Edit j'avais lu 1000 variables. 100 c'est trop ici quand même. Link to comment
Bézoukhov Posted July 20, 2018 Author Report Share Posted July 20, 2018 Je sais bien, c'est très exploratoire (plutôt pour aider à la sélection de variables d'ailleurs). M'enfin, c'est juste que tant de variation sur le train/test split ça m'ennuie ; je vais passer ma vie à faire du 5 folds maintenant. Link to comment
Noob Posted July 26, 2018 Report Share Posted July 26, 2018 Si tu veux faire de la sélection de variable c'est plus de l'analyse de corrélation et à la limite go full PCA, non ? Link to comment
Mathieu_D Posted July 26, 2018 Report Share Posted July 26, 2018 Sujet touchy la selection de variable. (redondance et pertinence) Link to comment
Bézoukhov Posted July 26, 2018 Author Report Share Posted July 26, 2018 Corrélations, aussi un peu de sens métier et tout. L’idee initiale c’est surtout que cette séparation test/train m’a bien mis dedans. Link to comment
Solomos Posted July 27, 2018 Report Share Posted July 27, 2018 19 hours ago, Mathieu_D said: Sujet touchy la selection de variable. (redondance et pertinence) C'est là qu'est tout le plaisir. Link to comment
Mathieu_D Posted July 27, 2018 Report Share Posted July 27, 2018 1 minute ago, Solomos said: C'est là qu'est tout le plaisir. Alors la sélection de variables en non supervisés c'est encore plus fun ! Link to comment
Recommended Posts