Lexington Posted October 9, 2008 Report Posted October 9, 2008 J'aimerais faire tourner un bot sur Wikibéral pour réparer les plus grosses erreurs (orthographe, grammaire, ponctuation à la Brugier) de façon automatisée, détecter les bio sans nationalité et pas mal de bricoles de ce genre qui prennent actuellement trop de temps. Vu que Wikibéral utilise le même logiciel que Wikipedia, je pensais que pywikipedia, le support de bot sur WP, pouvait être utilisé. Est-ce que Jabial, Pankkake ou d'autres pourraient me renseigner sur la faisabilité de la chose? Merci
pankkake Posted October 9, 2008 Report Posted October 9, 2008 J'y pensais depuis un moment, mais je n'avais pas vu de besoin très flagrant. A ce que j'ai compris, il y a un "support de bot", qui permet de programmer facilement son bot. Il doit y avoir des exemples pour les corrections d'orthographe, non ?
Lexington Posted October 9, 2008 Author Report Posted October 9, 2008 J'y pensais depuis un moment, mais je n'avais pas vu de besoin très flagrant.A ce que j'ai compris, il y a un "support de bot", qui permet de programmer facilement son bot. Il doit y avoir des exemples pour les corrections d'orthographe, non ? Oui mais j'ai galéré sans y arriver. En m'y mettant un week end je devrais y arriver mais si on peut m'épargner les dizaines d'heures, je suis preneur
pankkake Posted October 30, 2008 Report Posted October 30, 2008 J'ai commencé à essayer de configurer un bot. La config est assez chiante, je n'ai même pas fini (à cause de tous les namespaces) de l'écrire. Je la diffuserai ici
Lexington Posted October 30, 2008 Author Report Posted October 30, 2008 J'ai commencé à essayer de configurer un bot. La config est assez chiante, je n'ai même pas fini (à cause de tous les namespaces) de l'écrire. Je la diffuserai ici Great, moi qui croyais que j'allais devoir relancer le fil je suis agréablement surpris
jabial Posted October 30, 2008 Report Posted October 30, 2008 Tu es bureaucrate sur WL? Faut bien penser à mettre les bons droits au bot pour éviter les captchas.
Lexington Posted October 30, 2008 Author Report Posted October 30, 2008 Tu es bureaucrate sur WL? Faut bien penser à mettre les bons droits au bot pour éviter les captchas. C'est à moi que s'adresse la question? Je n'ai que les droits d'admin en ce moment
jabial Posted October 30, 2008 Report Posted October 30, 2008 Non, je parlais à pankkake qui fait des tests en ce moment. Sinon au pire il peut se mettre les droits lui-même par SQL C'est ce que j'avais fait au début quand Copeau n'était pas dispo pour le faire alors que j'en avais besoin.
pankkake Posted October 30, 2008 Report Posted October 30, 2008 Il utilise l'API (api.php), et visiblement ça marche (j'ai lancé un test mais je n'ai exécuté aucune modif pour l'instant). Après peut-être qu'il faudra créer des utilisateurs spéciaux marqués "bot".
Lexington Posted January 27, 2009 Author Report Posted January 27, 2009 Up Je suis intéressé par n'importe quelle ébauche
pankkake Posted February 20, 2009 Report Posted February 20, 2009 1) Télécharger pywikipedia 2) Créer un fichier families/wikiberal_family.py avec : # -*- coding: utf-8 -*- import family # The Wikiberal family class Family(family.Family): def __init__(self): family.Family.__init__(self) self.name = 'wikiberal' self.langs = { 'fr': 'www.wikiberal.org', } self.namespaces[1] = { '_default': u'Discussion', } self.namespaces[2] = { '_default': u'Utilisateur', } self.namespaces[3] = { '_default': u'Discussion Utilisateur', } self.namespaces[4] = { '_default': u'Wikibéral', } self.namespaces[5] = { '_default': u'Discussion Wikiberal', } def version(self, code): return "1.14" def scriptpath(self, code): return '/w' Attention c'est du python, l'indentation est importante. 3) dans mon user-config.py j'ai : # The family of sites we are working on. wikipedia.py will import # families/xxx_family.py so if you want to change this variable, # you need to write such a file. family = 'wikiberal' # The language code of the site we're working on. mylang = 'fr' # The dictionary usernames should contain a username for each site where you # have a bot account. usernames['wikiberal']['fr'] = u'pankkake' ça se connecte, après je ne suis pas allé vraiment plus loin. Plus de détails : http://meta.wikimedia.org/wiki/Pywikipedia…imedia_projects
Lexington Posted March 4, 2009 Author Report Posted March 4, 2009 1) Télécharger pywikipedia2) Créer un fichier families/wikiberal_family.py avec Attention c'est du python, l'indentation est importante. 3) dans mon user-config.py j'ai : ça se connecte, après je ne suis pas allé vraiment plus loin. Plus de détails : http://meta.wikimedia.org/wiki/Pywikipedia…imedia_projects Je viens d'essayer, ça m'a l'air de marcher et login.py fonctionne Par contre, quand j'essaie de faire des modifications, ça plante systématiquement, avec ce message d'erreur: Que faire?
pankkake Posted March 4, 2009 Report Posted March 4, 2009 Il se goure, ça devrait être http://www.wikiberal.org/w/api.php Il doit me manquer un truc.
Lexington Posted March 5, 2009 Author Report Posted March 5, 2009 Il se goure, ça devrait être http://www.wikiberal.org/w/api.phpIl doit me manquer un truc. Ca ne peut pas se régler par une ligne dans le fichier families indiquant ou chercher l'api?
Lexington Posted March 5, 2009 Author Report Posted March 5, 2009 je pensais que c'était "scriptpath" Ca donnerait quoi en code? Ca ? def scriptpath(self, code): return '/w' J'essaierai chez moi de bidouiller un truc de ce genre
Lexington Posted March 6, 2009 Author Report Posted March 6, 2009 Je vais étudier ça plus en détail, savez vous s'il y a un forum d'aide pywikipedia?
Lexington Posted March 12, 2009 Author Report Posted March 12, 2009 J'ai bidouillé et réussi à faire marcher le bot. Une réinstallation totale a fait marcher les choses Je cherche à faire fonctionner désormais des remplacements de texte automatisés mais ce n'est pas gagné…
Lexington Posted March 12, 2009 Author Report Posted March 12, 2009 petit problème que je rencontre, comment faire un é majuscule (É) dans l'invite de commande windows? J'ai essayé avec la combinaison alt + chiffres mais cela ne fonctionne pas. Je précise que j'ai un portable sans pavé numérique
pankkake Posted March 12, 2009 Report Posted March 12, 2009 Humpf je crois que c'est totalement archaïque et qu'il ne reconnaît pas les caractères unicode. J'y connais rien… peut-être avec PowerShell ?
neuneu2k Posted March 12, 2009 Report Posted March 12, 2009 Humpf je crois que c'est totalement archaïque et qu'il ne reconnaît pas les caractères unicode. Je plussoie, cmd.exe est une bouse sans nom… Et j'ai testé sous powershell, alt+0201 donne bien un É, et visiblement c'est bien passé a un process fils (j'ai fait un python -c "print u'É'" et ça a marché…)
Lexington Posted March 12, 2009 Author Report Posted March 12, 2009 Humpf je crois que c'est totalement archaïque et qu'il ne reconnaît pas les caractères unicode.J'y connais rien… peut-être avec PowerShell ? Connais pas :s Je télécharge Powershell et ça remplace l'invite de commandes windows? Je cherche à faire des corrections automatiques du style oeuvre => œuvre ou Etat => État mais cela impose apparemment de passer par les regex et de les incorporer dans un fichier user-fixes.py Ca va au dela de mes capacités donc je me contenterai de modifications plus simples à entrer
pankkake Posted March 12, 2009 Report Posted March 12, 2009 PowerShell ne remplace pas, il est différent.
Sekonda Posted March 13, 2009 Report Posted March 13, 2009 Tu peux essayer de copier-coller depuis une autre appli. Ce n'est pas idéal mais ponctuellement cela peut aider. Je n'ai pas de Windows sous la main pour vérifier.
Lexington Posted March 13, 2009 Author Report Posted March 13, 2009 Tu peux essayer de copier-coller depuis une autre appli. Ce n'est pas idéal mais ponctuellement cela peut aider. Je n'ai pas de Windows sous la main pour vérifier. C'est probablement ce que je ferai par la suite. Pour l'instant, j'ai expérimenté quelques modifications simples et ça s'est bien passé.
Lexington Posted March 25, 2009 Author Report Posted March 25, 2009 J'ai fait tourner le bot pour détecter les liens externes morts et ainsi les remplacer. Les liens non fonctionnels sont désormais signalés sur la page de discussion des articles. Si vous voyez de tels messages, essayez de trouver ou la nouvelle adresse, ou un autre site proposant le même contenu en ligne et mettez le lien à jour dans l'article puis supprimez le message sur la page de discussion de l'article. J'en profite pour rappeler l'intérêt de mettre au moins le titre de la page liée quand vous faites un lien vers l'extérieur : si le lien ne fonctionne plus, on peut retrouver plus facilement la nouvelle adresse de la page concernée. Exemple, au lieu de mettre le lien brut vers un article du Figaro, mettez le titre et la date.
jabial Posted March 25, 2009 Report Posted March 25, 2009 Ca marche? Normalement il y a un captcha et pour l'éviter il est nécessaire qu'un bot soit dans le bon groupe.
Lexington Posted March 25, 2009 Author Report Posted March 25, 2009 Ca marche? Normalement il y a un captcha et pour l'éviter il est nécessaire qu'un bot soit dans le bon groupe. J'ai demandé à Pankakke d'ajouter Lexibot au bon groupe et ça marche.
Recommended Posts