Aller au contenu

Club ouvert  ·  36 membres

Wikibéral

Bot


Lexington

Messages recommandés

Posté

J'aimerais faire tourner un bot sur Wikibéral pour réparer les plus grosses erreurs (orthographe, grammaire, ponctuation à la Brugier) de façon automatisée, détecter les bio sans nationalité et pas mal de bricoles de ce genre qui prennent actuellement trop de temps.

Vu que Wikibéral utilise le même logiciel que Wikipedia, je pensais que pywikipedia, le support de bot sur WP, pouvait être utilisé. Est-ce que Jabial, Pankkake ou d'autres pourraient me renseigner sur la faisabilité de la chose?

Merci

Posté

J'y pensais depuis un moment, mais je n'avais pas vu de besoin très flagrant.

A ce que j'ai compris, il y a un "support de bot", qui permet de programmer facilement son bot.

Il doit y avoir des exemples pour les corrections d'orthographe, non ?

Posté
  pankkake a dit :
J'y pensais depuis un moment, mais je n'avais pas vu de besoin très flagrant.

A ce que j'ai compris, il y a un "support de bot", qui permet de programmer facilement son bot.

Il doit y avoir des exemples pour les corrections d'orthographe, non ?

Oui mais j'ai galéré sans y arriver. En m'y mettant un week end je devrais y arriver mais si on peut m'épargner les dizaines d'heures, je suis preneur :icon_up:

  • 3 weeks later...
Posté

J'ai commencé à essayer de configurer un bot. La config est assez chiante, je n'ai même pas fini (à cause de tous les namespaces) de l'écrire. Je la diffuserai ici :icon_up:

Posté
  pankkake a dit :
J'ai commencé à essayer de configurer un bot. La config est assez chiante, je n'ai même pas fini (à cause de tous les namespaces) de l'écrire. Je la diffuserai ici :doigt:

Great, moi qui croyais que j'allais devoir relancer le fil je suis agréablement surpris :icon_up:

Posté
  jabial a dit :
Tu es bureaucrate sur WL? Faut bien penser à mettre les bons droits au bot pour éviter les captchas.

C'est à moi que s'adresse la question? Je n'ai que les droits d'admin en ce moment

Posté

Non, je parlais à pankkake qui fait des tests en ce moment. Sinon au pire il peut se mettre les droits lui-même par SQL :icon_up: C'est ce que j'avais fait au début quand Copeau n'était pas dispo pour le faire alors que j'en avais besoin.

Posté

Il utilise l'API (api.php), et visiblement ça marche (j'ai lancé un test mais je n'ai exécuté aucune modif pour l'instant).

Après peut-être qu'il faudra créer des utilisateurs spéciaux marqués "bot".

  • 2 months later...
  • 4 weeks later...
Posté

1) Télécharger pywikipedia

2) Créer un fichier families/wikiberal_family.py avec :

# -*- coding: utf-8  -*-

import family

# The Wikiberal family

class Family(family.Family):
def __init__(self):
	family.Family.__init__(self)
	self.name = 'wikiberal'
	self.langs = {
		'fr': 'www.wikiberal.org',
	   }

	self.namespaces[1] = {
		'_default': u'Discussion',
	}
	self.namespaces[2] = {
		'_default': u'Utilisateur',
	}
	self.namespaces[3] = {
		'_default': u'Discussion Utilisateur',
	}
	self.namespaces[4] = {
		'_default': u'Wikibéral',
	}
	self.namespaces[5] = {
		'_default': u'Discussion Wikiberal',
	}

def version(self, code):
	return "1.14"

def scriptpath(self, code):
	return '/w'

Attention c'est du python, l'indentation est importante.

3)

dans mon user-config.py j'ai :

# The family of sites we are working on. wikipedia.py will import
# families/xxx_family.py so if you want to change this variable,
# you need to write such a file.
family = 'wikiberal'

# The language code of the site we're working on.
mylang = 'fr'

# The dictionary usernames should contain a username for each site where you
# have a bot account.
usernames['wikiberal']['fr'] = u'pankkake'

ça se connecte, après je ne suis pas allé vraiment plus loin.

Plus de détails : http://meta.wikimedia.org/wiki/Pywikipedia…imedia_projects

  • 2 weeks later...
Posté
  pankkake a dit :
1) Télécharger pywikipedia

2) Créer un fichier families/wikiberal_family.py avec

Attention c'est du python, l'indentation est importante.

3)

dans mon user-config.py j'ai :

ça se connecte, après je ne suis pas allé vraiment plus loin.

Plus de détails : http://meta.wikimedia.org/wiki/Pywikipedia…imedia_projects

Je viens d'essayer, ça m'a l'air de marcher et login.py fonctionne

Par contre, quand j'essaie de faire des modifications, ça plante systématiquement, avec ce message d'erreur:

sanstitrevst.jpg

Que faire?

Posté
  pankkake a dit :
je pensais que c'était "scriptpath"

Ca donnerait quoi en code? Ca ?

def scriptpath(self, code):
	 return '/w'

J'essaierai chez moi de bidouiller un truc de ce genre

Posté

J'ai bidouillé et réussi à faire marcher le bot. Une réinstallation totale a fait marcher les choses :icon_up:

Je cherche à faire fonctionner désormais des remplacements de texte automatisés mais ce n'est pas gagné…

Posté

petit problème que je rencontre, comment faire un é majuscule (É) dans l'invite de commande windows? J'ai essayé avec la combinaison alt + chiffres mais cela ne fonctionne pas. Je précise que j'ai un portable sans pavé numérique

Posté
  pankkake a dit :
Humpf je crois que c'est totalement archaïque et qu'il ne reconnaît pas les caractères unicode.

Je plussoie, cmd.exe est une bouse sans nom…

Et j'ai testé sous powershell, alt+0201 donne bien un É, et visiblement c'est bien passé a un process fils (j'ai fait un python -c "print u'É'" et ça a marché…)

Posté
  pankkake a dit :
Humpf je crois que c'est totalement archaïque et qu'il ne reconnaît pas les caractères unicode.

J'y connais rien… peut-être avec PowerShell ?

Connais pas :s

Je télécharge Powershell et ça remplace l'invite de commandes windows?

Je cherche à faire des corrections automatiques du style oeuvre => œuvre ou Etat => État mais cela impose apparemment de passer par les regex et de les incorporer dans un fichier user-fixes.py

Ca va au dela de mes capacités donc je me contenterai de modifications plus simples à entrer :icon_up:

Posté

Tu peux essayer de copier-coller depuis une autre appli. Ce n'est pas idéal mais ponctuellement cela peut aider. Je n'ai pas de Windows sous la main pour vérifier.

Posté
  Sekonda a dit :
Tu peux essayer de copier-coller depuis une autre appli. Ce n'est pas idéal mais ponctuellement cela peut aider. Je n'ai pas de Windows sous la main pour vérifier.

C'est probablement ce que je ferai par la suite. Pour l'instant, j'ai expérimenté quelques modifications simples et ça s'est bien passé.

  • 2 weeks later...
Posté

J'ai fait tourner le bot pour détecter les liens externes morts et ainsi les remplacer. Les liens non fonctionnels sont désormais signalés sur la page de discussion des articles. Si vous voyez de tels messages, essayez de trouver ou la nouvelle adresse, ou un autre site proposant le même contenu en ligne et mettez le lien à jour dans l'article puis supprimez le message sur la page de discussion de l'article.

J'en profite pour rappeler l'intérêt de mettre au moins le titre de la page liée quand vous faites un lien vers l'extérieur : si le lien ne fonctionne plus, on peut retrouver plus facilement la nouvelle adresse de la page concernée. Exemple, au lieu de mettre le lien brut vers un article du Figaro, mettez le titre et la date.

Posté
  jabial a dit :
Ca marche? Normalement il y a un captcha et pour l'éviter il est nécessaire qu'un bot soit dans le bon groupe.

J'ai demandé à Pankakke d'ajouter Lexibot au bon groupe et ça marche.

×
×
  • Créer...