Retour vers le futur… de l’admissibilité

Tout commence hier soir avec un billet sur Canard WP (je salue le jeu de mot que je n’aurais pas osé trouver), nouveau blog Wikipédien, pour l’instant entretenu par Argos42 mais ce ne sera pas le seul ; blog à la tendance suppressionniste avouée. Le premier billet, facile mais intéressant, revient sur ce qu’il faudrait désormais appeler le « cas Poulpy« , tant le débat devient récurrent : peut-on autoriser la création à la chaîne d’article vraisemblablement admissibles, tous sur le même modèle et le même sujet : volcans, frontières, astéroïdes…

Le problème (et ce ne sera pas le sujet de ce billet), a été maintes fois expliqué par les détracteurs de Poulpy : difficile de retrouver les sources, mise à jour non faite qui rend les articles rapidement caducs, création de milliers de coquilles vides, suivi des articles quasi nul. Il y a également l’argument juridique sur la légalité du repompage automatique de base de données, mais j’ai pas tout compris et je suis aussi inspiré par le droit qu’une poule par un couteau, donc je laisse ceux qui savent dire les choses à ma place. Du côté des soutiens du poulpe wikipédien,on explique au contraire que ces coquilles vides seront plus faciles à améliorer plus tard, que ça permet de créer plein d’articles utiles, et que de toute façon, Wikipédia est aussi là pour s’amuser. Régulièrement, donc, ça pète (exemple 1 ; exemple 2).

Argos part donc de l’exemple des astéroïdes créés par Poulpy, et conclut sur un ton ironique qu’avec plus de 10 millions d’étoiles, on peut facilement décupler automatiquement le nombre d’articles de Wikipédia de façon rapide, avec un programme automatisé, en repompant des bases de données pour faire des articles à base d’infobox et d’une phrase, qui ne resteront à jour que peu de temps. (exemple, qui n’a quasi pas bougé depuis sa création en 2005 et n’a été visité que par des bots ou presque) Alors ; pour ou contre les 10 millions d’étoiles ?

La discussion se poursuit donc sur Twitter (bon nid à billets faciles, du coup ; j’ai bien fait d’y aller), où Alexander Doria (son blog) nous explique que dans l’absolu, 10 000 étoiles, il n’a rien contre. Je réponds donc que je mets au défi quiconque de faire d’un seul de ces articles quelque chose de rédigé, avec paragraphes etc. Or, l’argument d’Alexander Doria touche un point sensible : tous ces corps célestes n’ont pas encore été étudiés par les astronomes.

Bêtement, je pensais qu’un sujet devait avoir été étudié pour figurer sur Wikipédia. J’étais même prêt à défendre bec et ongles un Pokémon s’il a des sources ! Mais si un article doit se limiter à un nom et une taille, on peut, en forçant le trait, créer tout un tas de personnes à partir d’un annuaire téléphonique ou autre base de donnée. De façon plus sérieuse, cela ouvrirait la porte à plein de groupes de musique très confidentiels (genre celui qui joue dans le garage du voisin), au prétexte qu’il à joué à la fête communale de Chimoux-la-Vallée et que peut-être, un jour, des études traiteront du sujet. Bref, en l’état, cette politique me semble se baser avant tout sur un pari sur d’éventuelles futures études, ce qui me semble, sinon nocif, du moins être un détournement assez voyant des principes fondateurs.

Alors bientôt une prise de décision sur l’admissibilité des astéroïdes (suppressionnistes, que faites vous ?) ou, pour prouver que j’ai tort,une amélioration très visible du texte de (214) Aschera (inclusionnistes, que faites vous ?) ? En tout cas un débat qui risque de durer longtemps.

 


15 commentaires

  1. Darkoneko dit :

    Le problème (…) difficile de retrouver les sources

    *Pour les villes, il y a l’INSEE ou d’autres organismes équivalents selon les pays
    *Pour les étoiles, astériodes, il y a bien entendu la NASA, l’ESA et la base de données des instituts recensant les nouvelles découvertes en astronomie
    *les volcans, les frontières, les réacteurs nucléaires(!) etc. Tout ça possède plusieurs BdD d’organisations nationales et internationales.

    Bref, prétendre qu’on ne « peut pas trouver de sources » là dessus, c’est un peu se moquer du monde.

  2. LittleTony87 dit :

    Je ne parle pas de sources en terme de données chiffrées. Je filais juste l’argument donné par Alexander Doria lorsque j’ai proposé d’améliorer au max un de ces articles « pour voir » : un article sur une ville, on sait que ça peut s’améliorer facilement dès qu’on trouve des contributeurs vivant dans ce coin, car il y a toujours des ouvrages locaux etc. Idem (peut-être de façon plus réduite), pour les volcans. Quant aux frontières, je n’ai rien dit contre, au contraire : il est possible de parler de leur histoire etc.

    Je parlais ici des articles sur les astéroïdes. Or, Doria me répond que « les astronomes ne sont pas partout et n’ont donc pas pu tous les étudier ». Je me demande donc ici quel est le potentiel d’un article sur un sujet « pas encore étudié par les spécialistes ».

    Pour prendre un exemple simple et totalement autre : le site Encyclopedia Titanca (Cf ici : http://bibilotitanic.unblog.fr/2011/06/04/encyclopedia-titanica/) donne une fiche succincte sur chaque personne s’étant trouvée à bord du Titanic avec âge, sexe, profession etc., parfois plus quand on connaît un peu le bonhomme. Si je suis ce raisonnement, je peux tous les créer, non ? On va me répondre que non, car anecdotique, rien à dire sur tous etc. (et on aura raison). Pourquoi n’en irait-il pas de même pour les astéroïdes ? Pourquoi un corps céleste dont on connaît seulement la taille et la trajectoire, et pas forcément à jour, serait plus notable qu’un bonhomme dont on connaît les dates de naissance et de mort ? Voila la question que je pose.

  3. Meodudlye dit :

    Alexandre Doria se trompe: les étoiles ont été étudiées, on a tout ce qu’on peut mettre dans une infobox sous la main. Mais rien d’autre non plus.
    @Darkoneko : les bases de données des étoiles n’ont rien à voir avec la Nasa et l’ESA.

  4. Le concombre masqué dit :

    « Bêtement, je pensais qu’un sujet devait avoir été étudié pour figurer sur Wikipédia. »

    Là tu es dans le déni de la réalité, il y a des myriades de « séries » d’articles, certaines admises par des critères d’admissibilité explicites, d’autres par l’usage, qui contiennent des dizaines de milliers d’articles qui ne pourront en aucune façon dépasser le stade de la fiche contenant des informations stéréotypées, parce que leur sujet n’a jamais fait l’objet d’ »études » (universitaires ou même journalistiques ou même d’amateurs plus ou moins éclairés) ni n’est même couvert par des sources autres que des bases de données.

    Exemples :

    * les subdivisions administratives. Parmi les communes de France, toutes n’ont pas fait l’objet de « monographies » tant à la mode autour de 1900 et pour celles qui l’ont été on ne peut franchement affirmer que les sources ainsi compilées sont « de qualité » – ce n’est pas toujours (litote) du travail de titulaire d’une chaire d’histoire. Et au-delà des communes de France, relativement couvertes par des études (quoique pas exhaustivement) on a des articles sur toutes les localités de Serbie ou sur tous les cantons français ; dans ces cas l’existence d’ »études » ou même simplement de sources dépassant la coque stéréotypée (nombre d’habitants, nom des élus…) est exceptionnelle ;

    * les jeux de société pour lesquels des critères spécifiques existent, qui demandent une notoriété minimale mais nullement l’existence d’ »études » ;

    * les compétitions sportives ou les sportifs – des fanatiques de l’admissibilité ont tracé des frontières absolument arbitraires et très méthodiquement respectées (d’un côté de la frontière on efface l’article, de l’autre on conserve la coquille vide), mais il semble clair que du côté conservé il y a des tas de championnats de sports mineurs (voire majeurs !) qui n’ont fait l’objet d’aucune « étude », tiens [[Championnat du Groenland de handball]] au pif

    * les séries télévisées, voire leurs épisodes. Au hasard [[Meurtres à Badger's Drift (téléfilm)]]. Et d’ailleurs aussi les longs métrages cinématographiques sans prétention artistique, disons [[Mon curé chez les Thaïlandaises]] ;

    * etc, etc…

    Le point commun entre tout ça, c’est le goût pour les séries : dès lors qu’un truc se case bien dans une collection qu’on peut déclarer globalement admise (« tous les championnats de hand-ball au niveau d’une fédération nationale », « tous les long-métrages diffusés en salle », « tous les parlementaires », « tous les entiers (enfin pas trop gros) », on admet.

    Tout ça ne me semble pas plus ni moins défendable que les astéroïdes voire les étoiles ; ça l’est moins en un sens parce que les séries avant création sont moins effrayantes : dans chacun de mes exemples il y a au maximum quelques dizaines de milliers d’items (les communes, les long-métrages) et non une dizaine de millions. Mais admettre les séries « si elles ont moins de 100 000 items » ça me semble un peu absurde, tu ne trouves pas ?

  5. argos dit :

    J’ai lancé la discussion pour les astéroïdes sur le portail astronomie. Autant certains astéroïdes sont notoire pour avoir été découverts dans les premiers ou présentent un intérêt particulier… autant la plupart ne sont que des cailloux :-)

  6. LittleTony87 dit :

    @ concombre: oui et non : même à base d’articles ou (j’entends les plus sévères hurler) de sites perso, il est possible de faire quelque chose de pas trop mal sur ces articles. Pas de l’AdQ, mais du potable. Tu cites par exemple les séries : bah regarde les articles anglais sur les épisodes des Simpson, par exemple. On est loin d’une ébauche ou d’une fiche IMDb pour la plupart. Après, bien entendu, il est toujours difficile de trouver des sources nombreuses. Mais quand on racle vraiment dans tous le coins, on trouve de quoi dire, pas grand chose mais ça passe.

    Après, je te suis totalement sur le fait que le raisonnement par critères « et c’est tout » est ridicule : on peut entrer dans les critères et ne pas avoir les sources pour un article et vice versa. Donc oui, je te suis sur ce principe, sauf qu’il sera difficile de revenir sur tout ça (et puis il est toujours possible de trouver des sources, minimes mais des sources, sur des sujets assez mineurs). Par contre, limiter les dégâts sur une plus grande ampleur…

    Et en l’occurence, je pense qu’un projet comme le projet astronomie gagnerait à mettre en valeur les astéroïdes notoires (découverte qui révolutionne le domaine, propriétés étonnantes etc.) en leur donnant deux beaux articles, plutôt que de créer des milliers d’ébauches sur des cailloux qui n’ont pour seul mérite que d’exister, comme le dit argos. Au final, le projet se retrouve à avoir l’air d’un champ de ruines ou le bon est noyé dans l’ébauche in-améliorable, ce qui est dommage.

  7. argos dit :

    Tony, quelle philosophie suppressioniste renversante :-)

    « Et en l?occurence, je pense qu?un projet comme le projet astronomie gagnerait à mettre en valeur les astéroïdes notoires (découverte qui révolutionne le domaine, propriétés étonnantes etc.) en leur donnant deux beaux articles, plutôt que de créer des milliers d?ébauches sur des cailloux qui n?ont pour seul mérite que d?exister, comme le dit argos. Au final, le projet se retrouve à avoir l?air d?un champ de ruines ou le bon est noyé dans l?ébauche in-améliorable, ce qui est dommage. »

    Tiens au passage, maintenant y’a des liens bleus pour les articles et des liens verts pour les ébauches. Y’a moyen de différentier articles et ébauches dans les décomptes ?
    Genre pendant qu’on se vante d’avoir 1 million d’articles, j’aimerais bien savoir quel pourcentage sont des ébauches.

  8. LittleTony87 dit :

    Faut croire que je fais un coming out sans m’en rendre compte ! :D Mais en fait non, je reste persuadé que, sous réserve de sources, tout peut venir dans Wikipédia. Je considère en revanche que quand on crée un article « borderline », il vaut mieux le faire directement avec sources et contenu plutôt qu’en ébauche. Exemple avec tous mes articles sur les EP des Beatles ou sur le Titanic, tous probablement sur la ligne jaune en matière d’admissibilité pure, mais en général rédigés et sourcés.

    Ce qui me gêne plus dans le cas de créations en masse sans suivi (car suivre autant d’articles est impossible), c’est que généralement, il faut de toute façon repasser derrière pour rédiger. Faisable sur de petits projets même si ça prend du temps. Mais sur de gros… D’autant que j’ai, naïvement, en tête que généralement, le créateur est celui qui a les sources les plus adaptées pour écrire.

    Concernant ta remarque, le coup des liens verts se calculant au choix de l’utilisateur avec un « poids » palier, je ne sais pas si on pourrait le traduire en terme de statistiques (d’autant qu’une ébauche peut être lourde en code mais inutilisable ou très mauvaise). Mais il me semble évident qu’on a une grande majorité d’ébauches sur WP. Mais le désébauchage passe selon moi avant tout par l’effort des projets, quand ils sont vivants. Alors au boulot ! :D

  9. Alexander Doria dit :

    Personnellement, je suis assez embarrassé par cette sacralisation de la notion d’article. Il ne s’agit que d’une convenance éditoriale, pas d’un absolu : on confère à un sujet encyclopédique donné un article correspondant dès lors qu’il est suffisamment notable et distinguable. Le seul élément qui devrait entrer en question c’est la lisibilité : est-ce qu’il est plus simple de trouver les informations sur les étoiles dans un tableau ou dans un article autonome ? Tout le reste (la crainte d’un article-boîte-à-lettre, de la création en série) me paraît secondaire.

    @Meodluye : je joue peut-être sur les mots, mais il existe une importante nuance entre le fait de « connaître » une étoile (lui assigner un certain nombre de variables fixes, aisément déterminables) et le fait de l’avoir étudiée (produire une description académique de cet objet en indiquant par exemple : la composition de l’atmosphère, la présence d’exoplanètes etc.)

  10. argos dit :

    Alexander : d’où le problème de se servir du nombre d’articles comme indicateur de la « complétude » de WP.

  11. Alexnader Doria dit :

    @Argos : tout-à-fait. Le problème ce serait de trouver un autre indice de complétude. Peut-être en faisant le total des AdQs, BAs, As et Bs (à supposer que l’on nettoie les évaluations, car bcpde Bs sont usurpés), pour parvenir à définir une somme d’articles convenables ? à la louche, il doit y en avoir de 10 000 à 20 000 sur l’ensemble de la Wikipédia Francophone.

  12. LittleTony87 dit :

    Nettoyer les évaluations, vaste programme ! (qui risque d’ailleurs de ne pas faire consensus) Entre les articles qui ne sont pas évalués (souvent des ébauches d’ailleurs), ceux qui le sont mais n’ont pas été mis à jour etc. Déjà qu’évaluer sérieusement un petit projet de 100 à 500 articles prend un ou deux jours, évaluer un truc monstre comme le projet musique ou le projet cinéma prendrait des semaines, et je ne parle pas de l’ensemble de WP. Remarque, ça ferait grossir des compteurs d’édit !

    J’aurais quand même tendance à voir la louche un peu plus remplie, dans les 50 000, même si les articles « finis » restent rares. Mais il reste selon moi certain que c’est un des points qui décrédibilisent le plus Wikipédia. Mais ça implique aussi pas mal de boulot, pour redresser le niveau. Et d’ailleurs j’y retourne !

  13. Meodudlye dit :

    @Alexandre Doria: je n’ai pas l’impression que tu joues sur les mots, mais plutot qu’il t’a échappé qq infos concernant ces étoiles. Comment veux-tu qu’on les connaisse si on ne les a pas étudiées en détail? Et puis en fait, jouer sur les mots et mécomprendre ce dont ils parlent est une spécialité des arbitres, donc je ne suis pas étonné de te voir faire des commentaires à l’emporte pièce comme tu le fais.

  14. LittleTony87 dit :

    Je ne vois pas le souci dans ce que dit Alexander Doria : en effet une étoile peut-être connue (nom, distance), sans que des études poussées aient été menées à son sujet. J’ai du mal à imaginer que toutes les étoiles jusque là nommées (donc d’une certaine façon connues) soient aussi étudiées en profondeur. Et la question est donc de savoir ce que l’on peut véritablement faire de ces étoiles connues (car découvertes), mais non étudiées.

  15. Meodudlye dit :

    Oui, mais non. Parce que pour connaitre ne serait-ce que sa distance, on a besoin de connaitre sa composition chimique entre autre. Les informations ne viennent pas l’une après l’autre de manière indépendante. Soit on ne sait rien du tout (ce qui est le cas pour la majorité des étoiles) soit on en connait largement assez pour faire une infobox (et rien d’autre). C’est la le souci de ce que dit Alexandre. C’est surtout le souci de voir arriver sur un sujet des gens qui n’y connaissent pas grand chose (ce qui n’est évidemment pas un problème) et qui tiennent à imposer leur vue parce qu’ils pensent s’y connaitre (ce qui est évidemment un problème).

Répondre

tuxouf |
spitik56 |
solidaire maintenant |
Unblog.fr | Créer un blog | Annuaire | Signaler un abus | MJJ et DIANA ROSS
| pokerenreseau
| alice et june paradise :