Wikipédia Discussão:Avaliação automática – Wikipédia, a enciclopédia livre

Artigos de qualidade um ou dois

Proponho criarmos uma categoria para artigos de "qualidade 1 ou 2".

Pela escala de qualidade, artigos sem fontes tem qualidade 1 ou 2, nunca mais que isso. Seria possível criarmos uma cat para esses artigos (artigos com qualidade 1 ou 2) marcada por um bot (sem link externo, sem ref, sem seções relacionadas), de modo que eles fiquem separados do resto?

Isso vai ajudar no trabalho manual, pois já sabemos q esses artigos realmente não tem fonte, e já vemos os artigos pensando (é 1 ou 2), sendo mais rápido determinar a qualidade (será só ver o tamanho do artigo). E ao menos fala mais informações que "qualidade desconhecida".

Rjclaudio ^msg 16h10min de 12 de fevereiro de 2011 (UTC)[responder]

Mas eles já não são categorizados nas páginas de discussão, através da predefinições de avaliação? Flávio, o Maddox ^{(msg! • contrib)} 19h02min de 12 de fevereiro de 2011 (UTC)[responder]

Sim, mas queria que aceitasse colocar |qualidade=1-2 (qualidade 1 ou 2) e fazer a cat nessa nova categoria. Essa separação é importante como falei acima, pelo menos pra mim q prefiro avaliar 50 artigos que tem grandes chances de ter qualidade 3 pra cima, que avaliar 500 artigos de qualidade 1 ou 2. Do jeito atual nem tenho vontade de avaliar pq a maioria é tudo 1 ou 2. Rjclaudio ^msg 19h16min de 12 de fevereiro de 2011 (UTC)[responder]

Concordo para qualidade 1. Um bot pode marcar todos arigos com menos de X bytes com qualidade 1, mas para saber se é 2 não depende só do tamanho e das marcações de sem-fontes ou esboço, é preciso verificar o nível wikificação, se o assunto exige caixa de informação, se não existe outros problemas, não é algo que um bot possa analizar. E também, se fosse qualidade "1 ou 2" complicaria as já complicadas tarefas dos wikiprojetos. Marcar todas qualidades 1 já ajudaria bastante. ^Danilo.mac_(discussão) 19h42min de 12 de fevereiro de 2011 (UTC)[responder]

concordo para qualidade 1, neutro para qualidade 2. O que seria avaliado para deixar um artigo na qualidade 2? OTAVIO1981 (discussão) 12h48min de 14 de fevereiro de 2011 (UTC)[responder]

Proposta 1. Já q não dá pra preencher com "1 ou 2" pq pode causar confusão, um bot poderia produzir uma lista de artigos que tem a marca x e que não tem fonte, para alguém do projeto fazer a avaliação manualmente? Ex, tenho interesse em música, e quero fazer a avaliação. Primeiro pediria pra um bot fazer essa lista e depois passava pelos artigos fazendo a avaliação. É um modo de separar o trabalho. Seria como cruzar os artigos da cat "qualidade desconhecida" + "sem fontes"

Proposta 2. Pra qualidade 2 há uma opção pros bots: se o artigo não tem fonte, não importa o tamanho ele não pode ter qualidade maior que 2, certo? O critério para passar de 2 para 3 é ter verificabilidade. Então o bot pode fazer a avaliação para artigos com mais de x bytes (não pode ser pouco para não ter dúvidas) e que não tenham fontes (nenhuma url, nem ref, nem seção relacionada, só pra ter certeza) e colocar a qualidade 2.

Rjclaudio ^msg 12h58min de 14 de fevereiro de 2011 (UTC)[responder]

Na verdade, se um artigo não tem fontes, ele não deveria ser nem qualidade 2... Há uma inversão de valores quando um esboço referenciado é "1" e um artigo extenso sem referências é "2". A possibilidade do segundo ser pior é consideravelmente maior. Flávio, o Maddox ^{(msg! • contrib)} 13h10min de 14 de fevereiro de 2011 (UTC)[responder]

Segundo a escala Wikipédia:Versão 1.0/Avaliação q foi mt discutida, "1- Reservado aos artigos esboçados não referenciados. 2- Reservados aos artigos extensos não referenciados." Então sim, sem fonte pode ser 1 ou 2, dependendo da quantidade de conteúdo. Se essa escala está perfeita ou não já é outro assunto, e pela extensão daquela discussão é algo q nem quero pensar. Rjclaudio ^msg 13h14min de 14 de fevereiro de 2011 (UTC)[responder]

De fato a escala não é perfeita e a intenção era tirar do 1 artigos com algum potencial para serem melhorados. Se é informativo, apresentando seções, boa formatação, wikificação e conteúdo já é um ponto de partida para trabalhar. Na qualidade 1 este artigo ficaria com muitos outros sem condição alguma de serem amplicados. Um esboço referenciado também é 2 por acaso. Importante ressaltar também que as classificações de projeto são para uso interno da wikipédia do que ainda precisa ser melhorado para chegar a algum lugar, e não refletem necessariamente a condição ideal do artigo.OTAVIO1981 (discussão) 13h31min de 14 de fevereiro de 2011 (UTC)[responder]

A respeito das propostas, concordo com as duas. OTAVIO1981 (discussão) 13h31min de 14 de fevereiro de 2011 (UTC)[responder]

Da mesma página, sobre "qualidade 2": Geralmente possui mais de um extenso parágrafo, podendo ou não conter alguma(s) seção(ões). Com ou sem imagem, está formatado e referenciado. Conteúdo pouco trabalhado, porém objetivo e informativo, passa mais afluentes e uma ou outra especificidade. Por isso, discordo da proposta 2.

Flávio, o Maddox ^{(msg! • contrib)} 13h42min de 14 de fevereiro de 2011 (UTC)[responder]

São dois tipos de artigos que tem qualidade 2. Ou esboço referenciado, ou artigo desenvolvido não referenciado. Não é apenas esboço referenciado, é um ou outro. Assim como na qualidade 1, ou é mínimo ou é esboço não referenciado. A edição que você fez mudou o sentido do critério.

Na seção generalidades diz "Como princípios da Wikipédia, a imparcialidade e a verificabilidade, enquanto critérios avaliativos, reduzem a qualificação dos artigos diante do método de escolha.". Ou seja, o esboço se tiver ref é qualidade 2, se não tiver é qualidade 1. Se o artigo é maior q esboço e tem ref é qualidade 3, se não tiver é qualidade 2. A falta de ref diminui a qualidade em 1, não força a qualidade para 1.

Na coluna critérios de avaliação: 2.1 "Este desqualificou-se em um nível devido a sua falta de verificabilidade." (grande sem WP:V) 2.2 "Com ou sem imagem, está formatado e referenciado." (esboço com WP:V).

Na coluna Para o editor: "Edição substancial é necessária e muitas informações devem ser adicionadas ou referenciadas. Pode apresentar a ausência de caixa de informação e certos moldes de wikificação, que não os básicos, como categoria. Para os artigos extensos, (ou seja, a partir daqui é para os extensos sem WP:V, antes era para esboços com alguma WP:V) providenciar referências ainda ausentes."

A própria discussão da escala diz isso, se bem me lembro quando participei. Só não vou procurar onde está.

Rjclaudio ^msg 14h06min de 14 de fevereiro de 2011 (UTC)[responder]

Veja também os dois exemplos dados para qualidade 2: Zoltán Magyar é esboço referenciado e Hot Wheels AcceleRacers está bem desenvolvido e sem referências. Vai me dizer que os usuários que fizeram a escala erraram na hora de colocar o exemplo? É mais fácil pensar q sua interpretação está errada. Rjclaudio ^msg 14h15min de 14 de fevereiro de 2011 (UTC)[responder]

Sobre as propostas: A lista gerada por bots só deve ser usada quando quando não existe outra forma, pois ela precisará ser frequentemente atualizada. Para gerar lista dos artigos marcados por um projeto e que têm marca de sem-fontes pode-se usar o CatScan. Para gerar lista de todos artigos sem fontes com mais de X bytes pode-se adicionar na {{sem-fontes}} um código usando {{PAGESIZE:{{PAGENAME}}}} para colocar os artigos maiores que X bytes numa categoria "!Artigos grandes sem fontes". ^Danilo.mac_(discussão) 14h43min de 14 de fevereiro de 2011 (UTC)[responder]

Diante do exposto pelo Rjclaudio, entendo que os usuários que fizeram a escala erraram. Não na hora de colocar o exemplo, mas ao relativizar WP:CITE. Isso, entretanto, abordarei numa outra proposta, com o objetivo de modificar essa escala de avaliação.

O que está sendo discutido aqui é a categorização automática como "qualidade 1" e "qualidade 2". Como os critérios para o primeiro grupo estão mais definidos, já que os "2" podem ou não ter referências,

continuo concordando apenas com a automatização do primeiro grupo, dentro do definido também pro grupo 2. Flávio, o Maddox ^{(msg! • contrib)} 15h35min de 14 de fevereiro de 2011 (UTC)[responder]

Pergunta Artigos mínimos, mesmo com uma ou duas referências, são considerados sempre "de qualidade 1", certo? Flávio, o Maddox ^{(msg! • contrib)} 14h27min de 25 de fevereiro de 2011 (UTC)[responder]

Sim. Mínimo sempre 1, independente de WP:V. Rjclaudio ^msg 14h44min de 25 de fevereiro de 2011 (UTC)[responder]

Perfeito. O que seria preciso pra ocorrer automação pra qualidade 1? Flávio, o Maddox ^{(msg! • contrib)} 14h53min de 25 de fevereiro de 2011 (UTC)[responder]

Foi criada uma cat para artigos grandes sem fontes com essa discussão. Podemos criar tb uma cat para artigos pequenos sem fontes. E depois um bot passar por lá e colocar as marcas. A cat ajudaria tb na manutenção da WP:V (no projeto manutenção fizeram uma lista de artigos pequenos sem fontes, a cat seria mais eficiente)

Pelo oq vi, mts artigos grandes com a {{sem-fontes}} deveriam estar marcados com a {{mais notas}}. É importante separar os casos de artigos sem fonte alguma (possivel candidato a eliminação) e artigos que tem algumas informações sem fontes. Sugiro trocar a categorização da predef para Categoria:!Artigos que carecem de notas de rodapé qnd estiver sendo usada para apenas uma seção, usando o campo equivalente para isso. E um bot passar pelos afluentes preenchendo esse campo qnd a predef não estiver no topo do artigo, ou mudando para a {{mais notas}} qnd estiver no topo mas o artigo tiver seção de referências.

Rjclaudio ^msg 15h53min de 25 de fevereiro de 2011 (UTC)[responder]

Concordo também com esse ponto... Houve uma explosão de {{sem-fontes}} nos últimos tempos - talvez relacionada à popularização do FastButtons - e, se há ao menos um trecho referenciado, caberia, na verdade, a {{Mais notas}}.

No mais, o que achas que automatizar como "de qualidade 2" todos os artigos que tenham a marcação de esboço? Seguiria com os critérios de avaliação, que determinam que, se um artigo é 3, essa marcação tem que ser removida.

Flávio, o Maddox ^{(msg! • contrib)} 16h13min de 25 de fevereiro de 2011 (UTC)[responder]

O FastButtons poderia verificar se há {{referências}} (e redirects), se tiver ao invés de adicionar a sem-fontes adiciona a mais-notas. Tem como fazer isso? Acho q dá, já q ele verifica se tem {{ER}} antes de adicionar, pra não ficar 2 tags, então daria pra verificar as refs.

Esboço sem ref é 1, esboço com ref é 2. Se fizer essa distinção concordo.

Rjclaudio ^msg 16h30min de 25 de fevereiro de 2011 (UTC)[responder]

Não são só as referências que separam os esboços de qualidade 1 e 2, tem que levar em conta também a wikificação e o tamanho do artigo.

O FastButtons só coloca sem-fontes no topo do artigo, nunca vi ninguém colocar sem-fontes no topo de artigos que já têm referências, mas se isso acontece seria melhor simplesmente desativar o botão sem-fontes quando a página tiver referências, pois já existe o botão "mais notas".

Concordo com passar o bot em todos artigos que tem sem-fontes em seção para preencher o parâmetro.

^Danilo.mac_(discussão) 17h50min de 25 de fevereiro de 2011 (UTC)[responder]

Pode não ser só as refs, mas ao menos sabemos q se não tiver ref não será qualidade 2, correto? E se não tiver wikificação não será qualidade 2 tb, não é? Ou seja, artigos pequenos com {{Sem-fontes}} e/ou {{Wikificação}} devem estar com qualidade 1. Alguma outra predef relacionada? Ao menos pra qualidade 1 teremos bastante.

Tem como fazer uma cat extra (uma só) pra todos os artigos (independente do projeto) pequenos sem qualidade? E outra para os grandes?

Rjclaudio ^msg 20h08min de 25 de fevereiro de 2011 (UTC)[responder]

Esboços sem referências não têm necessáriamente a qualidade 1, se tiver wikificado e for grande pode ser de qualidade 2. Podemos fazer assim: menor que 2000 bytes é 1 e menor que 10000 bytes com "sem-fontes" ou "wikificação" também. Aí é só fazer o bot rodar em todos artigos ligados a Wikiprojetos, nem precisaria de categoria. E essa categoria seria gigantesca. ^Danilo.mac_(discussão) 01h05min de 26 de fevereiro de 2011 (UTC)[responder]

Concordo. Não tenho ideia de qual seria a quantidade de conteúdo de um artigo de 10k sem wikificação ou sem fonte, pq não teria as predefs/código wiki para aumentar o tamanho da página. Mas sigo as sugestões dos mais experientes.

Se tivermos problema com o número mágico 10k sempre dá pra pegar uma amostra de 10/20/50 maiores artigos nesses critérios e ver se tem algum falso-positivo. Se bem q não teria mt problema, só quando retirarem a predef de esboço/sem fonte/wikificar o usuário revisa a qualidade (e isso deveria ser usual)

Rjclaudio ^msg 22h00min de 26 de fevereiro de 2011 (UTC)[responder]

Critérios para qualidade dois[editar código-fonte]

Agora que estou mexendo com robôs, acho que dá para fazer o robô verificar outros parâmetros da página, por exemplo, contar as ligações internas, o número de seções, o número de parágrafos, imagens, referências, etc. Como esses dados estão ligados ao nível de wikificação, acho que daria para estipular parâmetros para definir qualidade 2 e 3. ^Danilo.mac_(discussão) 17h26min de 6 de março de 2011 (UTC)[responder]

Estou passando o bot classificando os artigos de qualidade desconhecida para 1 com base no tamanho da página (2000 bytes), mas já os artigos de qualidade 2 ou 3 já seria meio complicado com base nas ligações ou tamanho da página, poderiam ser juntadas as informações e a partir da lista classificar, talvez, se não forem muitas páginas, manualmente. Fabiano Tatsch ✉ 19h08min de 6 de março de 2011 (UTC)[responder]

Pô, seria interessante automatizar a qualificação em qualidade 2 e 3... Mas nesses dois casos, acho que deveria ser incluída uma marcação também na página de discussão - A qualidade deste artigo foi atribuída por um robô - abrindo espaço para que seja melhor discutido. Afinal, como são critérios mais, digamos, "flutuantes", um artigo 2 poderia ser classificado erroneamente como 3 - ou um artigo 4, como de qualidade 3.

Isso não tiraria a legitimidade da qualificação, mas deixaria claro que essa qualificação não está escrita em pedra. O que acham?

Flávio, o Maddox ^{(msg! • contrib)} 20h15min de 6 de março de 2011 (UTC)[responder]

Faço o uso da data de revisão, onde os artigos são listados após seis meses numa categoria do tipo ...Artigos a reavaliar sobre ... Se fosse 100% aplicado, cada artigo deveria ser reavaliado a cada seis meses, mas por enquanto isso não acontece. Já que precisam ser reavaliados a cada seis meses, não custa nada classificar automaticamente os artigos de qualidade dois ou três, só precisaria saber quais os parâmetros. Fabiano Tatsch ✉ 21h05min de 6 de março de 2011 (UTC)[responder]

Acho que a parte de desenvolver o robô não é difícil, acho que o mais difícil vai ser escolher os parâmetros, é preciso fazer uma tabela [tamanho da página; nº de ligações internas; nº de seções; nº de parágrafos; nº de imagens; predef que não podem ter] por [qualidade 2; qualidade 3], tendo essa tabela o desenvolvimento do script é uma questão de tempo. Acho que ninguém ligaria de ter a qualidade marcada por robô, seria até melhor pois a classificação ficaria mais equânime, se alguém achar que as informações do artigo estão muito inconsistente para aquela qualidade é só colocar uma marca de revisão, ou outra semelhante, que o robô irá levar a marca em consideração e colocar em uma qualidade mais baixa. ^Danilo.mac_(discussão) 23h49min de 6 de março de 2011 (UTC)[responder]

Coloquei uma proposta para os parâmetros aqui. ^Danilo.mac_(discussão) 22h10min de 9 de março de 2011 (UTC)[responder]

Como para qualidade 1 basta não se enquadrar na 2 e para 5 e 6 basta ter {{artigo bom}} ou {{artigo destacado}}, só ficou faltando a qualidade 4, então completei a tabela com uma proposta para qualidade 4 também, aí a classificação ficaria toda automatizada. O que acham? ^Danilo.mac_(discussão) 16h48min de 10 de março de 2011 (UTC)[responder]

Fiz uma adição nos critérios para qualidade 4, mas surgiu uma dúvida: porque 2 e 4 imagens? Acredito que 1 e 2 seriam uma exigência mais factível. 1 na infobox e outra, caso esteja suficientemente desenvolvido. Flávio, o Maddox ^{(msg! • contrib)} 17h15min de 10 de março de 2011 (UTC)[responder]

Com o Maddox. Lembrando que assuntos q exigem o URC não deveriam ter tantas imagens assim. Pra mts imagens já vai ficando subjetivo. Melhor o bot só ver se tem ou não imagem (na info e no corpo) Rjclaudio ^msg 18h08min de 10 de março de 2011 (UTC)[responder]

Também acho importante os bots não deixarem de incluir a data de revisão, assim uma hora saberemos que temos que revisar a qualidade. Rjclaudio ^msg 18h14min de 10 de março de 2011 (UTC)[responder]

Modifiquei a exigência de imagens como sugerido. Sobre a data de revisão, as marcas atuais tem "|rev=#######" com o oldid da página, para o robô e para a predefinição fica mais fácil colocar a data mesmo, no estilo "20110310" (ano,mês,dia), pois desse jeito uma data mais antiga é sempre um número menor, facilitando a comparação, aí a predefinição colocaria automaticamente marcas atualizadas a mais de X meses em uma categoria para reavaliação. ^Danilo.mac_(discussão) 22h52min de 10 de março de 2011 (UTC)[responder]

Só pra constar, já uso a data de revisão faz muito tempo, para facilitar criei a {{Rev}}. Fabiano Tatsch ✉ 23h08min de 10 de março de 2011 (UTC)[responder]

Desculpe Fabiano, sempre olhei esse número e pensei que era o id da revisão, mas agora que você falou percebi que é a data gerada por essa predefinição. Já existe categoria que agrupa os artigos a reavaliar? ^Danilo.mac_(discussão) 23h28min de 10 de março de 2011 (UTC)[responder]

Sim, Categoria:!Artigos por reavaliar. Fabiano Tatsch ✉ 00h03min de 11 de março de 2011 (UTC)[responder]

Modifiquei a {{marca de projeto}} para fazer essa categorização também. ^Danilo.mac_(discussão) 21h31min de 11 de março de 2011 (UTC)[responder]

Tem que ver agora quais marcas de projeto não tem a {{marca de projeto}}, mas sim estabelecem parâmetros manuais específicos. Como exemplo tem a {{Banda Desenhada/Marca}}. Flávio, o Maddox ^{(msg! • contrib)} 21h40min de 11 de março de 2011 (UTC)[responder]

A {{marca de projeto}} é a predefinição que substituirá todas as marcas, como discutimos aqui. Estou desenvolvendo um robô que troca a marca e avalia a qualidade ao mesmo tempo, aí já resolvemos tudo de uma vez. ^Danilo.mac_(discussão) 22h06min de 11 de março de 2011 (UTC)[responder]

Falando em fazer a substituição, comecei a escrever há alguns dias atrás um script para fazer a troca das predefinições, até onde vi deu certo. Neste código dá pra pegar a qualidade atual e inserir as marcas existentes com a suas respectivas importâncias. Fabiano Tatsch ✉ 22h23min de 11 de março de 2011 (UTC)[responder]

Também consegui fazer essa parte. Coloquei aqui o script como está agora. ^Danilo.mac_(discussão) 04h26min de 12 de março de 2011 (UTC)[responder]

O que acham de colocar essa tabela em uma página independente e que tenha uma sigla fácil? Por exemplo, 'WP:RAQ' poderia redirecionar para 'Wikipédia:Robô avaliador de qualidade', aí o robô colocaria um comentário do tipo "[[WP:RAQ|RAQ]]: Qualidade X (menos de Y seções)", com isso os editores do artigo saberiam porque o robô marcou aquela qualidade e teriam um link para a tabela para ver o que falta para o próximo nível. ^Danilo.mac_(discussão) 18h12min de 12 de março de 2011 (UTC)[responder]

Talvez seja necessário ampliar mais a tabela então, explicando cada um dos critérios? Ou basta apontar pra Wikipédia:Versão 1.0/Avaliação?

Flávio, o Maddox ^{(msg! • contrib)} 18h17min de 12 de março de 2011 (UTC)[responder]

Pras seções tb conta as seções padrão, como LE, REF, Bibliografia, Ver também, essas coisas? Ou só de conteúdo mesmo? Rjclaudio ^msg 20h03min de 12 de março de 2011 (UTC)[responder]

Atualmente está contando tudo que esteja entre ==...==, {{referências}} por exemplo, não conta. Sobre a tabela acho que poderia ser colocada em Wikipédia:Versão 1.0/Avaliação mesmo, já fica tudo junto. ^Danilo.mac_(discussão) 22h27min de 12 de março de 2011 (UTC)[responder]

Gerei esta lista das avaliações do script na categoria:Ciência. ^Danilo.mac_(discussão) 00h48min de 13 de março de 2011 (UTC)[responder]

O melhor modo de testar é passar o script nos ADs e ABs (retirando a regra que detecta as predefs correspondentes) e ver qual qualidade que vai dar. Se o script der qualidade 1 para um AD então tem algo errado. Dá pra fazer isso? Rjclaudio ^msg 01h14min de 13 de março de 2011 (UTC)[responder]

Feito. Está dando problemas com o tamanho dos parágrafos, o que sugerem? ^Danilo.mac_(discussão) 18h20min de 13 de março de 2011 (UTC)[responder]

Tem Age of Empires (série) com 2385 bytes, então no mínimo dos mínimos, 2500.

Alanya apareceu como menos de 5 refs, mas tem mais que 100. Algum erro no script

Clássico dos Clássicos está como sem imagem. Adicionar {{imagem dupla}} no script.

Frei Galvão é AB mas só tem 5 seções, sendo 3 seções padrão. E eu que queria que esse limite de 6 seções descontasse as seções padrão. Esse é um caso isolado ou dá pra mudarmos esse critério?

De início seria bom o bot listar os artigos/qualidade em algum lugar (uma página para cada qualidade, uma seção para cada motivo) pra revisão humana, pelo menos no início até o script ficar realmente confiável e ajustarmos bem os parâmetros.

Rjclaudio ^msg 20h42min de 13 de março de 2011 (UTC)[responder]

Aproveitando o bot pra análise de qualidade, um sonho antigo meu é um bot ajudando a avaliar as EADs, listando possíveis problemas, termos que possam indicar imparcialidade ou necessidade de fonte (ex: "segundo estudo xxx ..."), parágrafos/seções sem fontes, etc, incorporando também as ferramentas já existentes (numero de links para desambiguação, link vermelho na introdução). Como são coisas que precisam de pessoas pra ver se realmente é um problema, seria apenas indicar a lista na EAD. Poderia falar "pelos critérios de bot, o artigo teria qualidade 4, e foram encontrados os possíveis erros: ..." Um bot que sempre que uma EAD fosse criada analisasse o artigo indicando problemas. Ou por demanda, principalmente antes da EAD, pra resolver essas coisas antes da votação. Seria possível fazer algo do tipo? Rjclaudio ^msg 21h01min de 13 de março de 2011 (UTC)[responder]

Vou fazer as correções. Sobre o Frei Galvão, o script não contou a {{referências}}, então só tem 4 seções, na minha opinião, pelo tamanho do artigo, deveria ser qualidade 3 mesmo.

Assim que eu fizer as correções, vou fazer testes nas categorias "!Artigos de qualidade X...". Acho que não é necessário criar muitas listas, pois depois que o script ficar pronto, os robôs avaliariam primeiro as qualidades desconhecidas, isso já seria uma lista para revisar.

Sobre a EAD, buscar termos no texto e parágráfos sem fonte é fácil, para testar os links dá também, mas seria um pouco mais complicado. ^Danilo.mac_(discussão) 00h12min de 14 de março de 2011 (UTC)[responder]

Danilo, pelo que percebi a contagem no artigo Alanya não considerou os <refname="XYZ"/> pois não são acompanhados de </ref>. Acho que é isso, de resto tudo me parece ótimo! OTAVIO1981 (discussão) 01h06min de 14 de março de 2011 (UTC)[responder]

O problema nem é esse. São 100+ refs diferentes. Tem 100+ </ref>. Não foi pela não contagem das refs repetidas. Mas o script realmente deve contar cada ref, mesmo as repetidas, ou só as diferentes? Rjclaudio ^msg 01h12min de 14 de março de 2011 (UTC)[responder]

Acho que descobri o problema. As refs estão em um anexo que está embutido {{Anexo:Alanya (notas e referências)}}. Particularmente, acho errado ficar embutindo as coisas, mas como não é regrado o melhor é contar os ref names e os refs "normais".OTAVIO1981 (discussão) 11h31min de 14 de março de 2011 (UTC)[responder]

Fiz as correções e gerei a mesma lista. ^Danilo.mac_(discussão) 17h21min de 16 de março de 2011 (UTC)[responder]

Gerei listas das categorias de qualidade 4, 3, 2, 1 e desconhecida de dois dos projetos que têm mais artigos em qualidades altas (matriz geral): História militar e Brasil. A maioria das qualidades deram diferentes da categoria em que estão, mas na minha opinião as avaliações do robô estão mais corretas que as avaliações humanas. ^Danilo.mac_(discussão) 18h49min de 16 de março de 2011 (UTC)[responder]

Não queria abusar da boa vontade, mas vc podia passar o bot no projeto enxadrismo? Pode salvar em uma subpágina minha se for o caso, é só curiosidade mesmo. Se não der não tem problema. Obrigado. OTAVIO1981 (discussão) 19h09min de 16 de março de 2011 (UTC)[responder]

Vendo qualidade 4 que passou para qualidade 1, pra ter tamanha diferença tem usuários que não estão classificando direito. E usuários experientes. Depois pode fazer uma lista de artigos que passaram de 4 para 1, para orientarmos os usuários?
Tem algum modo de vermos quais são as novas páginas de qualidade 4?
Seguindo a sugestão lá em cima, melhor passar os critérios de bots para uma página mais acessível, como a WP:1.0, pra poder deixar o link pros usuários. Como a qualidade vai ser independente de projeto, podemos deixar o link pros critérios na marca mesmo (atualmente não tem nenhum link pra explicação, então os novatos acabam fazendo besteira)
Com critérios objetivos assim, uma avaliação humana será melhor q a avaliação do bot? Pq se não for, melhor deixar a avaliação 1-4 só pros bots (a avaliação dele teria prioridade) e 5-6 (AB e AD) pros usuários. O único critério que o humano seria melhor é abrangencia do conteúdo, mas pra mim está mais como critério de AB. Talvez verificabilidade, mas se falta ref tem predef para isso, e se tem predef no artigo o bot leva isso em conta também.
Ampliaria o critério de refs de qualidade 4 para no mínimo 1 ref em cada seção nível 2, substituindo ou não o critério de número de refs (pode ficar os dois tb). Tem artigo com 20 refs em uma seção e nenhuma nas outras. Ou, se quiser ser mais restrito, ref em cada seção nível 2 seria qualidade 3 e ref para cada seção nível 3 nível 4. O nível 5 (AB) iria verificar se é necessário uma ref pra cada parágrafo, e 6 (AD) se precisa de mais de uma ref por paragrafo.
Rjclaudio ^msg 21h01min de 16 de março de 2011 (UTC)[responder]

15000 bytes para qualidade 3?! Já acho 10000 meio forte para tal já que tamanho não quer dizer que tenha qualidade. Fabiano Tatsch ✉ 21h58min de 16 de março de 2011 (UTC)[responder]

Diminuí o tamanho da qualidade 3 para 12000 e da qualidade 2 para 8000 quando não tiver fontes e passei o bot nas categorias de enxadrismo. Está bom ou acham melhor diminuir mais?

Isto aqui ajuda um pouco a procurar as avaliações de nível 4, mas buscar só as avaliações acho que não dá.

Acho que será natural que os robôs passem a fazer essa tarefa, pois ficará muito mais fácil para os editores, se tiver qualquer problema no conteúdo do artigo é só colocar as predefinições de manutenção para limitar a qualidade, na qualidade 4 sobre Brasil por exemplo, duas qualidades foram limitadas pelas predefinições.

Tentei verificar se todos parágrafos têm referências, mas não vai dar certo, a maioria dos artigos bons não passa, América do Sul por exemplo, deu: qualidade 3 (paragrafo sem referências:"A América do Sul ficou ...").

^Danilo.mac_(discussão) 01h03min de 17 de março de 2011 (UTC)[responder]

Vou guardar esse link, ajuda sim. Se tivessemos um js para atualizar as marcas que indicasse isso no sumário seria mais fácil de achar as mudanças.

As refs por parágrafo ficaria mesmo como critério a ser avaliado (a necessidade ou não) na EAD. O bot pode ver se todas as seções tem ref. Se toda seção principal tiver ref seria nivel 3. Se toda subseção logo abaixo (só as de nivel 3, as de nível 4 ou maior não precisaria) tiver ref seria nível 4. Contar por parágrafo pode ficar até meio difícil, ainda mais quando alguns parágrafos só estão introduzindo uma lista logo abaixo. Rjclaudio ^msg 02h31min de 17 de março de 2011 (UTC)[responder]

Rjclaudio ^msg 02h31min de 17 de março de 2011 (UTC)[responder]

Obrigado por ter passado pelo Enxadrismo Danilo. Acho que ficou bom as linhas de corte de tamanho em 20000, 12000 e 8000. O numéro é uma regua inflexível e a aderência dos resultados me pareceu satisfatória. A maioria dos artigos que falharam na classificação em tamanho foi por pouco, menos de 2000kB. Não considero adequado que o bot verifique se todos os parágrafos tem referência, é uma avaliação muito crítica no qual a maioria dos artigos vai falhar. Respondendo ao Rjclaudio ali em cima se Citação: Rjclaudio escreveu: «Com critérios objetivos assim, uma avaliação humana será melhor q a avaliação do bot?» creio que sim, e não me oponho que fosse feito prioritariamente por bots para artigos sem avaliação.OTAVIO1981 (discussão) 11h34min de 17 de março de 2011 (UTC)[responder]

Fiz algumas modificações no script:

Juntei as funções de atualizar a marca e avaliar dando as opções de só atualizar, atualizar e avalair ou atualizar e avaliar só as qualidades desconhecidas, e também um comando para adicionar um tema à marca
Modifiquei a busca de seções para não buscar seções com predefinições no nome (ex: == {{Ver também}} ==), o que reduziu ainda mais a contagem de seções em alguns artigos, fanzendo-os cair um nível de qualidade, talvez seja melhor rever os parâmetros.
Adicionei uma busca de referências nas seções, mas as vezes aparece um falso positivo, juntei os que vi numa lista de exeções, mas provavelmente aparecerá mais, principalmente quando tiver só uma tabela ou lista na seção, algumas das exeções que coloquei foi Discografia, Galeria de imagens, Leitura adicional, Subdivisões e Leitura recomendada, além do Ver também , Notas, etc; e coloquei essa como a última busca, logo antes da qualidade 4, classificando como 3 se as referências não forem encontradas. Acham mesmo necessário a busca de referências nas seções?

Por fim gerei esta lista da categoria de artigos bons, tem uma seção "Bibliografia" pega como sem referências que só adicionei como exeção depois que gerei a lista, e como juntei com as funções de atualizar e avaliar, os artigos sem marcas não foram avaliados.

E além disso eu quero fazer uma proposta: mover a Wikipédia:Versão 1.0/Avaliação para 'Wikipédia:Qualidade' ou algo parecido, a Wikipédia 1.0 é apenas um dos usos da qualidade e muita gente nem sabe o que é isso. ^Danilo.mac_(discussão) 23h28min de 24 de março de 2011 (UTC)[responder]

Ninguém tem sugestões?

Sobre o JS para adicionar/atualizar a marca, já faz alguns dias que começei a desenvolver uma nova função do FastButtons para isso, mas está sendo mais difícil que com o python, vou demorar mais um pouco para terminar. ^Danilo.mac_(discussão) 23h30min de 25 de março de 2011 (UTC)[responder]

Futebol está como sem seção de ref. O artigo está usando a reflist e vários códigos (quase um subst {{referências}}), pode ter outros casos com variações, então melhor além de verificar se tem a seção verificar se há alguma <ref>. Raramente um artigo com mt ref não terá nem uma tagzinha que seja de ref, então a chance de erro é bem menor.
O número de seções está difícil como critério. Talvez incluir o número de subseções caso tenha poucas seções principais (tem artigo com só 4 seções principais, mas dezenas de subseções). Mts subseções compensaria poucas seções principais. Talvez, a cada 5 subseções contar como +1 seção principal. Outra opção (ou as duas) é abaixar um pouquinho o número de seções, pq tem temas q realmente não tem motivo para ter tanta seção. Abaixar pelo menos para 5, podendo ir até 4. Menos que isso já acho que tá com baixa qualidade, deixando que a comunidade diga o contrário em um EaD.
Pras exceções das seções pode tentar retirar as seções que só tem tabela, com a primeira linha após o cabeçalho começando com {| e a última linha da seção com |} (e sem duas quebras de linha, logo é a mesma tabela). Isso deve tirar alguns casos. Seções com tabela e com conteúdo significativo / q precisam de ref normalmente tem algum texto de introdução.
Ainda acho importante o critério de ref nas seções, pq senão teremos artigos de qualidade 4 com várias seções sem ref. Um meio termo, talvez deixar um pouco mais relaxado (evitando as várias exceções). Um modo é só considerar WP:V nas seções com mais de x parágrafos (conteúdo grande o suficiente) ou que tenha alguma subseção (tem conteúdo diverso, mesmo que seja pouco)
Rjclaudio ^msg 00h14min de 26 de março de 2011 (UTC)[responder]
Não sei como será feito, se vamos aplicar esse critério logo pra todos os artigos, ou passar por um grupo de teste. Se for com teste, nas marcas pode ter um link tipo "informe um erro na avaliação", pros usuários relatarem artigos que consideram de boa qualidade mas que o bot não considera (possivelmente necessário rever os critérios/script). Caso contrário capaz de os usuários simplesmente mudarem a qualidade por conta própria, ou nem mudar nem falar nada, ficar com medo de fazer qualquer coisa. Rjclaudio ^msg 00h17min de 26 de março de 2011 (UTC)[responder]

Gostei da idéia de só procurar referências nas seções que tem subseções, isso vai reduzir bastantes o número de falsos positivos. Coloquei 'reflist' na busca de referências. Vou tentar contar as subseções para aumentar o número de seções. Para a implementação, acho que a melhor forma de iniciar é fazer a avaliação primeiro nos projetos que pedirem, assim os participantes do projeto saberão onde reclamar se não concordarem com alguma avaliação ou acharem algum erro, ou poderam simplesmente falar com o operador do robô que fez a avaliação (quando terminar o script vou divulgá-lo para que outros operadores de robô possam ajudar na tarefa). ^Danilo.mac_(discussão) 22h56min de 26 de março de 2011 (UTC)[responder]

Fiz as modificações e gerei novamente uma lista. Cada 5 seçẽs nível 3 (=== ===) conta mais uma, mas mesmo assim estava dando qualidade 3 em alguns bons, então eu abaixei para 5 seções para qualidade 4 e 3 para qualidade 3, tudo bem? Alguém tem mais sugestões de modificações antes de iniciar as avaliações? ^Danilo.mac_(discussão) 02h01min de 30 de março de 2011 (UTC)[responder]

Ainda estou encontrando falsos positivos procurando as referências nas seções, como na seção "Módulos e frameworks" no artigo Python, estou modificando para só procurar referências em seções com pelo menos 2 parágrafos.

Não consegui atualizar a marca com o FastButtons, as regex do JavaScript são muito mais limitadas que as do python. ^Danilo.mac_(discussão) 20h01min de 1 de abril de 2011 (UTC)[responder]

Concordo com as modificações feitas.

Deixa pra atualizar manualmente/bot então. Mas pra adicionar, dá? Adicionar qnd não tiver nenhuma marca (adiciona a predef toda) ou qnd tiver (adiciona os campos). Deve ser mais fácil pro javascript. Rjclaudio ^msg 21h16min de 1 de abril de 2011 (UTC)[responder]

Adicionar a marca quando não tem nenhuma é bem mais fácil, estava mesmo pensando em aproveitar o que já fiz para isso, mas para adicionar mais temas seria a mesma coisa que atualizar, estou com uma idéia para resolver o problema mas não sei se vai dar certo. ^Danilo.mac_(discussão) 23h00min de 1 de abril de 2011 (UTC)[responder]

Veja se isso pode ser útil, me parece ter quase todos os códigos do regex (só não achei o [^x] ). Isso só faz mudança pré-definida, mas vai saber se dá pra juntar isso com a caixa pra inserir o motivo de ER do Fastbuttons e fazer algo útil. Rjclaudio ^msg 23h43min de 1 de abril de 2011 (UTC)[responder]

Ajuda sim, só vou ter que pegar o código da página de discussão por API (essa é a idéia que falei) para poder atualizar corretamente a marca. ^Danilo.mac_(discussão) 00h02min de 2 de abril de 2011 (UTC)[responder]

Meu robô foi aprovado e avaliei a qualidade de todos os artigos vinculados ao Projeto Física. Verifiquei algumas das edições e parece que está tudo certo. ^Danilo.mac_(discussão) 00h34min de 9 de abril de 2011 (UTC)[responder]

Estou diminuindo a avaliação de várias biografias de 2 para 1 por causa do número de seções, o que acham de diminuir ainda mais esse critério? Fiaria 1 para qualidade 2, 2 para 3 e 4 para 4. ^Danilo.mac_(discussão) 18h00min de 13 de abril de 2011 (UTC)[responder]

Acho que encontrei uma solução específica para as biografias, para não dispersar a discussão eu comentei na discussão do Conselho de WikiProjetos. ^Danilo.mac_(discussão) 19h34min de 13 de abril de 2011 (UTC)[responder]

Identificando artigos sem fontes[editar código-fonte]

Comentário Seria possível que um bot avaliasse todos os artigos da Wikipédia e, não encontrando a {{Referências}} ou, encontrando apenas uma fonte, pudesse marcar essas páginas com a {{Sem-fontes}} e {{Sem-notas}}? Flávio, o Maddox ^{(msg! • contrib)} 19h54min de 13 de abril de 2011 (UTC)[responder]

Possível é, resta saber se é de interesse. Se já reclamam de usuários editando só pra colocar essas tags, mesmo quando fazem correções além de taggear, com bot então. Além de não ter certeza que aprovam colocar a tag em todos os artigos (já fui bloqueado por colocar essa tag em artigos que não precisavam dela). No script do projeto AWB eu colocava a sem-fontes como automático, até reclamarem para desabilitar, aí está opcional, regra desabilitada por padrão e só usa quem quer. Nem com awb deixam. Rjclaudio ^msg 20h02min de 13 de abril de 2011 (UTC)[responder]

Azar de quem reclama, entendo. WP:V está acima de opiniões pessoais. Quando reclamaram pra desabilitar e que argumentos utilizaram? Flávio, o Maddox ^{(msg! • contrib)} 15h12min de 18 de abril de 2011 (UTC)[responder]

Teria q procurar, mas o principal era que "não há consenso". E como na minha época eu enchi páginas e páginas de discussão sobre isso, deixei quieto. Melhor fazer essa proposta como uma proposta nova, a parte, senão fica oculta sob a discussão da qualidade por bot. Fazendo nova deve ter mais opiniões.

Tem uma discussão na coordenação robótica para um bot passar pelos afluentes da Sem-fontes atualizando (retira, muda para Sem-notas ou para Mais notas), bom olhar lá também. Rjclaudio ^msg 15h46min de 18 de abril de 2011 (UTC)[responder]

Sem dúvida. Aguardemos o momento oportuno para retomar a discussão. Flávio, o Maddox ^{(msg! • contrib)} 15h58min de 18 de abril de 2011 (UTC)[responder]

Sugestões de mudança[editar código-fonte]

Marca de revisão: -1

A marca indica que alguém tem dúvidas sobre o conteúdo do artigo. Os bots podem verificar que há muito conteúdo, mas a qualidade dele só um usuário pode avaliar, e a qualidade da informação deve ser levada em consideração em todos os níveis da escala, não apenas um critério para 3. A tag então indicaria a necessidade de cautela, independente da qualidade avaliada. Proponho que artigos com a tag {{revisar}} recebam uma redução de 1 grau na avaliação final. Assim mesmo um artigo grande sem ref (q seria 2) se tiver a Revisar passaria para 1 pq mesmo q tenha mt conteúdo há dúvidas se aquele conteúdo está certo. Artigos que seriam avaliados em 4 que tem a tag passariam para 3 (e não 2 como atualmente), pois a tag pode representar dúvidas em apenas uma parte do artigo, e tendo uma qualidade alta normalmente tem usuários verificando o artigo e os problemas seriam corrigidos em pouco tempo, o artigo ser avaliado como 2 apenas pq o bot passou bem na hora q o artigo estava com a tag é meio injusto já q no dia seguinte já pode estar tudo resolvido, uma qualidade 3 já seria o suficiente.

Tamanho de parágrafo: 2500 para qualidade 4 e 3500 para 3.

A divisão de parágrafos fica mais fácil de ser feita quando há mais conteúdo no artigo para poder dividir. É também meio subjetiva, e o tamanho dos parágrafos pode variar um pouco de tema para tema. Considero q isso não é apenas um critério de Wikificação, mas também de Redação, e sendo Redação algo mt subjetivo para o bot, deveria ser um critério de apenas para qualidade alta (2500 para 4), tendo uma tolerância para qualidade logo abaixo (3500 para 3), e não exigir isso para qualidade 2 ou 1. Assim artigos grandes de qualidade 4 não são avaliados como 1 apenas pq não há uma quebra de linha em apenas 1 parágrafo.

Quantidade de parágrafos: Reduzir para 4 ou 3

Similar ao de cima, com um extra q pode-se escrever muita informação em poucos parágrafos (e vice-versa) ficando difícil de analisar realmente. Como é parâmetro para qualidade 2 (baixa), não vejo problema em reduzir para 4 ou 3 parágrafos, desde que cada parágrafo tenha mais que uma frase.

Tamanho do artigo: usar tamanho do texto

Foi indicado na esplanada um javascript que analisa o tamanho do texto da página, desconsiderando assim os códigos wiki, infobox, navbox, e outros q podem dar um peso grande pra um artigo mínimo (principalmente se o artigo foi feito em massa, pois esses normalmente vem bem wikificados e com infobox e todo o resto de código wiki). Proponho mudarmos e passar a usar esse dado como critério. Só precisamos discutir qual será o novo parâmetro.

Nº de refs

Não ficou claro se refs repetidas contam como uma só ou como refs diferentes. Um artigo pode ter apenas uma ref repetida 10 vezes, mas isso não aumenta a qualidade no quesito WP:V. Atualmente o script avalia refs repetidas como uma só, e já recebi mensagens sobre isso.

Rjclaudio ^msg 02h38min de 21 de setembro de 2011 (UTC)[responder]

Tentando entender a lógica[editar código-fonte]

Quer dizer então que de acordo com o que está posto nessa página de avaliação automática, um artigo que tenha referência tem exatamente a mesma qualidade de um que não tenha como ser verificado? Isso é para facilitar o trabalho do bot? Alguém poderia me explicar a lógica nisso? Obrigada! - Deh^sim? 13h29min de 1 de dezembro de 2011 (UTC)[responder]

Alguém reparou na existência disso? - Deh^sim? 13h38min de 1 de dezembro de 2011 (UTC)[responder]

Os parâmetros foram criados para tentar se aproximar da escala de avaliação. Seguindo a escala: 2- Reservados aos artigos extensos não referenciados / Reservado aos esboços referenciados. Um artigo extenso que não pode ser verificado tem exatamente a mesma qualidade que um esboço referenciado. Ou seja: esboço com ref = artigo extenso sem ref. Mesma coisa para qualidade 1 (esboço sem ref = mínimo com ref). Então, entre dois esboços, um com ref e outro sem ref, o q tiver ref tem qualidade 2 e o q não tiver vai pra qualidade 1, eles não teriam o mesmo nível de qualidade.

Claro que a avaliação automática não pode verificar se a quantidade de referências é satisfatória ou não. Poderia até tentar colocar um parametro pra verificar quantas seções não tem ref (pode até ser útil)

Se a ideia é colocar qualidade 1 para todos q não tiverem ref, aí já tem q mudar a escala de qualidade lá. Rjclaudio ^msg 13h54min de 1 de dezembro de 2011 (UTC)[responder]

Eu entendo o =, até porque ajudei a elaborar aquela escala, o que eu não entendo é a lógica usada atualmente. Quer ver um exemplo? Aqui. Esse artigo recebeu qualidade 1. Ficou mais clara minha questão? É isso que eu não entendo. Para que um grupo teve todo aquele trabalho para um artigo depois ser qualificado como qualidade 1 porque tem menos de 3 parágrafos? - Deh^sim? 14h29min de 1 de dezembro de 2011 (UTC)[responder]

P.S: Outro exemplo, mais outro e mais outro, e provavelmente todos os outros ginastas que competiram nos Jogos Olímpicos de 1908, 1912... cujas biografias não passarão de esboços. Só que tenho colocado as referências. Infelizmente não tem adiantado, porque outras tantas biografias já foram qualificadas como qualidade 1 (não falei antes porque não chequei e sei que algumas pecam na referenciação), sem provavelmente o ser.

Aí já é questão de verificabilidade e sim de tamanho, de diferença entre mínimo e esboço. Na discussão desses parâmetros nós pensamos q 3 parágrafos seria a diferença, podemos abaixar para 2 parágrafos. Um artigo com um único parágrafo, ou não é um parágrafo extenso, ou se é falta algum ajuste no texto pq daria para separar o parágrafo em dois, então eu não daria qualidade 2 para esse artigo de 1 parágrafo. Aí os q ficarem com 2 parágrafos cumpririam esse critério, e seria avaliado por outras coisas. Mudamos tb o tamanho do artigo? Sugestões?

Por mais q se melhore, sempre haverá alguns erros na avaliação automática, não dá para chegar a 100%. Se não passasse o bot, todos esses artigos não estariam avaliados, e é preferível uma avaliação automática com margem de erro de +-1 q não ter avaliação alguma. E qualquer usuário pode ir nos artigos e colocar a avaliação q essa terá prioridade. E podemos tb criar uma cat para cada tema de artigos só avaliados por bots, para ser um complemento a de artigos sem avaliação.

Rjclaudio ^msg 14h44min de 1 de dezembro de 2011 (UTC)[responder]

De 95% para cima das biografias dos ginastas que disputaram as primeiras edições dos JO nunca passarão de esboço de 4 ou 5 linhas, justamente porque não existe informação sobre eles. Dá para "encher linguiça", mas aí também já é demais. E, segundo o que foi discutido lá durante o processo de elaboração da escala, não dá para chamar de mínimo um artigo desse. Enfim, tem solução para o caso? - Deh^sim? 14h59min de 1 de dezembro de 2011 (UTC)[responder]

A solução é mudar o critério de número de parágrafos, para 2. Agora q vi, na tabela ainda está 5, eu já tinha baixado para 3 e não atualizei aqui. Então, baixamos para 2?

Depois do critério mudado, não sei se vale já passar nos artigos e atualizar. Preferia deixar para atualizar depois, até pq esses critérios ainda poderiam ser mudados mais vezes. Eu só faria a revisão nos artigos de qualidade 1 qnd os critérios ficarem estáveis / serem mais usados / ter mais artigos avaliados / mais gente ciente, comentando, criticando, dando ideias. Não vejo urgência.

Se não quiser esperar para um bot revisar tudo, pode fazer manualmente, colocando a avaliação humana.

Vou parar o bot até concluirmos se mudamos ou não esse critério.

Rjclaudio ^msg 15h11min de 1 de dezembro de 2011 (UTC)[responder]

Não sei, porque não sei se isso é relacionado com número de caracteres. Como pôde ver no comment acima, eu separo dados básicos da razão para o ginasta ter biografia aqui, ou seja, no caso desses, o primeiro parágrafo raramente passa de uma linha. Todavia, como eu disse, não é qualidade 1: tem referência, é imparcial e está formatado, incluindo as interwikis. O problema seria apenas o tamanho, pois a quantidade de informações é limitadíssima. Entretanto, como eu preciso responder sua pergunta para chegarmos em algum lugar, eu diria que sim, baixe para dois, desde que o artigo possua referências. Abraços! - Deh^sim? 00h30min de 2 de dezembro de 2011 (UTC)[responder]

Assim como o Rjclaudio, acho que é melhor que todo artigo tenha uma classificação automática inicial que em geral não erre grosseiramente (digamos, atribuindo qualidade 1 quando devia ser 3 ou vice-versa), do que não ter qualquer classificação, pois assim quem desejar focar seu esforço editorial no sentido de melhorar os artigos de pior qualidade, poderá tomar como base as matrizes de classificação, em vez de ter que fazer primeiro uma triagem dos artigos da Categoria:!Artigos de qualidade desconhecida em sua área de interesse.

Quanto ao critério a ser usada para se fazer uma avaliação automática, acredito que, idealmente, ele deveria ser modelado (matematica ou estatisticamente) a partir da coleta dos dados reais relativos ao conjunto dos artigos que já foram avaliados manualmente por alguém (isto é, que já têm uma avaliação não-robótica), e não por tentativa e erro. Assim, a estimativa da qualidade dos artigos poderia ser a que melhor refletisse as características comuns aos artigos já avaliados pelos editores, minimizando-se os eventuais erros. Vide en:Statistical classification. Helder 16h57min de 1 de dezembro de 2011 (UTC)[responder]

A dificuldade q eu vejo em fazer uma análise estatística da wiki.pt é a amostra que temos. Não temos assim tantos artigos avaliados (temos vários, mas não acho suficiente, são muito muito poucos em relação ao total), por ter poucas pessoas avaliando deve haver uma diferença grande entre os temas avaliados (a análise iria refletir os critérios para aqueles temas e não um critério geral), por não haver uma constância / acompanhamento, possivelmente teriamos alguns estariam desatualizados ou com a qualidade avaliada errado por novatos (já vi vários mínimos/esboços ou grandes artigos sem fonte com qualidade 4, até mesmo 5 ou 6) e mesmo não sendo tantos assim, pela pequena amostra já não seria tão desprezível. Rjclaudio ^msg 01h49min de 2 de dezembro de 2011 (UTC)[responder]

Falando nisso, qual o % de artigos q só estão avaliados por bots, só avaliados por usuários, e com as 2 avaliações? Daria pra ver isso? Rjclaudio ^msg 01h51min de 2 de dezembro de 2011 (UTC)[responder]

Pelo código atual da "Predefinição:Marca de projeto", posso dizer o seguinte:

Não há categorização dos artigos:
- Que ainda não foram avaliados automaticamente (isso inclui os artigos novos, avaliados após a última vez em que o bot foi executado - talvez pelo próprio autor)
- Cuja avaliação manual coincide com a automática
A categoria !Artigos com avaliação revisada reúne os artigos que foram avaliados manualmente após a avaliação automática mais recente
- Não é feita distinção entre "revisada e correta" e "revisada e incorreta", pelo menos não até que o robô avalie o artigo novamente. A distinção seria importante para poder detectar, por exemplo, os artigos cuja avaliação automática tivesse sido revisada pela Deh (e para os quais discordasse da estimativa feita pelo bot).
As 4 categorias !Artigos com avaliações conflitantes-<qualidade automática, de 1 a 4> reúnem os artigos cuja avaliação manual difere da automática e é mais antiga (por exemplo, se o artigo melhorou ou piorou no período, mas ninguém atualizou a indicação manual da qualidade)
A categoria !Artigos só avaliados por robôs contém os artigos cuja avaliação automática ainda não foi revisada manualmente.

Helder 13h47min de 2 de dezembro de 2011 (UTC)[responder]

Aparentemente, alguém (EpochFail) implementou algo do tipo que eu imaginava: Wiki-Class: Wikipedia article quality classification (GitHub). Parece que o que está por trás é o método de classificação en:Random forest. Helder 15h50min de 6 de agosto de 2014 (UTC)[responder]

Foi disponibilizado um modelo de classificação da qualidade dos artigos treinado especificamente com artigos da Wikipédia em português. Ver WP:Esplanada/anúncios#Modelos do ORES para o ptwiki e WP:Esplanada/anúncios#Melhorias na classificação de qualidade de edições e artigos. Helder 21h41min de 23 de abril de 2020 (UTC)[responder]

Artigo de ótima qualidade:[editar código-fonte]

Gostaria que todos os leitores da wikipédia soubessem que a página eletricidade têm uma tradução de ótima qualidade, e que não está com um texto com qualidade 3. Espero que mudem.

--D.P.S (discussão) 00h55min de 6 de abril de 2012 (UTC)Danilomath[responder]

"Passei um olho" no artigo e ao que parece, tamanho não é mesmo documento por aqui (ou não deveria ser). O texto até está bom (numa passada de olhos), mas não tem uma nota. Tem bibliografia ao final, mas nenhuma nota. Tem até tópicos na introdução (???). A qualidade é dada (ou deveria ser dada) diante de vários fatores e não apenas o texto. - Deh^sim? 07h33min de 6 de abril de 2012 (UTC)[responder]

Uso de Lua para estimar a classificação dos artigos[editar código-fonte]

Me ocorreu que talvez valesse a pena ter um módulo escrito em Lua para analisar o código wiki da página e estimar automaticamente qual a qualidade do artigo (sem precisar de edições robóticas nem auxiliadas por scripts). Esse valor seria utilizado a não ser que um humano definisse explicitamente um outro número para indicar a qualidade (por ter analisado o artigo, em termos de coisas que não podem ser automatizadas, e concluído que a estimativa automática não é adequada).

O que acham, Rjclaudio, Sway 2, Danilo.mac, PedR, Antero de Quintal? Helder 12h27min de 18 de setembro de 2013 (UTC)[responder]

Se for possível fazer isso, melhor.

Esse código seria executado toda vez que a página de discussão do artigo fosse carregada / exibida / editada? Rjclaudio ^msg 12h50min de 18 de setembro de 2013 (UTC)[responder]

Sim, e a estimativa que apareceria na página de discussão ao visualizá-la corresponderia sempre à versão mais recente do artigo.

Criei um esboço no Módulo:Avaliação, considerando inicialmente apenas o critério "tamanho do artigo". Experimentem abrir páginas como Discussão:Função indicadora, Discussão:Aritmética, Discussão:Conjunto e Matemática em modo de edição, colocar o código "{{#invoke:Classification|getClass}}", e mostrar uma previsão. Deverá aparecer o número de 1 a 4 que indica a classe à qual o artigo pertenceria se fosse levado em conta apenas o tamanho do código wiki.

Para colocar a ideia em prática efetivamente, seria preciso ampliar o código, para levar em conta todos os critérios, e isso pode ser feito com base nos scripts já existentes (marcas.py e AssessmentHelper.js). Helder 14h17min de 24 de setembro de 2013 (UTC)[responder]

Boa ideia! A avaliação é toda feita baseada em buscas no próprio texto do artigo, então dá sim para fazer tudo com Lua. Posso ver isso, mas como ando com pouco tempo talvez eu demore. ^Danilo.mac_(discussão) 15h43min de 1 de outubro de 2013 (UTC)[responder]

Inclui o parâmetro "página" para podermos testar mais facilmente (exemplo). Agora é só terminar a migração do código do Danilo e fazer aprimoramentos... Helder 14h01min de 1 de novembro de 2013 (UTC)[responder]

Traduzi o marcas.py para lua e coloquei no módulo, falta fazer testes e correções e colocar a verificação se toda seção tem referências (estava difícil então deixei para depois). Como disse na discussão do módulo, acho melhor deixar os módulos em português, passei então para português o nome do módulo e a função que é chamada nas páginas, espero que não se importem. Corrigi também esse último link do Helder para exibir a avaliação dada às páginas (módulo não redireciona, não sabia). ^Danilo.mac_(discussão) 00h56min de 15 de novembro de 2013 (UTC)[responder]

Criei a {{Marca de projeto/Testes}} para fazer testes. Editem uma marca sem salvar, só vendo a previsão, colocando o /Testes e removendo a qualidade se tiver, com isso a avaliação será feita pelo módulo. Por enquanto não está mostrando a qualidade na imagem, só no texto e colocando o mouse em cima do número mostra a razão da atribuição da qualidade. Ainda falta melhorias na predefinição e no módulo. ^Danilo.mac_(discussão) 19h56min de 2 de fevereiro de 2014 (UTC)[responder]

Coloquei no módulo a verificação se todas as seções têm referências, com isso o módulo está completo, fazendo todas as verificações que o robô fazia. Falta agora terminar de adaptar a marca de projeto e fazer testes. Coloquei aquela lista no link do Helder aqui, parece que a página de expandir predefinições não está mais aceitando conteúdo pela url. ^Danilo.mac_(discussão) 21h16min de 4 de fevereiro de 2014 (UTC)[responder]

Ótimo, Danilo.mac! Que os testes comecem! :-)

Quanto à página Especial:Expandir predefinições, ainda é possível definir o conteúdo pela URL, mas o nome dos parâmetros foi alterado em alguma mudança recente no MediaWiki (não sei dizer qual foi). Veja as correções que fiz em um script que usava os nomes antigos. Helder (discussão) 10h43min de 5 de fevereiro de 2014 (UTC)[responder]

Danilo.mac, eu troquei o antigo parâmetro bot pelo comando que invoca o módulo em mais alguns lugares da predefinição (e também fiz outras melhorias), então agora a imagem já está funcionando. Helder (discussão) 22h16min de 10 de fevereiro de 2014 (UTC)[responder]

Danilo.mac, já incorporei a estimativa feita pelo módulo à parte da predefinição que faz a categorização. Enquanto fazia isso, troquei "201100000" por "20110000", pois acredito que sua intenção aqui era indicar o início do ano de 2011. Era isso? Em todo caso, não corrigi na predefinição que está em uso pois esse tipo de edição força o MediaWiki a atualizar muitas páginas (por meio da fila de tarefas), então é melhor deixar pra fazer todas recategorizações de uma vez só.

Ainda sobre a categorização, acho que será preciso mudar o sistema atual, levando em conta que a estimativa da qualidade deixará de ser "feita de tempo em tempo por um robô" passando a ser "atualizada automaticamente" assim que o artigo e/ou sua discussão forem editados:

A categoria "!Artigos só avaliados por robôs" poderia ser renomeada para "!Artigos cuja qualidade só foi estimada automaticamente";
As categorias do tipo "!Artigos sobre XYZ por reavaliar" poderiam ser renomeadas para "!Artigos sobre XYZ cuja qualidade foi avaliada há muito tempo" (atualmente, "muito tempo" significa "há mais de 6 meses")

Helder (discussão) 17h45min de 12 de fevereiro de 2014 (UTC)[responder]

Não sei se é preciosismo meu, mas não seria melhor ter apenas um #invoke na predefinição? Ao ter mais de um, a qualidade é avaliada mais de uma vez no mesmo artigo. Acho que dá para colocar a imagem no mesmo #invoke que o texto, e as categorias poderiam ser inseridas via módulo, como não existirão mais as categorias "de qualidade desconhecida" e categorias de avaliação de robô, a predefinição não colocaria outra categoria depois do módulo, então não teriam categorias duplicadas. Sobre o 20110000, a correção está correta sim. Sobre as categorias, acho que fica mais simples "!Artigos com qualidade estimada" e "!Artigos sobre X precisando de reavaliação". ^Danilo.mac_(discussão) 00h03min de 18 de fevereiro de 2014 (UTC)[responder]

Sim, provavelmente é melhor reduzir o número de vezes que a função de avaliação é chamada (não tenho certeza de que o MediaWiki guarda isso em cache). Isso foi um dos motivos para eu começar a migrar a Predefinição:Marca de projeto para Lua também. Aí poderemos calcular cada coisa o mínimo de vezes possível...

O que eu não gosto em "!Artigos com qualidade estimada" é que tanto o resultado produzido pelo módulo quanto aquele que um editor informa é somente uma "estimativa" (ou "classificação") da qualidade da página. Mas a categoria serve para diferenciar aquelas páginas que foram classificadas por humanos daquelas que só têm a classificação feita pelo módulo em Lua. Idealmente o nome deveria refletir essa diferença.

De qualquer forma, podemos deixar o bikeshedding sobre isso para o futuro, se isso for atrasar a implementação do novo sistema, pois até lá poderíamos esclarecer as diferenças na página da própria categoria (em vez de já no título). Helder (discussão) 12h43min de 18 de fevereiro de 2014 (UTC)[responder]

Só pra constar: implementei mais algumas partes do código da Predefinição:Marca de projeto. Helder (discussão) 20h03min de 19 de fevereiro de 2014 (UTC)[responder]

Salvo eventuais bugs, acho que concluí a implementação da marca de projeto em Lua. Podem testar a partir deste exemplo (vejam mais alguns na página de teste). Helder (discussão) 22h04min de 21 de fevereiro de 2014 (UTC)[responder]

Muito Bom! Fiz algumas correções e alterei a {{marca de projeto/Testes}} para gerar a marca com o módulo. Quanto às categorias concordo com "!Artigos com qualidade estimada automaticamente", o que tinha achado meio estranho era o "cuja", acho que essa preposição não fica bem em nome de categoria. ^Danilo.mac_(discussão) 03h20min de 22 de fevereiro de 2014 (UTC)[responder]

Concordei com "!Artigos com qualidade estimada automaticamente", e já atualizei no módulo. Sobre o nome das outras categorias, aceito "!Artigos sobre X precisando de reavaliação", mas talvez seja melhor deixar como estão por serem várias... (todas teriam que ser apagadas e depois recriadas sob o novo nome) Helder (discussão) 15h59min de 22 de fevereiro de 2014 (UTC)[responder]

Danilo.mac, eu migrei a Predefinição:Marca de projeto/projeto para Lua. Antes disso, eu testei a nova versão da seguinte forma:

Coloquei na subpágina /Testes o código que pretendia utilizar
Abri algumas Predefinição:Marca de projeto/... e acrescentei "/Testes" ao nome da predefinição utilizada
Utilizei o recurso "Mostrar previsão da página com esta predefinição" que aparece abaixo da janela de edição para comparar o resultado da nova versão em algumas páginas de discussão que utilizavam essas marcas
Corrigi os bugs que encontrei na versão inicial do código

Helder (discussão) 13h41min de 3 de março de 2014 (UTC)[responder]

Implementado![editar código-fonte]

Rjclaudio, Sway 2, Danilo.mac, PedR, Antero de Quintal, !Silent, OTAVIO1981, Sturm, Stegop e demais interessados:

Depois de revisar o código que o Danilo.mac fez, corrigir alguns bugs e fazer uma bateria de testes com uma amostra aleatória de artigos, fui audaz e migrei a "Predefinição:Marca de projeto" para o novo sistema. O número de itens nas categorias de avaliação automática deverá aumentar aos poucos (e as subcategorias da Categoria:!Artigos de qualidade desconhecida, começarão a se esvaziar) conforme o MediaWiki for atualizando as páginas de discussão de artigos que não receberam avaliações manuais. Sempre é possível forçar a atualização fazendo uma edição na página (ou talvez seja suficiente usar "action=purge" na URL). Assim que as categorias se estabilizarem, podemos atualizar (ainda com edições semi-automáticas) as matrizes de classificação, para melhorar a nossa visão geral dos artigos com base nas estimativas feitas pelo módulo.

Se encontrarem páginas em que estimativa feita pelo módulo seja diferente daquela que estava prevista na tabela de critérios, é melhor informar na Módulo Discussão:Avaliação. Se tiverem sugestões de alteração nos critérios propriamente ditos, pode ser melhor discutir aqui (que seria um espaço para as discussões menos técnicas). Helder (discussão) 20h09min de 20 de junho de 2014 (UTC)[responder]

. Apesar de ser lamentável que isto de avaliação automática, algo sempre enganador, ter que existir, é muito melhor que nada e qualquer esforço para melhorá-lo é bem vindo e merece elogios. E como pedir não custa (agora ainda menos, pois o código passou para algo em que eu não sei mexer :-), já que estão com a mão na massa, tenho uma sugestão: a predef aceitar os códigos de todos os portais (ou os que houver paciência para incluir) e projetos que ainda não tenham as predefs auxiliares criadas, como faz {{Portal3}}. Isto permitiria deixar a marcação atualizada para quando tais predefs forem criadas. --Stegop (discussão) 22h56min de 20 de junho de 2014 (UTC)[responder]

@Stegop: Se refere, por exemplo, ao caso de Discussão:Adrian Sutil, onde foi informado "ProjetoAUTO", sendo que não existe uma Predefinição:Marca de projeto/ProjetoAUTO? Helder (discussão) 18h52min de 22 de junho de 2014 (UTC)[responder]

@Helder.wiki: Suponho que sim. Há duas situações diferentes em que esse comportamento de aceitar silenciosamente "códigos" de projetos e portais que (ainda) não existem podem ser úteis: um é a não existência de marcas, a outra é a não existência de projeto/portal. Exemplo desta última: tenho marcado muitos artigos com {{Portal3|Creta}} e {{Portal3|Império Bizantino}} pois tenho esperanças de um dia destes os criar, além de que me parece haver alguma probabilidade de tais portais serem criados por alguém. —comentário não assinado de Stegop (discussão • contrib) 19h23min de 22 de junho de 2014 (UTC)[responder]

O Fabiano Tatsch também deve ter interesse nisso, ele tem avaliado vários artigos ultimamente. E é bom lembrar também que é só colocar o mouse em cima do número da qualidade para exibir o motivo pelo qual o módulo determinou a qualidade do artigo, isso pode ajudar a identificar um erro no módulo. ^Danilo.mac_(discussão) 23h33min de 20 de junho de 2014 (UTC)[responder]

Pesquisa sobre algoritmo para avaliação automática da qualidade[editar código-fonte]

Divulgaram na wikitech-l a seguinte pesquisa:

Ferramentas Editoriais Automatizadas podem ajudar a força-tarefa (cada vez menor) de voluntários da Wikipédia? (em inglês, Can Automated Editorial Tools Help Wikipedia's Declining Volunteer Workforce?)

Helder 11h31min de 1 de novembro de 2013 (UTC)[responder]

Artigo extenso avaliado automaticamente com qualidade 1[editar código-fonte]

Já há algum tempo que tenho vindo a estranhar que haja tantos artigos que eu consideraria claramente 2, senão mesmo 3 ou 4 (nestas aqui nunca sei que peso hei-de dar à falta de notas de rodapé) são avaliados como 1 (ou 2, os mais extensos), mas agora foi o cúmulo: Granada (Espanha) é enorme, tem inúmeras notas de rodapé, está ilustrado e é classificado como 1?--Stegop (discussão) 13h14min de 23 de julho de 2014 (UTC)[responder]

Quando você coloca o mouse em cima do número da qualidade na marca é exibido o motivo pelo qual o módulo avaliou aquela qualidade, nesse caso é por causa de um parágrafo muito grande ("Os termos das Capitulações...") o que é um indício de má wikificação e previne que artigos sem wikificação sejam avaliados com qualidade superiores, ao dividir o parágrafo o módulo já deve dar qualidade 3 ou 4. ^Danilo.mac_(discussão) 14h39min de 23 de julho de 2014 (UTC)[responder]

Será possível explicar melhor onde se vê o motivo "pelo qual o módulo avaliou aquela qualidade" ? Por mais locais diferentes em que em coloque o mause, não me aparece nada disso. Aparece-me: "Ficheiro:Escala-azul-1de6.svg ⋅ações...." Será preciso fazer alguma alteração em algum local ? --João Carvalho ^{deixar mensagem} 16h19min de 23 de julho de 2014 (UTC)[responder]

Tive o mesmo problema: coloca o rato por cima do número que está a seguir de "Este artigo foi avaliado automaticamente com qualidade". --Stegop (discussão) 16h32min de 23 de julho de 2014 (UTC)[responder]

Stegop Obrigado ! Mesmo assim estava difícil de ver. Isso é como procurar uma agulha no palheiro. --João Carvalho ^{deixar mensagem} 21h03min de 23 de julho de 2014 (UTC)[responder]

@Stegop, Danilo.mac e João Carvalho: O que acham de trocar 'com <b title="$2">[[Wikipédia:Qualidade|qualidade]] $1</b>' por 'com <b>[[Wikipédia:Qualidade|qualidade]] $1</b> ($2)' no Módulo:Avaliação? Helder (discussão) 22h12min de 23 de julho de 2014 (UTC)[responder]

@Helder.wiki: lamento mas para mim estás a falar chinês. O Stegop e o Danilo que comentem, pois infelizmente, não percebo nada disso. --João Carvalho ^{deixar mensagem} 22h29min de 23 de julho de 2014 (UTC)[responder]

Obrigado Danilo. Agora ficou com 3, o que possivelmente até é a avaliação correta, mas o motivo diz que a secção "Transição do reino nasrida para Castela" não tem referências, quando todos os parágrafos dessa secção têm notas de rodapé. --Stegop (discussão) 16h38min de 23 de julho de 2014 (UTC)[responder]

Visibilidade do motivo[editar código-fonte]

Eu acho que o motivo da avaliação fica muito escondido. Na minha opinião o ideal seria mostrar todos os critérios que a página não cumpre, por exemplo, como o meu AssessmentHelper.js fazia, ou simplesmente como itens em uma "lista de coisas a melhorar". Helder (discussão) 17h27min de 23 de julho de 2014 (UTC)[responder]

Uma alternativa pode ser colocar para exibir o motivo quando se coloca o mouse em cima da imagem da escala de qualidade. Meu receio de deixar mais explícito é que alguns editores possam tentar burlar a avaliação tentando aumentar a qualidade do artigo se baseando nos critérios de avaliação, os quais se baseiam em indícios de qualidade e não refletem com precisão a qualidade do texto, a qual é impossível de ser avaliada automaticamente. Sobre mostrar todos critérios, além do que já disse sobre deixar critérios explícitos, isso também esbarraria no fato que o script interrompe a avaliação no primeiro critério não correspondido, isso é feito por motivo de otimização do processamento, o que pode ser visto por esta lista em que todos artigos de qualidade 1 ou 2 são avaliados enquanto nesta lista com muitas qualidades 3 e 4 o número de artigos avaliados é menor devido limite de tempo de processamento de módulos. Como cada edição no módulo dispara a atualização em centenas de milhares de marcas a otimização do código é importante. ^Danilo.mac_(discussão) 02h22min de 24 de julho de 2014 (UTC)[responder]

Essa abordagem seria uma forma de en:Security through obscurity, que não é uma prática recomendável. Mais do que isso: acho que se o motivo não fica explícito, perdemos a oportunidade de receber mais feedback dos editores/leitores a respeito da avaliação automática, ou de refinar por nós mesmos o algoritmo com base nas tentativas de 'não melhorar o artigo mas aumentar sua "qualidade"'. Helder (discussão) 20h59min de 25 de julho de 2014 (UTC)[responder]

Eu tendo a concordar que seria proveitoso listar mesmo que genericamente os problemas identificados na avaliação além de deixar um link para onde a pessoa poderia reportar inconsistências na avaliação automática assim como o Stegop fez aqui.OTAVIO1981 (discussão) 21h04min de 25 de julho de 2014 (UTC)[responder]

Só o critério de comprimento máximo de parágrafos não está visível atualmente. Todos os demais podem ser conferidos olhando para o artigo e comparando com essa página aqui ou usando o script do Helder (AssessmentHelper.js). Portanto, esconder o parágrafo que tem mais de 2000 bytes não esconde os demais motivos. Eu entendo essa preocupação de não dar muita visibilidade para o motivo para evitar a manipulação da qualidade. Mas, por outro lado, se tivermos voluntários corrigindo esses problemas, ainda que seja apenas para melhorar a qualidade automática do artigo, ele provavelmente estará melhorando "de facto" o artigo. Nesses níveis (1 a 4), estamos falando em expandir o artigo, acrescentar fontes e imagens, dividi-lo em mais parágrafos e seções e resolver os problemas apontados por outros editores. Isso me parece mesmo ser o básico para esses artigos. O aspecto subjetivo (por exemplo, "esse texto está muito mal escrito") se resolve com uma predefinição ("reciclar"). Enquanto essa predef estiver no artigo, ele não vai passar de Q2. Temos 800 mil artigos, não temos olhos suficientes para avaliar todos eles. A avaliação automática em conjunto com as predefs de manutenção é a melhor alternativa para filtrar os artigos que merecem uma avaliação humana, que são aqueles que já resolveram os seus problemas básicos e já têm um conteúdo suficiente para ser avaliado (Q4). Inclusive, esses critérios podem ser rediscutidos se descobrirmos que não estão sendo suficientes para apurar os artigos com problemas. Sendo assim, e sabendo que a avaliação para no primeiro problema encontrado, concordo em apresentar o motivo identificado no "Estimar qualidade" ou na marca de projeto, na discussão do artigo. CasteloBranco^msg 19h37min de 25 de agosto de 2014 (UTC)[responder]

Número de artigos por qualidade[editar código-fonte]

Com a avaliação automática sendo feita agora por módulo e com o processo de padronização das marcas temos uma quantidade grande de artigos avaliados, o que permite ter uma boa estimativa da proporção de artigos em cada nível de qualidade na Wikipédia lusófona. Para visualizar esses números fiz esta ferramenta que consulta o número de artigos e anexos com cada nível de qualidade. Infelizmente os números não são muito animadores (eu ia colocar um gráfico de pizza mas as fatias das qualidades 4, 5 e 6 ficaram tão finas que mal davam para ver), mas de qualquer forma é bom saber quais são os números. ^Danilo.mac_(discussão) 03h05min de 24 de julho de 2014 (UTC)[responder]

Mas a contagem de AB's e AD's é muito maior do que a da PP. A que se deve esta discrepância? Erro nas marcas de projeto? Tinha ficado com a impressão que no caso de AB's e AD's a qualidade posta na marca não afetava a categorização. --Stegop (discussão) 10h47min de 24 de julho de 2014 (UTC)[responder]

A PP só mostra o número de artigos, esta ferramenta conta também os anexos, a diferença que sobra após considerar os anexos (1106 - 366 + 382 = 69) são por causa de casos como este (veja as categorias ocultas no rodapé), em que a página continua categorizada em uma categoria de artigo destacado mesmo depois de perder o status de destacado. ^Danilo.mac_(discussão) 16h30min de 24 de julho de 2014 (UTC)[responder]

Obrigado pela explicação. realmente esqueci-me dos anexos. Mas aparentemente aquela categorização errada em artigos destacados é colocada por {{Marca de projeto}}. --Stegop (discussão) 16h42min de 24 de julho de 2014 (UTC)[responder]

@Stegop: removi a categoria que o OTAVIO1981 tinha inserido manualmente naquela discussão. Helder (discussão) 16h55min de 24 de julho de 2014 (UTC)[responder]

Obrigado, Helder, pelos vistos hoje estou (ainda) mais distraído do que é hábito... ;8) --Stegop (discussão) 17h00min de 24 de julho de 2014 (UTC)[responder]

Removi a categoria de artigos destacados das outras 4 discussões de artigos e anexos onde foram inseridas manualmente (encontrei procurando por ":\s*!Artigos[ _]destacados[ _]sobre[ _]" com o database scanner do AWB). O resto podem ser páginas que o MediaWiki ainda não terminou de atualizar pela fila de tarefas (e nesse caso uma edição na página também forçará a atualização da categorização feita por predefinições). Helder (discussão) 17h20min de 24 de julho de 2014 (UTC)[responder]

Stegop. Gerei a lista das páginas que podem estar categorizadas manualmente em uma das categorias para artigos destacados. Helder (discussão) 17h39min de 24 de julho de 2014 (UTC)[responder]

Há alguns casos (como estes 2) em que havia uma marca na página de discussão e alguém redirecionou o artigo sem atualizá-la.

Talvez fosse o caso de voltar a mostrar um erro se o módulo for usado nas discussões de redirecionamentos, em vez de "seguir" os redirecionamentos. Assim, múltiplos redirecionamentos para um mesmo alvo não serão avaliados (só o alvo). Helder (discussão) 20h03min de 24 de julho de 2014 (UTC)[responder]

Comprimento máximo dos parágrafos[editar código-fonte]

Não entendo bem essa linguagem do módulo. Onde está descrita essa função parMaxBytes? É ela que indica o tamanho dos parágrafos, certo? Pergunto porque tem artigos que têm parágrafos longos por causa de notas de rodapé ou referências bem completas, bem formatadas. Em Abraham Lincoln, por exemplo, o quarto parágrafo tem duas notas de rodapé e cinco referências. Isso não deveria ser um problema. Gostaria de saber se há outra função, ou uma forma de evitar a contagem dessas marcações que não são visíveis. Por exemplo, evitar o que está entre <ref></ref> ou dentro de {{nota de rodapé}}. Será que dá? CasteloBranco^msg 02h19min de 26 de agosto de 2014 (UTC)[responder]

@Castelobranco na verdade é só um objeto, com dois parâmetros (o limite, e o motivo a ser apresentado caso o limite não seja verificado):
parMaxBytes = {2500, 'parágrafo muito grande (%d bytes): \'%s...\''},
As referências são removidas antes de verificar o tamanho dos parágrafos, mas a versão atual ainda não remove {{nota de rodapé}}. Helder 11h44min de 26 de agosto de 2014 (UTC)[responder]

Eliminar o limite de comprimento máximo de parágrafos[editar código-fonte]

Alguns artigos que extrapolam esse critério do limite de comprimento máximo de parágrafos e são avaliados automaticamente em qualidade 1 chamaram minha atenção, como por exemplo Renascimento (ver parágrafo "O predomínio de influências do norte...") e Dinastia Ming (ver parágrafo "Estudiosos de fora da China..."). Em ambos, os parágrafos estão bem escritos, e têm um tema bem definido, pelo que não me parece correto dividi-los apenas por causa desse critério, o que sugere que talvez seja o critério que esteja inadequado. Pode ser o caso em vários artigos longos, onde o tema é bem aprofundado, e surge a necessidade de um parágrafo longo sem que isso represente um problema. Por isso eu gostaria de propor que esse critério seja eliminado, ou que só conte para artigos mais curtos (não sei se isso é tecnicamente viável). O que acham? CasteloBranco^msg 18h05min de 11 de fevereiro de 2015 (UTC)[responder]

Número de referências[editar código-fonte]

O artigo Andrômeda (constelação) tem 67 referências, mas a avaliação automática lhe atribui qualidade 2 por ter menos de 5 referências. Suponho que haja algum erro na contagem das referências, mas não sei como corrigir isso. Alguém aqui poderia ajudar? Grato. Py4nf (discussão) 17h08min de 1 de janeiro de 2017 (UTC)[responder]

Predefinição:Sfn[editar código-fonte]

Parece-me que o algoritmo de avaliação automática não considera a presença da predefinição {{Sfn}} para contar o número de referências em um artigo. Cito como exemplo a página Enrico Fermi, que está avaliada com qualidade 3 por não ter sido encontrada nenhuma referência na seção "Primeiros anos". No entanto, há nessa seção oito citações, e todas elas fazem uso da predefinição {{Sfn}}. Py4nf (discussão) 11h51min de 6 de março de 2017 (UTC)[responder]

Duas ponderações[editar código-fonte]

Me parece termos dois grandes equívocos nas avaliações:

A predef {{Notas e referências}}, que facilita a edição destas seções, faz com que o bot considere o artigo como "sem referências" - um erro, bem grande aliás.
O tamanho máximo dos parágrafos é pífio. Estimula a "quebra" indevida de ideias (aliás, na própria página que essa discute temos um "grande" parágrafo!). As medidas são aleatórias? Tudo bem que artigos pequenos não justificam parágrafos grandes; mas artigos grandes sempre pedem parágrafos maiores. Isto sem dizer quando se usa de citações... Não dá para inserir quebra de parágrafo nelas - sem se deturpar aquilo que está na fonte... Enfim, seria interessante ir aumentando isso a cada "nota": 1, indiferente; 2, 2.500; 3, 3.500; 4, 4.000 bytes - está de bom tamanho.

Espero ter ajudado; quanto melhor esse sistema ficar, menos teremos de nos submeter aos crivos subjetivos de outros usuários. André Koehne (discussão) 02h07min de 23 de julho de 2018 (UTC)[responder]

Concordo com a proposta de se adotar um critério progressivo para o tamanho máximo dos parágrafos. Py4nf (discussão) 21h25min de 23 de julho de 2018 (UTC)[responder]

Abstenho-me quanto ao tamanho dos parágrafos como critério. Só uma nota quanto a isso: nada impede, antes pelo contrário, notas de rodapé dentro dos parágrafos. Comigo é muito frequente ter que fazê-lo, quando o conteúdo do parágrafo vem de várias fontes, por vezes até contraditórias. Entretanto, salvo erro o módulo considera que não há secções de referências quando se usa <references/>, <references></references> ou {{reflist}} e ignora refs colocadas com {{sfn}} ou afins ({{harvnb}}, etc.). --Stego (discussão) 21h43min de 23 de julho de 2018 (UTC)[responder]

Problemas?[editar código-fonte]

Olá! Há algum tempo venho notando avaliações automáticas estranhas. E hoje me deparei com Copa do Mundo FIFA sendo automaticamente avaliado com qualidade 1. Acontece que o artigo é grandinho (beira os 200 mil bytes) e tem imagens e hiperligações. O artigo está sinalizado com problemas de fontes, mas essa marcação não é a de reciclagem ou de contexto, cuja existência impede que o artigo seja automaticamente avaliado como de qualidade 2. Enfim, pelos critérios apresentados em Wikipédia:Avaliação automática#Parâmetros de qualidade, o artigo deveria ser qualidade 4. Como eu encontrei avaliações estranhas em outros artigos, relato aqui a situação e pergunto se há algum problema com a avaliação automática. Saudações, --Luan (discussão) 15h19min de 13 de outubro de 2021 (UTC)[responder]