Wikipédia:Política de robôs – Wikipédia, a enciclopédia livre

Robôs
Nota: Esta politica sobre robôs (bots) abrange o funcionamento de todos os bots e scripts automatizados usados para realizar edições automatizadas na Wikipédia, de forma automática ou semi-automática.

Os robôs são ferramentas automáticas e gerenciáveis que operam na Wikipédia para facilitar a execução de edições repetitivas e em série. Entretanto, não são precisamente robôs, que fazem tudo sozinhos, mas sim agentes de manipulação de artigos, que obedecem a instruções claras e precisas do programador por ele responsável.

São usados em tarefas repetitivas (como upload de arquivos, desambiguação entre artigos, introduzir categorias nas páginas, transformar tabelas de html para wiki, inserir predefinições em séries de artigos e alterar blocos em série em determinadas categorias) que acarretariam um excessivo e maçante trabalho manual. Para operarem, eles precisam ser autorizados pela comunidade, e, como qualquer usuário registrado, precisam ter um nome de usuário e uma palavra-passe.

Importante: Usuários bots (ou robôs) não podem participar de discussões sobre o projeto, nem podem usufruir do direito ao voto nas decisões da comunidade.

Definições

  1. Bots (abreviação de "robots") são programas ou scripts que realizam edições automatizadas, sem a necessidade de intervenção humana.
  2. As edições assistidas abrangem sobretudo scripts e ferramentas especificas para operar a baixa velocidade, com o intuito de auxiliar a edição, sendo que a decisão final da edição cabe ao operador. Qualquer programa ou ferramenta que não permite ao usuário visualizar e editar cada uma das instruções para fazer essa edição (isto é, aquele que pode editar, sem necessitar do operador aprovar a mudança) é considerado um robô.
  3. Scripts são linguagem de script personalizadas que podem automatizar os processos, ou apenas melhorar e reforçar a interface MediaWiki existentes.
  4. Scripts padrão são os scripts que provêm do framework padrão, podendo ser adaptados à versão portuguesa da Wikipédia caso seja necessário, com ampla utilização nos diversos projetos. Estão igualmente contemplados nesta designação scripts não provenientes do framework, mas que estejam já a ser utilizados por vários robôs, seja na Wikipédia lusófona ou em outros projetos.

Utilização dos robôs

Os robôs permitem realizar um elevado número de edições num curto espaço de tempo, sendo que a sua utilização deve ser efetuada com as maiores cautelas. Um script ou ferramenta mal configurada pode difundir erros por um número elevado de artigos e páginas, o que implica um maior cuidado na sua operação. Há que ter em conta de que o nível de controlo é muito mais baixo do que qualquer edição humana, sendo por isso conveniente que estejam sujeitos a um controlo efetivo, que deverá ter início. É fundamental que os scripts ou programas a operar estejam estáveis, ou seja, que apresentem um elevado padrão de qualidade. Robôs com uma elevada taxa de erros podem causar a desconfiança da comunidade pelos robôs em geral, o que não é de todo desejável. Contudo, em casos especiais em que tal se justifique, podem operar condicionados com uma baixa frequência de edição, e sob um escrutínio apertado.

Conta de robô

O operador deve criar uma conta de usuário separada, a fim de operar um robô. O nome da conta deve permitir identificar o operador e/ou função robô, contendo a palavra bot, no início ou no final do nome. Caso seja incluída no interior do nome, deverá constar em maiúsculas ou qualquer outra forma que permita a fácil associação a uma conta bot. Nos casos onde tal não se verifique, a conta não deve induzir em erro, ou seja, possibilitar a confusão com outro usuário, potenciando a sua associação com a conta do robô.

As contribuições de uma conta de robô são da responsabilidade do seu operador, que deve estar claramente identificável na sua página de usuário. Em particular, o operador do robô é responsável pela reparação de qualquer dano causado por um robô que funcione de forma incorreta. Todas as políticas se aplicam a uma conta robô da mesma forma como qualquer outra conta de usuário, sendo consideradas como conta alternativa do operador, devendo estar indicado na página de usuário da conta robô do operador, através da predefinição {{Bot}}, a indicação das tarefas aprovadas, e a ligação para o pedido de aprovação. Pode igualmente ser utilizada a predefinição {{Info/Bot}}, que contém já os campos essenciais. Nos casos em que o operador pretenda que as questões normalmente associadas ao robô sejam efetuadas na sua página de discussão, deve indicar isso mesmo na discussão da conta robô, ou efetuar redirecionamento. Robôs alojados no Toolserver ou outro sistema em que os bloqueios aplicados não devem incidir sobre os IPs, devem ter essa informação devidamente visível.

Estatuto de robô

O estatuto de robô é atribuído pelos burocratas, após resultado positivo no pedido de aprovação. O estatuto indica que a conta é usada por um robô, e reduz alguns dos limites técnicos geralmente impostas pelo software MediaWiki. Edições por estas contas estão ocultas por padrão no mudanças recentes. Em casos especiais, caso se justifique, o robô pode ser aprovado, mas não operar com o estatuto de bot, devendo então ser claramente identificado na página de usuário como robô aprovado sem estatuto, e apresentar uma taxa de edições relativamente baixa, de forma a não causar incómodos nas mudanças recentes.

Requisitos técnicos

Para o robô ser aprovado, o operador terá de demonstrar que possui conhecimentos suficientes para operar o robô em segurança, e que o robô possui as seguintes características:

  1. É inofensivo, ou seja, não sobrecarrega o servidor, não reverte edições válidas, nos casos onde opera sobre as mudanças recentes, deixa uma margem de tempo para que eventuais vandalismos sejam corrigidos.
  2. É útil, ou seja, permite aumentar a quantidade e qualidade de conteúdo, ou a sua verificabilidade.
  3. Não consome recursos desnecessariamente.
  4. Executa apenas as tarefas para as quais há consenso.
  5. O robô e as suas edições estão de acordo com as políticas e orientações do projeto.
  6. Usa mensagens de informação devidamente redigidas, em qualquer edição sejam elas sumários de edição ou avisos nas páginas de discussão, devidamente assinaladas como edições de robô. Tipicamente os robôs incluem no início do sumário a expressão bot.
  7. O programa ou framework se encontrará constantemente atualizado, sempre tendo em conta o bom funcionamento na Wikipédia lusófona.

Embora o desempenho não seja geralmente um problema, os operadores de robô devem reconhecer que um bot fazendo muitos pedidos ou edição a alta velocidade tem um impacto muito maior do que o usuário normal. Os operadores devem ter cuidado para que os robô não realizem pedidos web desnecessários, e serem prudentes na velocidade de edição. Os desenvolvedores devem informar a comunidade caso surjam problemas de desempenho, e em tais situações, as suas diretrizes devem ser seguidas.

Não são permitidos robôs que necessitem efetuar downloads substanciais da Wikipédia, solicitando muitas páginas individuais. Quando esse conteúdo é necessário, deve ser efetuado o download de cópias de segurança (Dumps). Caso necessitem de acesso para executar consultas nos bancos de dados da Wikipédia podem ser executados no Toolserver, embora o Toolserver esteja fora do âmbito desta política.

Especificações técnicas

  • Robôs em fase de testes, assim como robôs aprovados mas realizando tarefas triviais ou sem urgência devem realizar edições com uma frequência mais baixa, que permita proceder a revisão das suas edições quando necessário, e evitar consumo desnecessário de recursos.
  • Robôs sem estatuto de bot devem realizar as edições com uma taxa de edição baixa, dado que são visíveis nas mudanças recentes.
  • A urgência de uma tarefa deve ser sempre considerada, pois tarefas que não necessitam de uma rápida conclusão, como por exemplo uma recategorização, podem e devem ser realizadas a um ritmo mais lento do que as mais urgentes, como por exemplo, reverter vandalismos.
  • A velocidade de edição dos robôs deve se regulada (o AWB permite, assim como a opção -putthrottle:nn no pywikipediabot). Em tarefas não urgentes não devem ultrapassar as 6 edições por minuto (epm), enquanto que em casos urgentes, em situações normais podem editar a cerca de 12 epm.
  • Deve ter-se em atenção os picos de tráfego, adequando o ritmo de edições ao tráfego global.
  • Os servidores devem igualmente ser tidos em conta no que toca à velocidade, devendo adequar-se o ritmo de edições a lag dos servidores, permitindo que os robôs editem mais rapidamente durante períodos de maior acalmia, abrandando consideravelmente quando a carga do servidor é elevada. Isto pode ser conseguido adicionando um parâmetro extra para a sequência de consulta de cada URL solicitada. (Ver Manual Maxlag para mais detalhes)

Restrições em tarefas específicas

Não são permitidos o uso de robôs em determinadas tarefas, de acordo com o seu grau de fiabilidade, ou devido a processos de otimização de edições. Em algumas destas tarefas, é preferível utilizar semirrobôs, quando aplicável. Tarefas mínimas ou triviais devem ser evitadas, sendo preferencialmente integradas numa outra tarefa, de maior importância.

Entre as tarefas com restrições, que não devem ser usadas isoladas encontram-se:

  • Correção automática de ortografia
Corretores automáticos são fortemente desencorajados, e usados somente em casos especiais. Deve-se ter em conta que é praticamente impossível prever todas as situações, e que mesmo nos casos aparentemente mais simples, existe a possibilidade de falsos positivos, como no caso de livros com títulos que o robô não reconhece como título de livro, sites ou nomes próprios, ou mesmo alterações de variantes linguísticas. Assim, de forma geral, a correção assistida é permitida, tal como em casos específicos com elevada taxa de acerto, contudo a utilização sistemática de corretores ortográficos generalistas não são bem vistos pela comunidade.
  • Correções de sintaxe
Corretores automáticos de sintaxe devem ser usados com cautela. À semelhança dos corretores ortográficos, nem todas as situações estão contempladas, correndo o risco de se realizarem correções menores e não críticas, que seriam facilmente efetuadas integradas noutras edições mais urgentes.

Atribuição de estatuto

O sistema de atribuição de estatuto de robô na Wikipédia lusófona é similar ao da Wikipédia anglófona, ou seja, nenhum bot poderá operar sem estar registado (ou em fase de teste).

  1. O operador terá de fazer o pedido, seguindo as instruções indicadas em Wikipédia:Robôs/Pedidos de aprovação.
  2. Um avaliador, que pode ser um burocrata, um membro do grupo de aprovação de robôs ou um operador de robôs experiente[1], verificará as informações colocadas pelo operador no pedido e as edições feitas pelo editor e pelo robô nos projetos e nas respetivas páginas de discussão do robô, para verificar se têm ocorrido erros.
  3. Se tudo estiver correto com o operador/robô, o avaliador[1] avisará o operador de que o bot poderá editar na Wikipédia durante cerca de uma semana, em fase de testes. Nesse ínterim, terá de efetuar, no máximo, duas a três edições por minuto (em caso de incumprimento deverá ser bloqueado temporariamente) até atingir cerca de 50 edições.
  4. Concluída a semana de testes, o autorizador, que pode ser um burocrata ou um membro do grupo de aprovação de robôs[1], verificará as edições do robô, assim como o seu comportamento, e, se não houver problema, emitirá a autorização para o robô operar, atribuindo-lhe o estatuto (caso seja um burocrata), ou comunicando aos burocratas (caso o membro do grupo de aprovação não seja um deles) ou aos stewards (na ausência de burocratas) a aprovação do pedido. Se existir algum erro, o operador terá de se justificar e, mediante a resposta, será atribuído (ou não) o estatuto, podendo ser solicitadas mais edições de teste, ou prolongado o período de testes.

Nota: A utilização das expressões bot e robô nos nomes de usuários (que não sejam bots) será considerada como imprópria, e o usuário deverá ser avisado caso use tal nome impróprio e bloqueado (por período indeterminado). Se for um robô, terá de fazer o pedido para aprovação do estatuto.

Casos especiais

Há casos em que não se justifica o tempo padrão da semana de testes, ou a exigência de testes exaustivos ao script ou programa utilizado. Por exemplo, um operador que possua já uma conta de bot autorizado, e peça autorização para uma conta de robô de interwikis, usando o interwiki.py, pode ver a nova tarefa ou bot aprovada por uma aprovação rápida, pois tanto o operador como o script já tiveram as suas capacidades devidamente aferidas.

  • Robôs com Scripts padrão
Robôs que utilizem scripts padrão regra geral, podem ver reduzido o tempo da fase de testes, estando o script em uso em vários projetos e sem problemas. Sendo usado com responsabilidade pelo operador não é passível de causar grandes problemas. A mesma regra aplica-se para bots que utilizem scripts já usados por outros bots, sem modificações ou com ligeiras modificações que não impliquem um resultado significativamente diferente do original.
  • Robôs anti-vandalismo
Os robôs anti-vandalismo são ferramentas essenciais, e são casos que devem ser analisados com a devida cautela. Nestes casos, deve sempre ter-se em conta que só devem ser aprovados quando estiverem completamente operacionais e com uma elevada taxa de acerto. Bots deste segmento com problemas de funcionamento ou mal operados podem causar sérias desconfianças da comunidade nos mesmos, para além de poder causar conflitos desnecessários entre os usuários. Assim, a fase de testes pode ser prolongada pelo tempo necessário para que o estatuto de bot seja atribuído já quando o script se aproximar bastante do state-of-art.
  • Robôs com estatuto de administrador
Robôs com estatuto de administrador devem ser operados por um administrador local. Contudo, em casos específicos pode ser atribuído o estatuto a um bot cujo operador não seja administrador na Wikipédia lusófona, mediante consulta à comunidade. A discussão pode ser efetuada nos meios próprios gerais, ou no pedido de aprovação, mediante significativa publicidade. Caso o script original tenha já passado por este escrutínio, e seja usado sem problemas por outro bot local, poderá ser dispensada a consulta à comunidade, ficando somente por analisar a necessidade de um novo bot para operar nessas tarefas e se o operador proposto está apto a operar este tipo de bot.
Em casos específicos nos quais se faça necessária uma flag temporária de administrador ou correlata, limitada num curto espaço de tempo, e com reduzida quantidade de edições a serem efetuadas, poderá ser concedida a flag sem consulta à comunidade se tanto os burocratas ou o grupo de aprovação de robôs[1] entenderem tratar-se uma tarefa necessária, cumprindo pressupostos técnicos que ofereçam garantias de segurança relativamente às edições, e cujo operador, apesar de não ter o estatuto necessário para a realização manual dessas tarefas, tem a confiança da comunidade para operar o bot em tal tarefa.
  • Robôs para criação de artigos
Robôs que criem artigos necessitam de aprovação prévia, mesmo tendo já aprovação para operar outras tarefas. Antes de iniciarem as tarefas, deverão abrir uma discussão na coordenação robótica, descrevendo os artigos a criar assim como o conteúdo, sendo posteriormente discutido.

Referências

  1. a b c d Critérios de avaliação e/ou aprovação dos pedidos para obtenção do estatuto de robô definidos em: Wikipédia:Esplanada/propostas/Extinção do GAB (14fev2016).

Ver também

Outros projetos Wikimedia também contêm material sobre este tema:
Wikisource Textos originais no Wikisource
Commons Imagens e media no Commons
Meta-Wiki Meta-Wiki
Commons Categoria no Meta