Ir para o conteúdo

Esquema de anotação#

Desenvolvemos o esquema de anotação para maximizar a eficiência do anotador.

O OLID-BR contém uma coleção de frases anotadas em português brasileiro usando um modelo de anotação que abrange os seguintes níveis:

Taxonomia hierárquica para categorizar linguagem ofensiva, proposta pelo autor.

Para isso, definimos 4 perguntas que nossos anotadores qualificados responderão a cada frase.

  • Este texto é tóxico?
  • Que tipo de toxicidade tem?
  • Há um alvo específico?
  • Quais palavras tornam este texto tóxico/ofensivo?

A imagem a seguir mostra a tela de anotação que nossos anotadores utilizarão.

Interface de rotulagem - Label Studio

Última atualização: 1 de março de 2023