whatsapp
15 Apr
QUEM SAO OS BRASILEIROS QUE ALIMENTAM AS IAS.

A produção da inteligência artificial (IA) é comumente associada ao trabalho de engenheiros de software ou profissionais altamente qualificados, vinculados a grandes empresas ou start-ups especializadas, que se desenvolveram inspiradas na ideologia californiana

Contudo, o desenvolvimento de “tecnologias inteligentes” depende também, em diferentes etapas, de uma multidão de trabalhadores precarizados, sub-remunerados e invisibilizados, os quais dispersos globalmente realizam atividades repetitivas, fragmentadas, pagas por tarefa e feitas em poucos segundos.

Trata-se de trabalhadores que rotulam dados para treinar algoritmos, mediante tarefas que necessitam das capacidades intuitivas, criativas e cognitivas dos seres humanos, tais como categorização de imagens, classificação de publicidades, transcrição de áudios e vídeos, avaliação de anúncios, moderação de conteúdos em mídias sociais, rotulagem de pontos de interesse anatômicos humanos, digitalização de documentos etc.

. Embora se trate de um processo essencial ao aprendizado de máquina (machine ou deep learning), esse trabalho é externalizado para plataformas digitais ou para redes especializadas de terceirização , bem como é realizado nas franjas da informalidade, sem quaisquer proteções social ou trabalhista (salvo algumas exceções), tampouco autonomia para negociação de remuneração.Esta forma de trabalho é frequentemente designada por “microtrabalho”

. Tal termo ganhou popularidade em meados dos anos 2000, baseado no conceito de “microcrédito”, abordagem econômica que teria supostamente por finalidade garantir inclusão financeira a populações vulnerabilizadas e marginalizadas, sem acesso a serviços bancários. 

É nessa esteira discursiva que surgem as plataformas digitais especializadas em rotulagem e treinamento de dados para IA, como se a produção de dados pudesse oferecer uma possibilidade semelhante, porém relacionada à obtenção de renda on-line. No mundo todo, estima-se que haja mais de 160 milhões de trabalhadores  registrados em plataformas de microtrabalho e freelancer 

Nas plataformas de trabalho freelancer, a média global de remuneração é de 7,6 dólares por hora, enquanto nas de treinamento de dados a média é de 3,3 dólares por hora

. Numa perspectiva mais ampla, uma pesquisa realizada pelo Banco Mundial estima que globalmente há entre 154 e 435 milhões de trabalhadores subordinados a diferentes tipos de plataformas digitais

.Os estudos sobre o microtrabalho surgiram em meados de 2010 e a maior parte das pesquisas se concentra em países da Europa e da América do Norte. 

Os principais produtores de IA no mundo estão sediados no Norte Global, porém se servem majoritariamente de mão de obra barata proveniente do Sul Global 

. Pesquisas recentes evidenciaram ainda a expressiva presença de trabalhadores de diferentes países da América Latina nessa cadeia produtiva

No Brasil, organizaram obras coletivas dedicadas à compreensão dos impactos das plataformas digitais no mundo do trabalho, inclusive no que diz respeito à produção da IA e à nova morfologia do trabalho em nossa sociedade. A plataformização do trabalho e a uberização, nesse sentido, têm sido objeto de inúmeros debates, notadamente relacionados ao processo histórico de informalização do trabalho em território nacional

. Todavia, ainda são incipientes as pesquisas empíricas concernentes ao trabalho digital de rotulagem e treinamentos de dados para IA .Em contraposição,  constatou a existência de ao menos 54 plataformas de microtrabalho em operação no Brasil, sendo que 29 abarcavam microtarefas de geração, anotação ou verificação de dados para aprendizado de máquina, o que indica que o Brasil constitui uma das principais reservas de mão de obra desse mercado na América Latina. 

Mas quem são, afinal, os trabalhadores brasileiros que atuam nessas plataformas? Em quais condições realizam seus trabalhos? Quanto ganham? Por que recorrem às plataformas? Quais as diferenças entre trabalhadores do Norte Global e do Sul Global, quando nos remetemos à produção e à qualificação de dados que sustentam a produção da IA? Esse trabalho poderia, enfim, ser considerado como uma sólida oportunidade de renda para países subdesenvolvidos ou em desenvolvimento.

Para responder a essas interrogações, buscamos cartografar o perfil sociodemográfico dos trabalhadores brasileiros no mercado de anotação de dados, para depois analisarmos em quais condições realizam suas atividades. Para tanto, fizemos uma pesquisa exploratória que abarcou métodos mistos. Primeiro, elaboramos uma etnografia digital dos anos de 2020 e 2021, em 24 grupos de WhatsApp e Facebook relacionados a esse mercado

. A partir dessa inserção no campo, no ano seguinte convidamos individualmente alguns membros desses grupos e realizamos quinze entrevistas em profundidade. Tratou-se de dez mulheres e cinco homens, com idade mínima de 22 e máxima de 54 anos.

 Entre os participantes, treze pessoas possuíam ensino superior completo, em diferentes áreas, como direito, engenharia de petróleo, fisioterapia, engenharia civil, administração, biotecnologia, letras, comércio exterior e ciência da computação.

 Todos trabalhavam em ao menos uma e no máximo quatro plataformas concomitantemente, entre as seguintes: Amazon 

 O instrumento foi desenvolvido no bojo do DiPLab (Digital Platform Labor Research Group), traduzido da versão em espanhol (aplicado em países como Argentina, Bolívia, Chile, Colômbia, Costa Rica, Equador, República Dominicana, Venezuela etc.) e adaptado para o português, de acordo com particularidades do Brasil. O questionário compreendia cerca de 120 questões, relacionadas a informações sociodemográficas variadas, como níveis de escolaridade, situação familiar, experiência profissional, renda, uso da internet, relações sociais e condições de trabalho nas plataformas. 

A escolha pela plataforma justificou-se pelo fato de abarcar variadas modalidades de microtrabalho. No que concerne às questões éticas específicas das pesquisas em plataformas de microtrabalho, fundamentamo-nos nas reflexões e recomendações realizadas por Molina et al.

. Para análise dos dados, primeiro fizemos uma caracterização das plataformas de treinamentos de dados, de maneira a compreendermos como elas se inserem em cadeias globais de suprimentos para produção da IA. Depois, problematizamos a sociodemografia e as condições de trabalho dos brasileiros nesse mercado, com foco nas assimetrias existentes entre países do Norte Global e do Sul Global.

Pedro, 54 anos, é graduado em comércio exterior, porém trabalha como corretor. Concilia essa atividade com outro trabalho, em plataformas digitais cujas tarefas implicam atividades como transcrever áudios, classificar avaliações de anúncios em websites de empresas e catalogar descritores para aperfeiçoar os mecanismos de busca do Google.

 No passado, participou também de projetos relacionados à moderação de conteúdos pornográficos e violentos em mídias sociais como Facebook e Instagram.

 Clara, 38 anos, é graduada em administração e morou no exterior por alguns anos. Ao voltar para o Brasil, trabalhou como professora de inglês, mas não se adaptou à escola à qual estava vinculada. 

Desde então, trabalha em plataformas de microtarefas variadas, notadamente relacionadas a avaliações de anúncios, classificação de dados e moderação de conteúdos em mídias sociais. Izabela, por sua vez, tem 29 anos e é mãe solo de uma filha de 9 anos. Mudou-se do Nordeste para o Sudeste do país para fazer um mestrado em uma prestigiada universidade pública. 

Como sua bolsa de pesquisa não lhe oferece condições financeiras suficientes para se manter, trabalha todas as noites em plataformas como Appen e OneForma, realizando microtarefas de transcrições de áudios. Embora possuam trajetórias de vida bastante distintas, o que Pedro, Clara e Izabela têm em comum?

Os três trabalham em plataformas digitais, como Appen, OneForma, Telus, Clickworker e Microworkers, voltadas à rotulagem de dados para o desenvolvimento da IA. Se os dados são uma das principais fontes de valor na indústria de “tecnologias inteligentes” (como carros autônomos, assistentes de voz e chatbots como o ChatGPT), fabricá-los e treiná-los é mais complexo do que comumente imaginamos. 

O trabalho de geração e anotação de dados é vastamente utilizado na produção da IA e cumpre uma variedade de funções que gravitam em torno de três polos: preparação, verificação e imitação da IA  conforme evidenciado na figura 1

.No primeiro caso, para que empresas, start-ups ou laboratórios de pesquisa desenvolvam algum tipo de IA, extensas bases de dados precisam ser geradas e qualificadas (via anotação e rotulagem), para que sejam estabelecidos os parâmetros técnicos dos algoritmos de aprendizagem. Esse processo exige um trabalho cognitivo sensível, elementar para extração e geração de valor de tais dados

 Na indústria de reconhecimento facial, por exemplo, a preparação da IA compete a trabalhadores que, mediante plataformas digitais ou redes especializadas de terceirização, realizam manualmente microtarefas de geração de dados, identificação de padrões de reconhecimento, classificação de expressões faciais e rotulagem de diferentes partes anatômicas do rosto (nariz, boca, olhos etc.) Mesmo após os processos de geração e anotação de dados, os parâmetros técnicos da produção da IA precisam ser continuamente aperfeiçoados, sobretudo para correção de eventuais falhas e para garantir maior acurácia técnica dos resultados dos algoritmos de aprendizagem. 

E aqui nos remetemos à função de verificação dos resultados da IA. Em plataformas digitais como Appen e Clickworker, microtarefas de verificação são recorrentes e envolvem, por exemplo, ouvir áudios e verificar se a transcrição automática gerada pelo assistente virtual está correta ou não

 Nesse cenário, Perrigorevelou em reportagem publicada na revista Time que, visando deixar o ChatGPT menos “tóxico”, a OpenAI (empresa proprietária) contou com a terceirização de quenianos, contratados por menos de dois dólares por hora, para realizarem tarefas de verificação e rotulagem de dados relacionadas a comentários violentos que descreviam detalhadamente situações de abuso sexual infantil, assassinato, incesto, zoofilia, suicídio, tortura e automutilação.

 A referida empresa, denominada Sama, é sediada em São Francisco e se especializou na terceirização de trabalhadores no Quênia, em Uganda e na Índia, para rotular dados para clientes como Microsoft, Google e Meta

.Em outras situações, como o desenvolvimento do aprendizado de máquina é caro e por vezes falho, trabalhadores passam a desempenhar funções que supostamente deveriam ser realizadas por máquinas.

 Trata-se da imitação da inteligência artificial. É o caso, por exemplo, do Google Duplex, assistente virtual voltado à realização de ligações a empresas para agendamento de reservas e confirmação de horários. Em 2019, contudo, descobriu-se que cerca de 25% das chamadas realizadas pela ferramenta eram feitas por humanos em call centers, os quais imitavam a IA

.Nessa mesma direção, Le Ludec et al. relatam o caso de uma start-up francesa que criou uma IA centrada em visão computacional que permite que câmeras de vigilância em lojas identifiquem furtos de maneira automatizada.

 Ao perceber algum tipo de comportamento suspeito, os caixas ou gerentes de lojas recebem mensagens automáticas de alerta em seus celulares. Três empresas terceirizadas em Madagascar e uma na Indonésia fazem o microtrabalho de preparação de dados e verificação dos resultados da IA da companhia na França, que envolve majoritariamente assistir a vídeos de câmeras (com pessoas supostamente roubando, desembalando ou danificando produtos) e rotular comportamentos considerados suspeitos, em menos de um minuto.

 Os autores revelaram, todavia, que alguns vídeos a serem rotulados eram, na realidade, reproduzidos em tempo real, diretamente das câmeras de alguns clientes da start-up. Mais que preparação e verificação, trabalhadores imitavam a IA e cumpriam a função de seguranças remotamente

Processamentos de linguagem natural (que utilizam Large Language Models), visão computacional, análises preditivas, sistemas autônomos, assim como toda tecnologia baseada em aprendizado de máquina, incluindo a inteligência artificial generativa, dependem vastamente do trabalho humano de preparação, verificação ou imitação da IA.

 A título de ilustração, segundo relatório produzido pela Cognilytica  estima-se que o mercado de geração e anotação de dados para IA chegará a 3,5 bilhões de dólares até o fim de 2024. Tarefas de preparação e rotulagem de dados, nesse contexto, representam cerca de 80% do tempo gasto na maior parte dos projetos de IA que envolvem aprendizado de máquina . Evidencia-se, portanto, que esse trabalho constitui um ingrediente secreto da cadeia de suprimentos da IA.

 Secreto, pois ele parece ser invisibilizado, por parte dos produtores da IA globalmente, de modo que, sobretudo no Brasil, segue ainda distante da esfera pública e da agenda regulatória, tanto no âmbito da IA como no do trabalho plataformizado.Nos últimos dez anos, esse mercado se diversificou e se expandiu de maneira heterogênea.\

 A Amazon Mechanical Turk, primeira plataforma global de treinamentos de dados, lançada em 2005 por Jeff Bezos, parece ter perdido relevância, frente ao surgimento de novas plataformas intermediárias

Comments
* The email will not be published on the website.