22.5 C
Barra de São Francisco
90

Descoberta de Abuso Sexual Infantil em Grande Base de Dados de IA

Date:

Compartilhe:

Descoberta de Abuso Sexual Infantil em  Maior Base de Dados de IA.

Após os investigadores detectarem materiais relacionados a abuso infantil, a base de dados LAION-5B foi desativada como medida preventiva.

Uma equipe do Stanford Internet Observatory revelou que o conjunto de dados utilizado para treinar ferramentas de IA na geração de imagens contém, no mínimo, 1.008 materiais relacionados a abuso sexual infantil (CSAM).

O estudo divulgado hoje indica que a presença desse conteúdo na “matéria-prima” que alimenta os modelos de inteligência artificial pode resultar no treinamento para gerar novas e ainda mais realistas imagens de CSAM.

Descoberta de Abuso Sexual Infantil em  Maior Base de Dados de IA.
Abuso Sexual Infantil encontrado em Base de Dados de IA

O documento destaca que os modelos mais recentes, como o Stable Diffusion, são treinados com bilhões de imagens provenientes da base de dados LAION-5B2.

Esta base, alimentada principalmente por pesquisa não direcionada, inclui uma quantidade significativa de material explícito.

IA e Geração de Conteúdo: Explorando a Conclusão dos Pesquisadores

Os pesquisadores já haviam concluído que os modelos de IA são capazes de gerar esse tipo de conteúdo relacionado a abuso sexual infantil ao combinar termos como “crianças” e “atos explícitos”.

Contudo, com este material específico, a IA consegue compreender o CSAM devido ao treinamento realizado com essas imagens explícitas.

A LAION, responsável pela criação da base de dados, respondeu à investigação, informando à 404 Media que temporariamente removeu a LAION-5B2 como precaução para realizar uma limpeza e garantir sua segurança antes de ser restabelecida.

Essa base de dados alimenta sistemas como o da Google, Stable Diffusion e outros modelos importantes.

A empresa declarou que, antes de republicar a base de dados, implementará filtros para detectar e remover conteúdo ilegal.

O estudo menciona que os administradores da LAION estavam cientes desde 2021 de que seus sistemas poderiam “capturar” esse tipo de conteúdo dentre as bilhões de imagens coletadas da internet.

A Bloomberg havia destacado anteriormente que essa base de dados continha milhões de imagens relacionadas à pornografia, violência, memes racistas, símbolos de ódio, arte com direitos autorais, nudez infantil e trabalhos retirados de sites de empresas privadas.

Ao todo, o LAION-5B possui 5 bilhões de imagens e é utilizado por muitos modelos de IA.

-publicidade-spot_img

━ MAIS LINKS

Força Tática e K9 realizam apreensões de drogas e munições em Barra de São Francisco

Na tarde dessa quarta-feira (16), duas operações distintas em Barra de São Francisco, conduzidas pela Força Tática, Patrulha K9 e equipes de apoio, resultaram...

Prefeitura de Barra de São Francisco constrói bueiros nos Córregos Miracema e Itá e registra a marca de 236 construções

A prefeitura de Barra de São Francisco, por meio da Secretaria Municipal de Transportes e Estradas (Semte), construiu mais dois bueiros no município. O...

Prefeitura de Barra de São Francisco promove Palestra sobre o Outubro Rosa para mulheres do bairro Vila Landinha

A Prefeitura de Barra de São Francisco promoveu, por meio da Secretaria de Saúde e sob a coordenação da Unidade de Saúde Elita Coimbra,...

Polícia Federal deflagra operação em Ecoporanga

Na manhã desta quarta-feira (16), em ação conjunta entre a Polícia Federal, a Polícia Rodoviária Federal e a Receita Federal no Espírito Santo, foi...

Volta do horário de verão em 2024 é descartada pelo governo

O ministro de Minas e Energia, Alexandre Silveira, anunciou, nesta quarta-feira (16), que o governo federal não irá retomar o horário de verão em...

Deixe um Comentário

Por favor, insira seu comentário!
Seu comentário está aguardando moderação