DESPERTANEWS

A Importância das Bases de Dados na Ufologia

Bases de dados são ferramentas cruciais para a coleta e análise de informações sobre avistamentos de Objetos Voadores Não Identificados (OVNIs). Há diversas bases de dados, cada uma com seu próprio escopo e metodologia, o que pode levar a uma proliferação e dispersão de dados heterogêneos. No entanto, a integração e a padronização dessas bases são desafios constantes, especialmente devido à necessidade de garantir a rastreabilidade e a anonimidade dos dados dos testemunhos.

Diversidade e Novidade nas Bases de Dados de OVNIs

Uma página no site RR0 lista aproximadamente 60 catálogos de casos de OVNIs, mas esse número está longe de ser exaustivo. Descubro novos catálogos anualmente, alguns antigos e esquecidos, outros completamente novos. Um exemplo recente é a apresentação da CUCO, uma fusão de bases de dados da Espanha, Portugal e Andorra, que revelou um banco de dados com 12.155 casos mantido por 24 anos.

A CUCO tomou boas decisões, como garantir a rastreabilidade dos dados e a anonimidade das testemunhas. Contudo, como qualquer fusão de bases de dados existentes, enfrentou desafios comuns, como a definição de campos específicos para fontes mescladas e a normalização de um pequeno subconjunto desses campos para a realização de estatísticas .

Decisões de Escopo e Perda de Informação

Ao criar uma base de dados, é crucial definir o que constitui um “caso de OVNI” para evitar uma coleta de dados excessiva. Por exemplo, casos de bigfoot devem fazer parte de uma base de dados de OVNIs? Em um catálogo CE3 (Encontros de Terceiro Grau), talvez sim, devido à correlação entre avistamentos de bigfoot e OVNIs em alguns estudos. Há, inclusive, estudos que sugerem uma correlação entre avistamentos de OVNIs e bigfoot .

Outro ponto importante é a restrição de casos de OVNIs apenas a objetos voadores ou qualificações “extraterrestres”. Tal definição pode excluir um conjunto de dados valiosos usados em hipóteses de larga escala, como as paranormais. Portanto, uma base de dados mais ampla pode reduzir a necessidade de criação de outras bases de dados, diminuindo a dispersão de informações .

A perda de informação é uma consequência inevitável ao estruturar dados em campos e colunas. No entanto, avanços em Inteligência Artificial (IA) e Processamento de Linguagem Natural (NLP) prometem extrair características complexas de textos e outros meios. Até lá, casos em bases de dados tradicionais são frequentemente reduzidos a codificações simplificadas de arquivos de investigação complexos .

A Questão da Anonimidade e Acessibilidade dos Dados

A anonimização dos dados é uma forma de perda de informação, mas necessária para proteger as testemunhas. No entanto, essa proteção deve ter um limite de tempo, pois dados centenários anônimos podem ajudar significativamente nas investigações. A anonimidade é comparada aos relatórios da Gendarmerie francesa, que são mantidos em sigilo por 60 anos .

A acessibilidade das bases de dados também é um desafio. A CUCO, por exemplo, não está publicamente disponível após 24 anos. Questões legais, como direitos autorais e sigilo de defesa, justificam essa restrição, mas podem ser contornadas com documentos redigidos e bases de dados anonimizadas. Publicar cedo e permitir o acesso aos dados brutos é crucial para evitar a perda de informações e incentivar a colaboração .

Conclusão: Melhores Práticas para Bases de Dados

Para ampliar o público e a adoção de bases de dados, é importante:

  • Maximizar o escopo da base de dados.
  • Publicar cedo e permitir a reutilização dos dados com uma licença controlada.
  • Evitar a perda de dados fornecendo tanto dados estruturados quanto os brutos.

Estas práticas ajudam a reduzir a necessidade de criar novas bases de dados e promovem uma maior colaboração e confiança na ufologia.

Fontes: Why so many databases?. Openness boosts adoption | by RR0 | Jul, 2024 | Medium

Compartilhar

Relacionadas

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *