Curso de formação: Qualidade e Limpeza de Dados de Biodiversidade - 2025

cartaz curso


Este curso está enquadrado pelo projecto GBIF.PT - Centro de Gestão de Dados de Biodiversidade, no âmbito do Programa Nacional de Ciência Aberta e Dados Abertos de Investigação (PN CADAI).

Objetivo do curso
Data e local
Descrição
Requisitos
Inscrição
Critérios de selecção dos alunos
Informações
Preparação do curso
Programa
Apresentações
Exercícios
Lista de participantes

 

Objetivo do curso
O principal objetivo do curso é proporcionar aos participantes os conhecimentos e prática sobre os princípios e métodos de qualidade e limpeza de dados de biodiversidade.

Data e local
23, 24 e 25 de Julho de 2025, Sala PORBIOTA (sala 48), Instituto Superior de Agronomia (Edifício Principal), Lisboa

Descrição
Este curso teórico-prático irá explanar os princípios de qualidade de dados, e procurar a sua aplicação através de práticas de deteção e limpeza de dados, com exemplos práticos. A qualidade dos dados é um dos aspetos mais importantes que determina a potencial utilização de um conjunto de dados. Esta qualidade é determinada por múltiplos factores, que integram a cadeia de produção e processamento da informação, desde o registo ou captura inicial até à utilização e interpretação final. A qualidade dos dados de biodiversidade está igualmente associada às suas várias dimensões, desde a taxonomia à informação espacial, metainformação, armazenamento e publicação.

O curso cobrirá os seguintes tópicos:

  • Princípios para a qualidade de dados

  • Ferramentas e protocolos para a qualidade de dados

  • OpenRefine

  • Qualidade de dados taxonómicos e espaciais

Requisitos
A experiência anterior no registo, manutenção e gestão de dados de biodiversidade favorece um melhor aproveitamento do curso, mas estes não são requisitos. Idealmente, os participantes deste curso deverão trazer um conjunto de dados de biodiversidade para realizar as partes práticas de controlo de qualidade, deteção e limpeza de dados. No caso de não ter a possibilidade de trazer esse conjunto de dados, será fornecido um, como exemplo. Os participantes podem trazer computador portátil, ou usar o computador da sala.

Inscrição
Pode efetuar a sua inscrição até 9 de Julho de 2025. Use para o efeito o formulário de inscrição. Para além dos seus dados, deverá informar sobre quais as motivações para participar no curso, e um pequeno resumo sobre a actividade anterior relacionada com a gestão de dados de biodiversidade.

A lista de alunos seleccionada será publicada nesta página no dia 11 de Julho de 2025.

Critérios de selecção dos alunos
Devido ao número limitado de lugares, poderá ser necessário realizar a selecção das candidaturas, segundo os seguintes critérios:

  • Avaliação da motivação e experiência anterior;

  • Número de candidaturas originárias da mesma instituição ou organização;

  • Ordem de inscrição.

Informações

Data: 23, 24 e 25 de Julho de 2025
Local: Instituto Superior de Agronomia, Edifício Principal, sala PORBIOTA (sala 48)
Como chegar: Tapada da Ajuda, Lisboa. Ver informações em http://www.gbif.pt/node/390
Organização: Nó Português do GBIF, Instituto Superior de Agronomia
Formador: Rui Figueira
Língua do curso: Português
Nº máximo de participantes: 20
Total de horas de formação: 24h
Data limite para candidatura: 9 de Julho de 2025
Preço de inscrição: gratuito
Contacto: node@gbif.pt
Inscrição: através do seguinte formulário

Preparação do curso
Os participantes devem preparar um conjunto de dados próprio para ser utilizado nas sessões práticas.

 

Programa

(descarregar programa em pdf)

Dia 1, Quarta-feira, 23 de Julho de 2025

09:00-09:30h - Bloco 0 - Apresentação
0.1. Boas-vindas
0.2. Apresentação dos participantes

09:30-10:30h - Bloco 1 - Introdução geral
1.1. Introdução à informática para a Biodiversidade
1.2. Dados abertos e qualidade dos dados

10:30-11:00h - Intervalo

11:00-12:30h - Bloco 2 - Princípios para a qualidade de dados
2.1. Princípios de qualidade de dados
2.2. Ontologias e padrões de dados de biodiversidade
2.3. Dados de referência em biodiversidade

12:30-14:00h - Intervalo para almoço

14:00-15:30h - Bloco 3 - Ferramentas e protocolos para a qualidade de dados
3.1. Ferramentas e recursos para a qualidade de dados
3.2. Boas práticas para o uso de folhas de cálculo no manuseamento de dados
3.3. Prática de uso de ferramentas e folhas de cálculo

15:30-16:00h - Intervalo

16:00-17:00h - Bloco 3 - Continuação
3.1. OpenRefine I – deteção e correção de erros
3.1. Prática de uso do OpenRefine - I

====////====

Dia 2, Quinta-feira, 24 de Julho de 2025

09:00-10:30h - Bloco 4 - Publicação de dados abertos
4.1. Revisão do dia 1
4.2. Princípios FAIR e publicação de dados abertos
4.3. Controlo de qualidade na publicação de dados através do GBIF

10:30-11:00h - Intervalo

11:00-12:30h - Bloco 5 - OpenRefine
5.1. OpenRefine II – scripts para a correção de dados
5.2. Prática OpenRefine II – scripts

12:30-14:00h - Intervalo para almoço

14:00-15:30h - Bloco 5 - OpenRefine (continuação)
5.3. OpenRefine III – reconciliação de dados
5.4. Prática OpenRefine III – reconciliação de dados

15:30-16:00h - Intervalo

16:00-17:00h - Bloco 6 - Qualidade de dados e Caracteres especiais
6.1. Qualidade de dados - caracteres especiais
6.2. Exercício de identificação e limpeza de caracteres especiais

====////====

Dia 3, Sexta-feira, 25 de Julho de 2025

09:00-10:30h - Bloco 7 - Qualidade de dados taxonómicos
7.1. Revisão do dia 2
7.2. Revisão sobre os projetos globais de informação sobre Biodiversidade
7.3. Qualidade de dados no registo em campo
7.4. Qualidade e correção de dados taxonómicos

10:30-11:00h - Intervalo

11:00-12:30h - Bloco 7 - Qualidade de dados taxonómicos (continuação)
7.5. Prática de limpeza de dados taxonómicos

12:30-14:00h - Intervalo para almoço

14:00-15:30h - Bloco 8 - Qualidade de dados espaciais
8.1. Qualidade e correção de dados espaciais
8.2. Prática de limpeza de dados espaciais

15:30-16:00h - Intervalo

16:15-17:00h - Bloco 9 - Conclusão e avaliação do curso
9.1. Revisão / Dúvidas
9.2. Avaliação do curso

Descarregue o programa em pdf

 

Apresentações

 

Exercícios

 

Aqui será publicada a lista de participantes

Fonte de financiamento

Esta iniciativa está integrada no projeto de criação dos Centros para a GDI, inserido no Programa Nacional de Ciência Aberta e Dados Abertos de Investigação (PNCADAI), uma medida do investimento RE-C05-i08 – Ciência Mais Digital financiado pelo Plano de Recuperação e Resiliência (PRR)