Curso de formação: Qualidade e Limpeza de Dados de Biodiversidade - 2025

cartaz curso


Este curso está enquadrado pelo projecto GBIF.PT - Centro de Gestão de Dados de Biodiversidade, no âmbito do Programa Nacional de Ciência Aberta e Dados Abertos de Investigação (PN CADAI).

Objetivo do curso
Data e local
Descrição
Requisitos
Inscrição
Critérios de selecção dos alunos
Informações
Preparação do curso
Programa
Apresentações
Exercícios
Lista de participantes

 

Objetivo do curso
O principal objetivo do curso é proporcionar aos participantes os conhecimentos e prática sobre os princípios e métodos de qualidade e limpeza de dados de biodiversidade.

Data e local
23, 24 e 25 de Julho de 2025, Sala PORBIOTA (sala 48), Instituto Superior de Agronomia (Edifício Principal), Lisboa

Descrição
Este curso teórico-prático irá explanar os princípios de qualidade de dados, e procurar a sua aplicação através de práticas de deteção e limpeza de dados, com exemplos práticos. A qualidade dos dados é um dos aspetos mais importantes que determina a potencial utilização de um conjunto de dados. Esta qualidade é determinada por múltiplos factores, que integram a cadeia de produção e processamento da informação, desde o registo ou captura inicial até à utilização e interpretação final. A qualidade dos dados de biodiversidade está igualmente associada às suas várias dimensões, desde a taxonomia à informação espacial, metainformação, armazenamento e publicação.

O curso cobrirá os seguintes tópicos:

  • Princípios para a qualidade de dados

  • Ferramentas e protocolos para a qualidade de dados

  • OpenRefine

  • Qualidade de dados taxonómicos e espaciais

Requisitos
A experiência anterior no registo, manutenção e gestão de dados de biodiversidade favorece um melhor aproveitamento do curso, mas estes não são requisitos. Idealmente, os participantes deste curso deverão trazer um conjunto de dados de biodiversidade para realizar as partes práticas de controlo de qualidade, deteção e limpeza de dados. No caso de não ter a possibilidade de trazer esse conjunto de dados, será fornecido um, como exemplo. Os participantes podem trazer computador portátil, ou usar o computador da sala.

Inscrição
Pode efetuar a sua inscrição até 9 de Julho de 2025. Use para o efeito o formulário de inscrição. Para além dos seus dados, deverá informar sobre quais as motivações para participar no curso, e um pequeno resumo sobre a actividade anterior relacionada com a gestão de dados de biodiversidade.

A lista de alunos seleccionada será publicada nesta página no dia 11 de Julho de 2025.

Critérios de selecção dos alunos
Devido ao número limitado de lugares, poderá ser necessário realizar a selecção das candidaturas, segundo os seguintes critérios:

  • Avaliação da motivação e experiência anterior;

  • Número de candidaturas originárias da mesma instituição ou organização;

  • Ordem de inscrição.

Informações

Data: 23, 24 e 25 de Julho de 2025
Local: Instituto Superior de Agronomia, Edifício Principal, sala PORBIOTA (sala 48)
Como chegar: Tapada da Ajuda, Lisboa. Ver informações em http://www.gbif.pt/node/390
Organização: Nó Português do GBIF, Instituto Superior de Agronomia
Formador: Rui Figueira
Língua do curso: Português
Nº máximo de participantes: 20
Total de horas de formação: 24h
Data limite para candidatura: 9 de Julho de 2025
Preço de inscrição: gratuito
Contacto: node@gbif.pt
Inscrição: através do seguinte formulário

Preparação do curso
Os participantes devem preparar um conjunto de dados próprio para ser utilizado nas sessões práticas.

 

Programa

(descarregar programa em pdf)

Dia 1, Quarta-feira, 23 de Julho de 2025

09:00-09:30h - Bloco 0 - Apresentação
0.1. Boas-vindas
0.2. Apresentação dos participantes

09:30-10:30h - Bloco 1 - Introdução geral
1.1. Introdução à informática para a Biodiversidade
1.2. Dados abertos e qualidade dos dados

10:30-11:00h - Intervalo

11:00-12:30h - Bloco 2 - Princípios para a qualidade de dados
2.1. Princípios de qualidade de dados
2.2. Ontologias e padrões de dados de biodiversidade
2.3. Dados de referência em biodiversidade

12:30-14:00h - Intervalo para almoço

14:00-15:30h - Bloco 3 - Ferramentas e protocolos para a qualidade de dados
3.1. Ferramentas e recursos para a qualidade de dados
3.2. Boas práticas para o uso de folhas de cálculo no manuseamento de dados
3.3. Prática de uso de ferramentas e folhas de cálculo

15:30-16:00h - Intervalo

16:00-17:00h - Bloco 3 - Continuação
3.1. OpenRefine I – deteção e correção de erros
3.1. Prática de uso do OpenRefine - I

====////====

Dia 2, Quinta-feira, 24 de Julho de 2025

09:00-10:30h - Bloco 4 - Publicação de dados abertos
4.1. Revisão do dia 1
4.2. Princípios FAIR e publicação de dados abertos
4.3. Controlo de qualidade na publicação de dados através do GBIF

10:30-11:00h - Intervalo

11:00-12:30h - Bloco 5 - OpenRefine
5.1. OpenRefine II – scripts para a correção de dados
5.2. Prática OpenRefine II – scripts

12:30-14:00h - Intervalo para almoço

14:00-15:30h - Bloco 5 - OpenRefine (continuação)
5.3. OpenRefine III – reconciliação de dados
5.4. Prática OpenRefine III – reconciliação de dados

15:30-16:00h - Intervalo

16:00-17:00h - Bloco 6 - Qualidade de dados e Caracteres especiais
6.1. Qualidade de dados - caracteres especiais
6.2. Exercício de identificação e limpeza de caracteres especiais

====////====

Dia 3, Sexta-feira, 25 de Julho de 2025

09:00-10:30h - Bloco 7 - Qualidade de dados taxonómicos
7.1. Revisão do dia 2
7.2. Revisão sobre os projetos globais de informação sobre Biodiversidade
7.3. Qualidade de dados no registo em campo
7.4. Qualidade e correção de dados taxonómicos

10:30-11:00h - Intervalo

11:00-12:30h - Bloco 7 - Qualidade de dados taxonómicos (continuação)
7.5. Prática de limpeza de dados taxonómicos

12:30-14:00h - Intervalo para almoço

14:00-15:30h - Bloco 8 - Qualidade de dados espaciais
8.1. Qualidade e correção de dados espaciais
8.2. Prática de limpeza de dados espaciais

15:30-16:00h - Intervalo

16:15-17:00h - Bloco 9 - Conclusão e avaliação do curso
9.1. Revisão / Dúvidas
9.2. Avaliação do curso

Descarregue o programa em pdf

 

Aqui serão disponibilizadas as apresentações do curso

 

Aqui serão incluidos os exercícios

 

Lista de Participantes

ID Nome Organização País
1 Alexandra Isabel dos Santos Lucas Museu Nacional de História Natural e da Ciência Portugal
2 Ana Isabel Vasconcelos Dias Correia Museu Nacional de História Natural e da Ciência Portugal
3 Ana Luísa Felgueiras de Brito Machado Universidade de Aveiro Portugal
4 Anabela Alves Roças de Matos Morgado Instituto Superior de Agronomia Portugal
5 Anabela Cristina Marques da Nave INIAV Portugal
6 Carolina Lopes Nogueira BIOPOLIS Portugal
7 Cristina de Sousa Chora da Cruz Correia Rocha Instituto Superior de Agronomia Portugal
8 Domingos Mumbundo António Francisco Centro de Botânica da Universidade Agostinho Neto Angola
9 Filipe Eduardo Parreiras Silva Dias Instituto Superior de Agronomia Portugal
10 Inês Daniela Herculano Ramires Instituto Superior de Agronomia Portugal
11 Ines Maria Castelhano Graça Instituto Superior de Agronomia Portugal
12 Isabel Maria Ribeiro Fernandes Universidade Aberta Portugal
13 Joana Rita Patrício Rodrigues Universidade de Aveiro Portugal
14 João Pedro Andrade Marques Faculdade de Ciências Universidade de Lisboa Portugal
15 Madalena Sottomayor Instituto Superior de Agronomia Portugal
16 Maria Beatriz Fernandes Faria Faculdade de Ciências Universidade de Lisboa Portugal
17 Maria João Ferreira R. Costa Instituto Superior de Agronomia Portugal
18 Matilde Pereira Tavares Instituto Superior de Agronomia Portugal
19 Participante* Instituto Superior de Agronomia Portugal
20 Participante* Faculdade de Ciências Universidade de Lisboa Portugal
21 Paula Rute Pereira Matono Alves Universidade de Évora Portugal
22 Paulo Cardoso da Silveira Universidade de Aveiro Portugal
23 Robin Payne Instituto Superior de Agronomia Portugal
24 Sonia Marina Santos Instituto Politécnico de Viana do Castelo Portugal

* Estes participantes optaram por não autorizar a publicação do nome.

Fonte de financiamento

Esta iniciativa está integrada no projeto de criação dos Centros para a GDI, inserido no Programa Nacional de Ciência Aberta e Dados Abertos de Investigação (PNCADAI), uma medida do investimento RE-C05-i08 – Ciência Mais Digital financiado pelo Plano de Recuperação e Resiliência (PRR)