
Este curso está enquadrado pelo projecto GBIF.PT - Centro de Gestão de Dados de Biodiversidade, no âmbito do Programa Nacional de Ciência Aberta e Dados Abertos de Investigação (PN CADAI).
Objetivo do curso
Data e local
Descrição
Requisitos
Inscrição
Critérios de selecção dos alunos
Informações
Preparação do curso
Programa
Apresentações
Exercícios
Lista de participantes
Objetivo do curso
O principal objetivo do curso é proporcionar aos participantes os conhecimentos e prática sobre os princípios e métodos de qualidade e limpeza de dados de biodiversidade.
Data e local
23, 24 e 25 de Julho de 2025, Sala PORBIOTA (sala 48), Instituto Superior de Agronomia (Edifício Principal), Lisboa
Descrição
Este curso teórico-prático irá explanar os princípios de qualidade de dados, e procurar a sua aplicação através de práticas de deteção e limpeza de dados, com exemplos práticos. A qualidade dos dados é um dos aspetos mais importantes que determina a potencial utilização de um conjunto de dados. Esta qualidade é determinada por múltiplos factores, que integram a cadeia de produção e processamento da informação, desde o registo ou captura inicial até à utilização e interpretação final. A qualidade dos dados de biodiversidade está igualmente associada às suas várias dimensões, desde a taxonomia à informação espacial, metainformação, armazenamento e publicação.
O curso cobrirá os seguintes tópicos:
-
Princípios para a qualidade de dados
-
Ferramentas e protocolos para a qualidade de dados
-
OpenRefine
-
Qualidade de dados taxonómicos e espaciais
Requisitos
A experiência anterior no registo, manutenção e gestão de dados de biodiversidade favorece um melhor aproveitamento do curso, mas estes não são requisitos. Idealmente, os participantes deste curso deverão trazer um conjunto de dados de biodiversidade para realizar as partes práticas de controlo de qualidade, deteção e limpeza de dados. No caso de não ter a possibilidade de trazer esse conjunto de dados, será fornecido um, como exemplo. Os participantes podem trazer computador portátil, ou usar o computador da sala.
Inscrição
Pode efetuar a sua inscrição até 9 de Julho de 2025. Use para o efeito o formulário de inscrição. Para além dos seus dados, deverá informar sobre quais as motivações para participar no curso, e um pequeno resumo sobre a actividade anterior relacionada com a gestão de dados de biodiversidade.
A lista de alunos seleccionada será publicada nesta página no dia 11 de Julho de 2025.
Critérios de selecção dos alunos
Devido ao número limitado de lugares, poderá ser necessário realizar a selecção das candidaturas, segundo os seguintes critérios:
-
Avaliação da motivação e experiência anterior;
-
Número de candidaturas originárias da mesma instituição ou organização;
-
Ordem de inscrição.
Data: 23, 24 e 25 de Julho de 2025
Local: Instituto Superior de Agronomia, Edifício Principal, sala PORBIOTA (sala 48)
Como chegar: Tapada da Ajuda, Lisboa. Ver informações em http://www.gbif.pt/node/390
Organização: Nó Português do GBIF, Instituto Superior de Agronomia
Formador: Rui Figueira
Língua do curso: Português
Nº máximo de participantes: 20
Total de horas de formação: 24h
Data limite para candidatura: 9 de Julho de 2025
Preço de inscrição: gratuito
Contacto: node@gbif.pt
Inscrição: através do seguinte formulário
Preparação do curso
Os participantes devem preparar um conjunto de dados próprio para ser utilizado nas sessões práticas.
(descarregar programa em pdf)
Dia 1, Quarta-feira, 23 de Julho de 2025
09:00-09:30h - Bloco 0 - Apresentação
0.1. Boas-vindas
0.2. Apresentação dos participantes
09:30-10:30h - Bloco 1 - Introdução geral
1.1. Introdução à informática para a Biodiversidade
1.2. Dados abertos e qualidade dos dados
10:30-11:00h - Intervalo
11:00-12:30h - Bloco 2 - Princípios para a qualidade de dados
2.1. Princípios de qualidade de dados
2.2. Ontologias e padrões de dados de biodiversidade
2.3. Dados de referência em biodiversidade
12:30-14:00h - Intervalo para almoço
14:00-15:30h - Bloco 3 - Ferramentas e protocolos para a qualidade de dados
3.1. Ferramentas e recursos para a qualidade de dados
3.2. Boas práticas para o uso de folhas de cálculo no manuseamento de dados
3.3. Prática de uso de ferramentas e folhas de cálculo
15:30-16:00h - Intervalo
16:00-17:00h - Bloco 3 - Continuação
3.1. OpenRefine I – deteção e correção de erros
3.1. Prática de uso do OpenRefine - I
====////====
Dia 2, Quinta-feira, 24 de Julho de 2025
09:00-10:30h - Bloco 4 - Publicação de dados abertos
4.1. Revisão do dia 1
4.2. Princípios FAIR e publicação de dados abertos
4.3. Controlo de qualidade na publicação de dados através do GBIF
10:30-11:00h - Intervalo
11:00-12:30h - Bloco 5 - OpenRefine
5.1. OpenRefine II – scripts para a correção de dados
5.2. Prática OpenRefine II – scripts
12:30-14:00h - Intervalo para almoço
14:00-15:30h - Bloco 5 - OpenRefine (continuação)
5.3. OpenRefine III – reconciliação de dados
5.4. Prática OpenRefine III – reconciliação de dados
15:30-16:00h - Intervalo
16:00-17:00h - Bloco 6 - Qualidade de dados e Caracteres especiais
6.1. Qualidade de dados - caracteres especiais
6.2. Exercício de identificação e limpeza de caracteres especiais
====////====
Dia 3, Sexta-feira, 25 de Julho de 2025
09:00-10:30h - Bloco 7 - Qualidade de dados taxonómicos
7.1. Revisão do dia 2
7.2. Revisão sobre os projetos globais de informação sobre Biodiversidade
7.3. Qualidade de dados no registo em campo
7.4. Qualidade e correção de dados taxonómicos
10:30-11:00h - Intervalo
11:00-12:30h - Bloco 7 - Qualidade de dados taxonómicos (continuação)
7.5. Prática de limpeza de dados taxonómicos
12:30-14:00h - Intervalo para almoço
14:00-15:30h - Bloco 8 - Qualidade de dados espaciais
8.1. Qualidade e correção de dados espaciais
8.2. Prática de limpeza de dados espaciais
15:30-16:00h - Intervalo
16:15-17:00h - Bloco 9 - Conclusão e avaliação do curso
9.1. Revisão / Dúvidas
9.2. Avaliação do curso
Descarregue o programa em pdf
- Sessão 1 - Programa
- Sessão 2 - Introdução
- Sessão 3 - Dados abertos e qualidade dos dados
- Sessão 4 - Princípios de qualidade de dados
- Sessão 5 - Ontologias e padrões de dados de biodiversidade
- Sessão 7 - Ferramentas e recursos para qualidade de dados
- Sessão 8 - Boas práticas no usos de folhas de cálculo
- Sessão 9 - OpenRefine - Introdução
- Sessão 11 - Princípios FAIR e dados abertos
- Sessão 12 - Controlo de qualidade na publicação de dados através do GBIF
- Sessão 16 - Revisão sobre os projetos globais de informação sobre Biodiversidade
- Sessão 18 - Qualidade e correcção de dados taxonómicos
- Sessão 19 - Controlo de qualidade de dados geográficos
- Exercício 1 - Folhas de cálculo
- Exercício 2 - Openrefine I
- Exercício 3 - Openrefine II
- Exercício 4 - Openrefine III
Aqui será publicada a lista de participantes
Fonte de financiamento
Esta iniciativa está integrada no projeto de criação dos Centros para a GDI, inserido no Programa Nacional de Ciência Aberta e Dados Abertos de Investigação (PNCADAI), uma medida do investimento RE-C05-i08 – Ciência Mais Digital financiado pelo Plano de Recuperação e Resiliência (PRR)