Geosciences Research Data Repositories Landscape: re3data.org as a datasource

Authors

DOI:

https://doi.org/10.26512/rici.v17.n3.2024.53645

Keywords:

Data Repository, Research Data, Geosciences, Re3data

Abstract

The so-called research data repositories are an evolution of document repositories that aim to access and preserve all research materials used before, during, and after scientific research. Against this backdrop, this study takes an exploratory and descriptive approach to the international landscape of research data repositories in the Geosciences (RDR-GEO) castrated and available on the Registry of Research Data Repositories (re3data.org). Specifically, the metadata related to themes, countries, licenses, software, institutions, and research data used by the international Geosciences community is analyzed. The data was extracted from re3data.org using web scraping techniques. Once the data has been collected, it is necessary to use the OpenRefine software to clean, recode, merge data sets, and export data for visualization in tables, graphs, and network maps. It is concluded that although the international community of data librarians in Geosciences encourages the use of software such as Ckan, DSpace, DataVerse, e-Prints, and Fedora, they are little used in the area of Geosciences that mostly use their technologies. Between the (325) RDR-GEO, only 17 use them. Some examples of RDR-Geo made with this software are GeoPlatform (Ckan), DataShare (DSpace), UCLA Social Science Data Archive (Dataverse), OceanRep GEOMAR Repository (e-Prints) e, and TAMBORA (Fedora). Finally, Geoscience Research Data Repositories (RDR-GEOs) are heterogeneous data sources that enable access and preservation of various research data types. They store information/knowledge of areas related to Earth Sciences such as Atmospheric, Geodesic, Geophysical, Geological and Oceanographic Sciences.

Downloads

Download data is not yet available.

Author Biographies

Alexandre Semeler, Universidade Federal Rio Grande do Sul, Instituto de Geociências, Porto Alegre, RS, Brasil

Pós-Doutorado em andamento pelo (PPGCI IBICT-UFRJ). Pós-Doutorado pela Universidade Federal de Santa Catarina (UFSC) - Brasil. Doutor em Ciência da Informação pela Universidade Federal de Santa Catarina (UFSC) – SC - Brasil. Atuo como pesquisador independente e bibliotecário de dados, tendo interesse interdisciplinar em Biblioteconomia de Dados. Acredito no quarto paradigma das ciências (eScience e Humanidades Digitais) e observo as atuais tecnologias de dados digitais como impulsionadoras da transformação em bibliotecas acadêmicas.

Luana Farias Sales, Instituto Brasileiro de Informação em Ciência e Tecnologia, Programa de Pós-graduação em Ciência da Informação, Rio de Janeiro, RJ, Brasil

Doutora em Ciência da Informação pelo Programa de Pós-Graduação do IBICT/UFRJ (2011-2014). Mestre em Ciência da Informação pelo convênio UFF/IBICT (2004-2006), Graduação em Biblioteconomia e Documentação pela Universidade Federal Fluminense (2003). Bolsista de Produtividade Pq1D. Jovem Cientista do Estado do Rio de Janeiro. Atuou como Analista em C T da CNEN, no Instituto de Engenharia Nuclear, participando da criação da linha de pesquisa de Gestão do Conhecimento Nuclear. Atuou ainda como docente do curso de graduação em Biblioteconomia da Universidade Federal do Estado do Rio de Janeiro (UNIRIO) e Universidade Federal Fluminense, ministrando disciplinas relacionadas à Organização do Conhecimento. Exerceu o cargo de Coordenadora Geral de Acesso e Difusão de Acervos do Arquivo Nacional entre 2019 e 2021 e atuou como editora científica da Revista Acervo no mesmo período. Atualmente é Analista em C T do MCTIC/IBICT, atuando como docente do Programa de Pós-graduação em Ciência da Informação do convênio IBICT-UFRJ e na DIECI -Divisão de Editoração Científica . É Coordenadora-Geral do office do GO FAIR Brasil. Tem experiência na área de Ciência da Informação, com ênfase em Organização e Representação do Conhecimento e Recuperação de Informações, com interesse em tópicos ligados à Comunicação Científica, Tecnologia de Informação, Gestão do Conhecimento, e-Science, Curadoria digital; Dados de pesquisa, Bibliotecas cientificas, Biblioteca digital, Metadados, Repositórios, Sistemas CRIS, Objetos digitais, e Sistemas de Organização do Conhecimento, como vocabulários controlados, tesauros, taxonomias e ontologias .

Adilson Luiz Pinto , Universidade Federal de Santa Catarina, Programa de Pós-graduação em Ciência da Informação, Florianópolis, SC, Brasil

Orientador de Mestrado e Doutorado desde 2011, com 9 teses defendidas e outras 14 dissertações. Coordenador do Programa de Pós-Graduação em Ciência da Informação da Universidade Federal de Santa Catarina - UFSC (gestão 2017-2019 e 2019-2021); Coordenador do Observatório de Informação da UFSC; Responsável pelo Canal Estudos Métricos da Informação no Youtube; Responsável pelo DINTER com a Unimontes e pelo MINTER com a Polícia Federal; Foi sub-coordenador do Programa de Pós-Graduação em Ciência da Informação da Universidade Federal de Santa Catarina - UFSC (gestão 2014-2016); Foi diretor de Pesquisa e Extensão da Universidade Federal de Santa Catarina - UFSC (gestão 2011-2012). Professor Associado IV do Departamento de Ciência da Informação da UFSC (Graduação em Biblioteconomia/Arquivologia/Ciência da Informação e Mestrado/Doutorado em Ciência da Informação), Professor Visitante: (i) Universidad de Panamá, (ii) Universidad Nacional de la Republica Uruguai, (iii) Universidad Nacional de Cuyo, (iv) Universidad Carlos III de Madrid, (v) Université Montpellier III, (vi) Universidade Estadual de Londrina.Titulações: Graduado em Biblioteconomia pela PUC-Campinas (2000), Mestre em Ciência da Informação pela PUC-Campinas (2004) e em Documentação Audiovisual pela Universidad Carlos III de Madrid (2006); Doutor em Documentação pela Universidad Carlos III de Madrid (2007). Membro do Inteligência, Tecnologia e Informação - Research Group (ITI-RG); Editor da revista (i) Iberoamerican Journal of Science Measurement and Communication; Membro do Conselho Editorial das revistas (i) Hipertext.net; (ii) Boletín Millares Carlo; (iii) Revista Interamericana de Bibliotecología; Avaliador contínuo (i) Transinformação, (ii) Revista da ACB, (iii) Revista RBBD, (iv) Enancib no GT7 e GT8, (v) revista InCID, (vi) El Profesional de la Información, (vii) da 3, 4,5 e 6 edição do Encontro Brasileiro de Bibliometria e Cientometria, (viii) LiiNC em Revista, (ix) CBBD, (x) SNBU e (xi) Bibliotecas: anales de investigación. Especialista em Ciência da Informação, com ênfase em: Estudos Métricos da Informação (bibliometria, cienciometria, informetria, librametrics, webometria e arquivometria), E-Science (mineração automatizada de dados), Visualização da Informação (Análise de Redes Sociais, Visualização analítica, Visualização de textos, Modelagem de Processo, Visualização temporal, Geolocalização de dados e Clusterização). ORCID: 0000-0002-4142-2061

Carlos Luis González-Valient, European Alliance for Innovation, Bratislava, Eslováquia

Maestro en Gestión de Información. Jefe de Publicaciones en European Alliance for Innovation, Eslovaquia

References

BENIN, Keli Rodrigues do Amaral; HAMANAKA, Raíssa Yuri; GONÇALEZ, Paula Regina Ventura Amorim. Digital open repositories: reliability evaluation based on iso 16363 criteria. Advanced Notes in Information Science, [S.L.], v. 2, p. 121-130, 2022. DOI: http://dx.doi.org/10.47909/anis.978-9916-9760-3-6.90. Available at: https://anis.pro-metrics.org/index.php/a/article/view/15. Access at: 02 Jul. 2024.

BREMEN Core Repository. MARUM: center for marine environmental sciences. Center for Marine Environmental Sciences. 1994. Available at: https://www.marum.de/en/Research/IODP-Bremen-Core-Repository.html. Access at: 02 Jul. 2024.

CANADA. Government. Canadian Centre for Climate Modelling and Analysis. 2024. Available at: https://www.canada.ca/en/environment-climate-change/services/climate-change/science-research-data/modeling-projections-analysis/centre-modelling-analysis.html. Access at: 02 Jul. 2024.

CORNELL UNIVERSITY. Mann Library. Cornell University Geospatial Information Repository. 1998. Available at: https://cul-it.github.io/cugir-help/about. Access at: 02 Jul. 2024.

EDINBURGH, University Of. Edinburgh DataShare. 2024. Available at: https://datashare.ed.ac.uk/. Access at: 02 Jul. 2024.

FIGSHARE. Figshare. 2012. Available at: https://knowledge.figshare.com/about. Access at: 02 Jul. 2024.

KHAN, Aasif Mohammad; LOAN, Fayaz Ahmad; PARRAY, Umer Yousuf; RASHID, Sozia. Global overview of research data repositories: an analysis of re3data registry. Information Discovery and Delivery, [S.L.], v. 52, n. 1, p. 53-61, 19 abr. 2023. Emerald. http://dx.doi.org/10.1108/idd-07-2022-0069. Available at: https://www.emerald.com/insight/content/doi/10.1108/IDD-07-2022-0069/full/html. Access at: 02 Jul. 2024.

KINDLING, Maxi; PAMPEL, Heinz; SANDT, Stephanie van de; RÜCKNAGEL, Jessika; VIERKANT, Paul; KLOSKA, Gabriele; WITT, Michael; SCHIRMBACHER, Peter; BERTELMANN, Roland; SCHOLZE, Frank. The Landscape of Research Data Repositories in 2015: a re3data analysis. D-Lib Magazine, [S.L.], v. 23, n. 3/4, p. 1-10, mar. 2017. CNRI Acct. http://dx.doi.org/10.1045/march2017-kindling. Available at: https://www.dlib.org/dlib/march17/kindling/03kindling.html. Access at: 02 Jul. 2024.

LIN, Dawei; MCAULIFFE, Matthew; PRUITT, Kim D.; GURURAJ, Anupama; MELCHIOR, Christine; SCHMITT, Charles; WRIGHT, Susan N. Biomedical Data Repository Concepts and Management Principles. Scientific Data, [S.L.], v. 11, n. 1, p. 1-10, 13 jun. 2024. Springer Science and Business Media LLC. http://dx.doi.org/10.1038/s41597-024-03449-z. Available at: https://www.nature.com/articles/s41597-024-03449-z. Access at: 02 Jul. 2024.

NASA. Challenging Mini-satellite Payload (CHAMP). 2010. Available at: https://eospso.nasa.gov/missions/challenging-mini-satellite-payload. Access at: 02 Jul. 2024.

PAMPEL, Heinz; VIERKANT, Paul; SCHOLZE, Frank; BERTELMANN, Roland; KINDLING, Maxi; KLUMP, Jens; GOEBELBECKER, Hans-Jürgen; GUNDLACH, Jens; SCHIRMBACHER, Peter; DIEROLF, Uwe. Making Research Data Repositories Visible: the re3data.org registry. Plos One, [S.L.], v. 8, n. 11, p. 1-10, 4 Nov. 2013. Public Library of Science (PLoS). http://dx.doi.org/10.1371/journal.pone.0078080. Available at: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0078080. Access at: 02 Jul. 2024.

PAMPEL, Heinz; WEISWEILER, Nina Leonie; STRECKER, Dorothea; WITT, Michael; VIERKANT, Paul; ELGER, Kirsten; BERTELMANN, Roland; BUYS, Matthew; FERGUSON, Lea Maria; KINDLING, Maxi. Re3data – Indexing the Global Research Data Repository Landscape Since 2012. Scientific Data, [S.L.], v. 10, n. 1, p. 1-10, 29 ago. 2023. Springer Science and Business Media LLC. http://dx.doi.org/10.1038/s41597-023-02462-y. Available at: https://www.nature.com/articles/s41597-023-02462-y. Access at: 02 Jul. 2024.

PANDURO, Anthony Fasanando. Technologies applied to information control in organizations: a review. Decisiontech Review, [S.L.], v. 3, p. 1-6, 15 jun. 2023. Pro-Metrics. http://dx.doi.org/10.47909/dtr.02. Available at: https://dtr.pro-metrics.org/index.php/d/article/view/2. Access at: 02 Jul. 2024.

PENG, Ge; GROSS, Wendy S.; EDMUNDS, Rorie. Crosswalks among stewardship maturity assessment approaches promoting trustworthy FAIR data and repositories. Scientific Data, [S.L.], v. 9, n. 1, p. 1-10, 21 set. 2022. Springer Science and Business Media LLC. http://dx.doi.org/10.1038/s41597-022-01683-x. Available at: https://www.nature.com/articles/s41597-022-01683-x. Access at: 02 Jul. 2024.

POTSDAM, Geoforschungszentrum. Scientific Drilling Database. 2024. Available at: http://www.scientificdrilling.org. Access at: 02 Jul. 2024.

RE3DATA. Registry of Research Data Repositories. 2012. Available at: http://www.re3data.org/about. Access at: 02 Jul. 2024.

RICE, R.; SOUTHALL, S. The data librarian’s handbook. London: Facet Publishing, 2016.

SEMELER, Alexandre Ribas; OLIVEIRA, Arthur Longoni; PEREIRA, Fabiana Andrade; MATIQUITE, Policarpo. Python scripts for web scraping metadata from descriptions of the international scenario of research data repositories. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, [S.L.], v. 28, p. 1-10, 4 ago. 2023. Universidade Federal de Santa Catarina (UFSC). http://dx.doi.org/10.5007/1518-2924.2023.e94877. Available at: https://periodicos.ufsc.br/index.php/eb/article/view/94877. Access at: 02 Jul. 2024.

UNIVERSITY OF BREMEN. PANGAEA: data publisher for earth & environmental science. Data Publisher for Earth & Environmental Science. 1987. Available at: http://www.pangaea.de. Access at: 02 Jul. 2024.

UZWYSHYN, Ray. Research Data Repositories: the what, when, why, and how. Computers In Libraries, [s. l], v. 36, n. 3, p. 1-10, 2016. Available at: https://www.infotoday.com/cilmag/apr16/Uzwyshyn--Research-Data-Repositories.shtml. Access at: 02 Jul. 2024.

VALLES-CORAL, Miguel; INJANTE, Richard; HERNÁNDEZ-TORRES, Edwin; PINEDO, Lloy; NAVARRO-CABRERA, Jorge Raul; SALAZAR-RAMÍREZ, Luis; CÁRDENAS-GARCÍA, Ángel; HUANCARUNA, Eddy. Agregación de repositorios institucionales para la generación de información del desempeño científico de universidades peruanas. Iberoamerican Journal Of Science Measurement And Communication, [S.L.], v. 3, p. 1-10, 18 out. 2023. Pro-Metrics. http://dx.doi.org/10.47909/ijsmc.63. Available at: https://ijsmc.pro-metrics.org/index.php/i/article/view/63. Access at: 02 Jul. 2024.

WHOI. WHOI Ship Data-Grabber System. Available at: http://4dgeo.whoi.edu/shipdata/index.html. Access at: 02 Jul. 2024.

WILKINSON, Mark D.; DUMONTIER, Michel; AALBERSBERG, Ijsbrand Jan; APPLETON, Gabrielle; AXTON, Myles; BAAK, Arie; BLOMBERG, Niklas; BOITEN, Jan-Willem; SANTOS, Luiz Bonino da Silva; BOURNE, Philip E. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, [S.L.], v. 3, n. 1, p. 1-10, 15 mar. 2016. Springer Science and Business Media LLC. http://dx.doi.org/10.1038/sdata.2016.18. Available at: https://www.nature.com/articles/sdata201618. Access at: 02 Jul. 2024.

Published

2024-11-07

How to Cite

Semeler, A., Sales, L. F., Pinto , A. L., & González-Valient, C. L. (2024). Geosciences Research Data Repositories Landscape: re3data.org as a datasource. Revista Ibero-Americana De Ciência Da Informação, 17(3), 524–548. https://doi.org/10.26512/rici.v17.n3.2024.53645