Skip to Main Content

Dades de recerca per a doctorands

Introducció

Al planificar un projecte de recerca, és important tenir en compte quins format de fitxer s’utilitzarà per emmagatzemar les dades. Els formats dels fitxers que utilitzeu tenen un impacte directe a l’hora de compartir les dades de recerca i en la seva reutilització en un futur.

Els formats que es presenten a la taula com a recomanats són formats de fitxer que oferiran les millors garanties a llarg termini en termes d’usabilitat, accessibilitat i sostenibilitat. Els formats acceptats són formats de fitxer que s’utilitzen àmpliament i que seran moderadament utilitzables i accessibles a llarg termini.

Els formats d’arxiu amb més probabilitat de ser accessibles tenen les característiques següents:

  • No propietaris
  • Estàndards oberts i documentats
  • Utilitzats per la comunitat investigadora
  • Representació estàndard ( ASCII, UNicode)
  • Sense xifrar
  • Sense comprimir

Bones pràctiques

  • Sempre que sigui possible, heu de desar les dades en un format obert i sostenible, no propietari (els programaris propietaris sovint permeten “desar com” un format obert sense dificultats). Si la conversió a un format de dades en obert genera una pèrdua de dades dels fitxers, considereu guardar-les tant en format propietari com en format obert. D’aquesta manera es podrà disposar d’una part de la informació.
  • Quan sigui necessari guardar arxius en un format propietari, considereu incloure un arxiu txt com a guia que documenti el nom i versió del programari utilitzat per generar l'arxiu, així com l'empresa que feia el programari. Pot ser de molta ajuda en cas de necessitar obrir aquests fitxers.
  • Per evitar el risc d’obsolescència i garantir l’accessibilitat i la sostenibilitat dels fitxers es poden prendre diverses mesures. Una d’aquestes mesures és utilitzar formats de fitxer que tinguin una alta probabilitat de romandre utilitzables durant molts anys.

Tipus de dades

  • Observacionals: dades capturades en temps real (p. ex., neuroimatges, dades de mostres, dades de sensors, dades d'enquesta)
  • Experimentals: dades capturades en equips de laboratori (p. ex., seqüències de gens, cromatogrames, dades de camps magnètics)
  • Simulació: dades generades a partir de models de prova (p. ex., climatològiques, matemàtiques o models econòmics)
  • Derivades o compilades: dades reproduïble però de difícil reproducció (p. ex., de text i mineria de dades, models 3D, bases de dades compilada)

Taula de formats

Tipus de dades

Format recomanat per compartir, reutilitzar i preservar

Format habitual acceptat

Text

Text pla

Llenguatges de marcatge

Llenguatges de programació 

 

Fulls de càlcul 

Bases de dades 

Dades estadístiques 

Imatge 

 

 Imatges (Vectors)

Àudio 

Vídeo 

Bases de dades

Disseny assistit per ordinador (CAD)

Informació geogràfica 

Imatges georeferènciades 

Raster GIS

3D

RDF

  • RDF/XML (.rdf)
  • Trig (.trig)
  • Turtle (.ttl)
  • NTriples (.nt)
  • JSON-LD
 

Computer Assisted Qualitative Data Analysis (CAQDAS)

Taula elabora a partir de la taula de formats de Data Archiving and Networked Services (DANS).
Més informació de formats a Recommended Formats Statement de la Library of Congress.

Llicència de Creative Commons
Aquesta obra està subjecta a una llicència de Reconeixement-NoComercial-CompartirIgual 4.0 Internacional de Creative Commons