archive-metadata 🢅4

Esto es una idea que saque de acá🡭 no es necesario tener un sistema tan complejo. Pero esta bueno para tener una base o al menos un esquema que sirva como guía.

  • Legacy Metadata
  • Primary Metadata
    • Datos relacionados al archivo en si, datos intrínsecos como por ejemplo el tipo de archivo, al extension, el formato, el tamaño, dimensión, resolución, datetimes (creación, edición, modificación, ultimo acceso), autor, editor. Y también atributos mas internos y tecnicos, por ejemplo datos EXIF de imágenes, datos de geolocalización.
  • Secondary Metadata
    • Acá entrarían datos que son agregados manualmente o automáticamente que corresponden a una descripción mas especifica del archivo, como por ejemplo: ID’s, indización, citas, lugar donde se encuentra el archivo, como se puede acceder al archivo, información de desde donde se origino el archivo, links e hyperlinks, datos semánticos o relaciones
  • Supplementary Metadata
    • Datos que son externos al archivo, que fueron generados por archivos o organizaciones externas.
  • Derived Metadata
    • Datos que son derivados del tipo de archivo, por ejemplo datos en formato binario BLOB, análisis de la información que contiene el archivo.
  • Control Metadata
  • “Meta” Metadata

La idea es armar un modelo de datos y metadatos pero con un enfoque archivistico y que sea algo fácil de entender. También tratar de definir una estructura de datos que permita relacionar datos y contenidos.

WAT - Web Archive Transformation

No encontré todavía mucha data sobre esto, pero es un formato que utilizan en {{internet-archive}} para generar metadata de warcz.

CDX

TODO

ZIM

Relacionado con {{Kiwix}}