|
|
Gabarit et instructions sur les dépotsLes projets retenus après dépôt de demande de soumission devront signaler leur(s) jeu(x) de données de vérité de terrain (entraînement) dans le catalogue HTR-United. Nous recommandons donc fortement d'entamer tôt une réflexion sur le traitement particulier des données d'entraînement (définition du corpus d'entraînement, des règles d'annotation, personnes impliquées, etc.).
Document de soumissionNous proposons à titre indicatif un modèle de document de soumission (télécharger le gabarit).
Les porteur·ses de projets retenus s'engagent à :
Précisions sur les modalités de dépôt de vérité de terrainNous recommandons fortement de déposer les jeux de données d'entraînement sur des plateformes ouvertes permettant l'obtention de liens permanents, voire de DOI. Ce lien permanent est essentiel pour que les données puissent être trouvées et réutilisées. Les données d'entraînement devraient être déposées au moins dans l'un des deux formats pris en charge par l'application d'HTR eScriptorium (XML ALTO ou XML PAGE) et être accompagnées soit des images, soit d'indications claires sur les moyens de récupérer les images correspondant aux fichiers XML. En plus de ces élements, le dépôt devrait être accompagné d'une license explicite ainsi que d'un fichier de description explicitant le contenu du jeu de données, les contributeur-rices, ainsi que les règles suivies pour l'annotation (segmentation et transcription). HTR-United propose un gabarit de dépôt de données dont il est possible de s'inspirer.
|
Personnes connectées : 2 | Vie privée |