Creative Commons license 2021 J3 Pablo Ruiz Fabo Retour d'expérience [March 12, 2021]

 Summary

Pablo Ruiz Fabo (Université de Strasbourg, LiLPa), « DISCO et DISCOver : Le Diachronic Spanish Sonnet Corpus et son interface de lecture circulaire »

Le corpus DISCO veut répondre au manque de ressources numériques pour les études quantitatives sur l’évolution du sonnet en espagnol. Il comporte 4 085 sonnets en TEI, par 1 204 auteurs d’Espagne et d’Amérique Latine, entre le XVe et le XIXe siècle. Les variables sociales des auteurs (dates, origine, sexe) sont encodées, ainsi qu’une annotation automatique des rimes, métrique et enjambement. Le corpus permet d’examiner la distribution de ces caractéristiques selon les périodes et régions. Son interface, DISCOver, permet de créer des sous-corpus, fournissant des données agrégées sur les rimes, les schémas métriques et rimiques et l’enjambement. À partir des résultats quantitatifs nous pouvons naviguer vers chaque poème et vice-versa, dans une lecture « circulaire ». Ceci aide à situer les caractéristiques d’un poème dans la production de son auteur ou de son époque et à évaluer l’originalité ou typicalité du texte.

Ressources 

ADSO (Análisis Distante del Soneto Castellano de los Siglos de Oro) : système de balayage métrique pour la poésie espagnole à mètre fixe.

ANJA (Automatic eNJambment Analysis) : outil en ligne qui détecte les enjambements dans la poésie espagnole.

Gunstick : base de données des rimes tchèques donnant accès aux résultats de l’analyse automatique des rimes dans les recueils de poésie contenus dans le Corpus de vers tchèques et publiés jusqu’en 1920.

RDFa (Resource Description Framework dans des Attributs) : format de données recommandé par le World Wide Web Consortium (sigle W3C) en tant que norme pour l’ajout des données RDF dans des pages HTML, XHTML et autres langages XML.

RhymeTagger : outil qui permet de reconnaître des rimes axées sur la collocation.

VIAF (Virtual International Authority File) : projet commun de plusieurs bibliothèques nationales, mis en œuvre et hébergé par OCLC. Il entend simplifier l’accès aux principaux fichiers d’autorité de noms du monde entier.

 

Vidéo mise en ligne par Juliette Keller.

Métadonnées par Michela Lagnena

Tags: corpus edition critique edition numerique j3 numerique outils projet rdf retour d'experience

 Infos

 Downloads

 Embed/Share

Social Networks

 Options
Check the box to autoplay the video.
Check the box to loop the video.
Check the box to indicate the beginning of playing desired.
 Embed in a web page
 Share the link
qrcode