Annexe II - Fichiers de corpus
Les fichiers de corpus (XML/txt) sont mis à disposition ici.
La structure des dossiers est la suivante :
corpus/
├── abstracts/
│ └── <uri-isidore>.abstract.txt
├── concepts/
│ └── <uri-isidore>.concepts.txt
├── titles/
│ └── <uri-isidore>.title.txt
└── <uri-isidore>.xml