Annexe II - Fichiers de corpus

Les fichiers de corpus (XML/txt) sont mis à disposition ici.

La structure des dossiers est la suivante :

corpus/
├── abstracts/
│   └── <uri-isidore>.abstract.txt
├── concepts/
│   └── <uri-isidore>.concepts.txt
├── titles/
│   └── <uri-isidore>.title.txt
└── <uri-isidore>.xml