Sources de données et constitution des corpus.
Les modèles d'apprentissage utilisés par CRIMENTALIA ont été entraînés sur des corpus issus de la pratique médico-légale, de la recherche universitaire et d'archives criminologiques anonymisées.
- Entretiens cliniques d'évaluation de dangerosité ou de suivi judiciaire.
- Transcriptions d'expertises psychologiques et psychiatriques.
- Textes d'auteurs de menaces, correspondances criminelles et déclarations judiciaires.
- Études de cas documentées dans la littérature scientifique en criminologie.
Chaque donnée a été prétraitée, anonymisée et codée selon une grille de variables cliniques, linguistiques et comportementales validée par des spécialistes.