Commit cbf09ab6 authored by Roussey Catherine's avatar Roussey Catherine
Browse files

Update ResultatsDesTests.md

parent a0840529
......@@ -5,15 +5,18 @@ Ensuite chaque bloc est labellisé par une catégorie:
* paragraphe: un bloc de texte courant --> balise html p,
* title: le titre du document balise html h1,
* title i: le titre de niveau i --> balise html h2,
* caption: une légende d'image --> balise html figcaption,
* bottom page: un texte qui se répéte en bas de toutes les pages, par exemple le numéro de page,
* top page: un texte qui se répète en haut de toutes les pages, par exemple le numéro de page,
* misc: un texte de petite taille qui n'appartient pas à une catégorie, par exemple les notes de bas de pages.
* caption: une légende d'image --> balise html figure et figcaption,
* bottom page: un texte qui se répéte en bas de toutes les pages, par exemple le numéro de page --> balise footer,
* top page: un texte qui se répète en haut de toutes les pages, par exemple le numéro de page --> balise header,
* misc: un texte de petite taille qui n'appartient pas à une catégorie, par exemple les notes de bas de pages --> balise p small.
Plusieurs types d'erreurs ont été identifiées:
* ER_Reg: mauvais regroupement de segments: des segments de texte n'ont pas été correctement regroupés dans un meme bloc.
* ER_Reg_Tab: le contenu d'une cellule du tableau se retrouve en dehors du tableau
* ER_Ord: mauvais ordonancement de blocs: deux blocs qui devaient etre consecutifs sont séparés par un autre bloc.
* ER_Cat: mauvaise catégorisation de bloc: la catégorie du bloc identifié par le programme n'est pas la bonne.
* ER_Cat_H: un titre n'a pas été reconnu
* ER_Cat_P: un paragraphe n'a pas été reconnu
* WA_Inv : un texte invisible pour l'humain apparait dans l'extraction du texte, ce n'est pas une erreur.
Pour évaluer les sorties du programme, un évaluateur humain compte le nombre de blocs ayant générés une erreur.
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment