Commit d99e1e29 authored by Roussey Catherine's avatar Roussey Catherine
Browse files

Update README.md

parent bf66cf51
......@@ -158,7 +158,8 @@ Les éléments de la liste *blocks* ont donc la structure suivante :
- **nb_cars** et **nb_words** : Le nombre de caractères et le nombre de mots du bloc calculés.
%%- **flags :** Une valeur sur 16 bits, initialisée à 0x0000, destinée à
accueillir le résultat de processus de classification de blocs.
- **classe :** le résultat de processus de classification de blocs.
- **class :** contient le résultat du processus de classification de blocs.
La valeur par défaut de cet attribut est BL_UNDEF.
- **lines :** Une liste, contenant les lignes ordonnées par pdftotext. C'est aussi une liste
de dictionnaires, contenant :
- **text :** Le texte contenu dans cette ligne.
......@@ -258,7 +259,7 @@ les numéros de pages soient considérés comme des pieds de page.
Tant que des lignes sont détectées comme étant des pieds de page,
on teste la ligne précédente, et ainsi de suite.
Les lignes détectées comme étant des bas de page sont marquées comme telles
Les lignes détectées comme étant des bas de page ont la valeur BL_BOTTOM_PAGE dans leur attribut class
et seront ignorée par la suite.
#### Détection des en-tête
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment