Commit 9bd17ea8 authored by Roussey Catherine's avatar Roussey Catherine
Browse files

Update README.md

parent d99e1e29
......@@ -260,7 +260,7 @@ Tant que des lignes sont détectées comme étant des pieds de page,
on teste la ligne précédente, et ainsi de suite.
Les lignes détectées comme étant des bas de page ont la valeur BL_BOTTOM_PAGE dans leur attribut class
et seront ignorée par la suite.
et seront ignorées par la suite.
#### Détection des en-tête
......@@ -268,11 +268,10 @@ L'algorithme est similaire à la détection des pieds de page, mais au lieu
de s'appliquer aux dernières lignes de chaque page, il considère les premières
lignes.
D'autre part, il ignore la première page, sauf si :
- le document n'a que deux pages, dans quel cas on regarde si les premières
lignes de chacune des deux pages sont identiques,
- des lignes d'en-tête sont reconnues dans les autres pages, dans quel cas
on teste si cette même ligne est reconnue dans la première page.
D'autre part, si le document n'a que deux pages, on regarde si les premières
lignes de chacune des deux pages sont identiques pour détecter les en-tetes.
Si le document a plus de deux pages, on détecte d'abord s'il existe des en-tetes à partir de la seconde page
et ensuite on teste si il exsite une en tete avec le meme contenu dans la première page.
De même que pour les pieds de page, les lignes reconnues comme en-tête
sont marquées et ignorées dans la suite du traitement.
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment