Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
copain
PDF2Blocs
Commits
9bd17ea8
Commit
9bd17ea8
authored
Apr 10, 2020
by
Roussey Catherine
Browse files
Update README.md
parent
d99e1e29
Changes
1
Hide whitespace changes
Inline
Side-by-side
src/py/README.md
View file @
9bd17ea8
...
...
@@ -260,7 +260,7 @@ Tant que des lignes sont détectées comme étant des pieds de page,
on teste la ligne précédente, et ainsi de suite.
Les lignes détectées comme étant des bas de page ont la valeur BL_BOTTOM_PAGE dans leur attribut class
et seront ignorée par la suite.
et seront ignorée
s
par la suite.
#### Détection des en-tête
...
...
@@ -268,11 +268,10 @@ L'algorithme est similaire à la détection des pieds de page, mais au lieu
de s'appliquer aux dernières lignes de chaque page, il considère les premières
lignes.
D'autre part, il ignore la première page, sauf si :
-
le document n'a que deux pages, dans quel cas on regarde si les premières
lignes de chacune des deux pages sont identiques,
-
des lignes d'en-tête sont reconnues dans les autres pages, dans quel cas
on teste si cette même ligne est reconnue dans la première page.
D'autre part, si le document n'a que deux pages, on regarde si les premières
lignes de chacune des deux pages sont identiques pour détecter les en-tetes.
Si le document a plus de deux pages, on détecte d'abord s'il existe des en-tetes à partir de la seconde page
et ensuite on teste si il exsite une en tete avec le meme contenu dans la première page.
De même que pour les pieds de page, les lignes reconnues comme en-tête
sont marquées et ignorées dans la suite du traitement.
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment