Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
copain
PDF2Blocs
Commits
561ed5e2
Commit
561ed5e2
authored
Apr 10, 2020
by
Roussey Catherine
Browse files
Update README.md
parent
9416d6ff
Changes
1
Hide whitespace changes
Inline
Side-by-side
src/py/README.md
View file @
561ed5e2
...
...
@@ -374,29 +374,25 @@ La boucle principale de l'algorithme effectue les tâches suivantes :
-
si on n'en trouve pas et que la zone comprend la dernière colonne,
on élargit la zone (à gauche) à l'ensemble des colonnes.
-
Le cas où l'on ne trouve pas de bloc et que la zone comprend l'ensemble
des colonnes ne se produit jamais, car ce cas signifie qu'on a parcouru
tous les blocs. On le teste néanmoins et on génère une erreur (qui n'a
jamais été observée).
-
parmi tous les blocs dont l'arrete haute est au même niveau que l'arrete B1 (modulo un petit
des colonnes algorithme se termine.
-
parmi tous les blocs dont l'arrete haute est au même niveau que l'arrete haute de B1 (modulo un petit
intervalle correspondant à la valeur de VERTICAL_ALIGMENT_THRESHOLD), on cherche le bloc le plus à gauche
intitulé B2 ; s'il existe ce sera le premier bloc a étre inséré dans la liste L (le bloc le plus haut et le plus à gauche).
-
étant donné B2, trois cas sont considérés :
-
il existe un bloc non traité qui commence plus haut dans une colonne
-
Dans le général, B2 est ajouté à L et la zone
est ajusté à celui de B2 (pour que les blocs situés dans la même colonne
que B2 soient parcourus avant ceux, plus hauts, de la colonne suivante).
-
sauf si il existe un bloc non traité qui commence plus haut dans une colonne
à gauche de la zone à traiter. Ceci se produit quand
un titre centré par exemple (s'il est centré il ne peut pas etre plus à gauche), ou un bloc situé à droite (à côté d'une
photo par exemple) vient d'être ajouté à la liste L.
Dans ce cas, on réinitialise la zone à l'ensemble des
colonnes (ce qui aura pour effet de traiter en priorité les blocs
de gauche).
-
l'arrete droite du bloc B2 est au delà de l'arrete droite de la zone.
C'est par exemple le cas d'un titre (sur toute la largeur
de la page) qui sépare des sections écrites en colonnes. Dans ce cas,
la colonne gauche de B2 est incrémentée (ce texte sera lu après avoir lu
la colonne suivante) ainsi que les bornes de la zone
à traiter.
-
Dans le troisième cas, B2 est ajouté à L et la zone
est ajusté à celui de B2 (pour que les blocs situés dans la même colonne
que B2 soient parcourus avant ceux, plus hauts, de la colonne suivante).
-
sauf si l'arrete droite du bloc B2 est au delà de l'arrete droite de la zone.
C'est par exemple le cas d'un titre sur toute la largeur
de la page. Dans ce cas, la zone est agrandit jusqu'à l'arrete droite de B2.
Tous les blocs de la zone situé au dessus de B2 sont inséré dans la liste L avant B2.
Une fois cette boucle terminée, L contient la liste des blocs dans un ordre de
lecture estimé convenable.
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment