Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
copain
PDF2Blocs
Commits
5be72023
Commit
5be72023
authored
Apr 10, 2020
by
Roussey Catherine
Browse files
Update README.md
parent
0bda34db
Changes
1
Hide whitespace changes
Inline
Side-by-side
src/py/README.md
View file @
5be72023
...
...
@@ -330,23 +330,27 @@ pour chercher le bloc le moins large (le plus petit x_max).
On recommence le processus de détection d'une autre colonne tant qu'il y a des blocs à l'étape 5.
La dernière verticale est placée au niveau d
u plus grand x_max (
l'ar
r
ete droite d
'un
bloc).
La dernière verticale est placée au niveau d
e
l'arete droite d
u
bloc
situé le plus à droite (le plus grand x_max
).
Les verticales ainsi définies seront ensuite utilisées pour
situ
er
l
es
blocs
dans les colonnes, en donnant deux valeurs :
Les verticales ainsi définies seront ensuite utilisées pour
identifi
er
d
es
colonnes.
Une colonne est localisée entre deux verticlaes.
-
le numéro de colonne contenant l'arrete gauche du bloc,
-
le numéro de colonne contenant l'arrete droite du bloc.
Chaque bloc est enrichi avec deux nouveaux attributs :
-
col_min: le numéro de colonne contenant l'arrete gauche du bloc,
-
col_max: le numéro de colonne contenant l'arrete droite du bloc.
En effet, certains blocs peuvent chevaucher plusieurs colonnes (par exemple
des titres). Les deux
valeurs désignent la même colonne dans le cas où
le bloc
des titres). Les deux
attributs ont la meme valeur quand
le bloc
est entièrement contenu dans une seule colonne.
Toutefois, les blocs ayant une fonte plus grande que la fonte par défaut
sont agrandis autant que possible vers la droite de la page (jusqu'à un autre
bloc ou jusqu'au bord de la page) avant la numérotation des colonnes.
Ceci afin d'éviter qu'un titre court ne soit considéré comme étant entièrement
contenu dans une seule colonne.
Avant la numérotation des colonnes pour définir l'ordre de lecture,
on effectue l'opération suivante. Les blocs ayant une fonte plus grande que la fonte par défaut (les titres potentiels)
sont élargis autant que possible vers la droite de la page (accroissement de leur x_max)
jusqu'à rencontrer un autre bloc ou jusqu'au bord de la page.
Cette opération est nécessaire pour définir le sens de lecture correcte quand un titre est trop court pour déborder sur les deux colonnes.
Il devrait éborder sur les deux colonnes mais il est de fait entièrement contenu dans une colonne.
##### Parcours des blocs dans le sens de lecture
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment