Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
copain
PDF2Blocs
Commits
6a61217a
Commit
6a61217a
authored
Apr 10, 2020
by
Roussey Catherine
Browse files
Update README.md
parent
aa5232ff
Changes
1
Hide whitespace changes
Inline
Side-by-side
src/py/README.md
View file @
6a61217a
...
...
@@ -319,14 +319,22 @@ La détection de colonnes ne considère que les blocs :
(MIN_CAR_IN_COLUMN_BLOCK - actuellement 20), pour les distinguer des colonnes
de tableaux.
On cherche le bloc situé le plus à gauche de la page.
On place une verticale V1 à gauche de ce bloc.
Puis on parcours l'ensemble des blocs dont l'arrete gauche est située sur V1
1.
On cherche le bloc situé le plus à gauche de la page.
2.
On place une verticale V1 à gauche de ce bloc. C'est la verticale de la première colonne.
3.
Puis on parcours l'ensemble des blocs dont l'arrete gauche est située à proximité de V1
pour chercher le bloc le moins large.
On pose une seconde verticale V' sur l'arrete de ce bloc.
On parcours l'ensemble des blocs, pour construire l'ensemble des blocs dont l'arrete de gauche est à droite de V'.
ON determine le bloc le plus à gauche dans cet ensemble.
On place une verticale intitulée V2 sur l'arete de ce bloc.
4.
On pose une seconde verticale V' sur l'arrete de ce bloc.
5.
On parcours l'ensemble des blocs, pour construire l'ensemble des blocs dont l'arrete de gauche est à droite de V'.
6.
On determine le bloc le plus à gauche de cet ensemble.
7.
On place une verticale intitulée V2 sur l'arete de ce bloc. Il s'agit de la erticale de la seconde colonne.
On recommence le processus de détection d'une autre colonne
si on trouve des blocs placés à droite
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment