Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
copain
PDF2Blocs
Commits
b6e9dfaa
Commit
b6e9dfaa
authored
Apr 10, 2020
by
Roussey Catherine
Browse files
Update README.md
parent
0d72daa6
Changes
1
Hide whitespace changes
Inline
Side-by-side
src/py/README.md
View file @
b6e9dfaa
...
...
@@ -135,14 +135,15 @@ Le programme *pdf2blocks* commence par lancer la commande suivante :
pdftotext -bbox-layout -eol unix /path/to/file.pdf
Le résultat de cette commande est stockée dans une liste python. Cette liste
a été nommée
***blocks**
*
. Cette liste est initialisée avec
l
es sorties de
a été nommée
***blocks**
*
. Cette liste est initialisée avec
une partie d
es sorties de
pdftotext".
Cette liste reprend la structure xml de
*pdftotext*
à partir de la balise
*block*
.
Les balises
*page*
ont été remplacées par un attribut de
*blocks*
donnant
le numéro de page, et les balises
*flow*
par un nombre incrémenté à chaque fois
que la balise est rencontrée.
Les balises
*page*
de pdftotext ont été remplacées par un attribut dans la balise
*blocks*
donnant
le numéro de page. Les balises
*flow*
de pdftotext ont été remplacées par un attribut dans la balise
*blocks*
.
La valeur de cet attribut est incrémenté à chaque fois
que la balise
*flow*
est rencontrée.
Ainsi, on peut identifier les blocs qui font partie d'un même flow.
Les éléments de la liste
*blocks*
ont donc la structure suivante :
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment