Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
copain
PDF2Blocs
Commits
0d72daa6
Commit
0d72daa6
authored
Apr 10, 2020
by
Roussey Catherine
Browse files
Update README.md
parent
a8017581
Changes
1
Hide whitespace changes
Inline
Side-by-side
src/py/README.md
View file @
0d72daa6
...
...
@@ -135,12 +135,11 @@ Le programme *pdf2blocks* commence par lancer la commande suivante :
pdftotext -bbox-layout -eol unix /path/to/file.pdf
Le résultat de cette commande est stockée dans une liste python. Cette liste
a été nommée
***blocks**
*
, qui est devenu à l'usage le terme utilisé pour
faire référence à "la liste dans laquelle est stocké le résultat de
a été nommée
***blocks**
*
. Cette liste est initialisée avec les sorties de
pdftotext".
Cette liste reprend la structure xml de
*pdftotext*
à partir de la balise
*block*
, qui est le niveau de découpage qui nous a paru le mieux adapté
.
*block*
.
Les balises
*page*
ont été remplacées par un attribut de
*blocks*
donnant
le numéro de page, et les balises
*flow*
par un nombre incrémenté à chaque fois
que la balise est rencontrée.
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment