Commit 0d72daa6 authored by Roussey Catherine's avatar Roussey Catherine
Browse files

Update README.md

parent a8017581
......@@ -135,12 +135,11 @@ Le programme *pdf2blocks* commence par lancer la commande suivante :
pdftotext -bbox-layout -eol unix /path/to/file.pdf
Le résultat de cette commande est stockée dans une liste python. Cette liste
a été nommée ***blocks***, qui est devenu à l'usage le terme utilisé pour
faire référence à "la liste dans laquelle est stocké le résultat de
a été nommée ***blocks***. Cette liste est initialisée avec les sorties de
pdftotext".
Cette liste reprend la structure xml de *pdftotext* à partir de la balise
*block*, qui est le niveau de découpage qui nous a paru le mieux adapté.
*block*.
Les balises *page* ont été remplacées par un attribut de *blocks* donnant
le numéro de page, et les balises *flow* par un nombre incrémenté à chaque fois
que la balise est rencontrée.
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment