Commit 2fa2d282 authored by Roussey Catherine's avatar Roussey Catherine
Browse files

Update README.md

parent 18d4e8e6
......@@ -117,10 +117,11 @@ La ligne suivante est aussi découpée en trois segements de texte
> Le ***petit*** papillon.
car un nouveau style (gras, italique) de la même police est défini comme une
nouvelle fonte. Cependant, rien, dans le fichier xml, n'indique ce découpage.
Il y a juste une succession de balises text. On peut toutefois se baser sur
la valeur de l'attribut *top*. Mais celui-ci n'est pas toujours égal
dans une même ligne (notamment pour les indices et exposants).
nouvelle fonte. On note que dans pdftohtml les lignes ne sont pas identifiées.
On peut toutefois reconstruire une ligne en se basant sur
les valeurs identiques de l'attribut *top* d'un ensemble de segments de texte.
Attention, il se peut que les valeurs de l'attribut top ne soint pas toujours égales
dans une même ligne notamment quand la ligne contient des indices ou des exposants.
Enfin, le découpage de colonnes fonctionne mal, et il arrive que du texte de
deux colonnes successives se retrouve dans la même balise text.
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment