Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
copain
PDF2Blocs
Commits
2fa2d282
Commit
2fa2d282
authored
Apr 10, 2020
by
Roussey Catherine
Browse files
Update README.md
parent
18d4e8e6
Changes
1
Hide whitespace changes
Inline
Side-by-side
src/py/README.md
View file @
2fa2d282
...
...
@@ -117,10 +117,11 @@ La ligne suivante est aussi découpée en trois segements de texte
> Le ***petit*** papillon.
car un nouveau style (gras, italique) de la même police est défini comme une
nouvelle fonte. Cependant, rien, dans le fichier xml, n'indique ce découpage.
Il y a juste une succession de balises text. On peut toutefois se baser sur
la valeur de l'attribut
*top*
. Mais celui-ci n'est pas toujours égal
dans une même ligne (notamment pour les indices et exposants).
nouvelle fonte. On note que dans pdftohtml les lignes ne sont pas identifiées.
On peut toutefois reconstruire une ligne en se basant sur
les valeurs identiques de l'attribut
*top*
d'un ensemble de segments de texte.
Attention, il se peut que les valeurs de l'attribut top ne soint pas toujours égales
dans une même ligne notamment quand la ligne contient des indices ou des exposants.
Enfin, le découpage de colonnes fonctionne mal, et il arrive que du texte de
deux colonnes successives se retrouve dans la même balise text.
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment