PDF2Blocs issueshttps://gitlab.irstea.fr/copain/pdf2blocs/-/issues2020-10-06T11:33:40+02:00https://gitlab.irstea.fr/copain/pdf2blocs/-/issues/8DOI ou identifiant2020-10-06T11:33:40+02:00Roussey CatherineDOI ou identifiantil faut créer un doi pour ce code, tu peux utiliser zenodo pour le declarer.il faut créer un doi pour ce code, tu peux utiliser zenodo pour le declarer.Bernard StephanBernard Stephanhttps://gitlab.irstea.fr/copain/pdf2blocs/-/issues/7licence2020-10-05T16:53:02+02:00Roussey Catherinelicenceadd licence n'est pas renseigné
a priori pour etre compatible avec le droit francais il faut que tu es une licence CECILEadd licence n'est pas renseigné
a priori pour etre compatible avec le droit francais il faut que tu es une licence CECILEBernard StephanBernard Stephanhttps://gitlab.irstea.fr/copain/pdf2blocs/-/issues/6refaire les evaluations du gold standard2020-09-14T18:20:35+02:00Roussey Catherinerefaire les evaluations du gold standardfaut il refaire les evaluations du goldstandard?faut il refaire les evaluations du goldstandard?Bernard StephanBernard Stephanhttps://gitlab.irstea.fr/copain/pdf2blocs/-/issues/5eliminer toutes les balises div2020-04-03T14:20:42+02:00Roussey Catherineeliminer toutes les balises divnormalement aucune balise div ne doit etre present dans le code html de pdf2blocs car tout a été transformé...
quand il reste une balise div cela veut dire que le texte n'a pas été classé... c'est bizarre
cas bsv vigne charentenormalement aucune balise div ne doit etre present dans le code html de pdf2blocs car tout a été transformé...
quand il reste une balise div cela veut dire que le texte n'a pas été classé... c'est bizarre
cas bsv vigne charenteBernard StephanBernard Stephanhttps://gitlab.irstea.fr/copain/pdf2blocs/-/issues/4saut de ligne2020-04-03T13:59:42+02:00Roussey Catherinesaut de lignepour rendre le code html moins long
enleve le saut de ligne apres un balise
balise P
hhhh
balise fin P
devient
balise P hhhh balise fin P
de plus l'usage des sauts de lignes à l'interieur d'un paragraphe n'est pas clair. Parfois...pour rendre le code html moins long
enleve le saut de ligne apres un balise
balise P
hhhh
balise fin P
devient
balise P hhhh balise fin P
de plus l'usage des sauts de lignes à l'interieur d'un paragraphe n'est pas clair. Parfois il y a la balise br parfois non alors que l'on voit bien un saut de ligne.
Il faut harmoniser. soit tous les sauts de lignes sont représentés avec a balise br soit aucun.Bernard StephanBernard Stephanhttps://gitlab.irstea.fr/copain/pdf2blocs/-/issues/3supprimer la balise title2020-04-03T11:10:52+02:00Roussey Catherinesupprimer la balise titlesi pdf2blocs detects un titre il faut le mettre dans une balise H1 plutot que titre.
la balise title de html va dans le head pas dans le body.si pdf2blocs detects un titre il faut le mettre dans une balise H1 plutot que titre.
la balise title de html va dans le head pas dans le body.Bernard StephanBernard Stephanhttps://gitlab.irstea.fr/copain/pdf2blocs/-/issues/2corpus de tests2020-04-09T09:26:55+02:00Roussey Catherinecorpus de testsmettre dans un repertoire les fichier pdf que tu as utilisé pour tester. Le repretoire peut s'appeler corpus. le repertoire peut contenir des bsf de differentes culture et etre mis à jour en fonction de tes avancées.mettre dans un repertoire les fichier pdf que tu as utilisé pour tester. Le repretoire peut s'appeler corpus. le repertoire peut contenir des bsf de differentes culture et etre mis à jour en fonction de tes avancées.Bernard StephanBernard Stephanhttps://gitlab.irstea.fr/copain/pdf2blocs/-/issues/1algorithme2020-04-06T09:05:44+02:00Roussey Catherinealgorithmenettoyer le code et presenter l'algorithme soit dans le wiki soit dans un read me ou un document, à toi de voirnettoyer le code et presenter l'algorithme soit dans le wiki soit dans un read me ou un document, à toi de voirBernard StephanBernard Stephan