Skip to content
GitLab
Projects Groups Topics Snippets
  • /
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
    • Contribute to GitLab
  • Register
  • Sign in
  • J J2K coupling
  • Project information
    • Project information
    • Activity
    • Labels
    • Members
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributor statistics
    • Graph
    • Compare revisions
  • Issues 0
    • Issues 0
    • List
    • Boards
    • Service Desk
    • Milestones
  • Merge requests 0
    • Merge requests 0
  • CI/CD
    • CI/CD
    • Pipelines
    • Jobs
    • Schedules
  • Deployments
    • Deployments
    • Environments
    • Releases
  • Packages and registries
    • Packages and registries
    • Container Registry
  • Monitor
    • Monitor
    • Incidents
  • Analytics
    • Analytics
    • Value stream
    • CI/CD
    • Repository
  • Wiki
    • Wiki
  • Snippets
    • Snippets
  • Activity
  • Graph
  • Create a new issue
  • Jobs
  • Commits
  • Issue Boards
Collapse sidebar

La forge institutionnelle d'INRAE étant en production depuis le 10 juin 2025, nous vous invitons à y créer vos nouveaux projets.

  • WatASitDev
  • J2K coupling
  • Wiki
  • spacetime

spacetime · Changes

Page history
Update spacetime authored May 04, 2020 by Veyssier Julien's avatar Veyssier Julien
Hide whitespace changes
Inline Side-by-side
spacetime.md
View page @ 1047f9bf
......@@ -10,22 +10,48 @@
On peut écrire des fichiers texte tabulaires et se débrouiller pour stocker les infos spatiales et temporelles.
* avantages
* Avantages
* simple à programmer et à maintenir
* inconvénients
* Inconvénients
* plus dur à traiter pour ceux à qui on passe les données
* solution la moins performante
## sqlite3
On pourrait écrire les données qu'on récupère dans une base sqlite3
* avantages
On pourrait écrire les données qu'on récupère dans une base sqlite3.
https://cran.r-project.org/web/packages/RSQLite/index.html
* Avantages
* lecture/écriture plus performante que des fichiers texte tabulaires
* on peut écrire au fur et à mesure donc économiser de la mémoire vive
* ça reste un seul fichier facile à transporter
* sqlite3 est interfaçable avec tous les langages de programmation
* inconvénients
* c'est moins performant que les gros SGBD comme MySQL ou PostgreSQL
* c'est plus chiant de changer la forme des résultats (la structure des tables) qu'avec une solution "texte tabulaire)
* Inconvénients
* c'est moins performant que feather et les gros SGBD comme MySQL ou PostgreSQL
* c'est plus chiant de changer la forme des résultats (la structure des tables) qu'avec les autres solutions
* on perd la possibilité d'utiliser les outils GNU sed, awk, grep
##
\ No newline at end of file
## Feather
Feather est un format binaire pour stocker des dataframes. Il est interfacé avec R, Python et Julia.
https://www.rdocumentation.org/packages/feather/versions/0.3.5
* Avantages
* de loin le plus performant niveau temps et espace
* plus facile que les autres, on a un package R qui peut directement écrire un dataframe
* Inconvénients
* on ne peut pas écrire au fur et à mesure qu'on obtient les données donc on met tout en RAM
* on ne sait pas si la personne qui traitera les données utilise un langage qui a une librairie qui sait lire les fichiers feather
* on perd aussi sed, awk, grep
## Autres solutions
On a aussi des trucs comme hdf5 ou la sérialisation type pickle mais c'est peu utilisé et peu connu.
# Ma conclusion
Feather a l'air vraiment bien et nous faciliterait la tâche. On a juste à produire un dataframe bien formé et le package s'occupe de le stocker pour nous.
La question est : Quelle quantité de données on va sortir du modèle couplé ? Si c'est énorme, on devrait choisir sqlite3, si c'est raisonnable et que ça ne fait pas exploser la RAM, je pense que feather est plus simple et plus pratique.
\ No newline at end of file
Clone repository
  • Home
  • j2k_modules
  • netbeans
  • protocole_j2k
  • rapport
  • run
  • spacetime
  • todo