Skip to content
GitLab
Projects Groups Topics Snippets
  • /
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
    • Contribute to GitLab
  • Register
  • Sign in
  • J J2K coupling
  • Project information
    • Project information
    • Activity
    • Labels
    • Members
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributor statistics
    • Graph
    • Compare revisions
  • Issues 0
    • Issues 0
    • List
    • Boards
    • Service Desk
    • Milestones
  • Merge requests 0
    • Merge requests 0
  • CI/CD
    • CI/CD
    • Pipelines
    • Jobs
    • Schedules
  • Deployments
    • Deployments
    • Environments
    • Releases
  • Packages and registries
    • Packages and registries
    • Container Registry
  • Monitor
    • Monitor
    • Incidents
  • Analytics
    • Analytics
    • Value stream
    • CI/CD
    • Repository
  • Wiki
    • Wiki
  • Snippets
    • Snippets
  • Activity
  • Graph
  • Create a new issue
  • Jobs
  • Commits
  • Issue Boards
Collapse sidebar

La forge institutionnelle d'INRAE étant en production depuis le 10 juin 2025, nous vous invitons à y créer vos nouveaux projets.

  • WatASitDev
  • J2K coupling
  • Wiki
  • spacetime

spacetime · Changes

Page history
Update spacetime authored May 04, 2020 by Veyssier Julien's avatar Veyssier Julien
Hide whitespace changes
Inline Side-by-side
spacetime.md
View page @ 1047f9bf
...@@ -10,22 +10,48 @@ ...@@ -10,22 +10,48 @@
On peut écrire des fichiers texte tabulaires et se débrouiller pour stocker les infos spatiales et temporelles. On peut écrire des fichiers texte tabulaires et se débrouiller pour stocker les infos spatiales et temporelles.
* avantages * Avantages
* simple à programmer et à maintenir * simple à programmer et à maintenir
* inconvénients * Inconvénients
* plus dur à traiter pour ceux à qui on passe les données * plus dur à traiter pour ceux à qui on passe les données
* solution la moins performante * solution la moins performante
## sqlite3 ## sqlite3
On pourrait écrire les données qu'on récupère dans une base sqlite3 On pourrait écrire les données qu'on récupère dans une base sqlite3.
* avantages
https://cran.r-project.org/web/packages/RSQLite/index.html
* Avantages
* lecture/écriture plus performante que des fichiers texte tabulaires * lecture/écriture plus performante que des fichiers texte tabulaires
* on peut écrire au fur et à mesure donc économiser de la mémoire vive
* ça reste un seul fichier facile à transporter * ça reste un seul fichier facile à transporter
* sqlite3 est interfaçable avec tous les langages de programmation * sqlite3 est interfaçable avec tous les langages de programmation
* inconvénients * Inconvénients
* c'est moins performant que les gros SGBD comme MySQL ou PostgreSQL * c'est moins performant que feather et les gros SGBD comme MySQL ou PostgreSQL
* c'est plus chiant de changer la forme des résultats (la structure des tables) qu'avec une solution "texte tabulaire) * c'est plus chiant de changer la forme des résultats (la structure des tables) qu'avec les autres solutions
* on perd la possibilité d'utiliser les outils GNU sed, awk, grep * on perd la possibilité d'utiliser les outils GNU sed, awk, grep
## ## Feather
\ No newline at end of file
Feather est un format binaire pour stocker des dataframes. Il est interfacé avec R, Python et Julia.
https://www.rdocumentation.org/packages/feather/versions/0.3.5
* Avantages
* de loin le plus performant niveau temps et espace
* plus facile que les autres, on a un package R qui peut directement écrire un dataframe
* Inconvénients
* on ne peut pas écrire au fur et à mesure qu'on obtient les données donc on met tout en RAM
* on ne sait pas si la personne qui traitera les données utilise un langage qui a une librairie qui sait lire les fichiers feather
* on perd aussi sed, awk, grep
## Autres solutions
On a aussi des trucs comme hdf5 ou la sérialisation type pickle mais c'est peu utilisé et peu connu.
# Ma conclusion
Feather a l'air vraiment bien et nous faciliterait la tâche. On a juste à produire un dataframe bien formé et le package s'occupe de le stocker pour nous.
La question est : Quelle quantité de données on va sortir du modèle couplé ? Si c'est énorme, on devrait choisir sqlite3, si c'est raisonnable et que ça ne fait pas exploser la RAM, je pense que feather est plus simple et plus pratique.
\ No newline at end of file
Clone repository
  • Home
  • j2k_modules
  • netbeans
  • protocole_j2k
  • rapport
  • run
  • spacetime
  • todo