-
Notifications
You must be signed in to change notification settings - Fork 31
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Module d'import unitaire GTFS stops avec suppression + outils associés #2851
Merged
Conversation
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
…bles with Docker)
So that I can work at scale locally.
thbar
commented
Jan 9, 2023
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Mes commentaires sont ajoutés
fchabouis
reviewed
Jan 9, 2023
fchabouis
reviewed
Jan 9, 2023
Co-authored-by: Francis Chabouis <[email protected]>
@etalab/transport-tech j'ai pris en compte vos inputs (merci !), je redemande la review du coup. |
AntoineAugusti
approved these changes
Jan 9, 2023
11 tasks
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.
This suggestion is invalid because no changes were made to the code.
Suggestions cannot be applied while the pull request is closed.
Suggestions cannot be applied while viewing a subset of changes.
Only one suggestion per line can be applied in a batch.
Add this suggestion to a batch that can be applied as a single commit.
Applying suggestions on deleted lines is not supported.
You must change the existing code in this line in order to create a valid suggestion.
Outdated suggestions cannot be applied.
This suggestion has been applied or marked resolved.
Suggestions cannot be applied from pending reviews.
Suggestions cannot be applied on multi-line comments.
Suggestions cannot be applied while the pull request is queued to merge.
Suggestion cannot be applied right now. Please check back later.
Dans cette PR, j'ajoute un module qui importe uniquement les arrêts GTFS d'un ResourceHistory donné via un
DataImport
(en s'appuyant sur le code réalisé par @fchabouis précédemment dansimport_gtfs_from_resource_history
), puis qui efface tous lesDataImport
précédents en lien avec la resource (ou parce qu'elles sont le mêmeresource_history_id
, ou parce qu'elles sont en lien avec d'autresresource_history_id
de la même resource).Cela va permettre dans la PR suivante d'avoir N imports qui ne conservent que la dernière version.
J'ai fait évoluer le code de
import_gtfs_from_resource_history
pour pouvoir Mox'er l'import, sans quoi Unzip tentait une connection AWS. Ceci m'a permis de mettre le tout sous tests efficacement.J'ai modifié
DataImport
pour avoir un cascading delete (dès lors qu'on en supprime un, effacer toutes les tables GTFS associées, de façon à ne pas polluer la base).Par ailleurs j'ai ajouté un script (que je vais utiliser pour la suite) qui permet de télécharger les données de production GTFS dans un bucket local.⚠️ pas la peine de le tester en réel, je compte l'ajuster dans la prochaine PR et il ne marche peut-être plus parfaitement.
Choses que je conserve pour la prochaine PR
En faisant des tests de volume sur S3 j'ai repéré par mal d'erreurs. Toutefois je ne souhaite garder cette PR suffisamment petite pour la relecture, et je garde donc ces todos pour la suite: