cours-2023-2024 | Documents de mes cours pour l'année 2023-2024 | FX Jollois

SAE Collecte automatisée de données web

A partir des données de la base SIRENE (et plus particulièrement le fichier StockEtablissement), vous devez compléter les informations par :

A PRENDRE EN CONSIDERATION

https://cloud.parisdescartes.fr/index.php/s/BsdJWfD7rnGdtnr

Pseudo-algo à prévoir

Voila le pseudo-algo à prévoir

N <- Nombre de lignes du fichier StockEtablissement - 1
P <- Taille des pas de lecture (100 par exemple)
i = 1
Tant Que i < N Faire
    Lire les P prochaines lignes
    Pour chaque siret Faire
        Chercher la localisation geographique
        Chercher les informations compléments sur Google Maps
        Ajouter ces informations au DataFrame
        Pause
    Fin Pour
    i <- i + P
    Ecrire les lignes dans le fichier (Faire attention si c'est la première fois)
Fin Tant Que

Séances