Introduction à MongoDB - évaluation
Rendu
Espace de dépôt du travail (notebook ipynb
- avec votre nom dans le nom du fichier) :
https://cloud.parisdescartes.fr/index.php/s/8tqTRDDTQMDKGRp
2 parties :
- Suite du travail sur les restaurants
- Données AirBnB
Restaurants
- Lister tous les restaurants de la chaîne “Bareburger” (rue, quartier)
- Lister les trois chaînes de restaurant les plus présentes
- Donner les 10 styles de cuisine les plus présents dans la collection
- Lister les 10 restaurants les moins bien notés (note moyenne la plus haute)
- Lister par quartier le nombre de restaurants, le score moyen et le pourcentage moyen d’évaluation A
Questions complémentaires
Nécessitent une recherche sur la toile pour compléter ce qu’on a déjà vu dans ce TP.
- Lister les restaurants (nom et rue uniquement) situés sur une rue ayant le terme “Union” dans le nom
- Lister les restaurants ayant eu une visite le 1er février 2014
- Lister les restaurants situés entre les longitudes -74.2 et -74.1 et les lattitudes 40.1 et 40.2
AirBnB
Nous allons travailler sur des données AirBnB. Celles-ci sont stockées sur le serveur Mongo dans la collection airbnb
de la base test
.
Aide sur les données
Une fois créée la connexion à la collection dans Python, répondre aux questions suivantes :
- Lister les différentes types de logements possibles cf (
room_type
)
- Lister les différents équipements possibles cf (
amenities
)
- Donner le nombre de logements
- Donner le nombre de logements de type “Entire home/apt”
- Donner le nombre de logements proposant la “TV” et le “Wifi (cf
amenities
)
- Donner le nombre de logements n’ayant eu aucun avis
- il exite les champs
number_of_reviews
et reviews
(tableau des avis)
- Lister les informations du logement “10545725” (cf
_id
)
- Lister le nom, la rue et le pays des logements dont le prix est supérieur à 10000
- Donner le nombre de logements par type
- Donner le nombre de logements par pays
- On veut représenter graphiquement la distribution des prix, il nous faut donc récupérer uniquement les tarifs
- Un tarif apparraissant plusieurs fois dans la base doit être présent plusieurs fois dans cette liste
- Calculer pour chaque type de logements (
room_type
) le prix (price
)
- On veut représenter la distribution du nombre d’avis. Il faut donc calculer pour chaque logement le nombre d’avis qu’il a eu (cf
reviews
)
- Compter le nombre de logement pour chaque équipement possible
- On souhaite connaître les 10 utilisateurs ayant fait le plus de commentaires