TP récapitulatif
Données AirBnB
Nous allons travailler sur des données AirBnB. Celles-ci sont stockées sur le serveur Mongo dans la collection listingsAndReviews de la base sample_airbnb.
import pymongo
URI = 'mongodb+srv://user:user@cluster0.ougec.mongodb.net'
client = pymongo.MongoClient(URI) # enlever le paramètre URI si connexion locale
db = client.sample_airbnb
list(db.listingsAndReviews.find(limit = 1))
Elles sont aussi disponibles en téléchargement via ce lien
Aide sur les données
Une fois créée la connexion à la collection dans Python, répondre aux questions suivantes :
- Lister les différentes types de logements possibles cf (
room_type)
- Lister les différents équipements possibles cf (
amenities)
- Donner le nombre de logements
- Donner le nombre de logements de type “Entire home/apt”
- Donner le nombre de logements proposant la “TV” et le “Wifi (cf
amenities)
- Donner le nombre de logements n’ayant eu aucun avis
- il existe les champs
number_of_reviews et reviews (tableau des avis) - vérifiez qu’ils soient cohérents
- Lister les informations du logement “10545725” (cf
_id)
- Lister le nom, la rue et le pays des logements dont le prix est supérieur à 10000
- Donner le nombre de logements par type
- Donner le nombre de logements par pays
- On veut représenter graphiquement la distribution des prix, il nous faut donc récupérer uniquement les tarifs
- Un tarif apparraissant plusieurs fois dans la base doit être présent plusieurs fois dans cette liste
- Calculer pour chaque type de logements (
room_type) le prix (price)
- On veut représenter la distribution du nombre d’avis. Il faut donc calculer pour chaque logement le nombre d’avis qu’il a eu (cf
reviews)
- Compter le nombre de logement pour chaque équipement possible
- On souhaite connaître les 10 utilisateurs ayant fait le plus de commentaires
ATTENTION : il est demander de stocker le résultat dans une variable (de type list ou DataFrame pandas avant de l’afficher)