cours-2025-2026 | Supports de mes cours pour l'année 2025-2026 | FX Jollois

TP récapitulatif

Données AirBnB

Nous allons travailler sur des données AirBnB. Celles-ci sont stockées sur le serveur Mongo dans la collection listingsAndReviews de la base sample_airbnb.

import pymongo
URI = 'mongodb+srv://user:user@cluster0.ougec.mongodb.net'
client = pymongo.MongoClient(URI) # enlever le paramètre URI si connexion locale
db = client.sample_airbnb
list(db.listingsAndReviews.find(limit = 1))

Elles sont aussi disponibles en téléchargement via ce lien

Aide sur les données

Une fois créée la connexion à la collection dans Python, répondre aux questions suivantes :

  1. Lister les différentes types de logements possibles cf (room_type)
  2. Lister les différents équipements possibles cf (amenities)
  3. Donner le nombre de logements
  4. Donner le nombre de logements de type “Entire home/apt”
  5. Donner le nombre de logements proposant la “TV” et le “Wifi (cf amenities)
  6. Donner le nombre de logements n’ayant eu aucun avis
    • il existe les champs number_of_reviews et reviews (tableau des avis) - vérifiez qu’ils soient cohérents
  7. Lister les informations du logement “10545725” (cf _id)
  8. Lister le nom, la rue et le pays des logements dont le prix est supérieur à 10000
  9. Donner le nombre de logements par type
  10. Donner le nombre de logements par pays
  11. On veut représenter graphiquement la distribution des prix, il nous faut donc récupérer uniquement les tarifs
    • Un tarif apparraissant plusieurs fois dans la base doit être présent plusieurs fois dans cette liste
  12. Calculer pour chaque type de logements (room_type) le prix (price)
  13. On veut représenter la distribution du nombre d’avis. Il faut donc calculer pour chaque logement le nombre d’avis qu’il a eu (cf reviews)
  14. Compter le nombre de logement pour chaque équipement possible
  15. On souhaite connaître les 10 utilisateurs ayant fait le plus de commentaires

ATTENTION : il est demander de stocker le résultat dans une variable (de type list ou DataFrame pandas avant de l’afficher)