cours-2022-2023 | Documents de mes cours pour l'année 2022-2023 | FX Jollois

Rappels de SQL

Nous utiliserons SAS pour réaliser les requêtes SQL sur le data-mart CA. Celui-ci représente un data warehouse (enfin, plutôt data mart) centré sur le chiffre d’affaires (CA) d’une entreprise en fonction de 3 dimensions (provenance, mois et département - ces deux dernières comprenant une hiérarchie). Voici les 4 tables le contenant (avec le schéma).

Pour exécuter une requête, vous devez utiliser donc la procédure SQL, comme dans l’exemple ci-dessous. Attention, cette procédure est dite interactive, il faut donc la quitter (avec QUIT;) pour la terminer.

PROC SQL;
	-- votre requête;
QUIT;

Vous trouverez dans ces slides un ensemble de rappels sur le langage SQL.

Importation des données

Ecrire le programme permettant de créer les 4 tables (vides pour le moment) dans une librairie (nommé "CA") dédié au data-mart (qui se situera sur votre espace personnel). Puis, importer les tables avec le code suivant :

%macro import(fic);
filename fic1 "z:/temp.csv";
proc http method="get" out=fic1 url="https://fxjollois.github.io/donnees/ca/csv/&fic..csv"; run;
filename fic2 "z:/temp.csv" encoding="utf-8";
PROC IMPORT datafile=fic2 out=temp dbms=csv replace; 
	getnames=yes; 
	delimiter=";"; 
run;
proc sql;
	insert into ca.&fic. select * from temp;
quit;
%mend;

%import(provenance);
%import(mois);
%import(groupe);
%import(ca);

Répondez aux demandes suivantes en utilisant exclusivement la PROC SQL

  1. Créer une vue comprenant l’ensemble des informations contenus dans les 4 tables, que vous nommerez CA_ALL
  2. Lister les groupes du département “Ménage”
  3. Lister les provenances contenant la chaîne de caractères “Studio”
  4. Combien de département ont un sous-groupe nommé “Divers” ? idem mais avec le mot “divers” dedans ?
  5. Calculer pour chaque provenance son chiffre d’affaires (CA) total, en les classant dans l’ordre décroissant par rapport au CA total
  6. Donner le TOP 5 des sous-groupes en fonction de leur CA total (en indiquant aussi leur groupe et leur département)
  7. Pour tous les départements ayant plus de 2 groupes, donner le nombre de sous-groupes pour chacun de leur groupe
    • le tri doit se faire sur les départements puis par ordre décroissant du nombre de sous-groupes
  8. On souhaite tester le lien entre la provenance et le département. Que doit-on préparer comme tableau ?
    • l’utilisation d’une autre procédure SAS est possible ici
  9. Calculer le chiffre d’affaires total pour chaque mois des deux années
    • le résulat doit intégrer les noms des mois (attention à l’ordre naturel de ceux-ci)
  10. Puis, convertir ces résultats en base 100 en janvier 2003
  11. Calculer, pour chaque mois, le taux d’augmentation du chiffre d’affaires total par rapport au mois précédent