Système pour la Data Science
Master AMSD/MLSD
Langage système de base
Demande à réaliser
Création d’une machine virtuelle Ubuntu Server
Vous pouvez utiliser ce tutoriel pour vous guider dans la création de la machine virtuelle, que l’on utilisera dans tous les cours par la suite
Répondre aux questions suivantes
Nous allons utiliser des données réelles sur l’usage de smartphones
- Créer un répertoire dédié au cours (
sysds
exemple)
- Créer un répertoire dédié à la séance (
seance1
par exemple)
- Créer un fichier texte vide (nommé
notes.txt
)
- Ecrire dans ce fichier les deux commandes que vous avez utilisé précédemment, pour rappel plus tard
- Puisque c’est un langage interprété, les commandes ne sont pas stockées dans un fichier
- Si vous souhaitez prendre des notes sur ce que vous avez fait, vous pouvez donc utiliser ce fichier
- La commande
history
permet de récupérer l’historiques des 500 dernières commandes (history 10
pour n’avoir que les 10 dernières)
- Télécharger le fichier
UbiqLog4UCI.zip
dans ce nouveau répertoire
- URL =
http://archive.ics.uci.edu/ml/machine-learning-databases/00369/UbiqLog4UCI.zip
- Le décompresser dans le répertoire de la séance
- (re)Compresser le répertoire au format
gz
, puis comparer leur taille
- En stockant le résultat dans un fichier texte nommé
compress_compare.txt
- Sans changer de répertoire, lister les sous-répertoires du nouveau dossier
- Stocker cette liste de répertoire (avec toutes les informations possibles) dans un fichier texte (à la racine de la séance) nommé
UbiqLog4UCI_list_dir.txt
- Afficher les premières lignes du fichier
log_11-1-2014.txt
présent dans le sous-répertoire 1_M
- Afficher les informations de ce même fichier
log_11-1-2014.txt
- Type
- Nombre de caractères, de lignes et d’octets
- En utilisant
grep
, chercher les lignes contenant Application
dans le même fichier
- Toujours avec
grep
, chercher les lignes contenant Application
et outlook
dans le même fichier
- Stocker ce résultat dans un fichier texte à la racine de la séance, nommé
res_grep.txt
- Ajouter à ce fichier les lignes contenant
Application
, puis google
puis email
- Faire les 3 dernières demandes avec la commande
sed
(en remplacant grep
par sed
dans le nom de fichier)
- Ecrire les numéros des individus (première partie du nom du répertoire) correspondant aux hommes (
M
) dans un fichier nommé idM.txt