Enseignement Master année 2 - Bio Informatique
DataMining - TD Noté
Objectifs
- Utiliser un des jeux de données disponibles pour mettre en oeuvre un réseau de neurones en PyTorch.
- Pour le jeu de données choisi vous choisirez un type de réseau de neurones parmi ceux abordés en TD ou vous en proposerez un nouveau.
- Vous calculerez la loss de votre apprentissage, vous afficherez la courbe pour le nombre d'epochs que vous avez calculés.
- Vous donnerez l'accuracy finale, pour la phase d'entrainement, de validiation (si vous en avez implémentée une) et le test (si vous le réalisez).
- Vous donnerez aussi la matrice de confusion pour l'apprentissage, la validation et le test (si vous les avez calculés).
Jeu de Données
Les sous répertoires DataSet contiennent différents jeux de données.
- DataSet1 contient un fichier avec une matrice de données pour l'apprentissage, un fichier contenant la valeur de la prediction pour chaque ligne de la matrice, et 2 fichiers de même format pour le test. Pour ce jeu de données il faut prédire un statut malade-non malade (0/1).
- DataSet2 contient plusieurs jeux de données d'images d'abeilles et de fourmis. La prédiction concerne la classification dans l'une ou l'autre catégorie. Un fichier .zip contient tout le jeu de données, un fichier .tgz contient un sous ensemble du premier fichier si le téléchargement est trop lourd pour votre connexion.
- DataSet3 contient un fichier de caractérisation de tumeurs en maligne/bénigne (M ou B) qui est spécifiée dans la 2ieme colone du fichier. Le reste des données sont des caractéristiques extraites d'images de tumeurs.
Travail à rendre
Vous rendrez votre fichier .py et un fichier (de format libre) expliquant votre démarche et donnant les résultats que vous avez obtenus.