Titanic-Ml

Last updated: May 24th, 20192019-05-24Project preview

Titanic #2 - Construisons des modèles d'Intelligence Artificielle

1 - On ouvre nos données

In [2]:
import pandas as pa

On ouvre notre fichier CSV.

In [8]:
df = pa.read_csv("dataset.csv")

On mélange les lignes, pour être certains que l'ordre des individus par défaut dans le jeu de données ne soit pas un biais.

In [9]:
from sklearn.utils import shuffle
df = shuffle(df)

Affichons nos données. Ecrire ci-dessous le code pour afficher les 5 premières lignes. Qu'est-ce qui a changé dans les données par rapport à hier ?

In [ ]:
 

2 - On crée notre premier modèle

Etape 1 : Initialiser le modèle DecisionTreeClassifier avec sklearn. Cela nous permettra d’appeler le code du modèle qu’on va utiliser, à savoir l’abre de décision

In [ ]:
 
In [ ]:
 

Etape 2 : Préparer un jeu de données X et un jeu de données y. Le jeu de données X contient toutes les colonnes à l’exception de la données qu’on veut prédire, qui sera alors y. X contiendra alors plusieurs colonnes, et y une seule colonne.

In [ ]:
 
In [ ]:
 

Etape 3 : Entraîner le modèle en lui donnant en entrée X et y. L’étape la plus importante, c’est là que notre modèle va apprendre de nos données ! Bon, ici, ça ne prendra que quelques millisecondes.

In [ ]:
 

Etape 4 : Faire une prédiction à partir de nouvelles données. Ici, deux possibilités :

  • Soit on prend une ligne au hasard dans le jeu de données X, et on regarde ce que prédit le modèle
  • Soit on crée nous même une nouvelle ligne, avec des données choisies, et on regarde ce que prédit le modèle !
In [ ]:
 
Notebooks AI
Notebooks AI Profile20060