Créer son data set sur Kaggle

Dans cette page trouveras :

Récupérer des images avec download all images

Télécharger l’extension

Pour télécharger rapidement des centaines d’images depuis l’outil de recherche d’image de google l’extension Download All images est super efficace. Elle est disponible sur firefox et google chrome:

Utilise l’extension

Une fois ajoutée, fais une recherche d’image sur le thème de ton choix.
Pense à scroller un max pour obtenir le plus d’image possibles.
Puis lance l’extension

La page de téléchargement ressemble à ça, tu peux choisir des filtres en fonction du type de fichiers, de la taille de l’image (dimensions -pixels) ou la taille du fichier (file size – attention ça allonge beaucoup la recherche pour peu d’utilité dans notre cas.

Une fois que l’analyse des images est terminée clique sur Save DIR pour télécharger toutes les images d’un seul coup sous forme d’un fichier zip.

Tu peux ensuite extraire les images, ouvrir le dossier et trier à la main les images que tu as récupéré.

Note : les outils de l’extension download all images permettent de nombreuses options comme supprimer les doublons, les images trop petites… utilise les a bon escient.

Créer son data set sur kaggle

Rends toi sur la page de ton data-set. En haut à gauche clique sur les Create puis sur New dataset
Puis entre le nom de ton dataset, glisse tes images et valide.
Tu peux choisir si tu veux que le dataset soit public ou privé.

Et voilà ton data set est créé !

Avant d’uploader tes fichiers fais bien attention à la manière dont tu organises tes dossiers pour récupérer les labels par la suite.
 
Pense aussi à compresser le tout pour le charger plus rapidement
Retour en haut