L'essentiel
Code(s) NSF
110 : Spécialités pluri-scientifiques
313 : Finances, banque, assurances, immobilier
326 : Informatique, traitement de l'information, réseaux de transmission
Formacode(s)
11016 : Analyse données
30812 : Langage Python
31026 : Data science
31035 : Data visualization
Date d’échéance
de l’enregistrement
01-10-2026
Nom légal | Siret | Nom commercial | Site internet |
---|---|---|---|
API SOCIETY | 83381699400010 | - | https://api-society.com |
Objectifs et contexte de la certification :
Cette certification s'adresse aux professionnels de la donnée (statisticiens, actuaires, data analysts et data scientists) et aux scientifiques voulant attester leurs compétences en manipulation, analyse et visualisation des données avec les modules Python de Data Science.
Compétences attestées :
Installer dans un environnement virtuel des modules et paquets scientifiques pour manipuler des données
Utiliser un environnement de développement scientifique afin de bénéficier d’une solution intégrée et ainsi être plus rapide et performant
Utiliser des outils collaboratifs afin de travailler à plusieurs data scientists sur les mêmes données
Trouver de nouvelles librairies et juger de leur pertinence en vue de répondre à un besoin particulier
Charger différents formats de données dans un tableau de données indexées ou non en vue de leur appliquer des traitements
Appliquer des fonctions et méthodes sur un tableau de données afin de le nettoyer et de le préparer à un futur traitement
Concevoir des masques pour extraire des données
Filtrer des données selon des plages temporelles afin d’extraire les données correspondantes à un moment précis
Filtrer des données à l’aide d’expressions rationnelles (regex) afin d’extraire les données correspondantes à un motif précis
Changer la fréquence d’échantillonnage de données afin de les ramener sur une échelle adaptée au besoin
Maîtriser les tableaux à n-dimensions (ndarray) et les types de données (entier, réel, chaîne de caractères, date et heure) afin de minimiser l’utilisation de la mémoire
Maîtriser les tableaux à données indexées à une dimension (Serie) et à deux dimensions (DataFrame) afin d’accéder aux fonctionnalités offertes par le module scientifique
Maîtriser l’indexation implicite (indiçage par position numérique) afin d’extraire des données et/ou de leur appliquer un traitement
Maîtriser l’indexation explicite (indiçage par clé alphanumérique) afin de manipuler plus facilement des données temporelles ou utilisant un identifiant alphanumérique
Faire pivoter des données pour obtenir un tableau croisé dynamique
Maîtriser les index multiples (multi-index) afin d’accéder plus facilement aux données et/ou de simuler des dimensions supplémentaires
Empiler et fusionner des tableaux afin de regrouper des données
Transposer des données (inversion ligne / colonne) pour en faciliter l’analyse, ou les préparer en vue de les empiler ou les fusionner
Trier des données en fonction des indices ou des valeurs du tableau en vue de les exploiter par ordre alphabétique, par nombre croissant ou décroissant, par date
Connaître et utiliser les opérations vectorisées pour gagner en performance
Appliquer des fonctions et méthodes sur une colonne d’un tableau de données afin d’appliquer des traitements mathématiques (nombre, minimum, maximum, moyenne, médiane, centile, écart-type)
Utiliser les fonctions universelles selon une dimension
Regrouper des données en fonction de la valeur de certaines colonnes pour appliquer un calcul
Calculer des moyennes glissantes (lissage des données) en vue de les visualiser
Utiliser les règles de broadcasting pour effectuer des calculs
Appliquer une fonction ou une fonction anonyme aux données pour réaliser des analyses spécifiques
Choisir le bon module ou paquet de visualisation des données afin de répondre au besoin exprimé
Afficher un graphique en 2 dimensions de type y = f(x) à partir d'un jeu de données simple
Identifier le bon type de graphique (histogramme, graphique en colonne, diagramme circulaire, boîte à moustaches, carte thermique …) en fonction des données à visualiser afin de générer un graphique pertinent
Connaître et utiliser les fonctions et méthodes des tableaux de données afin de générer très facilement des graphiques
Générer des graphiques interactifs afin de permettre à l’utilisateur d’interagir avec le graphique (isolation de données, agrandissement d’une zone, mise en évidence)
Concevoir des graphiques contenant plusieurs tracés afin de regrouper des données différentes, de montrer des corrélations ou des différences, ou de synthétiser une représentation des données
Intégrer les recommandations d'amélioration de l’accessibilité (via l'ajout de titres, étiquettes, labels et légendes, l'amélioration de la lisibilité des textes, l'épaississement des lignes et des bordures, le choix de couleurs contrastées) afin de générer des graphiques accessibles à une personne en situation de handicap
Modalités d'évaluation :
Organisées par l’organisme certificateur, les épreuves de la certification sont composées d’un questionnaire théorique évaluant les connaissances sur les modules Python de Data Science, et d’exercices pratiques évaluant les compétences de programmation du candidat.
A l’aide du logiciel API Cert permettant des captations audio vidéo durant les épreuves d’évaluation, cette certification est passable à distance et en asynchronie.
Le jury est composé d’un surveillant qui garantit l’identité du candidat et l’absence de fraudes grâce aux captations, d’un professionnel de la Data Science avec Python certifié qui corrige les exercices programmés par le candidat sans accéder aux captations afin de préserver l’anonymat des candidats et l’équité de la correction, et d'un président qui attribue ou non la certification selon les comptes rendus du surveillant et du correcteur.
Références juridiques des règlementations d’activité :
Le cas échant, prérequis à l’entrée en formation :
Connaître les fondamentaux de la programmation en langage Python
Le cas échant, prérequis à la validation de la certification :
Avoir acquis les fondamentaux des modules Python de Data Science suite à une formation continue ou à un apprentissage autodidacte
Validité des composantes acquises :
Voie d’accès à la certification | Oui | Non | Composition des jurys | Date de dernière modification |
---|---|---|---|---|
Après un parcours de formation sous statut d’élève ou d’étudiant | X | - | - | |
En contrat d’apprentissage | X | - | - | |
Après un parcours de formation continue | X |
Le jury est composé d'un surveillant (extérieur à l'organisme certificateur) vérifiant l'identité du candidat et s'assurant de l'absence de fraudes durant les épreuves théorique et pratique, d'un professionnel de la Data Science en langage Python (extérieur à l'organisme certificateur) corrigeant les exercices réalisés par le candidat durant l'épreuve pratique et relisant les réponses du candidat à l'épreuve théorique, et d'un président (salarié de l'organisme certificateur ou extérieur) harmonisant les résultats des deux épreuves selon les comptes-rendus du surveillant et du professionnel. |
03-10-2024 | |
En contrat de professionnalisation | X | - | - | |
Par candidature individuelle | X |
Le jury est composé d'un surveillant (extérieur à l'organisme certificateur) vérifiant l'identité du candidat et s'assurant de l'absence de fraudes durant les épreuves théorique et pratique, d'un professionnel de la Data Science en langage Python (extérieur à l'organisme certificateur) corrigeant les exercices réalisés par le candidat durant l'épreuve pratique et relisant les réponses du candidat à l'épreuve théorique, et d'un président (salarié de l'organisme certificateur ou extérieur) harmonisant les résultats des deux épreuves selon les comptes-rendus du surveillant et du professionnel. |
03-10-2024 | |
Par expérience | X |
Le jury est composé d'un surveillant (extérieur à l'organisme certificateur) vérifiant l'identité du candidat et s'assurant de l'absence de fraudes durant les épreuves théorique et pratique, d'un professionnel de la Data Science en langage Python (extérieur à l'organisme certificateur) corrigeant les exercices réalisés par le candidat durant l'épreuve pratique et relisant les réponses du candidat à l'épreuve théorique, et d'un président (salarié de l'organisme certificateur ou extérieur) harmonisant les résultats des deux épreuves selon les comptes-rendus du surveillant et du professionnel. |
03-10-2024 |
Aucune correspondance
Date de décision | 01-10-2024 |
---|---|
Durée de l'enregistrement en années | 2 |
Date d'échéance de l'enregistrement | 01-10-2026 |
Date de dernière délivrance possible de la certification | 01-04-2027 |
Statistiques :
Lien internet vers le descriptif de la certification :
Liste des organismes préparant à la certification :
Référentiel d'activité, de compétences et d'évaluation :