L'essentiel

Icon NSF

Code(s) NSF

110 : Spécialités pluri-scientifiques

313 : Finances, banque, assurances, immobilier

326 : Informatique, traitement de l'information, réseaux de transmission

Icon formacode

Formacode(s)

11016 : Analyse données

30812 : Langage Python

31026 : Data science

31035 : Data visualization

Icon date

Date d’échéance
de l’enregistrement

01-10-2026

110 : Spécialités pluri-scientifiques

313 : Finances, banque, assurances, immobilier

326 : Informatique, traitement de l'information, réseaux de transmission

11016 : Analyse données

30812 : Langage Python

31026 : Data science

31035 : Data visualization

01-10-2026

Nom légal Siret Nom commercial Site internet
API SOCIETY 83381699400010 - https://api-society.com

Objectifs et contexte de la certification :

Cette certification s'adresse aux professionnels de la donnée (statisticiens, actuaires, data analysts et data scientists) et aux scientifiques voulant attester leurs compétences en manipulation, analyse et visualisation des données avec les modules Python de Data Science.

Compétences attestées :

Installer dans un environnement virtuel des modules et paquets scientifiques pour manipuler des données

Utiliser un environnement de développement scientifique afin de bénéficier d’une solution intégrée et ainsi être plus rapide et performant

Utiliser des outils collaboratifs afin de travailler à plusieurs data scientists sur les mêmes données

Trouver de nouvelles librairies et juger de leur pertinence en vue de répondre à un besoin particulier

Charger différents formats de données dans un tableau de données indexées ou non en vue de leur appliquer des traitements

Appliquer des fonctions et méthodes sur un tableau de données afin de le nettoyer et de le préparer à un futur traitement

Concevoir des masques pour extraire des données

Filtrer des données selon des plages temporelles afin d’extraire les données correspondantes à un moment précis

Filtrer des données à l’aide d’expressions rationnelles (regex) afin d’extraire les données correspondantes à un motif précis

Changer la fréquence d’échantillonnage de données afin de les ramener sur une échelle adaptée au besoin

Maîtriser les tableaux à n-dimensions (ndarray) et les types de données (entier, réel, chaîne de caractères, date et heure) afin de minimiser l’utilisation de la mémoire

Maîtriser les tableaux à données indexées à une dimension (Serie) et à deux dimensions (DataFrame) afin d’accéder aux fonctionnalités offertes par le module scientifique

Maîtriser l’indexation implicite (indiçage par position numérique) afin d’extraire des données et/ou de leur appliquer un traitement

Maîtriser l’indexation explicite (indiçage par clé alphanumérique) afin de manipuler plus facilement des données temporelles ou utilisant un identifiant alphanumérique

Faire pivoter des données pour obtenir un tableau croisé dynamique

Maîtriser les index multiples (multi-index) afin d’accéder plus facilement aux données et/ou de simuler des dimensions supplémentaires

Empiler et fusionner des tableaux afin de regrouper des données

Transposer des données (inversion ligne / colonne) pour en faciliter l’analyse, ou les préparer en vue de les empiler ou les fusionner

Trier des données en fonction des indices ou des valeurs du tableau en vue de les exploiter par ordre alphabétique, par nombre croissant ou décroissant, par date

Connaître et utiliser les opérations vectorisées pour gagner en performance

Appliquer des fonctions et méthodes sur une colonne d’un tableau de données afin d’appliquer des traitements mathématiques (nombre, minimum, maximum, moyenne, médiane, centile, écart-type)

Utiliser les fonctions universelles selon une dimension

Regrouper des données en fonction de la valeur de certaines colonnes pour appliquer un calcul

Calculer des moyennes glissantes (lissage des données) en vue de les visualiser

Utiliser les règles de broadcasting pour effectuer des calculs 

Appliquer une fonction ou une fonction anonyme aux données pour réaliser des analyses spécifiques

Choisir le bon module ou paquet de visualisation des données afin de répondre au besoin exprimé

Afficher un graphique en 2 dimensions de type y = f(x) à partir d'un jeu de données simple

Identifier le bon type de graphique (histogramme, graphique en colonne, diagramme circulaire, boîte à moustaches, carte thermique …) en fonction des données à visualiser afin de générer un graphique pertinent

Connaître et utiliser les fonctions et méthodes des tableaux de données afin de générer très facilement des graphiques

Générer des graphiques interactifs afin de permettre à l’utilisateur d’interagir avec le graphique (isolation de données, agrandissement d’une zone, mise en évidence)

Concevoir des graphiques contenant plusieurs tracés afin de regrouper des données différentes, de montrer des corrélations ou des différences, ou de synthétiser une représentation des données

Intégrer les recommandations d'amélioration de l’accessibilité (via l'ajout de titres, étiquettes, labels et légendes, l'amélioration de la lisibilité des textes, l'épaississement des lignes et des bordures, le choix de couleurs contrastées) afin de générer des graphiques accessibles à une personne en situation de handicap

Modalités d'évaluation :

Organisées par l’organisme certificateur, les épreuves de la certification sont composées d’un questionnaire théorique évaluant les connaissances sur les modules Python de Data Science, et d’exercices pratiques évaluant les compétences de programmation du candidat.

A l’aide du logiciel API Cert permettant des captations audio vidéo durant les épreuves d’évaluation, cette certification est passable à distance et en asynchronie.

Le jury est composé d’un surveillant qui garantit l’identité du candidat et l’absence de fraudes grâce aux captations, d’un professionnel de la Data Science avec Python certifié qui corrige les exercices programmés par le candidat sans accéder aux captations afin de préserver l’anonymat des candidats et l’équité de la correction, et d'un président qui attribue ou non la certification selon les comptes rendus du surveillant et du correcteur.

Références juridiques des règlementations d’activité :

Le cas échant, prérequis à l’entrée en formation :

Connaître les fondamentaux de la programmation en langage Python

Le cas échant, prérequis à la validation de la certification :

Avoir acquis les fondamentaux des modules Python de Data Science suite à une formation continue ou à un apprentissage autodidacte

Validité des composantes acquises :

Validité des composantes acquises
Voie d’accès à la certification Oui Non Composition des jurys Date de dernière modification
Après un parcours de formation sous statut d’élève ou d’étudiant X - -
En contrat d’apprentissage X - -
Après un parcours de formation continue X

Le jury est composé d'un surveillant (extérieur à l'organisme certificateur) vérifiant l'identité du candidat et s'assurant de l'absence de fraudes durant les épreuves théorique et pratique, d'un professionnel de la Data Science en langage Python (extérieur à l'organisme certificateur) corrigeant les exercices réalisés par le candidat durant l'épreuve pratique et relisant les réponses du candidat à l'épreuve théorique, et d'un président (salarié de l'organisme certificateur ou extérieur) harmonisant les résultats des deux épreuves selon les comptes-rendus du surveillant et du professionnel.

03-10-2024
En contrat de professionnalisation X - -
Par candidature individuelle X

Le jury est composé d'un surveillant (extérieur à l'organisme certificateur) vérifiant l'identité du candidat et s'assurant de l'absence de fraudes durant les épreuves théorique et pratique, d'un professionnel de la Data Science en langage Python (extérieur à l'organisme certificateur) corrigeant les exercices réalisés par le candidat durant l'épreuve pratique et relisant les réponses du candidat à l'épreuve théorique, et d'un président (salarié de l'organisme certificateur ou extérieur) harmonisant les résultats des deux épreuves selon les comptes-rendus du surveillant et du professionnel.

03-10-2024
Par expérience X

Le jury est composé d'un surveillant (extérieur à l'organisme certificateur) vérifiant l'identité du candidat et s'assurant de l'absence de fraudes durant les épreuves théorique et pratique, d'un professionnel de la Data Science en langage Python (extérieur à l'organisme certificateur) corrigeant les exercices réalisés par le candidat durant l'épreuve pratique et relisant les réponses du candidat à l'épreuve théorique, et d'un président (salarié de l'organisme certificateur ou extérieur) harmonisant les résultats des deux épreuves selon les comptes-rendus du surveillant et du professionnel.

03-10-2024

Statistiques :

Liste des organismes préparant à la certification :

Référentiel d'activité, de compétences et d'évaluation :