David Stephane photo de profil

Stephane D. Belemkoabga


Ingénieur R&D en Computer Vision | Dassault Systems

Formation


  • polytechnique

    2019 - 2020

    École Polytechnique - Master 2 Mathématiques Appliquées, Data Science

    • Convex Analysis
    • Optimization for Data science
    • Reinforcement learning
    • Deep Learning
    • Theory of Machine Learning
    • Machine Learning for Business Case

    • Computer Vision
    • Bayesian Learning for partially Observed Systems
    • Advanced Learning for Text and Graph Data (NLP)
    • Natural Language Processing
    • Nuages de Points et Modélisation 3D (Master MVA)

  • esilv

    2015 - 2020

    ESILV - Ecole Supérieure d'Ingénieurs Léonard de Vinci, Paris - La Défense

    Majeure: Informatique, Big Data et objets connectés

    • Machine Learning
    • Probabilités Avancées
    • Calcul Différentiel
    • Analyse Numérique
    • Traitement de signal
    • Structures de données et Algorithmes Avancés
    • Cours de Mécaniques Dynamique & Statique, Mécanique des fluides

    • Thermodynamique
    • NoSQL
    • ChatBot and Recommendation Systems
    • Web Data mining & Semantics
    • Cloud & Virtualization techniques

  • Notre Dame de l'Espérance

    2012 - 2015

    Lycée Notre Dame de l'Espérance (Burkina Faso, Ouagadougou)

    Brevet des Collèges, Mention Très Bien, 7e place au classement National. (Communiqué Officiel)

    Baccalauréat Scientifique, Mention Très Bien

Experience


  • Dassault Systems

    Avril - Octobre 2020

    Ingénieur R&D en Computer Vision - Dassault Systems, Vélizy-Villacoublay

    Ce stage se déroule dans l'équipe Data Science du département de Recherche de Dassault Systems. L'un des défis majeurs dans le domaine de l'intelligence artificielle et la vision par ordinateur est de pouvoir doter les systèmes informatiques de la capacité humaine à identifier rapidement les caractéristiques et attributs de nouveaux objets.
    C'est dans ce cadre que ma mission consiste à proposer un modèle permettant d'identifier et de prédire les mouvements d'un objet 3D : détection automatique des parties mobiles d'un objet en scan 3D et animation de l'objet en question.

    ➢ Etude bibliographique.
    ➢ Proposition de méthodes innovantes à partir de l'existant.
    ➢ Implémentation de la solution.
    ➢ Démonstration fonctionnelle des résultats.

    ✹ Bases requises : Optimisation en Data Science, Processus Stochastiques, Apprentissage Statistique, Réseaux profonds.
    ✹ Technologies utilisées : Python, C++, Deep Learning Frameworks (Pytorch, Tensorflow, Keras)
  • DVRC

    2018 - 2020

    Etudiant Chercheur - Devinci Research Center (DVRC), Paris La Défense

    Immergé au sein de l'équipe de chercheurs du Pôle Léonard de Vinci, j'ai contribué à travers mes travaux à la réflexion sur la thématique du résumé automatique. J'ai essentiellement travaillé sur la génération de résumés abstractifs à partir de modèles à réseaux profonds. Ces travaux ont abouti dans un premier temps à une publication à la conférence EGC 2020 en Belgique, sur la génération de résumés de flux de commentaires sportifs.

    ✹ Principales pistes abordées : Réseaux à base d'attention (Transformers, Pointeur Générateur, etc), Reinforcement Learning, GAN (Generative Adversarial Networks)
    ✹ Technologies utilisées : Python, Deep Learning Frameworks (Pytorch, Tensorflow, Keras).

    Article: Génération de résumés abstractifs de commentaires sportifs, P.13
  • Société Générale

    Avril - Août 2019

    Data Scientist - Société Générale Corporate & Investment Banking (SGCIB), Paris La Défense

    Les données de marchés sont utilisés par milliards dans des processus sensibles comme la cotation des produits en bourse, la gestion des risques etc. Elles proviennent souvent de fournisseurs externes comme Bloomberg. Cependant, 90% des données achetées par SG ne sont pas utilisées, il y a une redondance dans l'achat, des difficultés à vérifier l'adéquation des données au cas d'usage avant l'achat.
    Dans ce contexte, ma mission était de creer un outil ergonomique, permettant de mesurer la qualité d'une donnée financière à partir d'une batterie de tests statistiques et d'apprentissage statistique, mais aussi de vérifier leur adéquation à leur cas d'usage.

    ➢ Élaboration d'un cahier des charges.
    ➢ Collecte et mise en place d'un flux de données.
    ➢ Etudes statistiques des données.
    ➢ Identification des tests à mener, et sélection des modèles mathématiques financiers que doivent suivre les données (absence d'arbitrage par exemple)...
    ➢ Mise en place d'une interface utilisateur du produit.

    ✹ Langages utilisés : Python, Git, SQL
    ✹ Bases : Statistiques, Probabilités, Machine Learning, Finance des marchés, Mathématiques financières
  • advenis IM

    Juillet 2018

    Assistant Gérant de portefeuilles - Advenis IM, Paris

    Au sein d'une équipe de traders chez Advenis IM, j'ai essentiellement appris à mener des analyses financières technique et fondamentale d'entreprises cotées en bourse. J'ai eu loccasion d'appliquer mes connaissances à des cas concrets d'études d'entreprise comme Altran, Avast Antivirus, etc, études qui ont servi à la décision d'un investissement par Advenis IM dans ces entreprises.
    De telles études impliquaient:

    ➢ Une analyse approfondie de l'activité de l'entreprise concernée.
    ➢ Une étude des comptes de l'entreprise.
    ➢ Une analyse de l'historique du cours d'actions.
    ➢ Une étude approfondie du secteur de l'entreprise dans le contexte économique de l'époque.

  • high co

    Juin - Septembre 2017

    Développeur Informatique - HighCo Box, Paris

    HighCo Box, est l'un des leaders européens dans l'émission et la distribution de bons de coupons. Cette entreprise travaille avec acteurs de la grande distribution (comme Auchan, Monoprix, ...), des marques, afin d'émettre des bons de réduction sur internet.
    Mes missions comportaient :

    ➢ Le développement de modules et plugins supplémentaires afin d'automatiser certaines tâches des collaborateurs
    ➢ La participation à la migration du Framework ".NET" de l'application principale
    ➢ La mise en place d'une nouvelle application annexe, automatique, de communication et d'échange de fichiers entre les partenaires et HighCo Box (mise à jour des bons de coupons à publier sur internet.)

    ✹ Langages/Frameworks utilisés : C#, Framework .Net, Ruby on Rails

Portfolio



GuideCam

Prototypage d'un outil d'aide à la vision

Dans ce projet, mes camarades Thibaut Tucoulou, Benoit Feurgard, Paul Thibonnier et moi-même voulions développer un prototype doter de vision par ordinateur, capable de détecter des objets du quotidien dans une pièce, guider vocalement un individu vers les objets qu'il souhaite atteindre.
1er prix au concours Défi H, nous avons réussi à convaincre de l'enjeu et de l'utilité d'un tel dispositif.

Afficher plus

  • Stephane D. Belemkoabga, Kévin Sylla, Abdallah Essa, Aurélien Bossard, Christophe Rodrigues, Valentin Nyzam
  • Février 2020

Deep Summarization

Génération de résumés abstractifs de commentaires sportifs

Proposition d'une architecture à réseaux profonds pour la génération de résumés de flux de commentaires sportifs. Publication: EGC 2020 TextMine

Afficher plus, P.13

Blog

J'ai toujours trouvé plaisir à discuter avec mes camarades de Machine Learning, de Mathématiques parlant des toutes dernières nouvelles architectures, ou trouvailles, essayant de comprendre en profondeur ce que nous apprenons. De ce fait, j'ai décidé de lancer mon propre blog dans lequel je parle de papiers de recherche qui m'ont beaucoup inspiré, mais aussi de la théorie derrière le Machine Learning de façon intuitive et didactique.

Afficher plus

  • Stephane D. Belemkoabga
  • 2020

Distil-Résumé

Génération de résumés automatiques de textes avec des réseaux profonds à taille réduite.

Ces dernières années, nous avons connu l'afflux d'un grand nombre de modèles neuronaux performants en NLP, mais avec des dimensions Astronomiques. Dans ce projet que j'ai commencé en Avril 2020, j'étudie les derniers modèles de l'Etat de l'art dans le domaine du résumé automatique; j'essaie ensuite de construire des modèles de plus petites dimensions avec pour objectif de réduire au maximum la perte de performance. Les premiers résultats sont assez concluants.

Afficher plus

  • Stephane D. Belemkoabga
  • 2019

3D Object Detection

Détection d'objets en 3D à partir de nuages de points LIDAR (Kitti Dataset)

Dans ce projet, je me suis donné la mission de recreer l'architecture Voxelnet avec les derniers framework Tensorflow.

Afficher plus

Entropy SGD

Implémentation d'une méthode d'optimisation pour réseaux profonds

"ENTROPY-SGD: BIASING GRADIENT DESCENT INTO WIDE VALLEYS" est un papier publié en 2017 dans lequel les auteurs théorisent, expliquent la généralisation en deep learning sous certaines hypothèses. C'est un papier que j'ai beaucoup aimé; j'ai donc décidé d'écrire un article dessus et d'implémenter une méthode d'optimisation suivant l'algorithme que les auteurs proposent.

Afficher plus

  • Stephane D. Belemkoabga
  • 2018

Pointeur Générateur

Résumés Abstractifs

Ré-implémentation d'une architecture neuronale pour la génération automatique de résumés.

Afficher plus

  • Stephane D. Belemkoabga
  • 2019

Pointeur Transformeur

Implémentation d'une architecture neuronale pour la génération de résumé.

Je me suis donné pour mission dans ce projet d'implémenter une architecture neuronale alliant les modèle "Pointer-Generator", "Transformer" pour la génération automatique de résumés abstractifs.

Afficher plus

  • Stephane D. Belemkoabga
  • Mars 2020

Rendu 3D

Comment appliquer une texture, une couleur, une exposition à la lumière, à des modèles 3D

Lors de mes cours sur la Vision en 3D, j'ai eu l'opportuinité d'aborder le sujet du rendu 3D, ainsi qu'une étude sur l'équation de la lumière. J'ai ainsi pu implémenter des modèles mathématiques permettant de simuler l'exposition à la lumière de certains objets, leur brillance, leur couleur, leur texture etc.

Afficher plus

Compétences



    Programmation

  • Python
  • C++
  • SQL / NoSQL
  • C


  • Java
  • C#
  • Ruby on Rails

    Apprentissage Automatique

  • Regression / Classifieurs / Réduction de Dimensionnalité / Clustering / Ensemble Learning
  • Réseaux profonds
  • Apprentissage Supervisé / Non Supervisé / Par Renforcement

  • Frameworks

  • Pytorch
  • Tensorflow, Keras
  • Scikit Learn

    Langues


  • Français (langue maternelle)
  • Anglais (TOEFL: 600)


  • Soft-Skills

  • Prise d'initiatives
  • Travail en équipe
  • Autodidacte

Mes intérêts


Contact


fr en