Et si on vous facilitait la vie ?

L’aventure de l’équipe Expensya finaliste du Allianz Startup Hack

Partager sur :

Finalistes du Allianz Startup Hack : on vous dit tout !

 

Fin Octobre, trois de nos meilleurs ingénieurs ont participé au Allianz Startup Hack. Leur objectif : développer en 2 jours un système OCR adapté aux activités d’Allianz et capable de traiter et de classifier des millions de documents ! Machine Learning, AI, vitesse de traitement, qualité de la reconnaissance : nos équipes, qui ont conçu et développé notre technologie OCR+, meilleur OCR de reconnaissance de factures du marché, connaissent très bien tout ça, et c’est ce qui nous a donné envie de nous essayer à cette compétition. On vous dit tout de cette aventure dans cette interview !

 

Nos 3 spécialistes :

Mohamed Iadh Aboud : « Data Scientist » à Microsoft-Munich et ancien Ingénieur logiciel chez Expensya.

Khaireddine Amamou : Ingénieur logiciel à Expensya Tunis.

Nidhal Ben Youssef : Ingénieur logiciel à Expensya Tunis.

 

Pourquoi avoir postulé à ce concours ?

 

Les problèmes d’Allianz étaient nos problèmes au début d’Expensya : plusieurs types de documents différents à traiter, un traitement spécial pour chaque type de document et la présence d’informations clés dans les documents

Nous sommes devenus des experts dans le domaine d’extraction de données durant les 3 ans de la vie d’Expensya. Ce challenge était une occasion de gagner plus d’expertise dans un domaine un peu plus large et différent du domaine des factures et de prouver la compétitivité d’Expensya au niveau international et la possibilité d’adapter Expensya et ses technologies à d’autres problématiques.

 

Quels étaient les défis lors de ce concours ?

 

Le premier défi était la quantité des données : nous avons dû traiter plusieurs dizaines de millions de documents, ce qui a augmenté la nécessité d’automatiser et d’accélérer le processus.

Les principales différences avec notre traitement interne chez Expensya ont été nombreuses.

Tout d’abord, la diversité du type de documents traités : des documents médicaux, des documents légaux et des documents fiscaux. Il fallait donc dans un premier temps créer un algorithme de classification de ces documents. Ensuite, il fallait appliquer un traitement différent à chaque type de document, car les structures, et les informations à extraire sont différentes. Nous sommes habitués à ce type de complexité, car notre technologie OCR+ est spécialisée dans le traitement des factures, et qu’il existe une très large typologie de factures, qui fait que nous sommes habitués à concevoir des algorithmes capables de mettre en place différentes stratégies, et de choisir la stratégie la plus adaptée à chaque facture.

L’extraction des informations contenues dans ces millions de documents a aussi été particulière car nous avons dû extraire des données auxquelles nous ne sommes pas habitués, comme les informations personnelles sur les documents légaux et fiscaux.

 

Comment s’est déroulé le concours ?

 

Le concours a duré trois jours et a commencé par un pitch. Nous devions présenter Expensya, notre expertise en AI et en Machine Learning et l’application que nous en faisions avec notre technologie OCR+ de reconnaissance de factures. Pour faire simple, nous devions expliquer en quoi nous étions aptes à résoudre la problématique posée par Allianz.

Le deuxième jour a été celui du début du Hackathon : nous avons reçu une problématique plus détaillée sur les objectifs de ce concours de développeurs, ce qui nous a permis de définir notre plan d’action et de répartir les tâches entre nous 3. Ensuite, nous avons commencé à coder pendant 24h non-stop !

Enfin, le troisième jour, nous avons générés les fichiers de résultats des algorithmes que nous avons développés pendant ce Hackathon, et nous avons participé au Demo Day, pour présenter ces résultats.

Expensya team working at Allianz Startup Hack

Qu’avez-vous su apporter comme réponses aux problématiques d’Allianz ?

 

24 heures c’est court, mais nous avons quand même réussi à atteindre plusieurs objectifs du concours. Nous avons réussi à mettre en place un algorithme efficace de classification des documents médicaux (ordonnance, documents hospitaliers, documents pharmaceutiques, etc…), et un algorithme de différenciation des documents légaux (décision du tribunal, règlement judiciaire, facture de tribunal

Nous avons également été capables en 24h d’extraire les informations clés des documents médicaux (TTC, date,  ….) et des informations personnelles sur les documents légaux (noms, adresses, numéros de téléphone, informations sur le juge, informations sur les avocats, etc…)

 

 

Qu’est-ce qui était le plus dur à réaliser lors de ce concours ?

 

Tout d’abord, la première difficulté était de bien comprendre le besoin d’Allianz, et bien comprendre les sources de ce besoin : en tant que développeurs chez Expensya, nous savons que tout ce qu’on développe n’est réussi que si l’on comprend parfaitement le « pourquoi » de chaque besoin. Ensuite, il a fallu faire face aux contraintes de l’exercice technique, à commencer par la manipulation et la compréhension des spécificités du jeu de données fourni par Allianz. Et enfin, il a fallu identifier comment nous pouvions capitaliser sur les algorithmes de notre technologie OCR+ et les adapter aux besoins légaux d’Allianz. La détection des données personnelles, et la classification des documents en fonction de leur typologie ont ainsi été des défis techniques passionnants.

 

Qu’est-ce que ce concours vous a donné envie de faire par la suite ?

 

Cette aventure nous a montré à quel point nous pouvions étendre les utilisations de notre technologie OCR+, et nous avons eu l’occasion de côtoyer plusieurs autres développeurs, et de découvrir leurs idées innovantes. Nous pensons notamment développer les compétences de notre technologie pour d’autres types de documents, et adapter OCR+ à d’autres problématiques que celles des factures. Et évidemment, on participera aux prochains challenges pour les gagner cette fois-ci !

 

Partager sur :

Sur le même sujet

Expensya à la conquête du marché International !

S’attaquer au marché international est une étape clé dans la vie d’une entreprise. Une préparation rigoureuse ainsi qu’une stratégie solide  s’imposent, avec bien évidemment une bonne capacité d’adaptation aux spécificités des marchés visés. Expensya, la solution pionnière qui automatise le processus de gestion des notes de frais, commence à faire ses pas à l’international et […]

Lire

Expensya remporte le Prix Next’ Step de la Banque Populaire et Maddyness

La Banque Populaire et Maddyness ont créé le concours Next’ Step pour mettre en avant et récompenser les startups B2B les plus innovantes. Plus de 400 entreprises ont participé et Expensya a remporté le premier prix, avec une mention spéciale pour son récent projet d’internationalisation. Le Prix Next’ Step, est une initiative dédiée aux startups […]

Lire


Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *