Ingénieur logiciel & étudiant en Master spécialisé : Expert Data, IA & MLOps à Télécom Paris.
Ingénieur logiciel diplômé de la Faculté des Sciences de Tunis, actuellement en Master spécialisé : Expert Data, IA & MLOps à Télécom Paris, l'une des meilleures écoles d'ingénieurs en France et en Europe.
Fort d'une expérience de plus d'un an chez Advanced Derivative Solutions en tant qu'ingénieur logiciel, j'ai travaillé sur des plateformes financières optimisées intégrant la gestion de devises, la facturation et la gestion de crédits.
Passionné par les nouvelles technologies, je combine mes compétences en développement full-stack (Java/Spring Boot, Angular, React) avec mon expertise croissante en Data Science, Big Data et Machine Learning.
Fév 2026 — Mars 2026
Pipeline Data Engineering corrélant la popularité des jeux vidéo avec les cours boursiers. Extraction depuis SteamSpy, Twitch et Yahoo Finance, transformation via Apache Spark en architecture Data Lake 3 couches sur S3, corrélation de Pearson glissante et modèle XGBoost. Orchestré par Airflow, visualisé via Kibana et 100% Dockerisé.
Mars 2026 — Avr 2026
Plateforme clinique de Q&A multi-agents avec routage LLM, GraphRAG via PrimeKG (100K+ nœuds, 4M+ arêtes), Self-RAG et Deep Search sur 301K chunks StatPearls + 36M+ articles PubMed. 4 agents LangGraph spécialisés (diagnostic, pharmacologie, général, évaluateur), 4 LLMs (Gemini 2.5, BioMistral 7B local, GPT-4o), CRAG confidence gating et observabilité Langfuse. Frontend React, 2 serveurs MCP (FastMCP). 62%+ de précision MedMCQA. 11 services Docker.
Mars 2026
Conception d'un pipeline MLOps de bout en bout automatisant l'entraînement continu et le déploiement d'un modèle de classification de fraudes bancaires.
Oct 2025 — Présent
Projet Data Science « Fil Rouge » visant à segmenter les teintes de produits cosmétiques pour améliorer la précision des recommandations. Évaluation de Clustering, KNN et Gradient Boosting avec un stack Python (Pandas, NumPy, Scikit-learn).
Sep 2025 — Déc 2025
Déploiement d'un cluster Hadoop complet (4 serveurs) pour analyser 50 Go d'avis Amazon. Configuration HDFS, YARN, ZooKeeper, HBase. Scripts PySpark pour le prétraitement distribué et classification via Spark ML pour l'analyse de sentiment.
Oct 2025 — Déc 2025
Application ML full-stack de recommandation de recettes combinant filtrage collaboratif (SVD), clustering (HDBSCAN), prédiction de temps de cuisson, classification nutritionnelle et analyse de sentiment NLP sur 230K+ recettes et 1M+ avis. Chatbot RAG (Google Gemini), UI Streamlit, Docker et CI/CD.
Sep 2025 — Nov 2025
Système MapReduce distribué en Python pour traiter 20 Go de données Common Crawl sur un setup hétérogène (Windows Master, 3 Workers Linux, NFS partagé). Pipelines WordCount, tri de fréquences distribué et détection de langue. Benchmarks avec la loi d'Amdahl.
Oct 2023 — Nov 2023
Application full-stack Spring Boot + React permettant aux utilisateurs d'uploader facilement des fichiers vers AWS.
Juil 2023 — Sep 2023
Application bancaire de gestion de rapports annuels avec authentification des auditeurs, sélection d'agences, et ajout/téléchargement de rapports PDF.
Fév 2023 — Mai 2023
Plateforme centralisée de gestion des surveillants universitaires avec calendrier, algorithme intelligent de recommandation de dates selon la disponibilité et attribution d'heures selon le grade.
Jan 2023 — Mars 2023
Application e-commerce responsive avec intégration de paiement Stripe, gestion d'état avancée via React Context API, Next.js comme backend et Sanity CMS pour la gestion de contenu.
N'hésitez pas à me contacter pour discuter de projets, d'opportunités ou simplement pour échanger.