Parallelisation d'algorithmes en génomique sur des architectures "Processing-in-Memory"

Publié le
Equipe
Date de début de thèse (si connue)
septembre 2021
Lieu
Campus de Beaulieu, IRISA, Rennes - UPMEM, Grenoble
Unité de recherche
IRISA - UMR 6074
Description du sujet de la thèse

La bioinformatique, et plus spécifiquement la génomique, est un des domaines les plus intenses en calcul et génération et manipulation de données. UPMEM développe des composants mémoire intelligents basés sur le concept de “Processing-in-Memory” (PIM). Cette architecture, permettant le calcul sur la puce mémoire et réduisant donc fortement le mouvement de données hors silicium, accélère très fortement les calculs gourmands en données et réduit leur coût et leur empreinte énergétique, dans le datacenter et edge computing. Cette architecture, déployant des milliers d’unités PIM (mémoire et processeur en mémoire associé) indépendantes entre elles, dispose d’une chaîne de programmation permettant de programmer en C ou RUST. Elle se montre plus performante, efficace énergétiquement et financièrement, et programmable que les CPU ou autres accélérateurs pour ces applications gourmandes en données.

UPMEM est déjà impliqué dans la parallélisation sur PIM de plusieurs applications de bioinformatique et avec plusieurs clients d’envergure. Nous recherchons actuellement un(e) ingénieur informatique intéressé(e) pour développer cet axe et entamer une thèse sous le dispositif CIFRE. La thèse sera co-encadrée avec l’équipe de recherche en bioinformatique GenScale, à l’IRISA de Rennes. La thèse aura pour objet d’adapter ou créer des algorithmes bioinformatiques hautement parallélisables pour être accéléré sur PIM. Le candidat idéal est passionné par la performance et l’optimisation de code pour utiliser au mieux des accélérateurs à disposition (GPU, FPGA, ou autre) afin d'augmenter les performances de leurs applications: puissance de calcul, bande passante, consommation énergétique. 

Nous recherchons une personne qui sera à l'interface de la recherche algorithmique et l'implémentation applicative pour des fins commerciales. Une experience en bioinformatique serait un plus, mais nous acceptons aussi les candidats sans expérience mais avec un grand intérêt pour ce sujet.

Bibliographie

D. Lavenier, R Jodin, R Cimadomo, Variant Calling Parallelization on Processor-in-Memory Architecture, International Conference on Bioinformatics and Biomedicine, Seoul, Korea, BIBM 2020

D. Lavenier, JF. Roy, D. Furodet Workshop on Accelerator-Enabled Algorithms and Applications in Bioinformatics, Dec 2016, Shenzhen, China, 2016

S. Ghose, A. Boroumand, J. S. Kim, J. Gómez-Luna and O. Mutlu, "Processing-in-memory: A workload-driven perspective," in IBM Journal of Research and Development, vol. 63, no. 6, pp. 3:1-3:19, 1 Nov.-Dec. 2019

Liste des encadrants et encadrantes de thèse

Nom, Prénom
Dominique Lavenier
Type d'encadrement
Directeur.trice de thèse
Unité de recherche
UMR 6074
Contact·s
Mots-clés
parallélisme, genomique, Processing-in-Memory