Parallelisation d'algorithmes en génomique sur des architectures "Processing-in-Memory"

Publié le lun 19/04/2021 - 17:10
Chercheurs et encadrants
Equipe de recherche
Chercheurs
Encadrant
Directeur.trice de thèse
Nom
Dominique Lavenier
Unite de recherche
UMR 6074
Contact.s
Nom
Dominique Lavenier
Email
lavenier@irisa.fr
Téléphone
02 99 84 72 17
Unité de recherche
IRISA
Description de la thèse

La bioinformatique, et plus spécifiquement la génomique, est un des domaines les plus intenses en calcul et génération et manipulation de données. UPMEM développe des composants mémoire intelligents basés sur le concept de “Processing-in-Memory” (PIM). Cette architecture, permettant le calcul sur la puce mémoire et réduisant donc fortement le mouvement de données hors silicium, accélère très fortement les calculs gourmands en données et réduit leur coût et leur empreinte énergétique, dans le datacenter et edge computing. Cette architecture, déployant des milliers d’unités PIM (mémoire et processeur en mémoire associé) indépendantes entre elles, dispose d’une chaîne de programmation permettant de programmer en C ou RUST. Elle se montre plus performante, efficace énergétiquement et financièrement, et programmable que les CPU ou autres accélérateurs pour ces applications gourmandes en données.

UPMEM est déjà impliqué dans la parallélisation sur PIM de plusieurs applications de bioinformatique et avec plusieurs clients d’envergure. Nous recherchons actuellement un(e) ingénieur informatique intéressé(e) pour développer cet axe et entamer une thèse sous le dispositif CIFRE. La thèse sera co-encadrée avec l’équipe de recherche en bioinformatique GenScale, à l’IRISA de Rennes. La thèse aura pour objet d’adapter ou créer des algorithmes bioinformatiques hautement parallélisables pour être accéléré sur PIM. Le candidat idéal est passionné par la performance et l’optimisation de code pour utiliser au mieux des accélérateurs à disposition (GPU, FPGA, ou autre) afin d'augmenter les performances de leurs applications: puissance de calcul, bande passante, consommation énergétique. 

Nous recherchons une personne qui sera à l'interface de la recherche algorithmique et l'implémentation applicative pour des fins commerciales. Une experience en bioinformatique serait un plus, mais nous acceptons aussi les candidats sans expérience mais avec un grand intérêt pour ce sujet.

Début des travaux
septembre 2021
Lieu
Campus de Beaulieu, IRISA, Rennes - UPMEM, Grenoble
Bibliographie

D. Lavenier, R Jodin, R Cimadomo, Variant Calling Parallelization on Processor-in-Memory Architecture, International Conference on Bioinformatics and Biomedicine, Seoul, Korea, BIBM 2020

D. Lavenier, JF. Roy, D. Furodet Workshop on Accelerator-Enabled Algorithms and Applications in Bioinformatics, Dec 2016, Shenzhen, China, 2016

S. Ghose, A. Boroumand, J. S. Kim, J. Gómez-Luna and O. Mutlu, "Processing-in-memory: A workload-driven perspective," in IBM Journal of Research and Development, vol. 63, no. 6, pp. 3:1-3:19, 1 Nov.-Dec. 2019

Mots-clés
parallélisme, genomique, Processing-in-Memory
Année de début de thèse
2021/2022