Publication:
Clustering highly correlated predictors to extract early predictive signatures of CAR-T cell quality

Thumbnail Image
Authors
Odeh Couvertier, Valerie
Embargoed Until
Advisor
Torres García, Wandaliz
College
College of Engineering
Department
Department of Industrial Engineering
Degree Level
M.S.
Publisher
Date
2020-07-03
Abstract
Improving accessibility to innovative cancer immunotherapies such as CAR-T cell therapy is imperative to allow treatment for patients in need. The establishment of critical quality attributes and parameters is crucial for ensuring the potency, safety, and consistency needed to guarantee a successful large-scale manufacturing transition, which in turn will lower costs and increase accessibility. Hence, this work aims to molecularly characterize T cells and to extract predictive features of quality at early stages of its manufacturing using machine learning techniques that mitigate the impact of multicollinearity. To this end, this work proposes a multi-step semi-supervised approach that incorporates consensus clustering of features before model fitting process and a median position metric that allows an unbiased importance ranking of both clusters and variables inside each cluster. Results demonstrated that this approach was able to mitigate the impact of highly correlated omics features and extract putative driving variables.

Aumentar la accesibilidad de pacientes a tratamientos contra el cáncer tales como las terapias con células CAR-T es imperativo. Para reducir costos operacionales se deben identificar los atributos y parámetros críticos para la calidad y seguridad de estas terapias que aseguren una transición exitosa a una manufactura a grandes escalas. El propósito de este trabajo es caracterizar molecularmente las células T y extraer características predictivas de calidad en las primeras etapas de su fabricación utilizando técnicas de aprendizaje automatizado que reduzcan el impacto de la alta correlación entre variables. Este trabajo propone un enfoque semi-supervisado por etapas que incluye agrupar variables altamente correlacionadas y una métrica de posición de la mediana que permite una clasificación de la importancia de estas variables. Los resultados demostraron que este enfoque fue capaz de mitigar el impacto de características ómicas altamente correlacionadas y de extraer variables predictivas de la calidad de estas terapias.
Keywords
CAR-T cells,
High correlation,
Random Forest,
CQA,
VIM
Usage Rights
All Rights Reserved / restricted to Campus
Cite
Odeh Couvertier, V. (2020). Clustering highly correlated predictors to extract early predictive signatures of CAR-T cell quality [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/2633