Normalized and weighted multivariate functional principal components analysis for clustering

No Thumbnail Available
Palomino Lescano, Velcy
Embargoed Until
Acuña Fernández, Edgar
College of Engineering
Department of Computer Science and Engineering
Degree Level
Most processes in real life are continuous, and thanks to the technological progress in many fields of application, these processes can be recorded at high frequency. Thus, Functional Data Analysis (FDA) has been an active field of research. In this research we focus on Multivariate Functional Principal Components Analysis (MFPCA) when functional variables differ in scale, variability, or domain. We develop different alternatives of normalized and weighted MFPCA. Particularly, when a weighted MFPCA is employed, we provide a strategy to estimate the weights based on the variability of Functional Principal Components (FPC) scores. The performance of normalized and weighted MFPCA are evaluated in the context of clustering using different simulated and real datasets. The simulations include cases of Multivariate Functional Data (MFD) on the same one-dimensional interval and MFD defined on different domains i.e. MFD including multivariate curves and MFD including curves and images. Similarly, real datasets include cases of MFD containing multivariate curves and a MFD consisting of curves and vectors. Normalized and weighted MFPCA can improve the clustering performance. Furthermore, our strategy proposed to estimate the weights in weighted MFPCA is a good alternative, since this provides comparable results to other methods and it is more efficient in running time.

Muchos procesos en la vida real son continuos y gracias al avance tecnológico en muchas áreas de aplicación, estos procesos pueden ser recolectados de manera frecuente. Esto hace que, Análisis de Datos Funcionales (FDA) sea un àrea activa de investigación. En esta investigación nos enfocamos en Análisis de Componentes Principales Funcionales Multivariadas (MFPCA) cuando las variables funcionales difieren en escala, variabilidad o dominio. Desarrollamos diferentes alternativas de MFPCA normalizados y ponderados. Particularmente, cuando un MFPCA ponderado es usado, proveemos una estrategia para estimar los pesos basada en los scores de las Componentes Principales Funcionales. El rendimiento de MFPCA normalizados y ponderados es evaluado en el contexto de clustering en datos simulados y datos reales. Las simulaciones incluyen datos funcionales multivariados (MFD) definidos en el mismo dominio y datos functionales multivariados en diferentes dominios, estos son: MFD incluyendo curvas multivariadas y MFD incluyendo curvas e imágenes. Similarmente, los conjuntos de datos reales incluyen MFD integrados por curves multivariadas y un MFD compuesto por curvas y vectores. MFPCA normalizados y ponderados pueden mejorar el rendimiento en clustering. Además, nuestra estrategia para estimar los pesos en MFPCA ponderado es una buena alternativa, ya que esta proporciona resultados comparables a los otros métodos y es más eficiente en tiempo de ejecución.
Functional data analysis,
Multivariate functional data,
Functional principal components,
Usage Rights
Except where otherwise noted, this item’s license is described as Attribution-NonCommercial-ShareAlike 4.0 International
Palomino Lescano, V. (2024). Normalized and weighted multivariate functional principal components analysis for clustering [Dissertation]. Retrieved from