Publication:
Normalized and weighted multivariate functional principal components analysis for clustering
Normalized and weighted multivariate functional principal components analysis for clustering
No Thumbnail Available
Authors
Palomino Lescano, Velcy
Embargoed Until
Advisor
Acuña Fernández, Edgar
College
College of Engineering
Department
Department of Computer Science and Engineering
Degree Level
Ph.D.
Publisher
Date
2024-05-09
Abstract
Most processes in real life are continuous, and thanks to the technological progress in many fields of application, these processes can be recorded at high frequency. Thus, Functional Data Analysis (FDA) has been an active field of research.
In this research we focus on Multivariate Functional Principal Components Analysis (MFPCA) when functional variables differ in scale, variability, or domain. We develop different alternatives of normalized and weighted MFPCA. Particularly, when a weighted MFPCA is employed, we provide a strategy to estimate the weights based on the variability of Functional Principal Components (FPC) scores. The performance of normalized and weighted MFPCA are evaluated in the context of clustering using different simulated and real datasets. The simulations include cases of Multivariate Functional Data (MFD) on the same one-dimensional interval and MFD defined on different domains i.e. MFD including multivariate curves and MFD including curves and images. Similarly, real datasets include cases of MFD containing multivariate curves and a MFD consisting of curves and vectors.
Normalized and weighted MFPCA can improve the clustering performance. Furthermore, our strategy proposed to estimate the weights in weighted MFPCA is a good alternative, since this provides comparable results to other methods and it is more efficient in running time.
Muchos procesos en la vida real son continuos y gracias al avance tecnológico en muchas áreas de aplicación, estos procesos pueden ser recolectados de manera frecuente. Esto hace que, Análisis de Datos Funcionales (FDA) sea un àrea activa de investigación. En esta investigación nos enfocamos en Análisis de Componentes Principales Funcionales Multivariadas (MFPCA) cuando las variables funcionales difieren en escala, variabilidad o dominio. Desarrollamos diferentes alternativas de MFPCA normalizados y ponderados. Particularmente, cuando un MFPCA ponderado es usado, proveemos una estrategia para estimar los pesos basada en los scores de las Componentes Principales Funcionales. El rendimiento de MFPCA normalizados y ponderados es evaluado en el contexto de clustering en datos simulados y datos reales. Las simulaciones incluyen datos funcionales multivariados (MFD) definidos en el mismo dominio y datos functionales multivariados en diferentes dominios, estos son: MFD incluyendo curvas multivariadas y MFD incluyendo curvas e imágenes. Similarmente, los conjuntos de datos reales incluyen MFD integrados por curves multivariadas y un MFD compuesto por curvas y vectores. MFPCA normalizados y ponderados pueden mejorar el rendimiento en clustering. Además, nuestra estrategia para estimar los pesos en MFPCA ponderado es una buena alternativa, ya que esta proporciona resultados comparables a los otros métodos y es más eficiente en tiempo de ejecución.
Muchos procesos en la vida real son continuos y gracias al avance tecnológico en muchas áreas de aplicación, estos procesos pueden ser recolectados de manera frecuente. Esto hace que, Análisis de Datos Funcionales (FDA) sea un àrea activa de investigación. En esta investigación nos enfocamos en Análisis de Componentes Principales Funcionales Multivariadas (MFPCA) cuando las variables funcionales difieren en escala, variabilidad o dominio. Desarrollamos diferentes alternativas de MFPCA normalizados y ponderados. Particularmente, cuando un MFPCA ponderado es usado, proveemos una estrategia para estimar los pesos basada en los scores de las Componentes Principales Funcionales. El rendimiento de MFPCA normalizados y ponderados es evaluado en el contexto de clustering en datos simulados y datos reales. Las simulaciones incluyen datos funcionales multivariados (MFD) definidos en el mismo dominio y datos functionales multivariados en diferentes dominios, estos son: MFD incluyendo curvas multivariadas y MFD incluyendo curvas e imágenes. Similarmente, los conjuntos de datos reales incluyen MFD integrados por curves multivariadas y un MFD compuesto por curvas y vectores. MFPCA normalizados y ponderados pueden mejorar el rendimiento en clustering. Además, nuestra estrategia para estimar los pesos en MFPCA ponderado es una buena alternativa, ya que esta proporciona resultados comparables a los otros métodos y es más eficiente en tiempo de ejecución.
Keywords
Functional data analysis,
Multivariate functional data,
Functional principal components,
Normalization
Multivariate functional data,
Functional principal components,
Normalization
Usage Rights
Persistent URL
Cite
Palomino Lescano, V. (2024). Normalized and weighted multivariate functional principal components analysis for clustering [Dissertation]. Retrieved from https://hdl.handle.net/20.500.11801/3703