Publication:
Evaluation of NIR, FTIR and Raman spectroscopies as monitoring techniques for recombinant GFP protein production in fed-batch cultures of Escherichia coli

Thumbnail Image
Authors
Rosario-Rosario, Arnaldo J.
Embargoed Until
Advisor
Saliceti-Piazza, Lorenzo
College
College of Engineering
Department
Department of Chemical Engineering
Degree Level
M.S.
Publisher
Date
2008
Abstract
The expression of green fluorescent protein (GFP) was induced and monitored in fed-batch cultures of a genetically-engineered Escherichia coli strain. This recombinant E. coli is commercially available (Bio-Rad pGLO kit), and it synthesizes GFP when induced by addition of L-arabinose. The E. coli fed-batch culture considered in this work utilizes glycerol as carbon and energy source and ammonium ion as nitrogen source. Acetic acid (acetate) is produced as a metabolic by-product because of incomplete oxidation of glycerol (Hall et al., 1996). Given that higher concentrations of acetate, ammonium and glycerol can inhibit E. coli growth (can decrease the biomass bench scale concentration), all fed batch fermentations were inoculated to start at high initial cell mass concentrations in close analogy to an industrial setting. After inoculation, all fermentations were monitored and samples collected regularly to be analyzed at line using NIR, IR and Raman spectroscopies. Acetate and glycerol concentrations were measured with an offline HPLC during each batch with very good accuracy (R2 > 92%). To contribute to the monitoring and eventually to bioprocess automation and industrial applications improvements (such as PAT), Raman spectroscopy was used along with chemometric techniques to model and predict analyte concentrations. During the fermentation, samples were collected and analyzed with at-line Raman and the off-line HPLC to establish a correlation. Specifically, to accomplish the correlation, a design of experiments (DOE) was programmed with Minitab (software version 14). A mixture design was used to correlate the analytes concentrations and the Raman spectra using a chemometric techniques, partial least squares (PLS). The correlation between Raman spectroscopy and the analyte mixture showed excellent model results (R2 > 99 % and Q2 > 99 %) with three factors. The correlation between the HPLC and the Raman with fermentation data was determined and validated. Different modes were used, such as crossvalidation (after model was obtained, it was tested by predicting the results with the set of data using in the model) and test set validation (reserve a representative data and predict it with the model). Both validation procedures presented a good model fit (linear y = x relation). The biomass concentration is another critical variable to ensure rigorous fed-batch fermentation. Specifically, the biomass concentrations were measured using two methods: 1) an at-line absorbance method (ultraviolet spectrophotometry) and 2) dry cell mass concentration, or gravimetric determination. Both methods were then correlated with near infrared spectroscopy (NIR). PLS regression presented a good model fit (R2 = 99%, two factors) as well as the validation analysis (y = x). After obtaining a good correlation between different analytical methods used for estimating dry cell mass and by-products concentrations, a GFP protein fluorescence correlation was investigated using flourometry as the reference method and Fourier transform infrared (FTIR) spectroscopy as the primary method. Analysis and PLS modeling resulted in a good fit for GFP concentration (protein concentration is proportional to the fluorescence). FT-IR was used with chemometric techniques to model and predict the recombinant protein concentration. Following available literature, a partial least squares (PLS) regression analysis was used to establish the correlation between fluorescence and the FT-IR spectra (R2 = 99 %, two factors). Also a cross validation and test-set validation were achieved with good linear relationships (y = x). Overall, a substantially better understanding on how we can measure the critical parameters of a recombinant protein fed-batch culture system using spectroscopic techniques and chemometrics was accomplished. Specifically, the ability to accurately determine glycerol, acetate, biomass and recombinant protein concentrations was achieved. More research is needed to test the techniques “in line” to determine if the bench scale experimental approach can be scaled-up to industrial and commercial scale working volumes.

La expresión de la proteína de verde fluorescencia conocida como GFP, por sus siglas en inglés fue inducida y medida durante la fermentación de Escherichia coli en modo de semitanda. Una cepa de E. coli recombinante está comercialmente disponible (Bio-Rad pGLO kit), la cual es capaz de sintetizar la proteína de verde fluorescencia cuando es inducida mediante adición de L-arabinosa. La E. coli utilizada en este trabajo consume glicerol como su fuente de carbón y energía, y amoníaco como su fuente de nitrógeno. Ácido acético (acetato) es producido como un producto metabólico a consecuencia de la oxidación parcial del glicerol (Hall et al., 1996). Dado que las altas concentraciones de ácido acético, amoníaco y glicerol pueden inhibir el crecimiento de E. coli (puede disminuir la concentración de biomasa), el monitoreo y la automatización o ambas son necesarias para lograr una fermentación óptima y reproducible a escala industrial. Las concentraciones de acetato y glicerol fueron medidas mediante cromatografía liquida de alta resolución (HPLC) durante cada fermentación para poder presentar un resultado lo suficientemente preciso (R2 > 92%). Como contribución a la automatización del bioproceso y mejorar las técnicas de monitoreo industriales, la técnica de espectroscopía analítica (Raman) fue utilizada junto a análisis de quimiometría para medir las concentraciones de los analitos. Durante las fermentaciones, las muestras fueron analizadas utilizando espectroscopía de Raman y HPLC para establecer una correlación entre ambas medidas. Específicamente, para lograr la correlación entre ambas tecnologías, un diseño experimental fue diseñado usando Minitab (version 14) para modelar y predecir la concentración de los analitos y los espectros de Raman utilizando análisis de quimiometría. En nuestro caso, “partial least squares” (PLS) fue utilizado. La relación entre la espectroscopía de Raman y el diseño de experimento presentó excelentes resultados (R2 > 99 % y Q2 > 99 % con tres factores). La correlación entre HPLC y Raman en la fermentación fue completada y validada. Para esto, diferentes pruebas fueron usadas tales como “cross-validation” (el modelo es probado con los mismos datos que fueron utilizados para crear el modelo) y “test-set validation” (se reserva una porción representativa independiente de datos para probarla con el modelo creado). Ambos presentaron una buena validación y un buen modelo lineal (y = x). La concentración de biomasa es una variable crítica para asegurar un nivel considerable del crecimiento de la bacteria para asegurar que la nuestra fermentación sería representativa y realizable a escala industrial. Específicamente, la concentración de biomasa fue medida por: 1) absorbancia, utilizando un equipo de espectrofotometría de ultravioleta y 2) como concentración de célula seca por el método conocido como gravimétrico. Luego, fue correlacionada con los espectros obtenidos mediante un equipo de cercano a infrarrojo (NIR por sus siglas en inglés). PLS presentó una buena precisión (R2 = 99%, dos factores) así como también los análisis de validación (y = x). Luego de obtener una correlación entre algunas de las variables mas críticas del proceso, la correlación de la producción de proteína recombinante fue establecida utilizando un fluorómetro. Esta tecnología presenta una manera fácil y precisa para la cuantificación de proteína recombinante (la concentración de proteína es proporcional a su fluorescencia). Infrarrojo mediano por transformadas de Fourier (FT-IR por sus siglas en inglés) fue utilizado junto con las técnicas de quimiometría para medir la concentración de la proteína. Tomando sugerencias de la literatura, el análisis de PLS fue realizado con muy buenos resultados (R2= 99 %, dos factores). Además los análisis de validaciones como se habían expuesto anteriormente presentaron un modelo lineal (y = x). En general, un mayor entendimiento fue obtenido sobre cómo medir las variables más críticas usando espectroscopía de infrarrojo y análisis quimiométrico en un bioreactor operado a modo de semi-tandas. Se pudo determinar con una buena precisión las concentraciones de proteína recombinante, analitos y biomasa. Mas investigación es necesaria, como por ejemplo, el utilizar estas técnicas en modo “in line” (sondas inmersas en el medio de cultivo) a escala industrial para determinar si la relación se asemeja a la de la escala pequeña.
Keywords
Green fluorescent protein (GFP),
Escherichia coli
Cite
Rosario-Rosario, A. J. (2008). Evaluation of NIR, FTIR and Raman spectroscopies as monitoring techniques for  recombinant GFP protein production in fed-batch cultures of Escherichia coli [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/460