Propuesta de modelos quimiométricos para establecer sistemas de trazabilidad de naranjas producidas en la región nordeste Argentina
Resumen
Los mercados más competitivos de frutos cítricos requieren conocer el origen
geográfico e identidad de estos, para lo que se necesita comprobar la identidad física
de las muestras. La composición mineral de los vegetales obedece a patrones
generales definidos para especies y variedades, pero cierta variabilidad se debe a
condiciones de los sitios en que crecen, por lo que los contenidos minerales
permitirían diseñar modelos matemáticos para definir su trazabilidad.
Esta tesis se ha realizado con los objetivos evaluar la presencia de marcadores
químicos de trazabilidad en jugos de frutas cítricas, mediante técnicas de huella
dactilar y de aprendizaje automático, con especial énfasis en la determinación de la
composición química multielemental y demostrar la capacidad de métodos de análisis
de datos multivariantes y de aprendizaje automático para establecer modelos de
predicción para autenticar o confirmar la identidad de jugos de frutos de limón
producidos en las regiones NEA y NOA, y de mandarina y naranja producidas en la
región NEA.
Se trabajó con información derivada de muestras de frutos de limonero (Citrus
limon L., Osbeck) 'Eureka', 'Lisboa' y 'Génova' de cuatro zonas de NOA y NEA, de
mandarino (tangor) 'Murcott' (C. sinensis L. x C. reshni) y 'Okitsu' (C. unshiu Marc.) y
naranjo dulce (C. sinensis L.) 'Valencia late' y 'Salustiana', de cuatro zonas del NEA,
caracterizadas por su composición multielemental.
La determinación de concentraciones de elementos en muestras digeridas de
jugos de limón se llevó a cabo por espectrometría de masas por plasma acoplado (ICP MS), las de jugos de naranja mediante espectroscopía de absorción atómica de llama
(FAAS) y las de jugos de naranja y mandarina por espectroscopía de emisión atómica
de plasma de microondas (MP-AES). Se aplicaron análisis de: Varianza (ANOVA) y
Varianza Multivariado (MANOVA) y Prueba de Hottelling, Componentes Principales
(PCA), Discriminante Lineal (LDA) y de Mínimos Parciales (PLS DA), K Vecinos más Cercanos (KNN), Redes Neuronales Artificiales (ANN), Máquinas Vectoriales de Soporte
(SVM) y Bosques Aleatorios (RF). Para comparar métodos y seleccionar modelos se
emplearon criterios de sensibilidad, especificidad, porcentaje de acierto e índice . Los
análisis se realizaron con InfoStat 2020 y R 3.2.1.
Se caracterizaron los jugos de diferentes regiones por sus contenidos de
elementos minerales. En los de limón se observaron concentraciones de Fe, Zn y Rb
mayores a 10 g/g, de Al, Ba, Cu, Mn y Ni entre 1 y 10 g/g y de La, Cr, Se, Li, Mo, Co,
Sn, Sc, V y Bi menores a 1 g/g. Los de mandarina y naranja presentaron perfiles
similares, el elemento más abundante fue K (cercano a 1000 g/g), Al, Mg y Ca > 10
g/g, Mn, Cu, Zn y Sr entre 1 y 5 g/g y Cd, Cr y Fe < 1 g/g.
En los jugos de naranja se describieron elementos nocivos. Según establece el
Código Alimentario Argentino, los promedios de Cu en 'Valencia late' superaron los
máximos y el Pb superó los máximos en algunas muestras, no en promedio. Los niveles
de los todos los elementos se encontraron por debajo de los máximos establecidos por
la Association of American Food Control Oficials (AFCO). El contenido promedio de Cd
de los jugos de naranja superó el máximo permitido por la OMS y la FAO.
Se detectaron potenciales marcadores químicos de trazabilidad. En los jugos de
limón la diferenciación entre regiones se estableció por los contenidos de Fe, La, V, Cu
y Zn. En los de mandarina por los contenidos de Al, Ca, Cr, Cu, Fe, K, Mg, Mn, Sr y Zn.
En los de naranja, cuando la información provino de FAAS, mediante Mn, Zn, Na y K y
cuando los datos se obtuvieron mediante MP-AES estos elementos fueron Al, Ba, Ca,
Cd, Cr, Co, Cu, K, Mg, Mn, Mo, Ni, Sr y Zn.
Se demostró la eficacia de métodos de análisis multivariados y de aprendizaje
automático para proponer modelos para la autenticación o confirmación de identidad
de los frutos. El orden de tasas de éxito de los métodos de clasificación para jugos de
limón por provincia fue: SVM 100% > RF = LDA = PLS-DA = KNN 95%. En jugos de
mandarina: ANN 96% > SVM 94% > DT 91% > LDA 86% > KNN 85%. En el caso de los
jugos de naranja, las técnicas de clasificación probadas pueden ordenarse en: LDA 96 % > ANN 92% > SVM = DT 90% > KNN 67% (información de FAAS) y SVM 99% > ANN = DT
= LDA 99% > KNN 74% (información de MP-AES). The most competitive citrus fruit markets need to know the geographical origin
and identity of citrus fruits, for which the physical identity of the samples needs to be
verified. The mineral composition of the plants is due to general patterns defined for
species and varieties, but some variability is due to conditions of the sites where they
grow, so mineral content would allow mathematical models to be designed to define
their traceability.
This thesis was carried out with the objectives of assess the presence of chemical
traceability markers in citrus fruit juices, using fingerprinting and machine learning
techniques, with particular emphasis on determining multi-element chemical
composition and demonstrating the ability of multivariate data analysis and machine
learning methods to establish prediction models to authenticate or confirm the
identity of lemon fruit juices produced in the NEA and NOA regions , and mandarin and
orange produced in the NEA region.
Information derived from samples of lemon fruits (Citrus limon L., Osbeck)
'Eureka', 'Lisbon' and 'Genove' from four areas of NOA and NEA, tangerine (tangor)
'Murcott' (C. sinensis L. x C. Reshni) and 'Okitsu' (C. unshiu Marc.) and sweet orange
tree (C. sinensis L.) 'Valencia late' and 'Salustiana', four areas of the NEA, characterized
by its multi-element composition.
Determination of element concentrations in digested samples of lemon juices
was carried out by mass spectrometry by coupled plasma (ICP-MS), orange juices using
atomic flame absorption spectroscopy (FAAS) and those of orange juices and mandarin
by atomic spectrometry by microwave plasma (MP-AES). Analysis: variance (ANOVA)
and Multivariate Variance (MANOVA) and Hottelling Test, Main Components (PCA),
Linear Discriminant (LDA) and Partial Minimums (PLS DA), K Closest Neighbors (KNN), Artificial Neural Networks (ANN), Vector Support Machines (SVM), and Random
Forests (RF) were applied. Sensitivity, specificity, accuracy, and index. Analyses were
performed with InfoStat 2020 and R 3.2.1.
Juices from different regions were characterized by their mineral content. In lemon
concentrations of Fe, Zn and Rb greater than 10 g/g, Al, Ba, Cu, Mn and Ni between 1
and 10 g/g and La, Cr, Se, Li, Mo, Co, Sn, Sc, V and Bi less than 1 g/g. Tangerine and
orange had similar profiles, the most abundant element was K (about 1000 g/g), Al,
Mg and Ca > 10 g/g, Mn, Cu, Zn and Sr between 1 and 5 g/g and Cd, Cr and Fe < 1
g/g. Elements considered harmful were described for orange juices. As established in
the Argentine Food Code, contents of Cu in 'Valencia late' exceeded the highs and the
Pb exceeded the highs in some samples, not on average. The levels of all elements
were included below the maximums set by the Official Association of American Food
Control (AFCO). The average Cd content of orange juices exceeded the maximum
allowed by WHO and FAO.
Potential presence of traceability chemical markers was detected in NEA and
NOA lemons and NEA tangerines and oranges. In lemon juices the differentiation
between regions was established by contents of Fe, La, V, Cu and Zn. In tangerine the
differentiation was based on contents of Al, Ca, Cr, Cu, Fe, K, Mg, Mn, Sr y Zn. In
orange, when the information came from FAAS, through Mn, Zn, Na and K and when
the data was obtained from MP-AES, by Al, Ba, Ca, Cd, Cr, Co, Cu, K, Mg, Mn, Mo, Ni, Sr
and Zn.
The effectiveness of multivariate analysis and machine learning methods to
propose models for authentication or confirmation fruit identity was demonstrated. The
rank of success rate of classification methods for lemon juices by province was: SVM
100% > RF = LDA = PLS-DA = KNN 95%. In tangerine juices the rank of success rate was:
ANN 96% > SVM 94% > DT 91% > LDA 86% > KNN 85%. In the case of orange juices,
proven sorting techniques can be ordered: LDA 96% > ANN 92% > SVM 90% = DT 90% >
KNN 67% (FAAS information) and SVM 99% > ANN 99% = DT 99% = LDA 99% > KNN
74% (MP-AES information).
Colecciones
- Tesis doctoral [27]