Evaluación Inicial

Los objetivos en esta primera sección son conocer cómo lucen los datos, entender su estructura, su distribución, su calidad y buscar atípicos.

Aspecto de los Datos

Los datos fundamentales que tenemos son de tres clases.

Descripción de los datos
clase fuente descripción uso
Perfil colorimétrico Obteindos en durante ReGOSH 2022, usando el colorímetro abierto de OurSci 10 bandas fijas, desde el UV hasta el IR. Principal predictor.
Relevo comunictario de agricultores Obtenidos por personal de UNCUYO y CEFIC, información solicitada a los agricultores que proveyeron muestras de suelo Es una encuesta amplia, con datos ambientales, agronómicos, económicos y sociales Metadatos
Contenido de carbono orgámico en suelos Obtenidos en el laboratorio de la facultad de agronomía de UNCUYO, método Walkley Black. La mayoría del suelo es de los agricultores encuestados, más algunos suelos que el laboratorio tenía disponibles en su banco Esta es una tabla simple de resultados de laboratorio Varaible Objetivo

¿Cómo luce un Solo Dato?

El principal predictor es el perfil colorimétrico. Este como se dijo se compone de la intensidad con que se refleja cada uno de los 10 colores disponibles en el dispositivo.

Tabla de intensidades y longitudes de onda para una sola medición.

longitud de onda intensidad
365 (nm) 25126.30
385 (nm) 13649.90
450 (nm) 3048.75
500 (nm) 2349.87
530 (nm) 2874.35
587 (nm) 3294.64
632 (nm) 3336.36
850 (nm) 3893.92
880 (nm) 3809.11
940 (nm) 5002.18

Una Curva, medida tres veces con cada uno de dos dispositivos diferentes.

Podemos ver que, al menos en este caso, ambos dispositivos y todas las repeticiones son muy cercanos entre sí, sugiriendo una buena calidad de medida. Esta curva puede llamarse perfil colorimétrico y en diversos desarrollos precedentes encontramos evidencia de que puede ser una herramienta útil para predecir diversas variables en el campo.

¿Cómo se distribuye lo que queremos medir?

Observamos la distribución de la variable objetivo.

  • La distribución para esta cantidad de datos no luce normal. Esto puede deberse a que las medidas disponibles son relativamente escasas, pero sin dudas va a dificultar lidiar con ellas.
  • Parecen observarse histogramas fragmentarios, o bimodalidad. Esto puede indicar que las muestras siguen distribuciones diferentes.
  • El contenido total es muy bajo en casi todas las muestras, siendo la mediana 1.2. Es importante profundizar sobre la sensibilidad del método de medición utilizado (Walkley Black) para saber cuál es el nivel de ruido para estas concentraciones, dado que hay riesgo de que el ruido explique la mayoría de la varianza.

Curvas

Graficamos todas las curvas juntas, en lo que suele llamarse un diagrama de arcoiris, para tener una perspective de la variación existente en las curvas. A veces también se observa curvas expurias o atípicas al hacerlo, pero no es el caso.