APLICACIÓN PRÁCTICA: REGRESIÓN LINEAL AL CULTIVO DE MAIZ

  


Ejemplo práctico de regresión lineal en aprendizaje supervisado, utilizando un conjunto de datos ficticios que relacionan la precipitación con el rendimiento del cultivo de maíz. La regresión lineal es una técnica estadística usada para modelar la relación entre una variable dependiente y una o más variables independientes. En este caso, usaremos una regresión lineal simple donde la variable dependiente es el rendimiento del cultivo de maíz y la variable independiente es la cantidad de precipitación.

1. Explicación del Algoritmo de Regresión Lineal

En la regresión lineal simple, la relación entre la variable dependiente \( Y \) y la variable independiente \( X \) se modela como una ecuación lineal:

\[ Y = \beta_0 + \beta_1 X + \epsilon \]

Donde:

- \( Y \) es la variable dependiente (rendimiento del cultivo).

- \( X \) es la variable independiente (precipitación).

- \( \beta_0 \) es el término de intercepción.

- \( \beta_1 \) es el coeficiente de la variable independiente.

- \( \epsilon \) es el término de error, que representa la variación en \( Y \) no explicada por \( X \).

El objetivo es encontrar los valores de \( \beta_0 \) y \( \beta_1 \) que minimizan la suma de los cuadrados de los errores (diferencia entre los valores observados y los valores predichos por el modelo).

2. Ejemplo Práctico con Datos Ficticios

Crearemos un conjunto de datos ficticios que representen la precipitación (en mm) y el rendimiento del cultivo de maíz (en toneladas por hectárea).

3. Análisis de Resultados y Evaluación del Modelo

Una vez tengamos el modelo, evaluaremos su rendimiento utilizando métricas como el coeficiente de determinación (R²) y el error cuadrático medio (MSE).

4. Generación de Código Python para Visualizar las Gráficas

Utilizaremos Python para realizar la regresión lineal, y matplotlib para visualizar los resultados.

Ahora, procederé a generar el conjunto de datos ficticios y a implementar el análisis:

Análisis de Resultados

Los resultados de nuestro modelo de regresión lineal son los siguientes:

- El coeficiente de intercepción (\( \beta_0 \)) es aproximadamente 7.51. Esto significa que cuando la precipitación es 0 mm, el rendimiento esperado del cultivo de maíz es de alrededor de 7.51 toneladas por hectárea.

- El coeficiente de pendiente (\( \beta_1 \)) es aproximadamente 0.056. Esto indica que por cada milímetro adicional de precipitación, el rendimiento del cultivo de maíz aumenta en promedio 0.056 toneladas por hectárea.

- El coeficiente de determinación (R²) es de 0.544. Este valor sugiere que aproximadamente el 54.4% de la variabilidad en el rendimiento del cultivo de maíz puede ser explicada por la cantidad de precipitación.

- El error cuadrático medio (MSE) es 26.43. Este valor representa el promedio de los cuadrados de los errores entre los valores observados y los valores predichos por el modelo.

Visualización de los Resultados

Ahora, vamos a visualizar estos resultados con un gráfico que muestre los datos observados y la línea de regresión ajustada.

 

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

from sklearn.metrics import mean_squared_error, r2_score

 

# Generación de datos ficticios

np.random.seed(0)

precipitacion = np.random.normal(500, 100, 100)  # Precipitación en mm

rendimiento = 10 + 0.05 * precipitacion + np.random.normal(0, 5, 100)  # Rendimiento del cultivo en ton/ha

 

# Crear un DataFrame para los datos

datos = pd.DataFrame({

    'Precipitacion (mm)': precipitacion,

    'Rendimiento (ton/ha)': rendimiento

})

 

# Crear y entrenar el modelo de regresión lineal

modelo = LinearRegression()

modelo.fit(datos[['Precipitacion (mm)']], datos['Rendimiento (ton/ha)'])

 

# Realizar predicciones

predicciones = modelo.predict(datos[['Precipitacion (mm)']])

 

# Cálculo de métricas

mse = mean_squared_error(datos['Rendimiento (ton/ha)'], predicciones)

r2 = r2_score(datos['Rendimiento (ton/ha)'], predicciones)

 


En el gráfico, los puntos azules representan los datos observados de precipitación y rendimiento del cultivo de maíz. La línea roja muestra la línea de regresión lineal ajustada según el modelo. Como podemos observar, hay una tendencia positiva, lo que indica que un aumento en la precipitación está generalmente asociado con un aumento en el rendimiento del cultivo de maíz.

 

Este ejemplo ilustra cómo se puede aplicar la regresión lineal en el análisis de datos y la modelización de relaciones entre variables. Sin embargo, es importante recordar que este es un conjunto de datos ficticio, y en la práctica, es esencial realizar un análisis detallado y considerar otros factores que puedan influir en el rendimiento del cultivo. Además, el modelo tiene sus limitaciones, como se refleja en el valor de R², lo que sugiere que hay otros factores no considerados en el modelo que también afectan al rendimiento del cultivo.

 

# Visualización de los resultados

plt.figure(figsize=(10, 6))

plt.scatter(datos['Precipitacion (mm)'], datos['Rendimiento (ton/ha)'], color='blue', label='Datos Observados')

plt.plot(datos['Precipitacion (mm)'], predicciones, color='red', label='Línea de Regresión')

plt.title('Regresión Lineal: Rendimiento del Cultivo de Maíz vs Precipitación')

plt.xlabel('Precipitación (mm)')

plt.ylabel('Rendimiento (ton/ha)')

plt.legend()

plt.grid(True)

plt.show()

Conclusión general

La gráfica muestra una relación lineal negativa entre el rendimiento del cultivo de maíz y la precipitación. Esto significa que el rendimiento del cultivo de maíz es mayor cuando la precipitación es menor.

Conclusiones específicas

  • El rendimiento del cultivo de maíz es máximo cuando la precipitación es de 300 mm.
  • El rendimiento del cultivo de maíz disminuye a medida que aumenta la precipitación.
  • La disminución del rendimiento del cultivo de maíz es más pronunciada a partir de los 500 mm de precipitación.

Consideraciones

Es importante tener en cuenta que la gráfica se basa en datos observados en una región específica. Es posible que la relación entre el rendimiento del cultivo de maíz y la precipitación sea diferente en otras regiones.

Reflexión, 

Los agricultores pueden utilizar esta información para planificar sus cultivos. En regiones con precipitaciones elevadas, los agricultores pueden considerar la posibilidad de cultivar variedades de maíz más tolerantes a la sequía.

https://chat.openai.com/share/31f29858-595e-4eb0-94cd-3f8afec42d6b

Bruno Rolando Aramayo Molina

Comentarios

Entradas más populares de este blog

APLICACIÓN PRÁCTICA: REGRESIÓN LOGÍSTICA EN EL SECTOR AGRÍCOLA

APLICACIÓN PRÁCTICA: ÁRBOLES DE DECISIÓN (APRENDIZAJE SUPERVISADO) EN LA CLASIFICACIÓN DE PLANTAS NATIVAS DE LOS ANDES DE BOLIVIA