APLICACIÓN PRÁCTICA: REGRESIÓN LINEAL AL CULTIVO DE MAIZ
Ejemplo práctico de regresión
lineal en aprendizaje supervisado, utilizando un conjunto de datos ficticios
que relacionan la precipitación con el rendimiento del cultivo de maíz. La
regresión lineal es una técnica estadística usada para modelar la relación
entre una variable dependiente y una o más variables independientes. En este
caso, usaremos una regresión lineal simple donde la variable dependiente es el
rendimiento del cultivo de maíz y la variable independiente es la cantidad de
precipitación.
1. Explicación del Algoritmo de Regresión Lineal
En la regresión lineal simple,
la relación entre la variable dependiente \( Y \) y la variable independiente
\( X \) se modela como una ecuación lineal:
\[ Y = \beta_0 + \beta_1 X +
\epsilon \]
Donde:
- \( Y \) es la variable
dependiente (rendimiento del cultivo).
- \( X \) es la variable
independiente (precipitación).
- \( \beta_0 \) es el término
de intercepción.
- \( \beta_1 \) es el
coeficiente de la variable independiente.
- \( \epsilon \) es el término
de error, que representa la variación en \( Y \) no explicada por \( X \).
El objetivo es encontrar los
valores de \( \beta_0 \) y \( \beta_1 \) que minimizan la suma de los cuadrados
de los errores (diferencia entre los valores observados y los valores predichos
por el modelo).
2. Ejemplo Práctico con Datos Ficticios
Crearemos un conjunto de datos
ficticios que representen la precipitación (en mm) y el rendimiento del cultivo
de maíz (en toneladas por hectárea).
3. Análisis de Resultados y Evaluación del Modelo
Una vez tengamos el modelo,
evaluaremos su rendimiento utilizando métricas como el coeficiente de
determinación (R²) y el error cuadrático medio (MSE).
4. Generación de Código Python para Visualizar las Gráficas
Utilizaremos Python para
realizar la regresión lineal, y matplotlib para visualizar los resultados.
Ahora, procederé a generar el
conjunto de datos ficticios y a implementar el análisis:
Análisis de Resultados
Los resultados de nuestro
modelo de regresión lineal son los siguientes:
- El coeficiente de
intercepción (\( \beta_0 \)) es aproximadamente 7.51. Esto significa que cuando
la precipitación es 0 mm, el rendimiento esperado del cultivo de maíz es de
alrededor de 7.51 toneladas por hectárea.
- El coeficiente de pendiente
(\( \beta_1 \)) es aproximadamente 0.056. Esto indica que por cada milímetro
adicional de precipitación, el rendimiento del cultivo de maíz aumenta en
promedio 0.056 toneladas por hectárea.
- El coeficiente de
determinación (R²) es de 0.544. Este valor sugiere que aproximadamente el 54.4%
de la variabilidad en el rendimiento del cultivo de maíz puede ser explicada
por la cantidad de precipitación.
- El error cuadrático medio
(MSE) es 26.43. Este valor representa el promedio de los cuadrados de los
errores entre los valores observados y los valores predichos por el modelo.
Visualización de los Resultados
Ahora, vamos a visualizar
estos resultados con un gráfico que muestre los datos observados y la línea de
regresión ajustada.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
# Generación de datos ficticios
np.random.seed(0)
precipitacion
= np.random.normal(500, 100, 100) # Precipitación en mm
rendimiento
= 10 + 0.05 * precipitacion + np.random.normal(0, 5, 100) # Rendimiento del cultivo en
ton/ha
# Crear un DataFrame para los datos
datos =
pd.DataFrame({
'Precipitacion (mm)': precipitacion,
'Rendimiento (ton/ha)': rendimiento
})
# Crear y entrenar el modelo de regresión lineal
modelo =
LinearRegression()
modelo.fit(datos[['Precipitacion (mm)']], datos['Rendimiento (ton/ha)'])
# Realizar predicciones
predicciones
= modelo.predict(datos[['Precipitacion (mm)']])
# Cálculo de métricas
mse = mean_squared_error(datos['Rendimiento (ton/ha)'], predicciones)
r2 =
r2_score(datos['Rendimiento (ton/ha)'], predicciones)
En el gráfico, los puntos
azules representan los datos observados de precipitación y rendimiento del
cultivo de maíz. La línea roja muestra la línea de regresión lineal ajustada
según el modelo. Como podemos observar, hay una tendencia positiva, lo que
indica que un aumento en la precipitación está generalmente asociado con un
aumento en el rendimiento del cultivo de maíz.
Este ejemplo ilustra cómo se
puede aplicar la regresión lineal en el análisis de datos y la modelización de
relaciones entre variables. Sin embargo, es importante recordar que este es un
conjunto de datos ficticio, y en la práctica, es esencial realizar un análisis
detallado y considerar otros factores que puedan influir en el rendimiento del
cultivo. Además, el modelo tiene sus limitaciones, como se refleja en el valor
de R², lo que sugiere que hay otros factores no considerados en el modelo que
también afectan al rendimiento del cultivo.
# Visualización de los resultados
plt.figure(figsize=(10, 6))
plt.scatter(datos['Precipitacion (mm)'], datos['Rendimiento (ton/ha)'], color='blue', label='Datos Observados')
plt.plot(datos['Precipitacion (mm)'], predicciones, color='red', label='Línea de Regresión')
plt.title('Regresión Lineal: Rendimiento del Cultivo de Maíz
vs Precipitación')
plt.xlabel('Precipitación (mm)')
plt.ylabel('Rendimiento (ton/ha)')
plt.legend()
plt.grid(True)
plt.show()
Conclusión
general
La gráfica muestra una relación lineal negativa
entre el rendimiento del cultivo de maíz y la precipitación. Esto significa que
el rendimiento del cultivo de maíz es mayor cuando la precipitación es menor.
Conclusiones específicas
- El
rendimiento del cultivo de maíz es máximo cuando la precipitación es de
300 mm.
- El
rendimiento del cultivo de maíz disminuye a medida que aumenta la
precipitación.
- La
disminución del rendimiento del cultivo de maíz es más pronunciada a
partir de los 500 mm de precipitación.
Consideraciones
Es importante tener en cuenta que la gráfica se
basa en datos observados en una región específica. Es posible que la relación
entre el rendimiento del cultivo de maíz y la precipitación sea diferente en
otras regiones.
Reflexión,
Los agricultores pueden utilizar esta información
para planificar sus cultivos. En regiones con precipitaciones elevadas, los
agricultores pueden considerar la posibilidad de cultivar variedades de maíz
más tolerantes a la sequía.
https://chat.openai.com/share/31f29858-595e-4eb0-94cd-3f8afec42d6b
Bruno Rolando Aramayo Molina


Comentarios
Publicar un comentario