Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 109 Judith Cristina Pesantez Rodríguez jcpesantezr@ucacue.edu.ec Universidad Católica de Cuenca Romel Patricio Mena Trujillo romel.mena@ucacue.edu.ec Universidad Católica de Cuenca Jimy Rodrigo Gualán Oviedo jgualanov@ucacue.edu.ec Universidad Católica de Cuenca Paola Alexandra Carangui Velecela paola.pacv@gmail.com Universidad Católica de Cuenca Optimización de la productividad agrícola ecuatoriana: Un análisis de conglomerados basado en K-Means Optimization of ecuadorian agricultural productivity: A cluster analysis based on K-Means Artículo original. Revista Killkana Sociales. Vol. 9, No. 1, pp. 109-124 , enero-abril, 2025. p-ISSN 2528-8008 / e-ISSN 2588-087X. Universidad Católica de Cuenca Recepción : 15 de julio de 2024 | Publicación: 30 de enero de 2025 DOI: https://doi.org/ 10.26871/killkanasocial.v9i1.1534 Resumen La investigación realiza un análisis de la Optimización de la Productividad Agrícola Ecuatoriana mediante Conglomerados basado en K-Means, con el objetivo de identificar patrones y agrupamientos en los datos de productividad agrícola, prestando especial atención a las variables de cantidad cosechada y cantidad vendida. Estas variables son medidas clave para evaluar la producción y comercialización de los productos agrícolas. Para llevar a cabo el análisis de conglomerados de la productividad agrícola en Ecuador, se utilizaron los datos de la Encuesta de Superficie y Producción Agropecuaria Continua
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 110 Jimy Rodrigo Gualán Oviedo, Paola Alexandra Carangui Velecela, Judith Cristina Pesantez Rodríguez, Romel Patricio Mena Trujillo (ESPAC) del Instituto Nacional de Estadística y Censos (INEC), correspondientes al año 2022, enfocados específicamente en cultivos permanentes. Los resultados del estudio indican que existe una marcada diferencia en las variables de cantidad cosechada y can - tidad vendida en el conglomerado 3, donde predominan productos específicos como el banano y la guanábana. Estos productos, que son predominantes en el conglomerado 3, demuestran una mayor eficiencia en la producción, logrando resultados significativa - mente superiores con el mismo o menor uso de recursos en comparación con los de - más conglomerados. Este hallazgo sugiere que el banano y la guanábana tienen un alto potencial para mejorar la productividad agrícola del país. Además, el análisis revela que la optimización de la producción y comercialización en estos cultivos puede ser clave para el desarrollo agrícola sostenible en Ecuador. En conclusión, el uso del análisis de conglomerados basado en K-Means ha permitido identificar áreas de alta eficiencia en la producción agrícola ecuatoriana, destacando la importancia de estrategias específicas para los cultivos de banano y guanábana. Estos resultados proporcionan una base sólida para la formulación de políticas y la implementación de prácticas agrícolas mejoradas, que podrían incrementar significativamente la productividad y sostenibilidad del sector agrícola en Ecuador. Palabras claves: clusters agrícolas, economía agrícola, eficiencia colectiva. Abstract The research conducts an analysis of the Optimization of Ecuadorian Agricultural Productivity through Clustering based on K-Means, with the objective of identifying patterns and groupings in agricultural productivity data, paying special attention to the variables of harvested quantity and sold quantity. These variables are key measures to evaluate the production and commercialization of agricultural products. To carry out the cluster analysis of agricultural productivity in Ecuador, data from the Continuous Area and Agricultural Production Survey (ESPAC) of the National Institute of Statistics and Censuses (INEC), corresponding to the year 2022, were used, specifically focusing on permanent crops.The study results indicate that there is a marked diference in the variables of harvested quantity and sold quantity in cluster 3, where specific products such as bananas and soursop predominate. These products, which are predominant in cluster 3, demonstrate greater eficiency in production, achieving significantly superior results with the same or fewer resources compared to the other clusters. This finding suggests that bananas and soursop have high potential for improving the country’s agricultural productivity. Furthermore, the analysis reveals that optimizing production and commercialization in these crops could be key to sustainable agricultural development in Ecuador. In conclusion, the use of clustering analysis based on K-Means has allowed the identification of highly eficient areas in Ecuadorian agricultural production, highlighting the importance of specific strategies for banana and soursop crops. These results provide a solid basis for the formulation of policies and the implementation of improved agricultural practices, which could significantly increase the productivity and sustainability of the agricultural sector in Ecuador. Key words: Agricultural Clusters, Agricultural Economy, Collective Eficiency.
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 111 Optimización de la productividad agrícola ecuatoriana: Un análisis de conglomerados basado en K-Means Introducción Ecuador cuenta con una gran diversidad climática y ecosistemas favorables para la agricultura, generando ventaja comparativa en los cultivos y productos agríco - las, a pesar de ello la producción de alimentos agrícolas es únicamente para el consumo local, eventualmente se destina para la exportación. Durante el periodo 2017-2022, el sector agrícola, aporto el 8% a la producción nacional, constituyén - dose en un sector de los que más aporta a esta producción y también a la gene - ración de empleo nacional.(Peñaherrera & Segovia, 2023). Es fundamental que el país optimice sus recursos naturales y agrícolas para mejorar la producción y se proyecte como potencia agrícola en la región. (Bermúdez et al., 2022). Con base a lo expuesto se realizó estudios estadísticos que permitan entender las caracte - rísticas y factores que influyen en la producción agrícola ecuatoriana a través del análisis de conglomerados basado en el algoritmo K-Means, herramienta eficaz para identificar patrones y agrupamientos en los datos, lo que a su vez facilitará la toma de decisiones informadas y estratégicas del sector en análisis. Cluster Los clusters se definen como la “concentración progresiva de empresas de la misma industria, que, con el afán de un crecimiento sostenido de ésta, mantie - nen relaciones de cooperación con entidades involucradas como Universidades, Gobierno, Centros de Investigación, Instituciones Financieras, Proveedores, etc.” (Vera Garnica, 2009). Los clusters son concentraciones de organizaciones relacionadas entre sí, situa - das en una zona territorial delimitada que agrupan a: productores, empresas e instituciones afines a un sector de la economía, buscan beneficios propios sin dejar de cooperar entre sí para generar un sistema productivo especializado de mayor eficiencia y especialización, contribuyen al desarrollo regional a través de la eficiencia colectiva (García et al., 2019). Esta tendencia de concentración de - liberada de empresas se fortaleció en la década de los ochenta, la combinación local de capacidades, tecnología, instalaciones y proveedores se instauró en la clave para alcanzar competitividad en el mercado. Los cluster tiene ventajas diversas, las principales a destacar son: reducción de costos de producción y comercialización, estandarización de productos/servi - cios, mayor acceso a financiamiento y capacitación, especialización y división de trabajo, productividad, aprendizaje productivo, tecnológico y comercial, desarro - llo de la industria y economía local, también enfrentan limitaciones relacionadas con culturas organizacionales de no cooperación, conducta competitiva de tipo
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 112 Jimy Rodrigo Gualán Oviedo, Paola Alexandra Carangui Velecela, Judith Cristina Pesantez Rodríguez, Romel Patricio Mena Trujillo predatorio, entre otros. (Morales et. al, 2014). Los cluster son, entonces, una vía para alcanzar eficiencia colectiva. En América Latina, Schejtman & Berndegue (2004) indican la existencia de tres tipologías de cluster: a) Cluster de sobrevivencia, conformado por micro y peque - ñas empresas productoras de bienes de baja calidad para consumo local, en gran medida son organizaciones informales de baja productividad y salarios deficien - tes; b) Cluster de medianas y grandes empresas, producen bienes de consumo masivo para mercados internos, y c) Cluster en torno a empresas transnacionales, poseen complejidad tecnológica. Cluster agrícola Tapia et al. (2015) refiere a los cluster de base agrícola como la “concentración de productores, agroindustria e instituciones soporte que participan en el mis - mo subsector agrícola o agroindustrial para construir redes de valor y enfrentar desafíos comunes” (p. 116). Los estudios de cluster agrícolas, varían de acuerdo a la dimensión o alcance, los microcluster estudian cómo las agrupaciones em - presariales alcanzan ventaja competitiva y los estudios de mes o cluster realizan análisis sectoriales, miden alianzas estratégicas, identifican potencialidades entre otros (Tapia et al., 2015). Economía agrícola La economía agrícola, denominada también economía agraria tiene como fina - lidad el estudio de los sectores agrícolas-pecuarios y su relación con el sistema económico, esta disciplina relaciona la teoría económica con actividades agrí - colas, agropecuarias, agroindustriales y aspectos ambientales centrándose, ade - más, en los sectores primarios y rurales de un país. Arias (2022) define a la economía agrícola como parte de la economía general que estudia los problemas económicos de la agricultura y actividades afines. Es sólo una rama de la economía aplicada cuya existencia es producto de la espe - cialización impuesta por el progreso y la complejidad creciente de la ciencia y de la tecnología. (Vivas, 2010, p. 33) El sector agrícola se relaciona con fábricas, comercio, finanzas, ambiente, pro - veedores, etc. siendo un factor dinámico en la economía, en Ecuador los bienes/ servicios se producen para el consumo local y en escasa medida para el mercado internacional, a pesar de ello es un sector que contribuye a la creación de fuentes de empleo, al mantener participación directa en el crecimiento del PIB debe tec - nificarse para presentar mayor aporte al PIB (Escalante et al., 2021).
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 113 Optimización de la productividad agrícola ecuatoriana: Un análisis de conglomerados basado en K-Means Eficiencia Colectiva En los años noventa se recalca la eficiencia colectiva como una ventaja compe - titiva que resulta de las alianzas y accionar de economías externas en conjunto, así las pequeñas y medianas empresas, en su mayoría, compartirían recursos y realizarían actividades en conjunto derivando en crecimiento y competitividad de las empresas involucradas (Obeso, 2014). La generación de alianzas se forma a través de procesos de aprendizaje colectivo basados en la confianza de los actores, interacción social, semejanzas culturales, normas y sanciones, en ocasiones estos procesos, de ensayo error empresarial, se fortalecen en otras se desvanecen, a pesar de que la eficiencia colectiva tex - tualmente se divise “como una simple fórmula:  externalidades + acción conjunta= eficiencia colectiva” (Obeso, 2014, p. 5), la interacción genera retos para las orga - nizaciones participantes. La especialización sectorial (cluster) crea externalidades involuntarias, las alian - zas, para esta aglomeración, son coordinadas a través de asociaciones y coope - raciones voluntarias, por ello para que exista eficiencia colectiva debe coexistir externalidades y acción conjunta en tejido productivo (Stumpo, et al., 2004). Algoritmo K-Means El algoritmo K-Means es ampliamente utilizado en el análisis de conglomera - dos para fraccionar un conjunto de datos en K grupos predefinidos. Se asigna cada observación al grupo más cercano en términos de distancia, minimizan - do la suma de las distancias al cuadrado dentro de cada grupo. Para optimizar el número de clústeres y evaluar la calidad de los resultados, se utilizan técni - cas como K-Means++, el método de silueta, el método del codo, y el Análisis de Componentes Principales (PCA). K-Means++ busca inicializar los centroides de manera más eficiente. En lugar de seleccionar aleatoriamente los centroides iniciales, K-Means++ utiliza una estra - tegia que selecciona los centroides iniciales de forma que estén más alejados en - tre sí. Esto ayuda a obtener una mejor convergencia y evita resultados subóptimos. El método de silueta es una técnica para evaluar la calidad de los clusters obteni - dos con el algoritmo K-Means. Calcula un valor de silueta para cada observación, que mide la similitud de la observación con su propio cluster en comparación con otros clusters. Un valor de silueta cercano a 1 indica que la observación está bien asignada a su cluster, mientras que un valor cercano a -1 indica una asignación incorrecta.
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 114 Jimy Rodrigo Gualán Oviedo, Paola Alexandra Carangui Velecela, Judith Cristina Pesantez Rodríguez, Romel Patricio Mena Trujillo El método del codo es otra técnica para determinar el número óptimo de clusters en el algoritmo K-Means. Se calcula la suma de los cuadrados de las distancias dentro de cada cluster para diferentes valores de K. Luego, se traza un gráfico de la suma de los cuadrados de las distancias en función de K. El punto en el gráfico donde la mejora en la suma de los cuadrados de las distancias se vuelve menos significativa se conoce como el “codo”. Este punto indica un equilibrio entre la va - rianza dentro de los clusters y la separación entre los clusters. Por último, el Análisis de Componentes Principales (PCA) es un método que se utiliza para reducir la dimensionalidad de los datos. Este método transforma las variables originales en un nuevo conjunto de variables, los componentes principa - les, que son combinaciones lineales de las variables originales, y que capturan la mayor parte de la variación en los datos. Esto facilita la visualización y la interpre - tación de los datos, y puede mejorar la eficiencia del algoritmo K-Means al reducir el número de dimensiones que necesita considerar Fundamentación metodológica La investigación realizada es de corte transversal, profundidad correlacional y do - cumental, para realizar el análisis de conglomerados de la productividad agrícola en Ecuador, se utilizaron los datos de la Encuesta de Superficie y Producción Agropecuaria Continua (ESPAC) del Instituto Nacional de Estadística y Censos (INEC), año 2022, referentes específicamente a cultivos permanentes. Así, de la base de datos original, que contiene más de 100 columnas, se eligieron las si - guientes variables para el análisis de la producción agrícola. Tabla 1 Variables de la investigación rc_clacul Clave de cultivo_campo cp_k409ha Superficie plantada_hectáreas cp_k411ha Superficie cosechada_hectáreas cp_k416 Cantidad cosechada cp_k422 Cantidad vendida cp_prod Producción_toneladas métricas cp_sriego Superficie con riego cp_sufertilizantes Superficie con fertilizantes cp_sufitosanitario Superficie con fitosanitarios Fuente : Elaboración propia en base a datos del INEC.
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 115 Optimización de la productividad agrícola ecuatoriana: Un análisis de conglomerados basado en K-Means Seguidamente para encontrar el número óptimo de clusters se realizó el agru - pamiento mediante el algoritmo k-means, método del codo, esta subdivisión es ejecutada considerando centroides para medir las distancias entre este y el punto, los grupos son formados con los puntos cuya distancia con el centroide sea más corta, creando, así, agrupamientos basados en patrones.(Rabadán et al., 2022). Resultados Producción (en toneladas métricas): Es el volumen total de producción agrícola obtenida en cada cultivo permanente. Además, se consideraron variables rela - cionadas con el manejo agrícola, como la superficie con riego, la superficie con fertilizantes y la superficie con fitosanitarios. Estas variables son importantes para comprender las prácticas agrícolas utilizadas en el cultivo de los productos. El ob - jetivo principal de este análisis de conglomerados es identificar patrones y agru - pamientos en los datos de productividad agrícola. Se prestó especial atención a las variables de cantidad cosechada y cantidad vendida, ya que estas son medidas clave para evaluar la producción y comercialización de los productos agrícolas. En el análisis de conglomerados, se agruparon los cultivos permanentes en función de sus características de producción y comercialización. Esto permitió identificar grupos similares de cultivos y analizar las diferencias y similitudes entre ellos. Es importante destacar que este estudio se centra en la productividad agrícola en Ecuador y tiene como objetivo proporcionar información que pueda ser utilizada para mejorar las prácticas agrícolas y optimizar la producción en el país. En el siguiente cuadro se tiene las principales estadísticas de cada una de las variables. Tabla 2 Estadísticas de las variables rc_clacul cp_k409ha cp_k411ha cp_k416 cp_k422 Min. :402.0 Min. : 0.0100 Min. : 0.0100 Min. : 0 Min. : 0 1st Qu.:410.0 1st Qu.: 0.7056 1st Qu.: 0.7056 1st Qu.: 51 1st Qu.: 50 Median :411.0 Median : 3.0000 Median : 3.0000 Median : 250 Median : 250 Mean :426.1 Mean : 46.1191 Mean : 45.7189 Mean : 56104 Mean : 53557 3rd Qu.:444.0 3rd Qu.: 25.0000 3rd Qu.: 25.0000 3rd Qu.: 6000 3rd Qu.: 6000 Max. :499.0 Max. :2000.0000 Max. :1730.0000 Max. :3458079 Max. :3458079 cp_prod cp_sriego cp_sufertili - zantes cp_sufitosani - tario Min. : 0.01 Min. : 0.0100 Min. : 0.0100 Min. : 0.0100
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 116 Jimy Rodrigo Gualán Oviedo, Paola Alexandra Carangui Velecela, Judith Cristina Pesantez Rodríguez, Romel Patricio Mena Trujillo 1st Qu.: 100.00 1st Qu.: 0.7056 1st Qu.: 0.7056 1st Qu.: 0.7056 Median : 204.54 Median : 3.0000 Median : 3.0000 Median : 3.0000 Mean : 1039.14 Mean : 46.1191 Mean : 46.1191 Mean : 46.1191 3rd Qu.: 477.27 3rd Qu.: 25.0000 3rd Qu.: 25.0000 3rd Qu.: 25.0000 Max. :81437.25 Max. :2000.0000 Max. :2000.0000 Max. :2000.0000 Fuente: Elaboración propia con estadístico R Gracias al uso del comando summarise en R, se observa una gran cantidad de datos faltantes en la base de datos. Por ejemplo, la variable cp_riesgo presentaba 102,227 datos faltantes. En este análisis, no se aplicó ninguna técnica para rellenar los datos faltantes, como el uso de la mediana u otros métodos basados en los vecinos más cercanos. La razón de esto es que, en la mayoría de las variables, la media era significativamente mayor que la mediana, lo que indica la presencia de un sesgo hacia la derecha. Esta característica dificulta la aplicación de técnicas de imputación. Además, dada la cantidad considerable de datos faltantes en la base de datos, predecir estos valores mediante un modelo podría generar datos erróneos y ses - gar los resultados del análisis. Por lo tanto, se optó por omitir los datos faltantes, lo que resultó en una base de datos más pequeña, pero con una mayor calidad de datos. En el análisis gráfico se encuentra una tabla de correlaciones entre las variables seleccionadas. Grafico 1 Correlaciones entre variables Fuente : Elaboración propia con estadístico R
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 117 Optimización de la productividad agrícola ecuatoriana: Un análisis de conglomerados basado en K-Means Como se puede observar, existen análisis altamente correlacionados, esto puede afectar negativamente al algoritmo K-means ya que esencialmente proporcionan información redundante. Esto puede influir de manera desproporcionada en la formación de los clusters, lo que podría sesgar los resultados. Por lo tanto, se utilizará un análisis de la dimensionalidad, como el Análisis de Componentes Principales (PCA), antes de realizar el análisis de conglomerados. Tabla 3 Análisis de componentes Importance of components: PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 Standard deviation 2.5185 12.419 0.98110 0.85598 0.64394 0.05112 0.05018 2.08e-15 1.3e-30 3,36E-43 Proportion of Variance 0.6343 0.1542 0.09626 0.07327 0.04147 0.00026 0.00025 0.00e+00 0.0e+00 0.000e+00 Cumulative Proportion 0.6343 0.7885 0.88475 0.95802 0.99949 0.99975 100.000 1.00e+00 1.0e+00 1,00E+03 Fuente : Elaboración propia con estadístico R Se tiene que las componentes principales PC1 y PC2 explican el 78.85% de la va - rianza total de los datos, mientras que la PC3 explica solo el 88.475%. Debido a la mayor facilidad de interpretación y la mayor contribución a la varianza, se optará por utilizar solo PC1 y PC2 en el análisis subsiguiente. Ahora que se tiene los datos transformados con los componentes principales, se aplicará los métodos para determinar el número óptimo de clústeres. Gráfico 2 Número de clusters Fuente : Elaboración propia con estadístico R
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 118 Jimy Rodrigo Gualán Oviedo, Paola Alexandra Carangui Velecela, Judith Cristina Pesantez Rodríguez, Romel Patricio Mena Trujillo En el método del codo, se puede observar que a partir de 5 clusters las distancias aumentan, por lo tanto, es un claro indicativo de que 5 es la opción más eficiente. Por otra parte, también tenemos otro método para seleccionar el número óptimo de clusters que es la gráfica de silueta. Con este método también se observa que a partir de 5 clusters es la mejor opción. Con este método también se observa que a partir de 5 clusters pierde la eficiencia. En conclusión, ambos métodos nos indicaron que 5 clusters es la mejor opción. Grafico 3 Número de conglomerados Fuente : Elaboración propia con estadístico R Aquí se presentan las gráficas encontradas en el análisis de clusters, con dife - rentes tipos de imágenes para que se puedan observar cómo están formados los clusters. Grafico 4 Análisis de cluster Fuente : Elaboración propia con estadístico R
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 119 Optimización de la productividad agrícola ecuatoriana: Un análisis de conglomerados basado en K-Means Finalmente, se realiza una tabla comparativa entre los clusters con cada una de las variables. Grafico 5 Análisis de clusters –variables Fuente : Elaboración propia con estadístico R El diagrama de caja y bigotes analizado muestra la distribución de la superficie agrícola en Ecuador, dividida en cinco clusters. El cluster 1 se destaca por su gran variabilidad y superficies extensas, con medianas superiores a 1000 ha y muchos valores atípicos. El cluster 2 también es variable, pero con una mediana menor, alrededor de 500 ha, y menos valores atípicos. El cluster 3 presenta una mediana similar al cluster 2, pero con menos valores atípicos, indicando mayor homogenei - dad. Los clusters 4 y 5 tienen medianas cercanas a cero y rangos intercuartílicos estrechos, lo que señala superficies pequeñas y consistentes. La presencia de valores atípicos en los clusters 1 y 2 sugiere operaciones agrícolas a gran escala, posiblemente para exportación o producción masiva, mientras que los otros clus - ters podrían indicar una agricultura de menor escala, enfocada en el consumo local o mercados más pequeños. Grafico 6 Cantidad cosechada por clusters Fuente : Elaboración propia con estadístico r
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 120 Jimy Rodrigo Gualán Oviedo, Paola Alexandra Carangui Velecela, Judith Cristina Pesantez Rodríguez, Romel Patricio Mena Trujillo La gráfica muestra un análisis de la cantidad cosechada en el sector agrícola ecuatoriano, distribuida en cinco clusters. El cluster 3 destaca con una mediana que supera los 2 millones de unidades, mostrando gran variabilidad y un valor atípico que sugiere una producción excepcionalmente alta. El cluster 2 también tiene variabilidad, con una mediana alrededor de 1 millón de unidades y algunos valores atípicos. Los clusters 1, 4 y 5, por otro lado, tienen cantidades cosechadas mucho menores, con poca o ninguna variabilidad y sin valores atípicos notables. Esto implica que los clusters 3 y 2 podrían representar áreas de cultivo de alto rendimiento, mientras que los otros clusters parecen estar asociados con cultivos de menor escala. Grafico 7 Cantidad producida por clusters Fuente : Elaboración propia con estadístico R La gráfica de caja y bigotes muestra la cantidad de producción en toneladas dis - tribuida por clusters. El cluster 1 tiene un rango intercuartílico amplio con una mediana cercana a 40,000 toneladas, indicando variabilidad en la producción y presencia de valores atípicos significativos. El cluster 2 exhibe una mediana mu - cho más baja y menos variabilidad. Los clusters 3, 4 y 5 tienen medianas y rangos intercuartílicos reducidos, lo que señala una producción mucho más baja y homo - génea. En resumen, hay una clara disparidad en la cantidad de producción entre el cluster 1 y los demás, con el cluster 1 destacando como el más productivo. En general se puede considerar que: Cluster 1: Superficie Plantada y Cosechada: Se caracteriza por tener la mayor superfi - cie plantada y cosechada, lo que indica operaciones agrícolas de gran esca - la. La variabilidad en el tamaño de estas superficies es significativa, lo cual puede sugerir diversidad en los tipos de cultivos o en las prácticas agrícolas.
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 121 Optimización de la productividad agrícola ecuatoriana: Un análisis de conglomerados basado en K-Means Cantidad Producida: Este cluster muestra la mayor cantidad de producción en toneladas, reflejando probablemente una alta eficiencia o cultivos de alto rendimiento. El hecho de que también tenga los valores más altos en super - ficie con riego y en el uso de fitosanitarios y fertilizantes apoya la idea de que se trata de una agricultura intensiva, posiblemente con una inversión significativa en tecnología y gestión agrícola. Cluster 3: Superficie Plantada y Cosechada: Aunque menor que el cluster 1, el cluster 3 presenta una superficie plantada y cosechada significativa, lo que sugiere que también participa en operaciones a gran escala pero con menos varia - bilidad en la superficie utilizada comparado con el cluster 1. Cantidad Cosechada y Vendida: Exhibe volúmenes altos en cosecha y ven - tas, pero no tan grandes como los del cluster 1. Esto puede indicar que las operaciones en este cluster son eficientes y orientadas al mercado, aunque tal vez no al mismo nivel de intensificación que el cluster 1. En general se obtiene en la siguiente table donde se encuentran qué tipo de culti - vos que se encuentra en cada cluster. Tabla 4 Tipos de cultivos por cluster cluster rc_clacul cluster rc_clacul 3 407 1 419 3 407 1 419 3 407 1 419 3 407 1 419 3 407 1 419 3 407 1 419 3 407 1 419 3 407 1 456 3 407 1 419 3 407 1 419 3 407 1 419 3 407 1 419 3 407 1 419 3 407 1 419 3 407 1 456 3 407 1 419
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 122 Jimy Rodrigo Gualán Oviedo, Paola Alexandra Carangui Velecela, Judith Cristina Pesantez Rodríguez, Romel Patricio Mena Trujillo 3 434 1 419 1 407 1 456 1 419     1 456 Fuente: Elaboración propia con estadístico R Como se puede observar en el conglomerado 3, la mayor cantidad de plantas tiene el código 407, el cual hace referencia al banano, y uno de 434 que es la gua - nábana. Por otra parte, en el conglomerado 2, tenemos dos que predominan que son el 419 y 456, que son la caña de azúcar y la palma. Discusión y recomendaciones De acuerdo con el análisis realizado, los conglomerados presentan similitudes en términos de variables como la superficie plantada, la superficie con riego, la super - ficie cosechada, la superficie tratada con fertilizantes y la superficie aplicada con fitosanitarios. No obstante, hay una marcada diferencia en las variables de cantidad cosechada y cantidad vendida en el conglomerado 3, donde predominan productos específicos como el banano y la guanábana. Estos productos, predominantes en el conglomerado 3, demuestran una mayor eficiencia en la producción, logrando resultados significativamente superiores con el mismo o menor uso de recursos en comparación con los demás conglomerados. Esto sugiere que el sector agríco - la ecuatoriano debería priorizar el enfoque en este tipo de cultivos más eficientes. Por otro lado, es necesario realizar un análisis más profundo para determinar si los productos del conglomerado 1, como la caña de azúcar y palma, están realmente optimizados. Además, se debe tener en cuenta que la inversión en estos productos, especialmente en la superficie plantada, puede ser utilizada por otros tipos de pro - ductos para mejorar la productividad. Es importante mencionar que, aunque no se realizó un análisis regional específico, se observa que la caña de azúcar y la palma son productos propios de climas tropicales. También se recomienda estudiar en mayor detalle el desarrollo del banano en la región amazónica, ya que representa una oportunidad para expandir el desarrollo agrícola en dicha zona. Finalmente, aunque se tomó como motivo principal para la distribución de los conglomerados el tipo de productos, es importante considerar que pueden existir otras variables que estén influyendo en esta agrupación. Por lo tanto, se reco - mienda realizar estudios adicionales para analizar si hay más variables relevantes más allá de las utilizadas en este análisis.
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 123 Optimización de la productividad agrícola ecuatoriana: Un análisis de conglomerados basado en K-Means Referencias bibliográficas Arias, E. R. (2022). Economía agrícola. Economipedia. https://economipedia.com/ definiciones/economia-agricola.html Escalante Pineda, M.E., Urbina Bustos, S.S., Banderas Benítez, V.E., Farinango Salazar, R.A., Sotomayor Cabrera, K.K. (2021). Análisis de la estructura pro - ductiva de la economía ecuatoriana: Exportaciones del sector agrícola. Revista Sociedad & Tecnología,4(3), 380-398 Ministerio de Agricultura y Ganadería (Ed.). (2019). Agricultura, la base de la economía y la alimentación . https://www.agricultura.gob.ec/ agricultura-la-base-de-la-economia-y-la-alimentacion/ Melendez, J. R. (2023). Economía agroalimentaria circular: tendencias gerenciales para la sostenibilidad de los sistemas de producción. Revista Venezolana De Gerencia, 28 (Especial 9), 664-684. Morales, L. A., Velasco, L., Perez, S. (2014). Estrategias Para La Formación De “Clusters” Agrícolas En Zonas Rurales. Revista Mexicana de Agronegocios , 35(1), 1004-1011. https://www.redalyc.org/articulo.oa?id=14131676009 Murcla, H. (1997). Fundamentos de economía. https://repositorio.iica.int/bits - tream/handle/11324/12690/BVE20108483e.pdf?sequence=1&isAllowed=y Obeso M, (2014). La construcción de eficiencias colectivas en redes de PyMES,  Revue Interventions économiques , 50. http://journals.openedi - tion.org/interventionseconomiques/2240 ; DOI : https://doi.org/10.4000/ interventionseconomiques.2240 Reinoso, L., Vera, J. A., y Naranjo, W. G. (2022). Condiciones sistémicas para el em - prendimiento dinámico en el cluster textil-confección en Ibagué-Colombia. Revista Venezolana de Gerencia , 27 (Especial 7), 492-509. https://doi. org/10.52080/rvgluz.27.7.32 Schejtman, A. y Berdegué, J. A. (2004). Desarrollo territorial rural. Centro Latinoamericano para el Desarrollo Rural (RIMISP)-Debates y temas rura - les No. 1. http://www.rimisp.or/wp-content/ files_ mf/ 13630933 92schejt - man_yberdegue2004_desarrollo_territorial_rural_5_rimisp_CArdumen.pdf. Consultado el 22 de marzo de 2024. Stumpo G. el al. (2004). Pequeñas y medianas empresas y eficiencia colectiva, Estudio del Caso de América Latina, CEPAL. https://repositorio.cepal.org/
Revista Killkana Sociales Vol. 9, No. 1 | abril 2025 | ISSN: 2528-8008. ISSN Elect. : 2588-087X https://doi.org/ 10.26871/killkanasocial.v9i1.1534 124 Jimy Rodrigo Gualán Oviedo, Paola Alexandra Carangui Velecela, Judith Cristina Pesantez Rodríguez, Romel Patricio Mena Trujillo server/api/core/bitstreams/bb9695f6-4086-4fa6-b9eb-228263a36b56/ content Tapia, B. L., Aramendiz, T. H., Pacheco, Q. J., & Montalvo, P. A. (2015). Clusters agrícolas: un estado del arte para los estudios de competitividad en el cam - po. Revista de Ciencias Agrícolas , 32 (2), 113-124. https://doi.org/10.22267/ rcia.153202.19 Vera, J. (2009). Cluster del Salmón en Chile: análisis de los factores de competitivi - dad a escala internacional. Revista Venezolana de Gerencia , 47 (14), 343-370, Universidad del Zulia Maracaibo, Venezuela . https://www.redalyc.org/articu - lo.oa?id=29014477003 Vivas, E. (2010). Economía Agraria (Vol. 1). Editronic S.A. https://repositorio.una. edu.ni/2465/1/ne10v855e.pdf Bermúdez, B. N., Arboleda, X., & Camino, M. S. (2022). Production and business profitability in the agricultural sector of Ecuador | Producción y rentabili - dad empresarial en el sector agrícola del Ecuador. Cepal Review, 2022(137), 133–157. Peñaherrera, C., & Segovia, V. (2023). ARIMA : UN MODELO PREDICTIVO PARA LA ESTIMACIÓN DE LA PRODUCCIÓN AGRÍCOLA ECUATORIANA. 19. Rabadán, P. F., Berumen, S. A., Guiance, L. J., & Hernández, M. C. (2022). Reconstrucción y consistencia factorial: la regla del codo aplicada al RMSEA, análisis paralelo y otras pruebas confirmatorias. Revista de Métodos Cuantitativos Para La Economía y La Empresa, 33, 353–385. https://doi. org/10.46661/revmetodoscuanteconempresa.5464 Bermúdez, B. N., Arboleda, X., & Camino, M. S. (2022). Production and business profitability in the agricultural sector of Ecuador | Producción y rentabili - dad empresarial en el sector agrícola del Ecuador. Cepal Review, 2022(137), 133–157. Peñaherrera, C., & Segovia, V. (2023). ARIMA : UN MODELO PREDICTIVO PARA LA ESTIMACIÓN DE LA PRODUCCIÓN AGRÍCOLA ECUATORIANA. 19. Rabadán, P. F., Berumen, S. A., Guiance, L. J., & Hernández, M. C. (2022). Reconstrucción y consistencia factorial: la regla del codo aplicada al RMSEA, análisis paralelo y otras pruebas confirmatorias. Revista de Métodos Cuantitativos Para La Economía y La Empresa, 33, 353–385. https://doi. org/10.46661/revmetodoscuanteconempresa.5464