Documento sin título

Escala nominal como alternativa para la evaluación de la calidad del servicio: Caso de estudio en hotel hacienda Bugambilias México

Nominal scale as alternative service quality evaluation: Study case of hacienda Bugambilias Hotel, Mexico

(*)Francisco Javier Urcádiz Cázares1; (**)Mauro Alejandro Monroy Ceseña2

(*)Instituto Tecnológico Nacional de México
Campus La Paz, México
urcadiz@me.com

(**)Universidad Autónoma de Baja California Sur
México
monroym@uabcs.mx

Fecha de recepción: 23/08/2021 - Fecha de aprobación: 29/09/2021
DOI: https://doi.org/10.36995/j.visiondefuturo.2022.26.02.005.es

RESUMEN

La calidad de servicio comúnmente se mide con instrumentos que utilizan la escala de Likert correspondiente a una variable cualitativa (ordinal o nominal) que a su vez se le asociada a una cuantitativa (discreta o continua) como un aproximado para poder realizar operaciones y comparaciones, lo cual ha generado controversia sobre el manejo estadístico e interpretación de los datos. Sin embargo, es posible realizar un análisis basando solo en la escala nominal dejando a un lado la típica escala numérica y algunas controversias. En este trabajo se plantea la medición y comparación de la calidad del servicio en un hotel utilizando dos escalas de valoración diferentes: de intervalo numérico y nominal. La percepción de la calidad del servicio del hotel fue medida durante tres temporadas vacacionales y fue contrastada mediante pruebas de hipótesis no paramétricas para observar cambios significativos cuando se valora con escala de intervalo numérico y nominal. Los resultados muestran que la calidad del servicio entre temporadas vacacionales contrasta de acuerdo con el tipo de escala. La escala nominal reveló información que la de intervalo numérico no pudo mostrar, presentando algunas ventajas para la evaluación de la calidad del servicio.

PALABRAS CLAVE: Calidad; servicio; hoteles; variable nominal; escala de Likert.

ABSTRACT

Service quality is commonly measured with instruments that use the Likert scale corresponding to a qualitative variable (ordinal or nominal) that in turn is associated with a quantitative one (discrete or continuous) as an approximate to be able to carry out operations and comparisons, which has generated controversy over the statistical management and data interpretation. However, it is possible to perform an analysis based only on the nominal scale leaving aside the typical numerical scale. In this work, the measurement and comparison of the quality of the service in a hotel are proposed using two different assessment scales: numerical-interval and nominal. The perception of the quality of the hotel service was measured during three holiday seasons and was contrasted using non-parametric hypothesis tests to observe significant changes when it is valued with a numerical and nominal interval scale. The results show that the quality of the service between holiday seasons contrasts according to the type of stopover. The nominal scale revealed information that the numerical interval could not show, presenting some advantages for the evaluation of the quality of the service.

KEYWORDS: Service; quality; hotel; nominal variable; Likert scale.

INTRODUCCIÓN

En la literatura se han documentado diversas metodologías (García y Díaz, 2008; Duque y Diosa, 2014) para valorar cómo se percibe la calidad de un servicio, donde se intenta medir qué tan bien coincide el nivel de servicio percibido con las expectativas de los consumidores (Zeithaml, Bitner y Gremler, 2013). Por otra parte, Kasiri, L. et al (2017), mencionan que, evaluar la calidad de servicio se origina principalmente de la opinión del cliente quien, a su vez, informa a la empresa si ésta realmente se encuentra ofreciendo un servicio competitivo y con una calidad aceptable. La calidad constituye una de las variables de decisión más relevantes de los compradores para elegir entre bienes y servicios en mercados competitivos, por lo que representa a la vez un factor estratégico para ubicar a las empresas en una posición competitiva favorable (Hsiao, H. y Hsiao, T. 2020). En el caso del segmento hotelero, dos de los instrumentos más utilizado son el SERVQUAL (Parasuraman, Zeithaml y Berry, 1988; Mei, Dean y White, 1999, Akbaba, 2006) y el SERVPERF (Cronin y Taylor, 1992; Choi y Chu, 2001; Al Khattab, 2011; Nashwa, 2015; Babić, Arslanagić, Banda y Sivac, 2019). Estos instrumentos usan componentes (o dimensiones) que, a su vez, conforman un constructo a estudiar (Tabla 1).

Las dimensiones son medidas en función de una escala de Likert, donde el encuestado valora de acuerdo con su percepción. La adquisición de los datos a través de las escalas de Likert y el respectivo análisis es debatible (Carifio y Perla, 2008) dado que frecuentemente se considera como escala de intervalo numérico, cuando otros autores argumentan la cualidad ordinal de la misma, y, por lo tanto, el manejo estadístico debe ser diferente (Bishop y Herron, 2015).

Tabla 1. Dimensiones del constructo calidad del servicio

Fuente: Traducción del trabajo de Parasuraman, Zeithaml y Berry (1988).

La escala de Likert

La escala de Likert consiste en un conjunto de ítems con afirmaciones, preguntas o juicios sobre un objeto de actitud (Hernández, Fernández y Baptista, 2014), cada ítem está acompañado de una escala cualitativa con un valor numérico subyacente (escala de intervalo numérico para una variable continua o discreta) bajo el supuesto que corresponde a un aproximado entre expresiones cualitativas y cuantitativas (Harpe, 2015). Por ejemplo, en la secuencia progresiva: Totalmente en desacuerdo, en desacuerdo, parcialmente de acuerdo/desacuerdo, y totalmente de acuerdo; son nominaciones que se les puede asignar valores de 1 a 5 (como escala de intervalo numérico). Esta escala es considerada por muchos autores como cualitativa ordinal (Javaras, 2004; Göb, McCollin, y Remalhoto, 2007). Sin embargo, es aquí donde se presenta la controversia por parte de la comunidad científica (Carifio y Perla, 2008; Norman, 2010), si corresponde a una escala ordinal puramente y deba tratarse con técnicas no paramétricas o si éste es un aproximado numérico válido que pueda tratarse con estadística paramétrica (Bishop y Herron, 2015).
El diseño de escalas de Likert muchas veces presenta un problema adicional al manifestar una categoría central-neutral, por ejemplo, “ni en desacuerdo, ni de acuerdo”. Por lo cual, la escala tendría dos valores en sentido “negativo” ordinal, una neutral y dos en sentido “positivo” ordinal. El uso de la categoría “neutral” es sumamente debatible (Hernández, Begoña y Vicente, 2001), ya que, las personas podrían seleccionarla por razones de indiferencia, ambivalencia, o por no tener otra elección, por lo que un análisis desde la perspectiva numérica presentaría sesgos hacia el centro. El valor central-neutral podría ocasionar problemas en la interpretación cuando se aproxima a una escala numérica. En este contexto, muchos autores recomiendan eliminar esta categoría (Hernández et al., 2001; Zeithaml et al., 2013; Streiner, Norman y Cairney, 2015) dejando solo los dos extremos de la escala como lo han implementado por ejemplo, Duque y Canas (2014) y Zambrano et al. (2015).
Una alternativa para el estudio y el análisis de los datos basados en escalas de Likert que incluyan necesariamente la categoría neutral (incluso sin ella, siempre que se planteen nominaciones como respuesta) podría ser mediante técnicas propias para una escala nominal, como el análisis de tablas de contingencias (Anderson, Sweeney, Williams, Camm y Cochran, 2018; Hernández et al., 2014) prestando atención únicamente a las frecuencias resultantes hacia un atributo por parte de los encuestados. En una escala nominal no es necesario “forzar” la valoración de una persona a una escala numérica, ni tampoco implica un orden en el sentido o dirección de las categorías, y, finalmente se evita el supuesto de que cada categoría se encuentra a una equidistancia continua. Destacablemente, tampoco requiere supuestos de normalidad como cuando se usa una escala numérica.
En este contexto, si un instrumento como el SERVQUAL o SERVPERF se maneja con una escala nominal ¿Cuál sería el resultado al analizar los datos bajo esta perspectiva? ¿Serían resultados consistentes con aquellos que utiliza una escala numérica subyacente? ¿Cuál es más informativa para los administradores de hoteles? La presente investigación aborda estos cuestionamientos.

Planteamiento de la investigación

El Hotel Hacienda Bugambilias (HHB) es un establecimiento que presta servicio de hospedaje para 224 personas en 56 habitaciones en la ciudad de La Paz, Baja California Sur, México. Se seleccionó este establecimiento debido a que, por experiencia por parte de los administradores, se mantiene más o menos homogéneo tanto el servicio como las características de los huéspedes. Antes del estudio, el hotel carecía de un modelo de evaluación de la calidad de su servicio. En este contexto, se plantea que “si las condiciones y las características del servicio de un hotel no cambian en el corto plazo (se mantienen más o menos similares), entonces la percepción de la calidad del servicio en todas sus dimensiones debería mantenerse constante para la población de huéspedes, con una variabilidad o distribución determinable” Para confrontar esta hipótesis, la investigación compara la percepción de la calidad del servicio en el HHB en tres momentos en el corto plazo, durante las temporadas vacacionales de invierno, semana santa y verano (2016-2017).
De acuerdo con lo anterior, el propósito de esta investigación es 1) determinar la calidad en el servicio en el HHB mediante el instrumento SERVPERF y 2) comparar la calidad durante tres temporadas vacacionales implementando dos perspectivas no paramétricas diferentes. En una perspectiva, se considera una escala de Likert con variable de tipo cuantitativo continuo (escala de intervalo numérico, como tradicionalmente se implementa) y la otra utilizando la escala con variable cualitativa nominal.

DESARROLLO

Contexto metodológico de la investigación

De acuerdo con el arreglo conceptual de Hernández, Fernández, y Baptista (2014), la presente investigación corresponde a un enfoque cuantitativo (documental y de campo) con diseño no experimental y longitudinal de tendencia, debido a que, el propósito es analizar los posibles cambios (un efecto) en un periodo definido en tres momentos de la percepción de la calidad del servicio para un solo establecimiento hotelero.
Se considera como hipótesis nula que “la percepción de la calidad en el servicio por parte de los huéspedes se mantiene igual entre temporadas tanto por ítem y como por dimensión”, analizando los datos mediante prueba de hipótesis con técnicas de estadísticas no paramétrica, propias para la escala nominal.

Instrumento de medición

Para medir la calidad del servicio del HHB, se empleó el instrumento SERVPERF (Cronin y Taylor, 1992) con amplio uso en investigaciones de calidad y consistentemente adaptado a diferentes sectores económicos (Duque y Canas, 2014; De Barros, Queiroz, da Silva, da Silva y Calacanti, 2015; Ibarra y Casas, 2014; Torres y Luna, 2017; Monroy y Urcádiz, 2019). El instrumento mide el concepto de calidad por medio de las actitudes percibidas de los usuarios en cinco dimensiones (tabla 1). A cada dimensión se le atribuye de tres a cuatro preguntas (ítems). En la versión original, el instrumento contiene 22 ítems (Parasuraman, Zeithaml y Berry, 1988) con una escala de Likert seccionada del 1 al 7 con dos únicas leyendas “totalmente de acuerdo” hasta “totalmente en desacuerdo” en cada extremo (sin leyendas intermedias).
En esta investigación, se utilizaron 17 ítems (tabla 2) consistentes con el SERVPERF y se excluyeron cinco debido a que dichas preguntas fueron modificadas para un estudio paralelo (Treviño, 2018).

A diferencia del instrumento SERVPERF original, esta investigación adoptó una escala explícitamente ordinal y una escala de intervalo numérico (Fig. 1), distribuida en cinco valores como lo recomienda Mata (2018) y Hernández, Fernández y Baptista (2014).

La escala presenta dos valores de desacuerdo, uno neutro y dos valores de acuerdo (cómo ocurre generalmente en la literatura), así como el valor del 1 al 5 tomados como aproximados de los anteriores, de esta manera, se obtuvo la percepción con dos escalas que permitieron el análisis de datos desde las dos perspectivas diferentes. Este estudio considera a la escala como nominal debido a que incorporó la categoría central previamente discutida. Cabe señalar que la escala de Likert con valor neutro (intermedio) es recurrentemente utilizada en los estudios de ciencias sociales y de la humanidad (Mata, 2018). En el instrumento, también se agregaron preguntas sobre algunos rasgos demográficos: sexo, edad, estado civil, nacionalidad, entidad federativa de procedencia y número de noches de hospedaje.
El instrumento SERVPERF ha demostrado confiabilidad y validez en varios estudios; incluso, cuando se realizan adaptaciones o modificaciones para diferentes sectores socioeconómicos (García y Díaz, 2008; Duque y Diosa, 2014). En este caso, el instrumento no se ha modificado (solo se ha traducido al español) por lo cual no fue necesario un análisis de validación o confirmación. No obstante, debido a que se redujo a 17 ítems, se estimó la confiabilidad del instrumento por medio del coeficiente de Alfa de Cronbach (Feldt, Woodruff y Salih, 1987), el cual arrojó un intervalo de confianza del 95% de 0.90 a 0.93 para la consistencia interna de los ítems, por lo cual, el instrumento se considera elevadamente confiable (Hernández et al., 2014).

Tabla 2. Instrumento SERVPERF con la numeración original (Parasumaran, Zeithaml y Berry, 1988). D=dimensión, T=elementos tangibles, F=fiabilidad, R=capacidad de respuesta, S=seguridad y E= empatía

Fuente: Cuestionario utilizado por los autores

Colecta y descripción de los datos

La población de estudio se define como los huéspedes del HHB mayores de edad en el periodo 2016-2017. En promedio, el hotel recibe 8,355 clientes por año (Treviño, 2018) de los cuales, se muestrearon de manera aleatoria simple un total de 258 personas en tres temporadas: 70 para la temporada vacacional de invierno (diciembre 2016 hasta enero del 2017), 81 para la temporada de semana santa (abril del 2017) y 107 para verano (julio y agosto del 2017). La muestra representa el 3% de la población finita promedio anual. Los rasgos de la estructura demográfica para cada temporada se compararon estadísticamente mediante el software Minitab 17. En el mismo se realizaron pruebas de hipótesis para diferencia de proporciones y diferencia de medias para la edad, sexo, estados civil y noches de hospedaje. El procedimiento anterior se realizó para establecer sí hay diferencias en estos rasgos entre las tres temporadas vacacionales.

Figura 1. Escala empleada en el instrumento de medición. Arriba la escala ordinal y debajo su aproximado numérico. Debido a que se incorpora la categoría neutral “ni de acuerdo ni en desacuerdo” la escala se manejó como nominal. 1.
Fuente: Elaboración propia de los autores.

Pruebas no paramétricas entre temporadas

Para la perspectiva con variable cuantitativa (donde se considera la escala continua entre 1 y 5) se obtuvieron los estadísticos muestrales de la media, desviación estándar, curtosis y sesgo con el software Minitab 17 para describir la calidad en el servicio por cada ítem y dimensión según la temporada vacacional. En el mismo, se implementó la prueba de Kruskal-Wallis (Anderson, Sweeney, Williams, Camm y Cochran, 2018) la cual contrasta el valor de las medianas entre las tres temporadas vacacionales (como factor) para cada ítem, bajo la hipótesis nula de que el valor promedio (mediana) es igual entre temporadas con un nivel de significancia de 0.01. Esta prueba se seleccionó por que los datos no satisfacen los supuestos de normalidad para un análisis de varianza (ANOVA) de un factor con estadística paramétrica. Para comparar las dimensiones por temporada (factor), se unieron todos los datos de los ítems según la dimensión y se realizó la prueba anteriormente mencionada. Por ejemplo, el ítem 1+ ítem 2 + ítem 3 = dimensión de elementos tangibles.
Para la perspectiva con variable cualitativa (nominal) se realizaron gráficas de barras y pruebas de hipótesis de homogeneidad para tablas de contingencia (Anderson, Sweeney, Williams, Camm y Cochran, 2018) por medio de la distribución de Pearson con el estadístico de prueba:

Donde Oi corresponde a las frecuencias observadas para k número de categorías (en este caso k=5 categorías, desde totalmente en desacuerdo hasta totalmente de acuerdo, Fig.1) y Ei a las frecuencias esperadas homogéneamente, considerando como la variable controlada a la temporada de vacaciones. El nivel de significancia utilizado fue de 0.01, esto es un 99% de nivel de confianza. Este procedimiento pone a prueba sí la distribución de las frecuencias categóricas para cada uno de los ítems es la misma entre las tres temporadas vacacionales (hipótesis nula). Finalmente, para comparar las dimensiones entre las tres temporadas se utilizó la misma prueba, pero considerando la suma total de las frecuencias obtenidas para cada ítem según la dimensión, de esta manera la suma de frecuencias representa el valor observado. El planteamiento anterior pone a prueba si la distribución de las sumas de los valores por dimensión es la misma entre las temporadas.

Resultados y discusiones

Las características demográficas de los huéspedes que visitaron el HHB durante las temporadas vacacionales de invierno, semana santa y verano, fueron similares de acuerdo con los estadísticos obtenidos (tabla 3).

La media de edad, así como la proporción de sexo y la nacionalidad no presentaron diferencias significativas en un nivel de significancia de 0.01. A pesar de que los huéspedes fueron encuestados en temporadas diferentes los datos sugieren que mantienen características homogéneas. Otros rasgos de la estructura demográfica no considerados en la encuesta, por ejemplo, las creencias, la religión, las emociones, entre otras, podrían tener un efecto sobre la percepción del servicio. No obstante, el procedimiento aleatorio y tamaño de muestra es suficiente para una representación aceptable de la población estadística de estudio.

Calidad en el servicio medida con escala de intervalo (variable cuantitativa)

La calidad del servicio percibida del HHB por ítem, presentan una baja variabilidad en el promedio (media aritmética) al igual que la dispersión (desviación estándar) cuando se compara longitudinalmente entre las temporadas vacacionales (apéndice 1).

Las medidas de forma indican una amplia variabilidad y una moderada a fuerte asimetría y curtosis entre temporadas. El valor promedio más alto fue de 4.3 para en el ítem 9, sobre el esfuerzo en mantener un registro sin errores en la dimensión de fiabilidad. En contraparte, el valor promedio más bajo fue de 3.38 para el ítem 16, el cual corresponde a la percepción de la cortesía por parte de los empleados en la dimensión de seguridad. Las valoraciones realizadas por los huéspedes a nivel ítem ofrecen información valiosa para la identificación de las debilidades y de las fortalezas en el servicio del hotel de acuerdo con la escala, pero, sobre todo, potencialmente podría ayudar en las mejoras organizacionales y toma de decisiones en función de un indicador numérico promedio.

Tabla 3. Características generales de los huéspedes. es la media, s la desviación estándar y p la proporción. * Valor p >0.01 de la prueba de diferencia de medias y proporciones

Fuente: De los datos obtenido en las entrevistas propias

Tabla 4. Pruebas de Kruskal-Wallis por ítems. D=dimensión, H=estadístico de prueba, GL=grados de libertad

Fuente: Elaboración propia de los autores

A pesar de que el valor promedio presenta una variabilidad para las medias de los ítems individuales entre temporadas, la prueba de hipótesis de Kruskal-Wallis (tabla 4), indica que no existe diferencia significativa entre los valores de las medianas en las tres temporadas, bajo un nivel de confianza del 99%.

Este resultado demuestra que la evidencia estadística no es suficiente para sostener que los valores promedios son diferentes entre temporadas vacacionales, si se considera un análisis independiente por ítem.
Por otra parte, la calidad percibida por dimensión (tabla 5) presentó valores similares entre temporadas.

La valoración promedio más baja y alta entre temporadas se obtuvo en la temporada de invierno con 3.74 para los elementos tangibles del hotel y 4.13 por la capacidad de respuesta. De acuerdo con la prueba de hipótesis de Kruskal-Wallis por dimensión (tabla 6), no se encontró diferencia significativa entre los valores de las medianas en las tres temporadas con un nivel de confianza del 99%.

Tabla 5. Estadísticos de la calidad del servicio por dimensión. es la media, s la desviación estándar

Fuente: Elaboración propia de los autores

Los resultados indican que la percepción de la calidad del servicio fue valorada por igual en las tres temporadas vacacionales. Las pruebas de hipótesis tanto de los ítems como de las dimensiones, sostiene el postulado “al no cambiar las condiciones y las características del servicio de un hotel, tampoco lo haría la percepción de la calidad en el servicio promedio”.
Es evidentemente que la percepción es un constructo que evoluciona según las características sociales y culturales de la población, por lo tanto, es susceptible a cambiar en un tiempo prolongado, tal vez a mediano o largo plazo. No obstante, el tiempo designado en este estudio fue suficientemente corto para evitar una influencia por un cambio de naturaleza sociocultural.

Tabla 6. Pruebas de Kruskal-Wallis por dimensión. H=estadístico de prueba, GL=grados de libertad

Fuente: Elaboración propia de los autores

Calidad del servicio medida con escala nominal (variable cualitativa)

Desde esta perspectiva, la valoración de la calidad del servicio del HHB por ítem se muestra mediante las distribuciones de frecuencia en el apéndice 2. En términos generales, las distribuciones permanecen similares al compararlas entre las tres temporadas vacacionales. Por ejemplo, para el ítem 2 sobre la percepción de “las instalaciones son atractivas a la vista”, los huéspedes se inclinaron con mayor frecuencia por estar “de acuerdo” en un 57, 57 y 55% en inverno, semana santa y verano respectivamente. La segunda nominación más frecuente fue “ni en desacuerdo, ni de acuerdo” con un 27, 26 y 24% en el mismo orden temporal. En lo sucesivo, las frecuencias se mantienen similares en la mayoría de los ítems, lo cual indicaría que la temporalidad vacacional no es un factor para atribuir un cambio en la percepción según la distribución de las categorías.
Sin embargo, la prueba de homogeneidad por cada ítem (tabla 7) indica que no hay diferencia significativa entre temporadas en 13 de los 17 ítems.

Las excepciones fueron el ítem 8 de la dimensión fiabilidad, 11 y 12 de la capacidad de respuesta y 19 de la empatía, los cuales, si presentan una diferencia en la distribución de frecuencias en al menos una temporada vacacional. Por ejemplo, en el caso del ítem 11 “yo no recibo un servicio con prontitud de los empleados del HHB” en semana santa el 42% sostienen estar “ni en desacuerdo, ni de acuerdo”, mientras que para la temporada de invierno el 21% considera esta nominación. En adición, en semana santa el 26% estaba “totalmente de acuerdo” mientras que en verano el 38% consideró dicha nominación. Cabe resaltar que en verano el 12% manifestó “no estar de acuerdo” con el ítem, mientras que en semana santa e invierno solo una persona se inclinó por no estar de acuerdo. Estos cambios porcentuales de la calidad percibida hacia los atributos nominales tanto del ítem 11, así como para el resto de los casos donde se rechazó la hipótesis nula, propician una diferencia de manera significativa entorno a la distribución por temporadas.

Tabla 7. Pruebas de homogeneidad para tablas de contingencia por ítems. Rechazo de la hipótesis nula*. D=Dimensión, 2=estadístico de prueba, GL=grados de libertad

Fuente: Elaboración propia de los autores

En el análisis por dimensión, durante las tres temporadas, la empatía consistentemente registró mayor frecuencia, donde el 68%, 69 y 69% de los huéspedes optaron por estar “de acuerdo”. Dado que la nominación “de acuerdo” y “totalmente de acuerdo” corresponde a un mismo sentido positivo y son excluyentes a los otros atributos, al unir los porcentajes se obtiene un indicador robusto de la calidad percibida, el cual presenta una correlación lineal moderada (r=0.724, Fig. 2) con el indicador de la media cuando se considera la escala numérica continua.

Esta relación es una manera de visualizar como ambos indicadores convergen.

Figura 2. Correlación de lineal de Pearson de la unión de las categorías nominales “de acuerdo” con “totalmente de acuerdo” (ATA, en porcentaje) con la media aritmética de la escala continua. 2.
Fuente: Elaboración propia de los autores

No obstante, respecto a las distribuciones de frecuencia por dimensión, las pruebas de homogeneidad (tabla 8) indican que tres de cinco dimensiones presentan evidencia estadística suficiente para sostener que las distribuciones son diferentes.

La dimensión de fiabilidad, capacidad de respuesta y empatía presenta un valor p <0.01. La dimensión de elementos tangibles y seguridad no mostraron diferencias, por lo cual, en estas últimas, los huéspedes valoraron de manera similar los atributos en las tres temporadas vacacionales.
Desde esta perspectiva, las pruebas entre temporadas a nivel ítem y dimensión, no pueden sostener de manera contundente la hipótesis de investigación planteada, al considerar la distribución de frecuencias de los atributos nominales.

Comparación de perspectivas (variable cuantitativa vs cualitativa)

Los resultados de ambas perspectivas contrastan de acuerdo con las respectivas pruebas, cuando se compara la calidad en las diferentes temporadas vacacionales. Si bien, en ambas perspectivas se obtuvieron indicadores de la calidad del servicio potencialmente útil para la toma de decisiones y la mejora organizacional del HHB, la perspectiva cualitativa nominal devela información que la cuantitativa no evidenció estadísticamente.

Tabla 8. Pruebas de hipótesis de homogeneidad por dimensión. Rechazo de la hipótesis nula*. D=Dimensión, =estadístico de prueba, GL=grados de libertad

Fuente: Elaboración propia de los autores

Desde la perspectiva cuantitativa entorno al promedio (mediana) se muestra que la calidad del servicio por ítem y por dimensión no son diferente de manera significativa entre las tres temporadas. Se interpreta que la calidad promedio por parte del servicio del HHB se mantuvo constante durante las tres temporadas, considerando que la muestra capturó representativamente a la población de estudio bajo el ejercicio aleatorio implementado. En el mismo rubro, las características de los huéspedes se mantuvieron similares, lo cual sugiere en términos generales, que grupos vacacionales con edades próximas y proporciones similares de sexo y nacionalidad, tienen una percepción promedio igual a partir del uso de la escala cuantitativa.
En contraparte, desde la perspectiva de la variable cualitativa, la distribución de frecuencias de los valores nominales en 4 de 17 ítems y tres de cinco dimensiones, fueron diferentes entre las temporadas. Se destaca que los ítems 8, 11, 12 y 19 con valor p<0.01 corresponden a las dimensiones que también fueron significativamente diferentes entre temporadas, por lo cual, esta perspectiva también es consistente entre ítems y dimensiones. Esto indica que una valoración diferente para un ítem bajo la escala nominal es suficientemente sensible para influir en el rechazo de la hipótesis nula de la dimensión correspondiente, al menos en este caso de estudio.
La perspectiva cualitativa detectó información que la cuantitativa no pudo develar. Por ejemplo, en el caso del ítem 11 sobre “yo no recibo un servicio con prontitud de los empleados del HHB” el promedio para las temporadas fue de 4.1, 3.8 y 3.9 respectivamente, indicando valoraciones similares, estos datos contrastan con el porcentaje de las personas que estuvieron “ni en desacuerdo, ni de acuerdo” con un 22%, 42% y 20% respectivamente, donde el 42% sostiene una postura neutral sin inclinarse en sentido positivo o negativo con dicho planteamiento. Por lo cual, las valoraciones en la escala nominal pueden ser diferentes y la valoración en la cuantitativa podría ser igual o similar (sin diferencia significativa). Una explicación de esta discrepancia es que diferentes escenarios de distribuciones de frecuencia para una variable cualitativa podrían arrojar la misma información cuantitativa en promedio. En la Fig. 3 se generalizan tres escenarios hipotéticos donde la media y mediana son similares pero la distribución nominal es diferente, denotando información que no es posible observar cuando se usan promedios como indicador.

Figura 3. Comparación de escenarios hipotéticos. Si se considera a la variable como cuantitativa (escala de intervalo del 1 al 5) los indicadores como la media y mediana permanecen similares, pero se considera como variable nominal, la distribución de frecuencias de la gráfica de barras es totalmente diferente. La escala desde la perspectiva nominal es: 1=Totalmente en desacuerdo, 2=De acuerdo, 3=Ni de acuerdo, ni en desacuerdo, 4=De acuerdo, 5=Totalmente de acuerdo.
Fuente: Elaboración propia de los autores

En suma, ambas perspectivas son herramientas útiles para el análisis de datos para instrumentos basado en percepciones con escala de Likert, no obstante, el análisis cualitativo nominal basado en distribución de frecuencias multinominales presenta información adicional al análisis tradicional (numérico continuo) con la ventaja de no tener que suponer que la escala numérica es un aproximado a la de Likert ordinal. Otra ventaja, es que se evita la problemática del valor neutro discutido por Hernández (2001), debido a que en la escala nominal no importa el orden de las categorías. Desde una óptica práctica, los administradores y tomadores de decisiones podrían centrarse en el porcentaje de las personas que estén “de acuerdo” o “totalmente de acuerdo” (o ambas) para una dimensión o ítem en particular durante un monitoreo de la calidad de corto a mediano plazo, en vez de solo monitorear un promedio. Esta perspectiva de análisis podría utilizarse de manera complementaria a la manera tradicional, siempre que la escala sea nominal u ordinal y se manifieste en las categorías el valor neutro en las respectivas encuestas. La técnica es útil para cualquier instrumento que use escala nominal no solo para la industria hotelera, sino para cualquier sector económico.
Por otro lado, una de las limitaciones de este estudio fue que los datos fueron manipulados o transformados, es decir, no fueron normalizados para que ambas perspectivas fueran puestas a prueba de manera no paramétrica. Los huéspedes fueron encuestados preguntando sobre sus condiciones socioculturales limitadas a la edad, sexo, estado civil, número de días y nacionalidad. Otras condiciones como las creencias, emociones, religión, entre otros, podrían tener un efecto no previsto en la investigación.
El presente estudio utilizó una escala doble con el propósito de comparar dos perspectivas metodológicas no paramétricas, develando el potencial uso de las escalas nominales de valoración. Se deja en claro que no se recomienda el uso sistemático de las dos escalas al mismo tiempo para estudios de evaluación de la calidad del servicio. De lo contrario, bajo una perspectiva cuantitativa, recomendamos utilizar escalas con letreros en los dos extremos, sin etiquetas intermedias, solo con números consecutivos, para aproximarse a una variable cuantitativa. Por otro lado, si la escala se considera cualitativa ordinal, se recomienda dejar solo las categorías en orden, sin etiquetas numéricas, sin categorías neutrales utilizando las técnicas estadísticas como las presentadas por Javaras (2004) y Göb, McCollin y Remalhoto (2007). Por último, en el caso de en un estudio sea necesario utilizar una escala con categoría neutral, se recomienda el uso de la escala nominal, sin números, utilizando las técnicas discutidas en el presente estudio. Recomendamos definir un tipo de perspectiva (variable) y sensibilizar al encuestado sobre la escala y sus opciones de valor.

CONCLUSIONES

En este trabajo de tipo longitudinal, se determinó la calidad del servicio percibida por los huéspedes del HHB por medio del instrumento SERVPERF en tres temporadas vacacionales utilizando dos perspectivas diferentes: una donde la escala de Likert se considera como cuantitativa continua (como se maneja de manera tradicional en la literatura) y otra tomando la escala como nominal, innovando el uso de técnicas no paramétricas como una alternativa para la descripción y análisis de la calidad del servicio, en este caso para la industria hotelera, pero con aplicación a cualquier industria o sector económico. Al comparar el comportamiento de los datos en las tres temporadas, la perspectiva cuantitativa sugiere que no hay diferencia significativa de la calidad percibida en promedio (mediana) por parte de los huéspedes. Lo anterior, tanto a nivel ítem como a nivel dimensional. Estos datos, sostiene la hipótesis planteada de que “sí las condiciones y las características del servicio en un hotel no cambian en el corto plazo, entonces la percepción de la calidad del servicio en todas sus dimensiones debería mantenerse constante para la población de estudio”. En contraste, desde la perspectiva cualitativa (con escala nominal), la distribución de frecuencia de las categorías sí presentó una diferencia significativa en las dimensiones de fiabilidad, capacidad de respuesta y empatía en al menos una temporada, rechazando parcialmente la hipótesis planteada desde este enfoque.
Más allá de rechazar o no rechazar la hipótesis de investigación, el análisis de datos considerando la escala nominal, develó información que la escala numérica tradicional no registró. Se deduce que los promedios (media o mediana) de la calidad del servicio desde la perspectiva numérica para una dimensión dada, pueden mantenerse constantes en el corto plazo, pero las distribuciones de frecuencia de las categorías pueden ser significativamente diferentes, como se evidenció en este estudio. La escala nominal presenta ventajas sobre la tradicional, sobre todo en que no supone un aproximado numérico continuo, ni tampoco implica un orden en las categorías, ni implica supuesto de normalidad, por lo que es potencialmente una alternativa viable para la valoración de la calidad del servicio cuando se requiere el uso de la categoría “neutral”, incluso, para otras nominaciones particulares.

RESUMEN BIBLIOGRÁFICO

Francisco Javier Urcádiz Cázares
Dr. En Ciencias Marinas (2018) en el instituto Politécnico Nacional. Profesor en el área de las Ciencias Básicas del Tecnológico Nacional de México. Cuenta con estudios en diseño y aplicación de métodos estadísticos. Realiza investigación en el tiempo libre. Miembro de la IASE (International Association for Statistical Education) y ANPM (Asociación Nacional de Profesores de Matemáticas). ORCID: https://orcid.org/0000-0001-8072-8162

Mauro Alejandro Monroy Ceseña
Profesor – Investigador de la Universidad Autónoma de Baja California Sur adscrito al Departamento Académico de Economía. Doctor en Ciencias Administrativas en el Instituto Universitario de Puebla. Cuenta con investigaciones publicadas en las áreas de conocimientos de: Calidad de servicio, satisfacción del cliente, lealtad y mercadotecnia aplicada. ORCID ID: https://orcid.org/0000-0001-7175-9362

NOTAS

1. Profesor - investigador de asignatura adscrito al Tecnológico Nacional de México, en el Instituto Tecnológico de La Paz, Departamento de Ciencias Básicas. Doctorado en Ciencias Marinas en el Instituto Politécnico Nacional. Sus líneas de investigación aplicadas a la empresa son el diseño y análisis estadístico multidisciplinario. ORCID ID: 0000-0001-8072-8162 urcadiz@me.com

2. Profesor – Investigador de la Universidad Autónoma de Baja California Sur adscrito al Departamento Académico de Economía. Doctor en Ciencias Administrativas en el Instituto Universitario de Puebla. Cuenta con investigaciones publicadas en las áreas de conocimientos de: Calidad de servicio, satisfacción del cliente, lealtad y mercadotecnia aplicada. ORCID ID: https://orcid.org/0000-0001-7175-9362. monroym@uabcs.mx

REFERENCIAS BIBLIOGRÁFICAS

1.Akbaba, A. (2006). “Measuring service quality in the hotel industry: a study in a business hotel in Turkey”. International Journal of Hospitality Management, 25, 170-192. https://doi.org/10.1016/j.ijhm.2005.08.006
2.Al Khattab, S., y Aldehayyat, J. S. (2011). Perceptions of Service Quality in Jordanian Hotels. International Journal of Business and Management, 6(7), 226–233. https://doi.org/10.5539/ijbm.v6n7p226
3.Anderson, D. R., Sweeney, D. J., Williams, T. A., Camm, J. F., y Cochran, J. J. (2018). Statistics for business y economics. (13th Ed) USA: Cengage Learning.
4.Babić-Hodović, V., Arslanagić-Kalajdžić, M., Banda, A., y Sivac, A. (2009). IPA and SERVPERF quality conceptualizations and their role in hotel services satisfaction. Tourism and Hospitality Management, 25(1), 1-17. https://doi.org/10.20867/thm.25.1.4
5.Bishop, P. A., y Herron, R. L. (2015). Use and Misuse of the Likert Item Responses and Other Ordinal Measures. International. Journal of Exercise Science, 8(3), 297-302. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4833473/
6.Brady, M. K., Cronin, J., y Brand, R. (2002). Performance only measurement of service quality: a replication and nnovando. Journal of Business Research, 55(1), 17 – 31. https://doi.org/10.1016/S0148-2963(00)00171-5
7.Carifio, J., y Perla, R. (2008). Resolving the 50-year debate around using and misusing Likert scales. Medical Education, 42(12):1150–1152. https://doi.org/10.1111/j.1365-2923.2008.03172.x
8.Ceseña Monroy, M. A., y Urcádiz Cázares, F. J. (2019). Calidad en el servicio y su incidencia en la satisfacción del comensal en restaurantes de La Paz, México. Investigación Administrativa, 48, 123. http://www.scielo.org.mx/scielo.php?script=sci_arttextypid=S2448-76782019000100006ylng=esytlng=es.
9.Choi, T., y Chu, R. (2001). Determinants of hotel guests’ satisfaction and repeat patronage in the Hong Kong hotel industry. International Journal of Hospitality Management, 20(3), 277–297. https://doi.org/10.1016/S0278-4319(01)00006-8
10.Cronin, J., y Taylor, S. (1992). “Measuring service quality: a reexamination and extension”. Journal of Marketing, 56, 55-68. https://doi.org/10.2307/1252296
11.Cronin, J., y Taylor, S. (1994). SERVPERF versus SERVQUAL: Reconciling performance-based and perceptions-minusexpectations measurement of service quality. Journal of Marketing, 58, 125-131. https://doi.org/10.1177/002224299405800110
12.De Barros, J. T., de Queiroz, V. B., da Silva, C. F., da Silva, N. P., y Calacanti, A. M. (2015). nnovando a estratégia de gestão da qualidade pelo uso do Desdobramento da Função Qualidade combinado com SERVPERF em empresas de prestação de serviços. Exacta, 13(2), 167-176. https://doi.org/10.5585/ExactaEP.v13n2.5339.
13.Duque Oliva E. J, y Diosa Gómez Y. (2014). Evolución conceptual de los modelos de medición de la percepción de calidad del servicio: una mirada desde la educación superior. Suma de Negocios, 5(12), 180-191. http://dx.doi.org/10.1016/j.neucir.2013.12.001
14.Duque Oliva, E. J., y Canas Baquero, J. A. (2014). Validación del modelo SERVPERF en el ámbito de internet: un caso colombiano. Suma de negocios, 5(12), 115-123. http://dx.doi.org/10.1016/j.neucir.2013.12.001
15.Feldt, L. S., Woodruff, D. J., y Salih, F. A. (1987). Statistical inference for coefficient alpha. Applied Psychological Measurement, 11, 93-103. https://doi.org/10.1177/014662168701100107
16.García Mestanza, J., y Díaz Muñoz, R. (2008). Comparativa entre distintos sistemas de mediación de calidad de servicio. EsicMarket, 130, 57–97. https://www.esic.edu/editorial/editorial_revista_esic_contenidos.php?id=231
17.Göb, R., McCollin, C., y Remalhoto, M. F. (2007). Ordinal methodology in the Analysis of Likert Scales. Quality y Quantity, 41, 601-626. https://doi.org/10.1007/s11135-007-9089-z
18.Harpe, S. E. (2015). How to analyze Likert and other rating scale data. Currents in Pharmacy Teaching and Learning, 7(6), 836-850. https://doi.org/10.1016/j.cptl.2015.08.001
19.Hernández Baeza, A., Begoña Espejo, T., y Vicente González, R. (2001). Escalas de respuesta tipo Likert: ¿Es relevante la alternativa “indiferente”? Metodología de Encuestas, 3(2), 135-150. http://hdl.handle.net/10550/39081
20.Hernández Sampieri, R., Fernández Collado, C., y Baptista, L. (2014). Metodología de la Investigación, (6ª Ed.). México: McGraw Hill Education.
21.Hsiao, Y.-H. y Hsiao, Y.-T. (2021). Online review analytics for hotel quality at macro and micro levels, Industrial Management & Data Systems, Vol. 121 (2), p. 268-289. https://doi.org/10.1108/IMDS-04-2020-0214
22.Ibarra Morales, L. E., y Casas Medina, E. V. (2014). Aplicación del modelo Servperf en los centros de atención Telcel, Hermosillo: una medición de la calidad en el servicio. Contaduría y Administración, 60(1), 229-260. http://dx.doi.org/10.1016/S0186-1042(15)72153-4
23.Javaras N. K. (2004). Statistical Analysis of Likert Data on Attitudes. Doctoral Dissertation. Oxford University.
24.Kasiri, L. A., Cheng G., K., T., Sambasivan, M. y Sidin, S., M. (2017). Integration of standardization and customization: Impact on service quality, customer satisfaction, and loyalty. Journal of Retailing and Consumer Services, 35 (2017) 91–97.
https://doi.org/10.1016/j.jretconser.2016.11.007
25.Mata, A. (2018). Diseño del formato de escalas tipo Likert: un estado de la cuestión. Revista Electrónica e Investigación Educativa, 20(1). https://doi.org/10.24320/redie.2018.20.1.1347
26.Mei, A. W., Dean, A., y White, C. J. (1999). Analyzing service quality in the hospitality industry. Managing Service Quality, 9(2), 136 – 143. https://doi.org/10.1108/09604529910257920
27.Nashwa, F. A. (2015). Evaluation of perceived service quality provided by tourism establishments in Egypt. Tourism and hospitality Research, 15(3), 149-160. https://doi.org/10.1177/1467358414567916
28.Norman, G. 2010. Likert scales, levels of measurement and the “laws” of statistics. Advances in Health Sciences Education, 15 (5), 625-635. https://doi.org/10.1007/s10459-010-9222-y
29.Parasuraman, A., Zeithaml, V. A., y Berry, L. L. (1988). SERVQUAL: A multiple-item scale for measuring consumer perceptions of service quality. Journal of Retailing, 64(1), 12–40.
30.Streiner, D. L., Norman G. R., y Cairney, J. (2015). Health Measurement Scales: A Practical Guide to Their Development and Use. (5th Ed.). USA: Oxford University Press.
31.Tam, J. L. (2000). The effects of service quality, perceived vale and customer satisfaction on behavioral intentions. Journal of Hospitality and Leisure Marketing, 6(4), 31 – 43. https://doi.org/10.1362/0267257041838719
32.Torres Fragoso, J., y Luna Espinoza, I. (2017). Evaluación de la percepción de la calidad de los servicios bancarios mediante el modelo SERVPERF. Contaduría y administración, 62(4), 1270-1293. https://doi.org/10.1016/j.cya.2016.01.009
33.Treviño Aguilar, G.G. (2018). Evaluación de la calidad en el servicio, caso de estudio: Hotel Hacienda Bugambilias. Tesis de maestría, Universidad Autónoma de Baja California Sur.
34.Zambrano, R., Gil, N., Lopera, E., Carrasco, N., Gutiérrez, A., y Villa, A. (2015). Validez y confiabilidad de un instrumento de evaluación de estrategias docentes en la práctica de la enseñanza universitaria. MAGISTER, 21, 23-36. https://doi.org/10.1016/j.magis.2015.06.002
35.Zeithaml, V., Berry, L., y Parasuraman, A. (1996). The behavioral consequences of service quality. Journal of Marketing, 60(2), 31–46. https://doi.org/10.2307/1251929
36.Zeithaml, V., Bitner, M., y Gremler, D. (2013). Services Marketing. (6th Ed.) McGraw-Hill, New York.

APÉNDICES

Apéndice 1. Estadísticos de la calidad en el servicio por ítem. As=coeficiente de asimetría, Cu=curtosis

Fuente: Elaboración propia de los autores

Apéndice 2. Distribución de frecuencia (por ítem y dimensión) considerando a la variable como cualitativa nominal. TD= Totalmente en desacuerdo, D= En desacuerdo, NDA= Ni de acuerdo ni en desacuerdo, A= De acuerdo, TA= Totalmente de acuerdo.

Fuente: Elaboración propia de los autores