Introducción
Una pregunta de interés en los estudios psicolingüísticos implica conocer cómo opera el procesador sintáctico, o parser, para organizar las palabras en estructuras específicas y qué información utiliza para eso. En este sentido, el estudio del procesamiento sintáctico y la comprensión de oraciones se ha centrado en construcciones que son estructuralmente complejas, como aquellas que presentan ambigüedades sintácticas, es decir, frases que exhiben más de una estructura interpretable, en las que el parser debe imponer restricciones o aplicar reglas para definir qué adjunción prevalecerá en la interpretación final. Por ejemplo, en una oración como la del ejemplo (1), la cláusula relativa (CR) “que huyó después del robo” se puede interpretar como dependiente de dos sintagmas nominales distintos: la estructura permite una adjunción alta o cierre temprano, asociando la CR al primer nombre -“el cómplice”-, o una adjunción baja o cierre tardío, si se asocia al segundo -“el ladrón”-.
(1) La mujer reconoció al cómplice del ladrón que huyó después del robo.
Inicialmente, el Modelo de vía muerta (Frazier & Fodor, 1978; Frazier & Rayner, 1982) proponía que el procesador sintáctico seguía preferencias de adjunción universales, para todas las lenguas y todas las estructuras sintácticas dentro de las lenguas. Sin embargo, en los últimos cuarenta años, se han llevado a cabo una gran cantidad de estudios experimentales en distintas lenguas que sugieren fuertemente que las preferencias de adjunción presentan variación. A partir de estas investigaciones empíricas, se han presentado diferentes propuestas para hacer frente a la ausencia de una preferencia de adjunción sistemática: Modelo construal (Frazier & Clifton, 1996), Hipótesis de ajuste lingüístico (Mitchell & Cuetos, 1991), Hipótesis de recencia y proximidad del predicado (Gibson, Pearlmutter, Canseco-González & Hickok, 1996), Hipótesis de la prosodia implícita (Fodor, 2002), Hipótesis de las pseudorrelativas primero (Grillo & Costa, 2014), Modelo de equilibrio cognitivo (Karimi & Ferreira, 2015), entre otras. Si esa variación existe efectivamente y qué la explica es un debate en curso que pareciera estar lejos de cerrarse (para una revisión ver Stetie, 2021a).
En este artículo, nos interesa profundizar en las variaciones que se pueden presentar dentro de una misma lengua. El experimento que desarrollamos tiene como objetivo estudiar las preferencias de adjunción en español, con el fin de contribuir a la comprensión de los mecanismos involucrados en el procesamiento sintáctico. En particular, presentamos los datos del primer estudio de procesamiento de CR con doble antecedente nominal realizado con hablantes de español rioplatense y en una población amplia.
Diseñamos una tarea de lectura y comprensión de oraciones para evaluar las preferencias de adjunción frente a estructuras ambiguas. Con el propósito de evaluar si dichas preferencias se mantienen constantes o se modifican en función de diversas estructuras sintácticas, manipulamos la posición de la CR (2 niveles: sujeto y objeto). Además, a partir del tipo de respuesta de los participantes, organizamos dos grupos (adjunción al primer antecedente y al segundo), lo que constituyó un segundo factor de análisis.
La hipótesis central que planteamos para el experimento supone que existirá un efecto de la posición de la CR. Concretamente, esperamos que haya una preferencia por la adjunción alta para las CR en posición de objeto, tal como se ha registrado en estudios previos en otras variedades de español (Stetie, 2021b). Esta preferencia se evidenciará no sólo en el tipo de respuesta, sino también en el tiempo que toma hacer la elección. A su vez, esperamos encontrar una preferencia por la adjunción baja para las CR que se encuentren dentro del sujeto, en consonancia con hallazgos previos (Fernández, 2005; Branco-Moreno, 2014; Hemforth, Fernández, Clifton, Frazier, Konieczny & Walter, 2015).
En la sección 1. Marco teórico, realizamos un breve recorrido por los antecedentes específicos en el procesamiento de CR en español y señalamos algunos problemas metodológicos que se registran en estudios previos. En el apartado 2. Marco metodológico, describimos en detalle el experimento realizado -diseño, materiales y procedimiento- y las características de los participantes. En el apartado 3. Resultados, presentamos el análisis estadístico de los resultados obtenidos. En los dos últimos apartados, discutimos las implicancias de los hallazgos y presentamos las conclusiones.
1. Marco teórico
Los estudios realizados sobre CR con doble antecedente nominal en español suelen presentar una preferencia por la adjunción alta (Stetie, 2021b), en particular, en tareas offline de cuestionarios, en las que los participantes pueden releer la oración (Cuetos & Mitchell, 1988; Carreiras, 1992; Gilboy, Sopena, Clifton & Frazier, 1995; Igoa, Carreiras & Meseguer, 1998; Fernández, 2003; Branco-Moreno, 2014; Hemforth et al., 2015; Bezerra, 2019; Aguilar, Ferré, Gavilán, Hinojosa & Demestre, 2021; Vergara & Socarrás, 2021). Esta preferencia también se ha encontrado en tareas de completamiento de oraciones (Piñeiro Barreiro, 2011; Arancibia Gutiérrez, Bizama Muñoz & Sáez Carillo, 2015) y en estudios de corpus, cuando ambos antecedentes refieren a entidades animadas (Piñeiro Barreiro, 2006; Acuña-Fariña, Fraga, García-Orza & Piñeiro Barreiro, 2009).
En relación con el procesamiento online, se han efectuado tareas de lectura autoadministrada en las que se reportó que, al forzar un tipo de adjunción, los participantes leían más rápido aquellas oraciones que presentaban un sesgo de adjunción alta, vinculado con una estrategia de cierre temprano (Cuetos & Mitchell, 1988; Carreiras, 1992; Carreiras & Clifton, 1993; Gibson, Pearlmutter & Torrens, 1999; Piñeiro Barreiro, 2006; Acuña et al., 2009; Piñeiro Barreiro, 2011; Jegerski, Keating & VanPatten, 2014). Sin embargo, no todas las tareas online incluyeron preguntas posteriores que permitieran verificar las preferencias de adjunción de forma directa, lo que vuelve difícil determinar qué representación se construyó de la oración y si la persona estaba prestando atención a la tarea (Ferreira & Yang, 2019). Otra metodología utilizada para evaluar el procesamiento en curso es el seguimiento de movimientos oculares. En dos estudios realizados en español (Carreiras & Clifton, 1999; Dussias & Sagarra, 2007), se reportaron menores tiempos en la primera fijación para las oraciones que forzaban una adjunción alta, aunque sin ser una diferencia estadísticamente significativa, y mayores tiempos totales de lectura para las oraciones que forzaban una adjunción baja. Estas diferencias en los tiempos fueron interpretadas como señal de que la lectura de una oración con adjunción alta es más sencilla debido a que se realiza más rápido.
A pesar de la tendencia al cierre temprano en español, hay algunos aspectos que merecen ser considerados. Por un lado, es preciso señalar que esta preferencia, aunque existente y estadísticamente significativa en varios casos, en algunos ronda el nivel de azar. Por ejemplo, Cuetos y Mitchell (1988), con su estudio seminal en español, reportaron una preferencia por la adjunción alta en el 62% de los casos. Números similares se repiten en otros trabajos: 55% en Igoa et al. (1998) y Hemforth et al. (2015).
En segundo lugar, hay aspectos metodológicos que podrían estar influyendo en los resultados obtenidos. En algunas de las tareas de lectura autoadministrada mencionadas previamente (Cuetos & Mitchell, 1988; Carreiras, 1992; Carreiras & Clifton, 1993; Piñeiro Barreiro, 2006; Acuña et al., 2009; Jegerski et al., 2014), se utilizaron diversas formas de segmentación que podrían haber generado una preferencia hacia la adjunción alta. En particular, se segmentaron en dos o tres frases los estímulos, de tal forma que los antecedentes y la CR quedaban en fragmentos distintos. En este sentido, la Hipótesis de la prosodia implícita (Fodor, 2002) postula que, a medida que se lee una oración, la forma en que una voz interna la divide en unidades prosódicas y esto, a su vez, puede usarse como información discriminatoria para optar por una de las dos interpretaciones. De esta forma, la segmentación antes de la CR podría interpretarse como una ruptura prosódica que marca una discontinuidad estructural y así inducir una preferencia de adjunción al primer nombre, ya que se construiría una estructura en la que todo el sintagma nominal complejo es modificado por la CR, en lugar de tener alcance sólo sobre el segundo antecedente (Swets, Desmet, Hambrick & Ferreira, 2007).
Además, los distintos paradigmas utilizados para presentar las opciones de respuesta son otro aspecto metodológico que podría estar condicionando los resultados. La mayoría de las tareas incluye opciones dicotómicas. En algunas ocasiones se presentan los dos posibles antecedentes como opciones; en otras se pregunta por la posibilidad de adjunción al primer antecedente a través de una pregunta cerrada (sí/no). En esta línea, se ha reportado que las respuestas a preguntas en tareas experimentales suelen presentar una preferencia por el primer sintagma nominal, independientemente de las preferencias de la lengua en particular (Fernández, 2003). Maia, Fernández, Costa y Lourenço-Gomes (2007) plantearon que esto se debería a cómo se retiene la información durante el procesamiento del discurso: los elementos más locales a los argumentos principales de la frase, es decir, menos anidados, deberían ser más fáciles de recordar. De esta forma, responder correctamente a “¿Huyó el cómplice después del robo?” debería ser más sencillo que responder a “¿Huyó el ladrón después del robo?”. En el primer caso, “el cómplice” es un elemento más local en el ejemplo (1), al ser núcleo del objeto directo y no de un modificador, como “ladrón”. Esto no sucedería en tareas offline de cuestionario, ya que los sujetos pueden releer la oración luego de ver la pregunta.
En tercer lugar, algunas propuestas argumentan que la variabilidad en las preferencias de adjunción entre lenguas es pequeña en comparación con la observada dentro de cada lengua (Gilboy et al., 1995; Schafer, Carter, Clifton & Frazier, 1996; Frazier & Clifton, 1996; Grillo & Costa, 2014). Por ejemplo, Gilboy et al. (1995) encontraron que las preferencias de adjunción de las CR varían entre diferentes construcciones, evidenciando la influencia de factores semánticos, pragmáticos, de estructura sintáctica, argumental y de foco, entre otros. En el caso del español, a pesar de la preferencia por la adjunción alta ya señalada, se han registrado algunas situaciones en las que predomina una preferencia por la adjunción baja. Por ejemplo, en tareas en las que se controló la posibilidad de interpretar a la CR como una pseudorrelativa (Grillo & Costa, 2014). Tal es el caso de una tarea de seguimiento de movimientos oculares realizada por Aguilar et al. (2021) en donde reportaron menores tiempos en la primera fijación de la palabra desambiguadora para las oraciones que forzaban una adjunción baja, diferencia que desaparecía en el tiempo total de lectura. La tendencia al cierre tardío también se registró en tareas de cuestionario (Alonso-Pascua, 2020; Aguilar et al., 2021) y en una tarea de lectura autoadministrada con ventana móvil no acumulativa (Alonso-Pascua, 2020).
Asimismo, la posición de la CR también podría ser causante de variación en las preferencias de adjunción. La tendencia a adjuntar alto que se registra en español se da cuando la CR se encuentra en posición posverbal, generalmente, como modificador dentro del objeto directo de la oración. Sólo tres experimentos han considerado este factor en el diseño experimental en español: Hemforth et al. (2015), Branco-Moreno (2014) y Fernández (2005). Hemforth et al. (2015) realizaron un cuestionario escrito y encontraron que cuando los dos posibles antecedentes de la CR y esta última estaban en la posición de sujeto, había una preferencia por la adjunción baja en el 71% de los casos. No obstante, los estímulos en español presentaban posibles sesgos semánticos que fomentaban la adjunción hacia el segundo sintagma nominal y generaban confusión en la estructura sintáctica1. En la misma línea, Branco-Moreno (2014) también registró una menor preferencia por la adjunción alta en la posición de sujeto, 54,7% para sujeto preverbal y 46,1% para sujeto posverbal; sin embargo, utilizó pocos ítems y, en un análisis post hoc, señaló que algunos ítems podrían estar condicionando la resolución de la tarea. Por último, Fernández (2005) realizó una tarea de elicitación en la que les pidió a los participantes que produjeran oraciones de forma oral. En las producciones, encontró distintos patrones de entonación dependiendo de la posición de la CR y lo atribuyó a diferentes preferencias de adjunción dependientes de la posición.
Finalmente, como ya se adelantó, también puede ser que los distintos resultados encontrados se deban a factores no controlados en la formulación de los estímulos. En la bibliografía, se han reportado aspectos diversos que influyen y condicionan las preferencias de adjunción en distintas lenguas, particularmente, en español (para una revisión ver Stetie, 2021b). En varios de los experimentos referidos, estos factores no han sido controlados en el diseño y eso podría explicar los datos contradictorios.
En esta contribución, retomamos algunos aspectos de investigaciones previas y nos centramos en el estudio de las preferencias de adjunción en español rioplatense. El español rioplatense no coincide con una única unidad política actual, sino que es la variedad hablada en Buenos Aires, el sur de las provincias de Santa Fe y Entre Ríos, la Patagonia argentina y la mayor parte del territorio de Uruguay (Di Tullio & Kailuweit, 2011). El trabajo con hablantes de esta variedad constituye un área de vacancia. Las investigaciones citadas en este artículo se realizaron con hablantes de español ibérico y con hablantes de herencia, en su mayoría mexicana, que viven en Estados Unidos; hasta donde llega nuestro conocimiento, no hay estudios sobre el procesamiento de CR con doble antecedente nominal realizados con hablantes de español rioplantese. Además, a diferencia de los trabajos previos, nos propusimos estudiar las preferencias de adjunción en una población no homogénea, que incluye individuos de distintas edades y niveles de escolaridad. El propósito detrás de estas elecciones es poder extender los hallazgos a variedades de español no analizadas previamente y a grupos de hablantes más amplios, dado que todas las investigaciones comentadas en el apartado anterior se realizaron exclusivamente con estudiantes universitarios de los primeros años de carreras vinculadas a la lingüística y psicología. Esto puede resultar en una muestra no representativa de la población en general y proyectar resultados anómalos (Henrich, Heine & Norenzayan, 2010; Hanel & Vione, 2016).
2. Marco metodológico
Este experimento fue diseñado para estudiar el procesamiento de CR con doble antecedente nominal en español rioplatense. En este apartado, describiremos en detalle las características de los participantes y del diseño experimental.
2.1. Participantes
Participaron en la tarea 151 personas del Área Metropolitana de Buenos Aires. De estas hubo que remover 4 (una había realizado la tarea dos veces, otra tuvo más de 12 errores y otras dos no llegaban al tiempo mínimo de 100 milisegundos, considerado como límite inferior para lectura de palabras: Hartley, Stojack, Mushaney, Annon & Lee, 1994). Los 147 participantes restantes tenían entre 18 y 89 años (M = 34.41; DE = 13.85). En cuanto a la escolaridad, 16 participantes declararon haber terminado el secundario, 33 estar cursando una carrera de nivel superior y 98 haber terminado una carrera de nivel superior. La participación fue voluntaria y los participantes no recibieron ninguna remuneración a cambio.
2.2. Diseño de investigación
Diseñamos una tarea de lectura y comprensión de oraciones para evaluar el procesamiento de CR con doble antecedente nominal y analizar las preferencias de adjunción frente a estructuras ambiguas. Evaluamos dos medidas: una offline y otra online. Como se señaló en el apartado 1. Marco teórico, las tareas offline de cuestionarios implican una medida directa del fenómeno, pero no incluyen una medida del proceso online. Por este motivo, también analizamos los tiempos que toma optar por un tipo de adjunción, con el fin de tener una medida que permita inferir algunas características del proceso subyacente.
Como ya se adelantó, para el diseño experimental, manipulamos la variable Posición de la CR (2 niveles: sujeto y objeto) para analizar las preferencias de adjunción en diversas estructuras sintácticas. A partir del Tipo de respuesta a la pregunta de comprensión, organizamos dos grupos (adjunción al primer antecedente y al segundo), lo que constituyó un segundo factor de análisis en este trabajo. Además, nos interesaba analizar si realmente existe una preferencia de adjunción alta para el español o si los resultados reportados con anterioridad se deben a factores no controlados en el diseño experimental. Por este motivo, como se detallará en el próximo apartado, se prestó especial atención a evitar algunos de los problemas que se habían presentado en investigaciones previas: nombres de rol atípicos utilizados como antecedentes de la CR (Gilboy et al., 1995; Hemforth et al., 2015); sesgos semánticos y pragmáticos en los ítems que generan una preferencia por un tipo de adjunción en particular (Gilboy et al., 1995; Fernández, 2003; Hemforth et al., 2015); desequilibrio en cuanto a las estructuras presentadas dentro de la CR (Carreiras & Clifton, 1993; Gilboy et al., 1995) y en las que la CR se inserta (Cuetos & Mitchell, 1988; Carreiras & Clifton, 1993; Gilboy et al., 1995; Fernández, 2003; Hemforth et al., 2015; Aguilar et al. 2021).
2.3. Materiales
Diseñamos 56 oraciones, 28 para cada condición según la posición de la CR: sujeto vs objeto. Todas las oraciones tenían una extensión similar: entre 11 y 14 palabras (M = 12.34; DE = 0.66) y tenían entre 22 y 30 sílabas (M = 24.75; DE = 1.88). En todos los casos, el verbo de la cláusula principal estaba en pretérito perfecto simple y los verbos de las CR estaban la mitad en el mismo tiempo verbal y la otra mitad en pretérito imperfecto. Además, prestamos especial atención a que las oraciones fueran ambiguas y no presentaran sesgos hacia una u otra interpretación. En los ejemplos (2) y (3) se muestran estímulos de cada condición y en el Anexo se encuentran todos los ítems utilizados.
(2) CR en sujeto: La hija del coronel que tuvo un accidente estudió en el exterior.
(3) CR en objeto: El bombero ayudó al tío de la joven que llamó a emergencias.
Para cada oración formulamos una pregunta que buscaba evidenciar la interpretación de la CR. Incluimos cuatro opciones de respuesta posible: el primer sintagma nominal, el segundo sintagma nominal, un distractor semántico y un distractor no relacionado. En el ejemplo (4) se muestra una pregunta y sus opciones de respuesta. De esta forma, evitamos obtener una preferencia de adjunción que fuera debida al azar, como sucedía en experimentos previos, que solo presentaban dos opciones de respuesta.
(4) ¿Quién tuvo un accidente? a. la hija; b. el coronel; c. el profesor; d. la vestuarista
Además, confeccionamos 80 ítems para ser utilizados como fillers o distractores. De estos, algunos presentaban ambigüedad y otros no, como se muestra en el ejemplo (5). Organizamos las oraciones en tres listas con 45 ítems cada una: 18 experimentales y 27 distractores.
(5) El taxista llevó a la amiga del bailarín que era el mejor del país.
Luego del diseño de los materiales, organizamos una revisión con expertos. Les pedimos a 5 lingüistas2 que revisaran los estímulos confeccionados con el fin de evaluar que estos no tuvieran inconsistencias en relación con las condiciones experimentales, problemas con el léxico utilizado, sentidos no percibidos, entre otras cuestiones potencialmente problemáticas. A partir de estos aportes, modificamos algunos estímulos. Uno de los cambios realizados estuvo vinculado con la posibilidad de tener una lectura especificativa de la CR, como se muestra en el ejemplo (6). En ese caso, se torna poco plausible una adjunción alta, ya que, para interpretar que el antecedente de la CR es “la novia”, se debería suponer un contexto en donde el fotógrafo tenga dos novias y, por eso, se vuelva preciso aclarar a cuál de las dos se está refiriendo. Aunque esta situación es posible, se podría asegurar que, en la mayoría de los casos, no es el contexto más usual.
(6) El futbolista besó a la novia del fotógrafo que asistía al conservatorio.
Además, organizamos una prueba experimental piloto con el fin de testear tanto el diseño general de la tarea como los estímulos particulares. Luego de la etapa piloto, realizamos algunas modificaciones a las consignas y los ítems de práctica.
2.4. Procedimiento
La tarea fue diseñada y tomada mediante el software IBEX (Internet Based Experiments: Drummond, 2013). Inicialmente, los participantes accedían a un formulario de Google que les asignaba aleatoriamente una de las tres listas y desde allí eran redirigidos a la tarea. En todos los casos, presentamos primero un consentimiento informado que debía ser aceptado para acceder a las preguntas sobre datos demográficos y al experimento. Les pedimos a los participantes que indicaran su nivel máximo de estudios alcanzado y edad. Posteriormente, presentamos la consigna y las pautas para realizarla: les pedimos que primero leyeran las oraciones palabra por palabra, que sólo pasaran a la siguiente cuando hubieran terminado, y que luego respondieran una pregunta de opciones múltiples lo más rápido posible, basándose en su primera impresión. A diferencia de otras tareas realizadas en español -por ejemplo, Igoa et al. (1998)- la actividad no se presentó como una prueba para evaluar las preferencias de interpretación frente a la ambigüedad, sino como una tarea de comprensión de oraciones.
Realizamos una tarea de lectura autoadministrada con ventana móvil acumulativa: los participantes leían una oración palabra por palabra. De esta forma, evitamos imponer sesgos en la interpretación de la CR debido a la segmentación elegida. Luego de la lectura de la oración, se pasaba a otra pantalla en donde se les presentaba una pregunta centrada en la selección de un posible antecedente para la CR a partir de cuatro opciones. Una vez que seleccionaban la respuesta, pasaban a otra pantalla con un asterisco en donde podían descansar o continuar con el siguiente estímulo. Les aclaramos que tendrían tres oraciones de prueba, a las que les seguían tres ítems más de práctica, que para los participantes ya eran parte de la tarea experimental. La tarea sólo podía realizarse en una computadora con conexión a internet.
3. Resultados
Para el análisis de los datos, consideramos dos variables dependientes: tipo de respuesta y tiempo de respuesta3. Los datos fueron procesados mediante el programa R versión 4.1.1 en la interfaz R Studio (R Core Team, 2021). Utilizamos los paquetes tidyverse (Wickham, Averick, Bryan, Chang, D’Agostino, et al., 2019), ggplot2 (Wickham, 2016), lme4 (Bates, Maechler, Bolker & Walker, 2015), lmerTest (Kuznetsova, Brockhoff & Christensen, 2017) y MASS (Venables & Ripley, 2002).
Para el análisis final, tomamos sólo las respuestas que referían al primer sintagma nominal o al segundo y descartamos aquellas que referían a los dos distractores. Esto implicó eliminar el 0,69% de los datos. Además, debido a que la tarea se realizó de modo remoto sin poder controlar la situación experimental en la que se encontraban los participantes, establecimos límites de tiempo para su realización. El límite inferior fue de 300 milisegundos, mientras que el límite superior fue de 45.000 milisegundos. Esto implicó remover 163 datos (5,28% de la muestra total).
3.1. Análisis del tipo de respuesta
El análisis del tipo de respuesta elegida permite inferir las preferencias de adjunción de los sujetos al comprender la oración. En el Gráfico 1, se muestran los porcentajes de cada tipo de respuesta según la posición de la CR. Para las CR en posición de sujeto, hay una fuerte preferencia por el segundo antecedente. En cambio, para las CR en posición de objeto, la preferencia por la adjunción al segundo sintagma nominal ronda el nivel de azar.
Para el análisis de las respuestas, realizamos un modelo mixto generalizado. Codificamos cada nivel de los factores fijos como -0.5 y 0.5, compatible con lo que se denomina suma escalada (Schad, Vasishth, Hohenstein & Kliegl, 2020). La posición de la CR se utilizó como efecto fijo, colocamos participantes e ítems como efectos aleatorios cruzados. La fórmula del modelo fue: glmer(Tipo de respuesta ~ Posición de la CR + (1+ Posición de la CR | Participantes) + (1 | Ítems). Encontramos un efecto principal de Posición de la CR (βsujeto-objeto = 1.3831, z = 4.624, p = <0.0001). Como se evidencia en el Gráfico 1, frente a las CR en posición de sujeto, los participantes optaban en mayor proporción por una adjunción baja, es decir, al segundo sintagma nominal, y esa diferencia fue estadísticamente significativa en comparación con las CR en posición de objeto. En estas últimas, se encuentra una preferencia cercana al nivel de azar.
Debido a que las preferencias de adjunción de las CR en posición de objeto estaban próximas al nivel de azar, realizamos un análisis pormenorizado de los ítems con el fin de identificar si se trataba efectivamente de que las preferencias no son claras o de que algún ítem presentaba un patrón específico que estaba interfiriendo en la selección de la respuesta. Encontramos que en 4 ítems (ver ítems 32, 41, 50 y 56 en el Anexo) la preferencia por la adjunción alta era superior al 70%. En particular, tres de esos ítems habilitaban una interpretación como pseudorrelativa. Una vez eliminados estos ítems, la preferencia por la adjunción baja es del 63,5% para las CR en posición de objeto.
3.2. Análisis del tiempo de respuesta
Para el análisis de los tiempos, realizamos una identificación de outliers y posterior imputación. Todas aquellas medidas que superaron los dos desvíos estándar por condición por participante fueron reemplazadas por la media de cada participante en cada condición (Baayen & Milin, 2010; Cousineau & Chartier, 2010). Esto implicó reemplazar el 1,21% de la muestra. En los Gráficos 2 y 3, se muestra la distribución de los tiempos de respuesta y la media para cada condición luego de la imputación de outliers.
Como primer paso para el análisis de los tiempos de respuesta, testeamos los supuestos de normalidad y homocedasticidad a partir de modelos lineales mixtos: decidimos realizar una transformación logarítmica para el análisis de los datos (Winter, 2019). Al igual que para el análisis de los tipos de respuesta, codificamos cada nivel de los factores fijos como -0.5 y 0.5 (Schad et al., 2020). El modelo elegido para el análisis incluía al tipo de respuesta y la posición de la CR como efectos fijos, uno anidado a otro, y a los participantes e ítems como efectos aleatorios cruzados. La fórmula del modelo fue: lmer(log(TR_respuesta) ~ Tipo de respuesta / Posición de la CR + (1 + Tipo de respuesta / Posición de la CR | Participantes) + (1 | Ítems). Encontramos un efecto principal del Tipo de respuesta (βSN2-SN1 = -0.07118, t = -2.674, p = 0.00851) y no hubo efecto de la posición de la CR (βSN1_sujeto-objeto = 0.06828, t = 1.345, p = 0.18171; βSN2_sujeto-objeto = -0.01967, t = -0.655, p = 0.51486). Como se observa en el Gráfico 3, los tiempos de respuesta fueron menores cuando la opción preferida era el segundo antecedente, es decir, una adjunción baja, tanto para la CR en posición de sujeto como de objeto.
4. Discusión
En este artículo, analizamos los datos del primer experimento que indaga sobre las preferencias de adjunción para las CR con doble antecedente nominal en español rioplatense. Además, buscamos evaluar la influencia de la posición de la CR en el establecimiento de dichas adjunciones. Para ello, registramos dos medidas: el tipo de respuesta (medida offline) y el tiempo de respuesta (medida online).
Antes de pasar a la discusión del análisis de cada variable dependiente, es preciso retomar algunos aspectos del diseño de la tarea. La utilización del paradigma de ventana móvil acumulativa para la lectura de la oración evitó imponer sesgos en la interpretación de la CR debido a la segmentación del estímulo (Swets et al., 2007). De las tareas de lectura autoadministradas realizadas previamente en español sólo dos presentaban la oración palabra por palabra (Gibson et al., 1999; Piñeiro Barreiro, 2011), pero en un paradigma de presentación de ventana móvil no acumulativa. Esto podría sobrecargar la memoria de trabajo y generar un sesgo en la interpretación de la CR.
En relación con la primera variable dependiente, consideramos dos respuestas posibles: el primer antecedente y el segundo. Interpretamos los resultados bajo el supuesto de que la opción de respuesta elegida por los participantes tiene un correlato directo con la interpretación que realizan de la oración. En este sentido, esperábamos que hubiera una mayor elección del primer antecedente en las CR en posición de objeto, como ha sido documentado clásicamente para el español (Cuetos & Mitchell, 1988; Carreiras, 1992; Gilboy et al., 1995; Igoa et al., 1998; Fernández, 2003; Piñeiro Barreiro, 2006; Acuña-Fariña et al., 2009; Piñeiro Barreiro, 2011; Branco-Moreno, 2014; Arancibia Gutiérrez et al., 2015; Hemforth et al., 2015; Bezerra, 2019; Aguilar et al., 2021; Vergara & Socarrás, 2021). Además, la predicción inicial suponía una mayor elección del segundo nombre en las CR en posición de sujeto, como reportan los estudios realizados al respecto (Fernández, 2005; Branco-Moreno, 2014; Hemforth et al., 2015). Los resultados obtenidos confirman parcialmente la primera hipótesis. Para las CR en posición de sujeto, nuestros resultados están en línea con investigaciones previas: hay una marcada preferencia hacia la adjunción baja. En cambio, para las CR en posición de objeto, encontramos una tendencia contraria a las preferencias clásicas para el español.
En cuanto a la segunda variable dependiente -tiempos de respuesta-, inferimos que mayores tiempos implican que el procesamiento sintáctico sea más complejo y que, por ende, no se trate de una primera preferencia, sino que de una interpretación posterior, estratégica o con requerimiento de integración semántica no automática. Según nuestras hipótesis experimentales, esperábamos encontrar una diferencia en los tiempos de respuesta en función del tipo de respuesta elegida y de la posición de la CR. Para las oraciones con CR en posición de sujeto, esperábamos que hubieran menores tiempos de respuesta para el segundo sintagma nominal, ya que suponíamos que iba a haber una preferencia por la adjunción baja. En cambio, para las CR en posición de objeto, nuestra predicción suponía menores tiempos para el primer antecedente, ya que esperábamos una tendencia a la adjunción alta. De nuevo, estas hipótesis se confirmaron parcialmente. Encontramos menores tiempos de respuesta generales para el segundo antecedente y no encontramos diferencias estadísticamente significativas en relación con la posición de la CR. A continuación, discutimos los resultados por separado: primero, los resultados de las CR en posición de sujeto y, luego, los de objeto.
Los trabajos realizados previamente (Fernández, 2005; Branco-Moreno, 2014; Hemforth et al., 2015) coinciden en que habrá diferencias en las preferencias de adjunción de las CR según la posición sintáctica, pero proponen distintas explicaciones al respecto. Una de ellas está centrada en las nociones de tema y foco, vinculada al Modelo construal (Frazier & Clifton, 1996). Este propone que en las lenguas hay dos tipos de estructuras o relaciones que se procesan de forma diferente: las primarias y las secundarias. Las CR con doble antecedente nominal implican relaciones secundarias, es decir, una relación no obligatoria entre los constituyentes, y, para estos casos, el modelo sostiene que la información no sintáctica -por ejemplo, pragmática o prosódica- puede guiar tempranamente al parser en el establecimiento de adjunciones. En este marco, Schafer et al. (1996) propusieron la Hipótesis de atracción del foco: una frase que no es sintácticamente obligatoria se interpretará, preferentemente, como modificador de una frase en foco, a menos que esto viole restricciones lingüísticas. En otras palabras, habría una preferencia por el material ambiguo que se adjunta modifique la información más saliente de la frase -que estaría en foco- en lugar de la información menos relevante o ya conocida -el tema-.
En español, el sujeto aparece canónicamente en posición de tema, es decir, preverbal, pero también puede aparecer en una posición posverbal si se quiere focalizar. Siguiendo a la Hipótesis de atracción del foco, las CR en posición de objeto o sujeto posverbal deberían presentar una mayor preferencia por la adjunción alta, ya que reciben una focalización amplia y, por lo tanto, el primer sintagma nominal atrae la adjunción de la CR, mientras que las estructuras preverbales no están en posición de foco y allí debería registrarse una menor preferencia de adjunción al primer sintagma (Schafer et al., 1996; Hemforth et al., 2015; Carlson & Potter, 2021). Esto se condice con nuestros resultados, ya que encontramos una mayor preferencia por la adjunción baja para las oraciones que contenían una CR en posición de sujeto preverbal.
Branco-Moreno (2014) también encontró una mayor tendencia a la adjunción baja para las CR en posición de sujeto. Sin embargo, en su diseño experimental, distinguió además entre sujeto preverbal y posverbal y, en su caso, los resultados fueron distintos. Para las CR en posición de sujeto preverbal, encontró una mayor tendencia a la adjunción alta que para las que estaban en sujeto posverbal4. Siguiendo la Hipótesis de atracción de foco (Schafer et al., 1996), las oraciones con sujeto posverbal deberían haber mostrado una mayor tendencia a la adjunción alta que las de sujeto preverbal, considerando que, en español, esa es la posición focalizada. Esto no se dio así en los resultados de Branco-Moreno (2014), pero podría deberse a problemas metodológicos: tenía solo seis ítems de cada condición y no consideró la relación entre los antecedentes nominales al confeccionar los estímulos. En particular, existen algunos casos de relación de parentesco en donde se torna poco plausible una interpretación de adjunción alta. Similar al ejemplo (6) ya comentado, para interpretar en el ejemplo (7) que el antecedente de la CR es “el esposo”, se debería suponer un contexto en donde la mujer tenga dos esposos y, por eso, se vuelve preciso aclarar a cuál de los dos se está refiriendo. No es de extrañar que los dos ítems que presentaban este tipo de estructura fueron los que mostraron una mayor preferencia por la adjunción baja.
(7) Es gordo el esposo de la mujer que corría mucho.
La otra posible explicación para las diferencias en las preferencias de adjunción según la posición sintáctica se relaciona con la Hipótesis de la prosodia implícita (Fodor, 2002). En español, las oraciones con una CR en posición de objeto posverbal contienen una discontinuidad prosódica antes de la CR. En cambio, en las oraciones en las que la CR está en posición de sujeto preverbal no se genera esta discontinuidad prosódica, sino que se produce al final de la CR con la ruptura sujeto-predicado. Así, en el primer caso, la CR se formula por separado del sintagma nominal complejo, una prosodia que fomenta la adjunción alta, mientras que en el segundo la CR se produce junto con el sintagma nominal complejo, una prosodia que desalienta la adjunción alta. Fernández (2005) corroboró esto en una tarea de producción de oraciones en la que encontró diferencias en las pausas y los patrones entonacionales en función de la posición sintáctica de la CR. Si esto sucede en la producción, podríamos suponer que, al leer las oraciones, los participantes imponen implícitamente esta prosodia a las oraciones. El experimento presentado aquí no permite distinguir entre ambas explicaciones. Sería interesante, a futuro, diseñar una tarea con CR en posición de sujeto preverbal y posverbal en la que se mida la influencia de rupturas prosódicas en distintas partes de la oración, ya sea mediante una tarea auditiva o mediante la separación visual de la oración.
Por otro lado, los resultados hallados para las CR en posición de objeto también admiten diversas explicaciones. En primer lugar, la preferencia por la adjunción alta señalada en estudios previos podría deberse a problemas metodológicos, como la presentación de los estímulos o la modalidad de pregunta. En esta tarea, se tuvo especial atención a no imponer ninguna interpretación en particular en la lectura de las oraciones y, por eso, se decidió que los participantes hicieran la lectura de los ítems lingüísticos a su propio ritmo y palabra por palabra. Además, la pregunta que indagaba por la interpretación del antecedente de la CR no forzaba un tipo de interpretación -como hubiera sido de haber presentado una pregunta como “¿El cómplice huyó después del robo?” en lugar de “¿Quién huyó después del robo?” para el ejemplo (1)- y presentaba opciones de respuesta que eran distractoras. Es decir, puede ser que la supuesta preferencia por la adjunción alta en español se explicara por artefactos de la prueba y, al eliminarlos, encontramos una tendencia hacia la adjunción baja, como señalan nuestros resultados.
Otra hipótesis que se ha discutido en los últimos años es que la preferencia por la adjunción alta que se registró para el español podría deberse a la posibilidad de interpretar la oración como una pseudorrelativa (Grillo & Costa, 2014). En el diseño de este experimento, no controlamos esta variable, pero realizamos un análisis post hoc de los ítems lingüísticos y encontramos que cuatro de ellos habilitaban una lectura como pseudorrelativa. En particular, tres de estos ítems presentaban una clara preferencia por la adjunción alta, como sostiene la Hipótesis de las pseudorrelativas primero5 (Grillo & Costa, 2014). Para futuros trabajos, sería importante considerar este factor en el diseño experimental y evaluar si efectivamente genera diferencias en las preferencias de adjunción.
Por último, es importante discutir si realmente podemos considerar que hay una preferencia por la adjunción alta o baja para el español o si, en realidad, lo que muestran los distintos estudios es que dicha preferencia se encuentra al nivel de azar y es susceptible a la variación impuesta por distintas fuentes, que no se vinculan directamente con la lengua y los parámetros que la definen. Es decir, podríamos interpretar que no hay una preferencia fija por ningún tipo de adjunción y que lo que demuestran las diferentes tareas realizadas es que distintos tipos de información -semántica, pragmática y prosódica- pueden intervenir tempranamente en el procesamiento y generar una preferencia por una interpretación específica de la oración en cada instancia. Esta discusión estaría en el centro del debate acerca del funcionamiento global del parser sintáctico humano y las tensiones teóricas que se desarrollan en torno a los supuestos y proyecciones que derivan de proponer un procesador sintáctico serial o interactivo (Frazier, 1995; Igoa et al., 1998; Grillo & Costa, 2014; Karimi & Ferreira, 2015; Stetie, 2021a).
Conclusiones
Según los resultados analizados, en español rioplatense se registra una marcada preferencia por la adjunción baja cuando la CR está en posición de sujeto y una tendencia hacia la adjunción baja en posición de objeto. Si suponemos un procesamiento serial, algorítmico y guiado por la existencia de reglas universales, como el principio de cierre tardío (Frazier & Fodor, 1978; Frazier & Rayner, 1982; Grillo & Costa, 2014), esta preferencia es esperable. Sin embargo, para el caso puntual de las CR en posición de objeto, nuestros resultados contradicen los hallazgos de experimentos clásicos realizados en otras variedades de español y no permiten distinguir una clara preferencia por la adjunción baja, que sostenga la existencia de principios reglados y universales, ya que dicha preferencia está próxima al nivel de azar.
La falta de una preferencia marcada y consistente no permite descartar ni afirmar la existencia de un principio de cierre tardío para el español. Como se ha discutido, una gran variedad de factores -lingüísticos, extralingüísticos y metodológicos- parecen condicionar las tendencias de adjunción del parser. Frente a estos hallazgos diversos, una posible explicación es la existencia de dos vías de procesamiento funcionando en paralelo: una algorítmica, reglada y con principios universales de economía estructural, y otra de procesamiento heurístico, guiada por marcos conceptuales e información semántica y discursiva (Karimi & Ferriera, 2015). Al procesar una oración, optaríamos por la interpretación que esté disponible más rápidamente, independientemente de la ruta de la que provenga. Una propuesta de este estilo permitiría dar cuenta de las distintas preferencias de adjunción reportadas, ya que explicaría que el principio de cierre tardío es válido para el español, pero, además, convive con otros factores que generan sesgos interpretativos de forma temprana.