publicidad

 

Página principal
    Hispania [Publicaciones periódicas]. Volume 78, Number 2, May 1995
    
Página principal Enviar comentarios Ficha de la obra Marcar esta página Índice de la obra Anterior Abajo Siguiente

ArribaAbajo

Theoretical Linguistics

Prepared by John Lipski



ArribaAbajo

Homogeneidad argumental en la formación de cadenas

Francesco D'Introno

University of Massachusetts at Amherst

Guillermo Lorenzo

MIT y Universidad de Oviedo



Abstract: Las estructuras nominales del español tienen un carácter hermético con respecto a la extracción de constituyentes. Se analizan ciertas instancias que aparentemente desafían tal generalización, y se muestra que se trata de extracciones de adyacentes verbales, no nominales. Se observa también la posibilidad de interpretar ciertas estructuras con dos elementos vacíos, uno correspondiente a un adyacente verbal y otro correspondiente a un adyacente nominal. Para estos casos se propone una condición que establece que es posible operar la extracción de un adyacente verbal y, al tiempo, proyectar un índice sobre un adyacente vacío dentro de una estructura nominal que complemente al mismo verbo, a condición de que los valores argumentales de los dos adyacentes sean homogéneos.

Key Words: adyacentes, argumentos, homogeneidad argumental, estructura argumental, extracción, sintagma nominal (SN), sintaxis generativa del español



1. La extracción desde el sintagma determinante (SDet)en español

     La extracción de una palabra-qu (por ejemplo, palabras interrogativas, como qué, quién, cómo, dónde, cuándo, etc.) desde el interior de un sintagma determinante (SDet) está básicamente limitada en español a aquellos casos en los que el elemento desplazado va encabezado por de y recibe un valor argumental directamente del núcleo léxico del sintagma (Demonte 1987). Así, la extracción resulta legítima en (1.b.) porque la palabra-qu, encabezada por de, está coindizada con una huella en una posición argumental dentro del complejo nominal, pero no en (1.c.) ni en (2.b.), donde el argumento desplazado va encabezado por una preposición diferente a de. Tampoco en (3.b.), donde la huella es un adjunto, y no un argumento, del nombre:

(1)
     a. Compré un libro de mi amigo Vicente sobre la guerra en El Salvador.
     b. Mi amigo Vicente, de quieni compré [SDet un libro hi sobre la guerra en El Salvador], trabaja en la Universidad Centroamericana.
     c.*La guerra en El Salvador, sobre la quei compré [SDet un libro de mi amigo Vicente hi ], dejó al país arruinado.
(2)
     a. Por fin leí la crítica de Chomsky a Skinner.
     b.*Skinner, a quiéni por fin leí [SDet la crítica de Chomsky hi], no deja en muy buen lugar al ser humano.
(3)
     a. Nos alegró el alto el fuego en El Salvador.
     b.*El Salvador, en dondei nos alegró [SDet el alto el fuego hi], es el país en el que trabaja mi amigo Vicente.

     No se razonarán aquí las causas que subyacen a la restricciones sobre la extracción en español. Basta señalar lo siguiente: sólo son susceptibles de someterse a extracción los argumentos externos (generalmente, agentes) o «externalizados», en el sentido de Williams (1981) (generalmente, temas). Puede asumirse que tales argumentos ocupan posiciones de complemento hermanas [356] a la categoría nominal. Esta idea descansa en el caracter «pseudo-preposicional» de «de», defendido por Rivero (1985), Demonte (1987) y Giorgi y Longobardi (1991), entre otros. La extracción de este tipo de argumentos deja una huella defendida mediante «rección nuclear». No pueden extraerse, en cambio, los adjuntos y los argumentos propiamente internos, que son frases preposicionales. La imposibilidad de extraer los adjuntos se explica fácilmente como un problema de falta de rección de la huella que dejan atrás. Esta explicación puede extenderse al caso de los argumentos internos, cuya extracción parecería dejar, en principio, huellas léxicamente regidas: la cabeza de las cadenas formadas con el especificador del sintagma nominal (SN) actúa como elemento de interferencia en la rección de las huellas de los complementos preposicionales internos(40). Los casos que analizaremos en nuestro trabajo son, precisamente, instancias de extracción en las que este efecto sobre el desplazamiento de argumentos internos deja de percibirse.

     Ahora bien, las restricciones que hemos señalado determinan que en (4) la interpretación relacione inequívocamente a la palabra-qu con el núcleo verbal y no con el nominal. De ahí la falta de ambigüedad de los ejemplos (4.b.) y (4.c.), en los que la palabra-qu se interpreta únicamente como relacionada con el elemento verbal. De ahí también la agramaticalidad de (4.d.), en la que se ha forzado la interpretación de la palabra-qu como relacionada con la estructura nominal debido a la presencia de al gobierno nacional dentro del entorno verbal:(41)

-4
     a. Mi empresa organizó al gobierno regional la entrega de premios a las personalidades destacadas.
     b. ¿A quiéni [SFlex organizaréis hi [SDet la entrega de premios (*hi)]]?
     c. El gobierno regional, al quei [SFlex mi empresa siempre organiza hi [SDet la entrega de premios a las personalidades destacadas]], tarda a menudo meses en pagar.
     d.*Las personalidades destacadas, a las quei mi empresa siempre organiza al gobierno regional [SDet la entrega de premios hi], resultan a menudo fáciles de tratar.
     La serie que ofrecemos en (5) recoge situaciones paralelas a las anteriores:
(5)
     a. La empresa preparó con los sindicatos una reunión con los representantes del gobierno
     b. ¿Con quién preparó la empresa una reunión?
     c. Los sindicatos, con los que la empresa preparó una reunión con los representantes del gobierno, se están mostrando inflexibles en las negociaciones.
     d.*Los representantes del gobierno, con los que la empresa acordó con los sindicatos una reunión, no parecen demasiado interesados en el asunto.
     Observemos ahora la oración (6):
(6)
      Las recientes inundaciones en el Norte de España, sobre las que he leído un informe del Ministerio de Agricultura, han destrozado la cosecha de cereales.

      Si comparamos (6), que es gramatical, con (1.c.), estructuralmente afín pero de dudosa gramaticalidad se puede ver que como en (1.c.), la palabra-qu extraída en (6) va precedida de una preposición diferente a de, lo que en (1), pero no en (6), determina la agramaticalidad del ejemplo. ¿Cómo explicar entonces la gramaticalidad de (6)? La respuesta es que en (6) no ha habido movimiento de sobre las que desde el interior del SDet sino desde el interior del sintagma verbal (SV): sobre las que no está relacionado con informe sino con he leído. En consecuencia, la gramaticalidad de (6) se explica porque la extracción ha tenido lugar directamente desde el complejo verbal, y no desde la estructura nominal: la estructura -parcial- de (6) es (7.a.), donde la huella se encuentra fuera del SDet, y no (7.b.), donde la huella está dentro del Sdet: [357]

(7)
      a. sobre las quei [SFlex V hi [SDet N]]
     b.*sobre las quei [SFlex V [SDet N hi]]


2. Extracción desde el SV e interpretación conjunta

     En (6), por tanto, lo que se ha extraído es un adyacente(42) no del nombre informe, sino del verbo leer(43) Ahora bien, este tipo de ejemplos tiene la peculiaridad de que, tanto desde el punto de vista interpretativo como desde el punto de vista formal, es necesario suponer cierto tipo de relación entre la palabra-qu y la estructura nominal. Obsérvese, en primer lugar, que la cláusula de relativo en (6) puede servir para especificar tanto el tema de la lectura como el asunto del informe; o, tal vez, ambos a un tiempo. Nos referiremos a este hecho como «interpretación conjunta». Nada de esto ocurre, por ejemplo, en (4.b.), repetido como (8), donde la pregunta incide inequívocamente sobre el beneficiario de la organización y no sobre los destinatarios de la entrega, «interpretación disjunta»:

(8)
     ¿A quiéni [SFlex organizaréis hi [SDet la entrega de premios (* hi)]?

Desde el punto de vista formal, la incidencia de la palabra-qu sobre la estructura nominal en (6) se refleja en la imposibilidad de introducir en el SDet un adyacente con un valor argumental afín al del adyacente extraído desde la estructura verbal: al introducir el adyacente sobre las causas en el SDet de (6) se obtiene una oración agramatical -véase (9.a.). Pero esta condición no afecta a otros tipos de ejemplos, como se deduce de la gramaticalidad de (4.c.), repetido aquí con el número (9.b.):

(9)
     a.*Las recientes inundaciones en el Norte de España, sobre las que he leído un informe del Ministerio de Agricultura sobre las causas, han destrozado las cosechas de cereales.
     b. El gobierno regional, al que mi empresa siempre organiza la entrega de premios a las personalidades destacadas, tarda a menudo meses en pagar.

Por tanto, un ejemplo como (6) plantea las siguientes dificultades. En primer lugar, para que la extracción pueda considerarse acorde con las restricciones que afectan a este tipo de operación en español, resulta necesario suponer que tiene lugar desde la estructura verbal y no desde la nominal, lo cual es perfectamente compatible con el tipo de adyacentes que puede atribuirse a verbos como leer. En segundo lugar, es necesario suponer que la palabra-qu, o la huella con la que ésta se relaciona en el SV, ejerce cierto tipo de influencia sobre las posibilidades de desarrollo argumental de la estructura nominal, cosa que se revela en la imposibilidad de un adyacente dentro del SDet con un valor argumental afín al del elemento extraído desde el SV.

     Un posible modo de formalizar lo anterior consiste en postular la existencia de una categoría vacía en el interior de la estructura nominal que comparte un índice con la huella presente en la estructura verbal, como se indica en (10):

(10)
     qui [SFlex V hi [SDet N ei]]

Pero (10) plantea, en realidad, más problemas que soluciones. El más inmediato de todos ellos consiste en aclarar cuál es la diferencia entre los ejemplos que toleran la interpretación conjunta de la palabra-qu reflejada en la estructura (10) -es decir oraciones tipo (6)- y los que no la toleran -es decir oraciones tipo (4) y (5). No obstante, analizar uno a uno los problemas que plantea (10) puede servir para alcanzar una mejor comprensión del fenómeno.



3. Categorías vacías parásitas.

     La configuración representada en (10) puede ponerse en relación con el tipo de estructuras que legitiman la presencia de «categorías vacías parásitas(44)»: [358]

(11)
     ¿Qué documentoi archivaste hi sin leer ei?

Como en el análisis sugerido en (10), la oración que se ofrece en (11) tiene la característica de que un sólo operador-A' aparece vinculado con dos variables independientes, cada una de las cuales recibe caso y valor temático de un núcleo léxico diferente. En consecuencia, no pueden considerarse eslabones de una misma cadena. El aspecto más destacable de la similitud entre los ejemplos de (11) y los que representa (10) -por ejemplo, (6)- es el hecho de que en ambos casos la segunda categoría vacía ocupa una posición desde la cual no resulta legítima la extracción. Puede comprobarse esto introduciendo un sintagma fonéticamente lleno en el lugar de la huella:

(12)
     a.*¿Sobre quéi has leído sobre las inundaciones un informe ei?
     b.*¿Qué documentoi archivaste el informe sobre las inundaciones sin leer ei antes?

En ambos casos, la segunda categoría vacía de los ejemplos originales queda como único elemento con el que el operador interrogativo se relaciona, de modo que, como una variable normal y corriente, debería obedecer a los requisitos estructurales que operan sobre la extracción. De ahí su incorrección. En definitiva, la segunda categoría vacía de las dos modalidades de ejemplos no se relaciona de un modo normal con el operador-A', sino que su presencia en la estructura es dependiente de la de una variable relacionada normalmente con el operador-cf. Engdahl (1983:13-14).

     No obstante, la semejanza entre las construcciones cuya estructura se esquematiza en (10) y las construcciones con categorías vacías parásitas se agota aquí. Una primera diferencia entre ellas consiste en que las construcciones con categorías vacías parásitas consienten la sustitución de éstas por elementos nominales llenos (Engdahl 7) y (13.a.) es un ejemplo de ello. Este tipo de sustitución conduce a ejemplos agramaticales, en cambio, en el tipo de construcción del que nos estamos ocupando en este trabajo. Esto se ilustra en (13.b.):

-13
     a. ¿Qué documentoi archivaste hi sin leer antes el informe sobre las inundaciones?
     b.*¿Sobre quéi has leído hi un informe sobre las inundaciones?

     En segundo lugar, una categoría vacía parásita no puede tener como antecedente un elemento nominal lleno (Engdahl 12), mientras que la categoría vacía del tipo de construcción que nos interesa aquí sí tolera un antecedente con tales características. El contraste entre los ejemplos de (14) muestra lo anterior:

(14)
     a.*Vicente archivó varios documentosi sin leer ei.
     b. Vicente leyó sobre las recientes inundacionesi un informe del Ministerio de Agricultura ei.

Pero lo más importante es que la categoría vacía de nuestros ejemplos no obedece a la restricción estructural básica que se aplica sobre las categorías vacías parásitas, esto es la condición en (15), propuesta por Engdahl (22):

-15
     Una categoría vacía parásita no puede estar mandada-c por la variable de la que depende.

Esta disposición es la que determina la degradación de (16.b.) -donde la huella hi, en posición de sujeto, manda- c a la categoría parásita ei -con relación a (16.a.)- repetición de (10):

(16)
     a. ¿Qué documentoi archivaste hi sin leer ei?
     b.*¿Qué documentoi dices que hi desapareció sin leer ei?

Es característico del tipo de ejemplos que estamos analizando, en cambio, el que la [359] huella hi mande-c a la segunda categoría vacía ei, como se nota en (17), estructura en la que estamos asumiendo que un sintagma preposicional del tipo sobre las recientes inundaciones es un «adjunto temático» del verbo, y como tal aparece en una posición de adjunto al SV:

Ahora bien, desde su posición de adjunto al sintagma verbal, el adjunto temático no domina a los argumentos nominales, y todas las proyecciones máximas que dominan al adjunto temático, empezando por SFlex, dominan a los argumentos del nombre. Por tanto, el primero manda-c a los segundos.

     Esta última diferencia es fundamental, porque la inexistencia de mando-c entre las huellas y las categorías vacías parásitas es explotada crucialmente por Engdahl para justificar la legitimidad de las últimas: puesto que una categoría vacía parásita comparte necesariamente su referencia con una auténtica huella, uno y otro tipo de elemento evitan la relación de mando-c, que les asignaría referencias disjuntas (Engdahl 22). Recordemos que, en tanto que variables independientemente ligadas por un mismo operador-A' -que por lo tanto no forman una cadena-, cada una de estas categorías vacías debe comportarse como una expresión-R a efectos de ligamiento.

     Lo anterior plantea, con relación a nuestro caso, el problema de que tenemos dos categorías vacías correferentes y que sin embargo mantienen una relación de mando-c entre sí. Este hecho nos invita a explorar la posibilidad, en principio problemática, de que estas categorías vacías formen en realidad parte de una misma cadena. De ser así, liberaríamos a una de ellas de la condición de variable -expresión-R vacía-, de modo que el vínculo de mando-c entre las dos dejaría de resultar anómalo (ver sección 6).



4. Pronombres reanudativos abstractos

     Cinque (1990: 98-160) ha propuesto que diversas instancias de extracción de desde dominios considerados como «islas» para tal tipo de operación, pueden explicarse con naturalidad si asumimos que en la posición original de no se encuentra una huella sino un elemento pronominal vacío: pro. Esta hipótesis permite superar algunas de las dificultades planteadas por el enfoque basado en la consideración de categorías vacías parásitas. Notemos que el carácter pronominal de pro determina que éste pueda estar ligado por una categoría superior en la oración. De hecho, puesto que en la definición de ligamiento figura crucialmente la relación estructural de mando-c entre ligador y ligado -ver (18)-, tenemos que este planteamiento no sólo supera, sino que se ajusta al requisito estructural contra el que chocaba el análisis anterior. La definición de «ligamiento», tomada de Lasnik y Uriagereka (1988: 33), dice así:

(18)
     Ligamiento:
     « liga a ssi:
     i. manda-c a , y
     ii. . y comparten un índice» [360]

Ahora bien, un pronombre debe ser libre en su categoría regente, pero fuera de tal categoría puede estar ligado a un antecedente que lo mande-c. Sin embargo, cuando el pronombre es un pro en una posición de adyacente, el ligamiento con un antecedente es obligatorio ya que pro necesita adquirir los rasgos- propios de las entidades pronominales, es decir [Persona, Número], mediante dicha relación.

     Si adoptamos esta hipótesis para los casos que estamos tratando, es decir, si asumimos que el elemento vacío dentro de la estructura nominal es pro, en la representación de la oración siguiente el primer elemento vacío será una huella, y el segundo pro:

(19)
     Las recientes inundaciones, sobre las quei he leído hi un informe proi del Ministerio de Obras Públicas, han desbordado la capacidad de nuestros pantanos.

     Con este análisis, la relación entre las categorías vacías vinculadas con el operador-A', es decir hi y proi deja de ser problemática desde el punto de vista estructural, ya que hi manda-c proi como exige el ligamiento entre un pronombre pro y su antecedente. Pero el problema de este planteamiento es que resulta demasiado poderoso: permite establecer la relación entre una posición de complemento nominal (representada por pro en (2)) y un operador no argumental (representada por la palabra-qu en (2)) incluso en casos en que los juicios de gramaticalidad las desmienten, como sucede en (20):(45)

(20)
     a.*Las recientes inundaciones, sobre las quéi he archivado varios informes proi del Ministerio de Obras Públicas, han desbordado la capacidad de nuestros pantanos.
     b.*Ciertos temas de la Lingüística, sobre los quei encuaderné varios artículos proi, parecen cosa de marcianos.

En vista de casos como éstos, tenemos que rechazar este enfoque basado sobre la hipótesis de Cinque.(46)



5. Extracción desde el SDet

     En la literatura sobre la extracción desde el interior del SDet es posible encontrar algunas propuestas encaminadas a explicar casos en los que la extracción procede, aparentemente, contra las restricciones básicas señaladas en el apartado 1. En estas propuestas se sostiene la idea de que lo que se extrae es un argumento nominal y no un adjunto verbal, por tanto dichas propuestas no postulan una cadena entre dos categorías vacías, una en el entorno verbal y otra en el entorno nominal. Fijémonos de nuevo en un caso con extracción de un sintagma encabezado por una preposición diferente a de e interpretable como uno de los argumentos nominales:

(21)
     La última novela de Casariego, sobre la quei leí [SDet una [N' crítica demoledora hi]], me pareció una obra estupenda.

En un trabajo de Mallén(47) se estudian casos como éstos y se sostiene que lo que aquí ocurre es que la no manifestación de un argumento nominal agentivo dentro del SDet determina que la estructura léxica del SDet se desarrolle sólo hasta N' y no hasta SN. En tanto que la proyección no máxima, N', no es computada por la gramática a efectos de la determinación de barreras, al contrario de SN que sí es computado como barrera al no ser marcado-L. Por ello el movimiento de sobre la que desde el interior de N' en (21) es posible.

     Sin embargo, el análisis de Mallén no capta, de nuevo, la influencia que el verbo que rige a la estructura nominal tiene sobre la supuesta extracción de desde el interior de dicha estructura nominal. Por ejemplo, no explica que la presunta extracción de sobre la que desde el interior del SDet es posible en (21) porque el elemento extraído es «compatible» con el verbo de la cláusula relativa, es decir con «leer». Fijémonos en la degradación que experimenta (21) si cambiamos el núcleo verbal de la cláusula [361] relativa y lo sustituimos con el verbo olvidar.

(22)
     *La última novela de Casariego, sobre la quei olvidaba [SDet una [N' crítica demoledora hi]], me pareció una obra estupenda.

Ahora bien, si el núcleo verbal sobre el que procede la extracción determina la gramaticalidad de los ejemplos, tenemos que concluir que el verbo interviene directamente en la selección del elemento extraído. Es más, tenemos que concluir que lo que realmente se extrae en casos como (6) y (22) es un «adjunto temático» del verbo y no un «adjunto temático» del nombre. Esto explica por qué (21) es gramatical pero no (22): sólo los verbos como leer pueden construirse con un adyacente «adjunto temático», otros verbos, por ejemplo olvidar, no pueden. En otras palabras, casos como (21), incorrectamente interpretados como casos de extracción desde el interior de un dominio nominal, son casos de extracción de un adjunto verbal.

     Sin embargo, en oraciones como (21) existe al interior del SDet un elemento vacío, ei, que se interpreta como un elemento trabado por la palabra-qu: éste es por tanto un operador que traba simultáneamente dos elementos vacíos, la huella del adyacente verbal y ei al interior del SDet.

     Esta conclusión nos deja sin embargo aún sin respuesta a las preguntas siguientes:

           i. ¿en qué mecanismo descansa la interpretación conjunta del operador como adjunto del verbo y argumento del nombre?; y
     ii. ¿cómo es posible que la huella presente en la estructura verbal impida la generación de un argumento afín en la estructura nominal?

Debemos aclarar, en definitiva, qué es lo que marca la diferencia entre un ejemplo como (23), en el que debe considerarse activo el mecanismo que responde a las cuestiones anteriores, y otro como (24), estructuralmente afín pero en el que tal mecanismo no tiene incidencia:

(23)
     a. Las cárceles del Tercer Mundo, sobre las quei [SFlex leí hi [SDet un reciente informe de Amnistía Internacional ei]], deberían ser motivo de preocupación para cualquier persona sensata.
     b.* Las cárceles del Tercer Mundo, sobre las que leí un reciente informe de A.I. sobre las condiciones higiénicas, deberían ser motivo de preocupación para cualquier persona sensata.
(24)
     a. Los representantes de la oposición, con quienesi organicé hi una reunión (* ei), parecen por fin dispuestos a discutir con el gobierno.
     b. Los representantes de la oposición, con quienes organicé una reunión con el futuro presidente, parecen por fin dispuestos a discutir con el gobierno.

     En las próximas secciones se tratan las preguntas anteriores explicitando la diferencia entre (23b) y (24b).



6. Formación de cadenas

     Asumamos un tipo de gramática como el esbozado en Chomsky (1993), es decir, una gramática cuyas condiciones de buena formación se concentran en los niveles de interfase con los sistemas cognitivos interpretativos. «Concentrarse» tiene aquí el doble sentido de que dichas condiciones se desprenden de las características de los sistemas cognitivos de interpretación -el Articulatorio-Perceptual y el Conceptual-Intencional-, y de que se computan al alcanzar los niveles de interfase -Forma Fonológica y Forma Lógica (abreviada FL a continuación), respectivamente. Asumiremos también que la Gramática consta de una operación de Formación de Cadenas (FC) alternativa -parcial o exhaustivamente- a la de Muévase (M-). La diferencia entre una y otra consiste en que M- establece relaciones entre diversas posiciones estructurales mediante la aplicación de pasos sucesivos, mientras FC las sanciona mediante un paso único.(48) [362]

     Hemos mostrado que el tipo de ejemplos que estamos analizando no pueden explicarse mediante la aplicación de M- a un adyacente del nombre. En primer lugar, porque entre el operador-A' y la variable argumental en la estructura nominal con la que el operador se relacionaría, media más estructura de la permisible en este tipo de casos. Por supuesto, podría suponerse que la aplicación de M- procede mediante más de un paso. El primero llevaría el material extraído hasta una posición de adjunto al SV, acortando el camino hasta la posición de operador. De este modo, la presencia de una categoría vacía en el dominio del verbo serviría como intermediario entre el operador-A' y la variable en la estructura nominal, asegurando el cumplimiento de los requisitos estructurales que operan sobre la extracción. Ahora bien, de acuerdo con todo lo razonado arriba, esta operación se serviría de una posición de adjunto verbal que, para el tipo de verbos que dan lugar a resultados correctos, está claramente semantizada. Esto debería conducir a una violación del Criterio-, pues la cadena recibiría un valor temático independiente en cada uno de sus eslabones vacíos. Si el mecanismo que opera sobre nuestros ejemplos fuera realmente éste, deberíamos obtener más bien el resultado contrario. Es decir, en los casos en los que el verbo no es compatible con un adjunto temático, la introducción de una categoría vacía en el dominio del verbo no debería conllevar anomalía alguna, ya que ocuparía una posición estructural no semantizada de antemano. Sin embargo, la diferencia entre (21) y (22) muestra que éste no es el caso. En definitiva, el contraste que se recoge en (25) arroja los resultados contrarios a los que se podrían esperar de la aplicación sucesiva de M- desde la estructura nominal hasta la posición-A', pasando por el dominio del verbo:

(25)
     a. Los vinos chilenos, sobre los quei leí h'i una elogiosa crítica hi (1) de un célebre enólogo, están a la altura de los mejores riojas.
     b.* Los vinos chilenos, sobre los quei recorté hi, (') una elogiosa crítica hi () de un célebre enólogo, están a la altura de los mejores riojas.(49)

     Pasemos a estudiar las ventajas que ofrece FC sobre M-. En las construcciones que estamos considerando, un operador en una posición-A' se relaciona con varios elementos vacíos situados en posiciones marcadas desde el punto de vista argumental. Supongamos que lo que ocurre en tales casos es que tanto el operador como los elementos vacíos se generan directamente en tales posiciones. Supongamos también que FC es el mecanismo encargado de sancionar en FL la legitimidad de la interpretación en la que todos estos elementos son tomados como un solo objeto gramatical, o sea, como una cadena. Es decir, FC es el mecanismo con el que cuenta FL para comprobar si una secuencia compuesta de un operador y uno o varios elementos vacíos satisfacen las condiciones que se aplican sobre las cadenas operador-variable.

     Cuando el operador se relaciona con más de un elemento vacío, como es el caso que nos ocupa aquí, la principal condición que se aplica sobre este tipo de objeto en FL consiste en que la secuencia debe recibir un solo valor argumental. Por tanto, las categorías vacías intermedias, como también el operador, deben ocupar posiciones-A'. Ahora bien, el problema de nuestra construcción consiste, precisamente, en que todas las categorías vacías están marcadas argumentalmente. ¿Cómo dar cuenta entonces de estos casos? Una posibilidad obvia es que FC trate a estos casos como si las dos categorías vacías fueran una sola. Suponemos que FC tiene la capacidad de «nivelar» los valores temáticos atribuídos a dos o más elementos vacíos si tales valores son «similares», pues bien en este caso FC podrá admitir como válidas cadenas en las que este requisito se cumple, que son las construcciones que nos interesan, por ende sancionaría como correctamente formadas estructuras como (25.a.), y rechazaría como mal formada estructuras como (25.b.), repetidas aquí como (26.a.) y (26.b.) respectivamente. [363]

(26)
     a. Los vinos chilenos, sobre los quei leí e'i una elogiosa crítica ei de un célebre enólogo, están a la altura de los mejores riojas.
     b.* Los vinos chilenos, sobre los quei recorté e'i una elogiosa crítica ei de un célebre enólogo, están a la altura de los mejores riojas.

     Expresado en términos intuitivos, la propiedad que estamos atribuyendo a FC consiste en reducir los valores argumentales del adyacente verbal y del argumento nominal a un solo valor temático, diluyendo la pluralidad argumental en que se cifra el problema contenido en la cadena que parte del operador. Esto es posible en (25.a.) porque las dos categorías vacías tienen un mismo valor temático, pero no en (25.b.). Aquí el núcleo verbal no es compatible con un adyacente «adjunto temático», que sí es posible dentro del dominio de crítica, y de hecho es el valor que se asigna a ei. Por lo tanto si una categoría vacía e'i se genera como adyacente del verbo, dicha categoría no puede recibir el valor de «adjunto temático», y la nivelación de los valores temáticos de las dos categorías vacías no es posible. En consecuencia la oración es rechazada porque el mismo operador encabeza dos cadenas.

     Pasemos a revisar otros casos, y observemos el contraste entre (26.a.) y (27) -que repite el patrón de (4.b.) o (24.a.). La característica más relevante de (27) consiste en que la cadena que parte del operador integra como eslabón la primera categoría vacía e'i pero no puede integrar la segunda, i.e. ei:

(27)
     Los ecologistas, con quienesi Pedro organizó ei' un encuentro (*ei\ con el Ministro de Obras Públicas), siempre se han mostrado proclives a la colaboración.

Expresándonos aún intuitivamente, diremos que en este tipo de casos ocurre que FC se encuentra con dos categorías vacías cuya caracterización argumental es irreductible a un solo valor. La cadena, por tanto, resulta anómala en FL y es rechazada.



7. La condición de homogeneidad argumental

    Tratemos ahora de formalizar las intuiciones. Vamos a fijarnos, en primer lugar, en el tipo de ejemplos en los que la nivelación argumental no resulta posible-como en (27). En (27) tenemos, de un lado, un núcleo verbal de tipo agentivo -organizar- y, de otro lado, un núcleo nominal de tipo no agentivo -encuentro. El primero selecciona dos argumentos interpretables como «agente» y como «tema». La caracterización de los argumentos de encuentro resulta algo más difícil. En efecto encuentro parece seleccionar dos argumentos con valor de «experimentante»: uno el que se manifiesta con la preposición de y otro que se manifiesta con la preposición con(50). Esta idea es confirmada por el hecho de que los sintagmas correspondientes a estos dos argumentos son reversibles, como revelan (28.a.) y (28.b.), o combinables en un solo sintagma con de, como revela (28.c.):

(28)
     a. Fue muy elogiado el encuentro del presidente con el jefe de la oposición.
     b. Fue muy elogiado el encuentro del jefe de la oposición con el presidente.
     c. Fue muy elogiado el encuentro del jefe de la oposición y el presidente.

Asumiremos que la estructura argumental de este tipo de nombres se proyecta en una estructura sintáctica como la que se recoge en (29). Este tipo de representación se inspira en Hale & Kayser (1993):

     (29) atribuye al nombre encuentro una estructura de tipo larsoniano(51) en la que, en tanto que X0, selecciona una proyección máxima en la que está de nuevo incluido -representado por una categoría vacía- y pone en relación a dos experimentantes. De acuerdo con esta estructura, encuentro no selecciona directamente ningún argumento en la posición de especificador de la proyección máxima que representa su estructura [364] léxica completa, ya que esta posición es la propia de los argumentos con valor de agente.

     La estructura argumental seleccionada por un verbo como organzar -un verbo agentivo, como ya hemos indicado- se proyecta del modo representado en (30):

En esta estructura, el especificador de la estructura léxica completa es la posición básica del argumento agente.

     Pero aún nos falta por aclarar el lugar del adyacente de tipo preposicional, también encabezado por con, que recibe organizar en ejemplos como (31):

(31)
     Luis organizó con Pedro la presentación del libro.

Este adyacente es también reversible, en este caso con el agente(52):

(32)
     a. Luis organizó con Pedro la presentación del libro.
     b. Pedro organizó con Luis la presentación del libro.
     c. Pedro y Luis organizaron la presentación del libro.

Siguiendo Rigau (1990: 364-68), podemos atribuir a la preposición con que aparece en ejemplos como éstos un carácter de operador, cuyo valor consiste en introducir nuevos argumentos en la estructura léxica de un predicado. En concreto, un argumento encabezado por la preposición con es interpretado como un actor o agente más del predicado, entendido éste en términos holístas (i.e. como un predicado único). Rigau sugiere que estas cualidades interpretativas de con descansan en su incorporación sobre el verbo en el nivel de Forma Lógica, operación que le permite proyectar sobre su complemento el valor del argumento externo del predicado denotado por el verbo. Asumiendo de nuevo una distribución larsoniana de los argumentos en la estructura léxica de los predicados, lo anterior puede representarse del siguiente modo:

     Fig. 33

Interesa notar que las dos proyecciones marcadas temáticamente como agentes en esta estructura léxica se encuentran en el ámbito de un especificador.

     Se puede decir, basados en el contraste entre (29) y (33), que los adyacentes preposicionales presentes en una y otra representación son argumentalmente irreductibles entre sí -y no integrables, por [365] tanto, en una misma cadena- porque ocupan posiciones en ámbitos sobre los que no se puede aplicar la propiedad de nivelación de FC. Recordemos que en (27) hay una primera categoría vacía en el dominio de organizar, que ahora hemos situado en el ámbito de su especificador léxico, y una segunda categoría vacía en el dominio de encuentro, concretamente en el ámbito de su complemento léxico. Sobre la base de estas observaciones, sostendremos que los adyacentes caracterizados argumentalmente en el complemento de la estructura léxica de un nombre no se pueden nivelar con los caracterizados en el especificador de la estructura léxica del verbo que selecciona a la primera. De esta manera, los valores de las categorías vacías en (27) no serán nivelados y la oración será rechazada.

     Pasemos ahora a los ejemplos en los que parece actuar la operación de igualación argumental de la que estamos hablando. Son, recordemos, aquellos en los que podemos atribuir al verbo un «adjunto temático», al que hemos supuesto una posición de adjunto al SV. Recuérdese la representación dada en (17), que repetimos como (34).

     La posición del adjunto temático no cae exactamente dentro del dominio léxico del verbo, pues no es dominado por todos los segmentos de su proyección máxima. Esto marca una clara diferencia con relación a los casos anteriores, en los que los adyacentes verbales considerados estaban exhaustivamente dominados por las proyecciones verbales. Por tanto, la primera formulación de la hipótesis en el párrafo anterior puede fortalecerse ahora diciendo que el procedimiento de igualación argumental de FC no puede operar sobre las categorías vacías inscritas en el dominio de un mismo verbo; puede hacerlo, sin embargo, cuando sólo una de ellas está propiamente inscrita en dicho dominio.

     Admitiendo que los constituyentes inscritos en el dominio léxico del verbo reciben de éste una caracterización argumental más fuerte que los constituyentes no inscritos propiamente en él(53), podemos decir que la nivelación argumental entre categorías vacías es posible cuando entre ellas se registra un descenso en la fuerza de su caracterización argumental, de modo que la menos fuerte subordina su valor al de la más fuerte. En los casos considerados, la categoría vacía más fuerte es la que figura en la proyección nominal, y la menos fuerte la que lo hace en el ámbito verbal.

     Resulta interesante el hecho de que las categorías vacías parásitas se comportan de una manera totalmente diferente con relación a las observaciones hechas en el párrafo anterior. Como ha mostrado Engdahl (21), una categoría vacía parásita puede tener el mismo valor temático que la variable que la legitima(54), pero también puede tener un valor no igualable con el de la variable. En el ejemplo (35), la variable tiene valor de agente y el elemento parásito de tema, o tal vez de destino, de la acción verbal:

(35)
     ?¿Qué camareroi te dijo Juan que hi derramó la sopa mientras regañaba ei?

Estamos, por tanto, ante una prueba más de [366] la especificidad de nuestro fenómeno con relación al de la legitimación de los elementos parásitos vacíos.

     Reparemos ahora en el ejemplo (36):

(36)
     Turina, de quien he escuchado recientemente la retransmisión de varios conciertos, es un compositor que empieza a gustarme.

El interés de este ejemplo resulta de su contraposición con (37):

(37)
     *Turina, de quien he leído recientemente la fecha de varios conciertos, es un compositor que empieza a gustarme.

Las cláusulas de relativo de (36) y de (37) tienen, ambas, núcleos verbales compatibles con un adjunto temático, cuyo valor argumental es nivelable con el del agente del núcleo nominal conciertos. La diferencia entre uno y otro ejemplo reside en las características del núcleo nominal intermedio que aparece en cada uno de ellos: mientras que retransmisión es un nombre compatible, a su vez, con un adjunto temático, fecha no lo es(55). Por tanto, FC puede legitimar una cadena entre el operador relativo y la categoría vacía que complementa a conciertos en el caso de (36) pero no en el de (37). Esto indica que FC exige que una cadena tenga eslabones en todos los dominios léxicos que haya entre la cabeza y la cola de la cadena.(56)

     Otro aspecto interesante de (36) reside en que en los dos primeros dominios léxicos en los que la cadena tiene eslabones vacíos, tales elementos tienen el mismo valor de adjunto temático. Esto quiere decir que la propiedad de igualación argumental de FC puede aplicarse si la fuerza de la caracterización argumenta de las categorías vacías implicadas es (i.) decreciente, como ocurre entre ri y ri', en (38), o (ii.) estable, como ocurre en (38) entre e'i, y e''i, tomando siempre la cola como punto de partida en el cálculo:

-38
     Turina, de quieni he escuchado e''i (3 =2) recientemente la retransmisión e'i (2 < 1) de varios conciertos ri (1), es un compositor que empieza a gustarme.

Proponemos que en casos como (27), repetido como (39), en los que la igualación argumenta no es posible, se da, frente a los casos anteriores, un crecimiento en la caracterización argumenta de las categorías vacías implicadas:

(39)
     Los ecologistas, con quienesi Pedro organizó e'i (2 < 1) un encuentro (*ri (1)\con el Ministro de Obras Públicas), siempre se han mostrado proclives a la colaboración.

     Habiendo aclarado ya lo que entendemos por sentido creciente -«>»-, decreciente -«<«- e igual -«=»- entre los valores argumentales, estamos en posición de sugerir que la propiedad en que FC se apoya para determinar la legitimidad de la integración de una serie de categorías vacías en una misma cadena consiste en una condición de homogeneidad argumenta como la que formulamos en (41), basada en la definición de «homogeneidad argumenta» que proponemos en (40):

(40)
     Homogeneidad-:
     « ] desde el punto de vista argumental»
(41)
     Condición de homogeneidad argumenta en la formación de cadenas (CHA):
     « y son eslabones de la misma cadena <Qui...i...i> ssi y son -homogéneos»

La CHA atribuye a FL la capacidad de calcular la consistencia argumenta de una cadena de elementos coindizados. Este tipo de cálculo opera tomando la cola de la cadena como punto de partida. Tras computar la fuerza argumenta de la cola en función del tipo de posición que ocupa, CHA examina sucesivamente la de las variables que median entre la cola y el operador. Si [367] en cada uno de los pasos no detecta, con relación al anterior, un incremento en la fuerza argumenta de las variables implicadas, sanciona como legítima la cadena.

     Retomando algunos de los ejemplos con los que planteamos inicialmente la discusión, tenemos que la CHA explica la legitimidad de la cadena que atraviesa el ejemplo (6), repetido como (42), al tiempo que da cuenta de la posibilidad de interpretar el operador de manera conjunta, es decir, tanto en relación a V -«leer»- como en relación a N-«informe»:

(42)
     Las recientes inundaciones en el Norte de España, sobre las quei he leído e'i (2 < 1) un informe del Ministerio de Agricultura ri (1), ...

En otros casos, en cambio, el desarrollo de una interpretación conjunta no resulta posible bien porque el verbo pertenece a un tipo semántico que no legitima la presencia de una variable intermedia, como en (43), bien porque CHA detecta un incremento de la fuerza argumenta con relación a la variable inferior, como en (44):

(43)
     *Las personalidades destacadas, a las quei mi empresa siempre organiza la entrega de premios hi, ...
(44)
     *Los miembros del sindicato, con los quei el gobierno organizó h'i (2 > 1) una reunión hi (1),...


8. Conclusiones y perspectivas

     Lo que hemos propuesto consiste, en síntesis, en que una cadena operador-variables como la que se esquematiza en (45) resulta legítima si Forma Lógica es capaz de sancionarla como homogénea desde el punto de vista argumenta:

-45
Qui [SV V e'''i [SNn N e''i [SNn-1 N e'i [... [SN1 N ri]]]]]

El planteamiento implica la introducción de una puntualización mínima en la Teoría-: ciertos valores argumentales, sin ser totalmente idénticos, son conceptualmente reducibles los unos a los otros. Con todo, puede decirse que este extremo no afecta en absoluto la esencia de la condición que dicha teoría proyecta sobre el nivel de Forma Lógica, el Criterio-. Éste puede seguir entendiéndose como un filtro encaminado a salvaguardar la unicidad y la coherencia argumenta de los objetos gramaticales.

     Pensamos, como conclusión, que el procedimiento de formación y legitimación de cadenas propuesto en las dos últimas secciones es perfectamente compatible e integrable en un modelo gramatical como el de Chomsky (1993). La propia operación de FC, que, pensamos, encuentra una motivación clara en el tipo de ejemplos investigados en este trabajo, ha sido independientemente justificada por razones de economía de la derivación, por lo que puede considerarse una seria alternativa a «Movimiento de ». Por otra parte, la condición de homogeneidad argumenta a la que la hemos asociado, puede ser caracterizada como un filtro orientado a discriminar las cadenas aceptadas y rechazadas de entre las concebibles a partir de la secuencia de piezas léxicas que componen una oración, de tal modo que sólo las primeras quedan sancionadas en FL como interpretaciones legítimas de la oración.

     Una extensión natural de la hipótesis que hemos desarrollado aquí consiste en plantear la generalización de FC a las instancias no problemáticas de extracción, esto es a casos en que Movimiento de en principio se justificaría, con la consiguiente simplificación, en número de operaciones, de los mecanismos de la Gramática, así como de las características de las derivaciones. [368]



OBRAS CITADAS

     Aoun, J. 1983. «The Status of Movement Rules». UMass Occasional Papers in Linguistics 8: 1-16.

     Bach, E. y G. Horn. 1976. «Remarks on Conditions on Transformations». Linguistic Inquiry 7: 265-300.

     Bordelois, I. 1985. «Parasitic Gaps: Extensions of Restructuring». Generative Studies in Spanish Syntax. Eds. I. Bordelois, H. Contreras y K. Zagona. Dordrecht: Foris.

     Chomsky, N. 1982. Some Concepts and Consequences of the Theory of Government and Binding. Cambridge (MA): The MIT Press,

     _____. 1986. Barriers, Cambridge (MA): The MIT Press.

     _____. 1993. «A Minimalistic Program for Linguistic Theory». The View from Building 20. Essays in Linguistics in Honor of Sylvain Bromberger. Eds. K. Hale y S.J. Keyser. Cambridge (MA): MIT Press.

     Cinque, G. 1990. Types of A'-Dependencies. Cambridge (MA): The MIT Press.

     Demonte, V. 1987. «Rección y minimidad en el sintagma nominal». Sintaxis de las Lenguas Románicas. Eds. V. Demonte y M. Fernández Lagunilla. Madrid: Ediciones El Arquero.

     Engdahl, E. 1983. «Parasitic Gaps». Linguistics and Philosophy 6: 5-34.

     Hale, K. y S. J. Keyser. 1993. «On Argument Structure and the Lexical Expression of Syntactic Relations». The View from Building 20. Essays in Linguistics in Honor of Sylvain Bromberger. Eds. K. Hale y S. J. Keyser. Cambridge (MA): MIT Press.

     Larson, R. 1988. «On the Double Object Construction». Linguistic Inquiry 19: 335-91.

     Lasnik, H. y J. Uriagereka. 1988. A Course in GB Syntax. Lectures on Binding and Empty Categories. Cambridge (MA): MIT Press.

     Lorenzo, Guillermo. 1994. Geometría de las Estructuras Nominales Sintaxis y Semántica del SDet. Tesis doctoral. U de Oviedo.

     Mallén, E. 1991. «Noun Phrase Structure, Clitic-Doubling and Extraction». Linguistiche Beritche 134: 276-309.

     Martínez, J. A. 1993. «El 'complemento de compañía' y otras cuestiones de sintaxis prepositiva». Comunicación presentada en el VIII Congreso de ALFAL, Veracruz, México.

     Ormazabal, J. 1992. «Asymmetries on Wh-movement and Specific DP-s.» Syntactic Theory and Basque Syntax, Supplements of the Anuario del Seminario de Filología Vasca «Julio de Urquijo». International Journal of Basque Linguistics and Philology 27. Eds. [369] J.A. Lakarra y J. Ortiz de Urbina.

     Rigau, G. 1990. «The Semantic Nature of Some Romance Prepositions». Grammar in Progress. GIOW Essays for Henk van Riemsdijk. Eds. J. Mascaró y M. Nespor. Dordrecht: Foris.

     Fivero, M. L. 1985. «Binding in NPs.» Generative Studies in Spanish Syntax. Eds. I. Bordelois, H. Contreras y K. Zagona. Dordrecht: Foris.

     Rizzi, L. 1990. Relativized Minimality. Cambridge (MA): MIT Press.

     Ross, J. R. 1986. Infinite Syntax! Norwood (NJ): Ablex.

     Williams, E. 1981. «Argument Structure and Morphology. «The Linguistic Review I: 81-114. [370]





ArribaAbajo

Analyzing Syntactic Variation with Computer-Based Corpora: The Case of Modern Spanish Clitic Climbing

Mark Davies

Illinois State University



Abstract: A large computer-based corpus provides the data for the first comprehensive investigation of clitic climbing (lo debe comprar vs. debe comprarlo) in both written and spoken modern Spanish. The results are based on nearly 15,000 tokens with 32 different main verbs (ir+a, tener+que, desear, etc), extracted (using WordCruncher) from a computer corpus of 3.5 million words of spoken and written Spanish from ten countries. The large amount of data from both registers permits consideration of previously problematic questions. For example, the data suggests that a semantics-based model accounts well for the continuum-like distribution of clitic climbing with different main verbs, and that the nature of the clitic (reflexivity/animacy) is also important. Although the frequency of clitic climbing varies little from country to country, it is much more common in spoken than in written Spanish, which in turn poses major new questions concerning diachronic Spanish clitic climbing.

Key Words: Spanish language, clitics, clitic climbing, syntax, syntactic variation, corpus-based approach



1. Introduction

    One of the most persistent topics of research in Spanish syntax in the past two decades has been that of «clitic climbing», which is the apparently optional movement of unstressed object pronouns from a postverbal (a) to a preverbal position (b), in the context of infinitives subordinated to modal-like main verbs:

     (1a) ella quería [comprarlos]
     (1b) ella los quería [comprar ___]

     There are two issues dealing with clitic climbing that have been the focus of most previous research. First, investigators such as Contreras (1979), Luján (1980), Napoli (1982), Suñer (1980), Pizzini (1982), and Rosen (1989) have sought to explain why clitic climbing is not possible with all verbs, as it is in (b) above. For example, as the data from the study will show, with many verbs clitic climbing is only partially (a) or completely unacceptable (b):

     (2 a) ??ella los deseaba [comprar ___]
     (2b) *ella los anhelaba [comprar ___]

     Beyond the question of why clitic climbing occurs only with certain verbs, researchers have addressed the more general question of why any clitic climbing at all is possible. A common premise of recent syntactic theory is that there are tight constraints on the movement of elements across clausal boundaries, and the seemingly problematic movement of clitics across such a boundary needs to be explained:

     (3) ella los quería [comprar ___]
                                  ||(clausal boundary)

     Some generative grammarians such as Rizzi (1982) theorize a type of clausal reconstruction, in which the clausal boundary is removed and movement can occur. Other generativists such as Luján (1980) and Kayne (1989) suggest that the boundary remains intact, but that the absence or presence of other structural elements either permit or disallow clitic climbing. In the Relational Grammar model (Aissen and Perlmutter 1983), clitic climbing data provides important evidence for a supposedly [371] universal rule of Clause Union, in which the Argument Structure of both clauses is unified, and all lower clause elements (clitics, in this case) become main clause elements. Regardless of the particular model, explaining clitic climbing has been an important goal of several contemporary syntactic theories.

     1.1 Given the potential that clitic climbing has for syntactic theory, one would hope that previous researchers would have collected extensive data for Modern Spanish on which to base their analyses, but unfortunately this is not the case. Nearly all of the previous studies have been theory-oriented, and have provided valuable insight into why even limited clitic climbing occurs in different languages. Nevertheless, because the research questions under consideration often relied on the introspective judgments of one or two researchers, these studies have typically dealt very little with the actual frequency of clitic climbing in the community at large. Yet even among the theory-oriented studies, there are a few that have looked at data beyond the level of the individual researcher. Suñer (1980), for example, bases her conclusions on intuitions from ten native speakers, and Farrán (1990-91) bases his survey to sixteen native speakers from Puerto Rico.

     Most of the large scale data-based studies, however, were conducted more than fifty years ago. For example, Colburn (1928) looked at clitic climbing in short selections from ten novels from the 1800s, and Spaulding (1927) expanded the scope somewhat to also include some works from the early 1900s. The most ambitious study was Keniston (1937a), which briefly considered clitic climbing in a more general investigation of syntactic variation in selections from sixty prose works covering 1900-1930. The only extensive data-based study during the past fifty years has been Myhill (1988), which is based on fairly lengthy passages from seven novels by five recent authors. In summary, although there has been some data-based research on clitic climbing in written prose, most of the research is based on data from eighty to one hundred years ago. More serious is the fact that to date there has been no study made of clitic climbing based on any corpus of spoken Spanish. It is not difficult to see why researchers have found it hard to explain Spanish clitic climbing, when in fact there has been little understanding about how widespread it is and what type of variation exists.



2. Data base for Spanish clitic climbing

     The purpose of the present study is to provide the first comprehensive data base of clitic climbing in Modern Spanish, based on corpora from both the spoken and the written registers. A secondary focus will be to consider how this new data helps to clarify several issues that have previously been quite problematic, such as measuring the acceptability of clitic climbing based on the nature of the governing verb or the nature of the clitic itself. Regarding the composition of the data base, the spoken corpus on which the study is based on the complete «Habla culta» corpus, which comprises more than 2,500,000 words from 402 conversations with speakers from eleven different cities in ten countries in Latin America and Spain. The size of the eleven corpora ranges from 68,000 to 389,000 words each, with an average size of over 200,000 words. The goal was to also create a large written corpus, achieved by compiling a corpus of more than 1,000,000 words of prose text from 356 short stories by twentieth-century authors from the same ten countries as the «Habla culta» corpus. Each of these ten corpora was comprised of approximately 100,000 words. (Note 1 gives a complete listing of the «Habla culta(57)» cities and the countries represented in the «Cuento» corpus). The advantage of basing our corpus on the same countries for both spoken and written Spanish is that this will permit more accurate comparisons of clitic climbing in the two registers. To extract the clitic climbing data from the 3.5 million word corpus, the texts were scanned into a computer, and then indexed with the WordCruncher text [372] retrieval program. Once an every-word index of the corpus was constructed, the WordCruncher program could then carry out rather complicated Boolean and proximity searches on the data. I extracted all cases of any one of thirty two verbs followed by an infinitive, which in turn was either preceded (a) or followed (b) by a clitic pronoun.

      (4a) «El cumplimiento ante todo, señores», nos solía recalcar a diario.
(Chile2:Bombal:103)
(4b) Solía comentarme las cartas que recibía. (Cuba1: Leante:389)

The list of the thirty two verbs under investigation was based on those verbs that were most often included in previous research, as well the most frequently appearing verbs in the corpus. The examples were then further categorized (by main verb) and submitted to distributional analyses, producing the results presented. In total, nearly 15,000 tokens of potential clitic climbing constructions were extracted (as seen in 4a-4b), including more than 10,000 from the «Habla culta» corpus and more than 4,000 from the «Cuento» corpus.

     2.1 The large data base makes it possible to address several aspects of variation in Spanish clitic climbing that have not been adequately treated until this time. First, Section 3 will consider whether clitic climbing is more common in either the spoken or the written register. Some researchers have suggested that it is more common in spoken Spanish, but without a corpus of spoken Spanish there has previously been no way to test this hypothesis. Related to this sociolinguistic variation is the question of whether the frequency of clitic climbing with all verbs varies from one geographical dialect to another (Section 4).

     Section 5 treats the question that most previous research has centered on, which is the variation resulting from different main verbs (such as ir+a, tener+que, desear, etc.). Particular attention focuses on for the «degrees» or «shades» of acceptability of clitic climbing found with given main verbs. Finally, Section 6 considers other syntactic factors (besides the main verb) that are at play in conditioning clitic climbing, but which have rarely been looked at in previous research. These include the nature of the clitic itself (single vs. multiple clitics, reflexive vs. nonreflexive, and animate vs. inanimate referent) as well as the syntactic environment in which the construction occurs.



3. Variation by register

    Most previous research has been based solely or largely on the intuitions of a single speaker or a very limited number of speakers, and there has to date been no large-scale corpus-based investigation for spoken Spanish. As a result, it has been impossible to study whether the phenomenon is more common in one register than in another, although Suñer (1980:328) and others have hypothesized that it is more common in the spoken register. The data from the corpus confirms that this is the case. As the figures from Table 2 below indicate, the average for [+CC] in the spoken register is nearly three times more common than in the written register (e.g. acabar 29% vs. 85%, volver+a 27% vs. 81%). The only exception is the verb, pasar+a, in which 1/6 tokens in the written register is [+CC], but 0/5 in the spoken register. Nevertheless, there are only 11 cases with pasar+a, as opposed to nearly 15,000 with all verbs combined. Note also that ir+a is the only verb to take [+CC] in the majority of the cases in both registers and the only verb with which the written language approaches spoken Spanish. In summary, one can clearly say that [+CC] is more common in spoken than in written Spanish. Assuming the uncontroversial notion that the spoken register of a language represents the more popular tendencies of a language than the conservative written register, [+CC] represents a popular (rather than conservative) tendency of Spanish.



4. Variation by geographical dialect

     According to (Sankoff 1988), dialectal differences in syntax are generally found at [373] the register level (vertical dialects) rather than in different geographical divisions (horizontal dialects). Therefore, one should not expect to find nearly as much variation in [+CC] from one city or country to another as between the spoken and written registers. The data seen in Table 1 confirms the hypothesis that the difference in [+CC] between the eleven cities is quite slight. These figures are based on the average [+CC] for the eight most common verbs, which account for 83% of all tokens in the corpus. Note that the highest degree of [+CC] in the spoken register is found in México, which is the only city for which we have a Popular in addition to a Culto corpus. Note also that there is a difference of only four percent separating the seven cities at the lower end of the table.

Table 1. %[+CC] by city, country

 
                    Average Spoken Written            
México (C/P) 0.46 0.66* 0.26
España (M/S) 0.45 0.61* 0.28
Puerto Rico 0.41 0.56 0.26
Cuba 0.37 0.47 0.27
Colombia 0.36 0.45 0.28
Argentina 0.36 0.59 0.14
Venezuela 0.34 0.53 0.15
Chile 0.34 0.53 0.15
Perú 0.34 0.41 0.26
Bolivia 0.33 0.43 0.22
AVERAGE 0.40 0.56 0.23
*México (C/P) refers to the average of México Culto and México Popular, while España (M/S) refers to the average of Madrid and Sevilla.



5. Variation by verb

     As previously noted, very little research has dealt with gradations or shades of acceptability of [+CC] with given verbs. Typically, statements regarding acceptability have been given in binary terms; in other words, a verb either allows or disallows clitic climbing. This study is the first to consider in-depth the «degree of acceptability» of [+CC] with given verbs in both the spoken (and written) register. The results are presented in the following table, which gives for each register the % [+CC] with each verb and the corresponding number of tokens for that verb.

     Regarding the influence of the main verb, Table 2 indicates that verbs do not divide neatly into strictly [+CC] or [-CC] classes. Rather, there is a continuum ranging in spoken Spanish from ir+a (86% [+CC]) to poder (60%) to tener+que (38%) to intentar (11%) to esperar (0%). The problem is how to account for this continuum-like nature of main verbs, which is an issue has already been addressed in three important studies of Romance clitic climbing (Napoli 1982, Myhill 1988, and Rosen 1989). Their suggestion is that we adopt a meaning or semantics-based model, in which clitic climbing is not binary in nature ([+CC] vs. [+CC]), but one in which the frequency of the construction with different verbs is almost predicted to range over the entire continuum of [+CC] to [-CC].

     In the Napoli model, [+CC] is a function of how «auxiliary-like» the main verb is, with highly auxiliary verbs allowing clitic climbing more than weak auxiliaries or non-auxiliary verbs. She defines auxiliary verbs as verbs that «offer supplementary information about the action or state [of the embedded verb]» and that «add conceptually basic or simple information». Myhill casts the issue in terms of «grammaticalization» of the main verb. Those main verbs that mainly carry aspectual information or possess modal-like meaning are the verbs that most allow [+CC] (353-57). Rosen (1989), working from within the generative paradigm, makes reference to «light» vs. «heavy» verbs, in which the distinction arises from the meaning of the verb, and is mapped directly onto syntax.

     As for how these semantics-based accounts relate to the data from the corpus, Table 2 shows that of the fifteen verbs that most easily allow [+CC], nearly all of them fall into the auxiliary/aspectual/modal set of verbs. For example ir+a, acabar+de, volver+a, soler, venir+a, terminar+de, empezar+a, llegar+a, dejar+de, and comenzar+a all serve as aspectual markers (5-6). The modals include haber+de and tener+que (which express obligation), poder and saber (ability) and querer (desire). The one noticeable exception to this rule is hay [374] que, which expresses simple deontic modality, and yet never allows clitic climbing (7).

Table 2. %[+M by verb and register

 
      VERB AVERAGE/# SPOKEN/# WRITTEN/#             
 
ir+a 0.76 (3421) 0.86 (2838) 0.66 (583)
acabar+de 0.57 (143) 0.85 (92) 0.29 (51)
haber+de 0.56 (134) 0.80 (65) 0.33 (69)
volver+a 0.54 (379) 0.81 (159) 0.27 (220)
soler 0.46 (60) 0.86 (16) 0.05 (44)
poder 0.41 -4764 0.60 (3633) 0.22 (1131)
venir+a 0.36 (237) 0.55 (129) 0.18 (108)
saber 0.33 (164) 0.52 (119) 0.14 (45)
terminar+de 0.31 (23) 0.55 (13) 0.08 -10
querer 0.31 (1265) 0.47 (798) 0.15 (467)
empezar+a 0.29 (379) 0.45 (221) 0.13 (158)
llegar+a 0.27 (177) 0.42 (131) 0.11 (46)
dejar+de 0.25 (66) 0.41 (21) 0.10 (45)
tener+que 0.25 (1230) 0.38 (984) 0.13 (246)
comenzar+a 0.25 (219) 0.45 (75) 0.05 (144)
aprender+a 0.22 (24) 0.45 (19) 0.00 (5)
lograr 0.21 (121) 0.41 (45) 0.02 (76)
necesitar 0.20 (63) 0.33 (36) 0.07 (27)
deber 0.20 (714) 0.32 (473) 0.08 (241)
salir+a 0.17 (17) 0.35 (9) 0.00 (8)
pensar 0.15 (98) 0.24 (54) 0.07 (44)
desear 0.12 (39) 0.20 (14) 0.04 (25)
tratar+de 0.10 (216) 0.20 (110) 0.01 (106)
pasar+a 0.08 (11) 0.00 (5) 0.17 (6)
preferir 0.07 (51) 0.15 (30) 0.00 (21)
procurar 0.07 (37) 0.14 (18) 0.00 (19)
intentar 0.06 (52) 0.11 (11) 0.01 (41)
resolver 0.03 (13) 0.05 (7) 0.00 (6)
esperar 0.00 (18) 0.00 (14) 0.00 (4)
insistir+en 0.00 (6) 0.00 (1) 0.00 (5)
soñar+con 0 (1) 0.00 (1) 0.00 (4)
haber+que 0.00 (485) 0.00 (385) 0.00 (100)

Although further research is needed, the unexpected nature of hay+que may be due its origin as a verb of possession plus a locative adverbial element (HABER + Y), which sets it apart from the more lexically simple verbs.

      (5 a) como te decía antes, y lo vuelvo a repetir... (Sevilla: 16:197)
(5b) Él hace muchos años me vino a ver (Buenos Aires:33:510)
(6a) Lo pavimentaron, lo terminaron de pavimentar hace como tres meses atrás (Santiago:41:223)
(6b) Y los frecuenta todavía, o ya los dejó de ver? (México-Popular:6:78)
(7) Hay que darles buenas oportunidades (México-Culto: 16:213)

Compare now the auxiliary/aspectual/modal nature of these preceding verbs with that of the verbs that least commonly allow clitic climbing, which are verbs that are semantically complex and less modal-like: [375] tratar+de, preferir, intentar+de, insistir + en, etc.
      (8a) Taquito se acercó al grupo y trató de mirarla de la misma manera en que todos la habían mirado. (Perú:Echenique:361)
(8b) Y ella no la disimulaba ni intentaba disminuirla (Venezuela1:Mariño Palacio:183)

To further compare the two groups of verbs, consider the series of verbs that expresses desire: querer, desear, preferir, soñar+con. As the meaning becomes «conceptually less basic» (cf. Napoli), the percentage of [+CC] decreases accordingly (47%-20%-l4%-0%).

      (9a) Estoy trabajando en varias comunidades, y hasta me han querido hacer comunera. (Lima:21:278)
(9b) Como todo proceso que se desea apagar, el tratamiento que me hice yo fue colocarme hielo (Santiago:22:373)
(9c) Ahora prefieren irse a bailar, que a go go y la cuestión esa (México-Culto:32:443)
(9d) Y no sólo eso, sino que eran codiciadísimas y los mendigos ni soñaban con ponerles manos encima. (México1:Puga:272)

In summary, the data from the corpus suggests that a semantics-based account like that already proposed by Napoli (1982), Myhill (1988), and Rosen (1989) provides clues about which type of verbs are most likely to allow clitic climbing, and that this account also allows quite nicely for the continuum-like nature of the phenomena. Although these models, being meaning-based, cannot give precise quantitative statements regarding the probability of [+CC] with any given verb, they much more accurately account for the continuum-like nature of the phenomena than models that simply mark a given verb as [+CC] or [CC]. Finally, while this is not the first study to suggest this type of semantics-based account for clitic climbing, it does provide strong support in favor of such a model.



6. Variation by other syntactic factors

     While most past research has focused on the verb as the principal syntactic or semantic factor influencing clitic climbing, there have been occasional references to other syntactic factors. This section considers four of these: single vs. multiple clitics, reflexive vs. nonreflexive clitics, animate vs. inanimate clitics, and the nature of the syntactic material immediately preceding the clitic climbing construction. The data from the corpus will confirm that each of these factors impacts in some way on the probability that the clitic will climb to the main verb.

6.1 Multiple clitics

     Spaulding (1927:346) claims that when multiple clitics are involved (both of them objects of the embedded infinitive) there is a greater probability of [+CC], a claim disputed by Colburn (1928:428). Keniston (1937a:71-72) is the only study to quantify the effect, and shows that [+CC] occurs in 34/45 (75%) of the cases in which there are multiple clitics. In more recent studies this factor has received less attention and the common assumption (cf. Aissen and Perlmutter 1983:365, Luján 1980:383) is that two clitics can as easily stay attached to the embedded infinitive ([-CC]) as can one single clitic:

      (10a) quiero mostrártelos (Aissen and Perlmutter 1983:365)
(10b) quisiera poder dártelo (Luján 1980:383)

The data from the corpora, however, show that there is a higher incidence of [+CC] with multiple clitics (11a) than with single clitics. In other words the type of construction seen in (11b) is more marked than if there was one clitic.

           (11a) El estudiante sabe que no va a pasar el rato porque ella sencillamente no se lo va a permitir (San Juan: 15:296)
(11b) Los dioses le habían regalado una hermosa vida y quería retornársela antes de matarla en su hora. (Cuba2:Pastora Fernández:54) [376]

Table 3 below summarizes the data for single vs. multiple clitics, as well as the effect of reflexivity, animacy, and the syntactic environment. The table is based on the eight most frequent main verbs, which account for about 83% of all tokens. Regarding single and multiple clitics, the first section of Table 3 shows a difference of 87% (multiple clitics) vs. 68% (single clitic) in spoken Spanish and 62% vs. 31% in written Spanish. Both of these are statistically significant at the .001 level (chi-square values of x=64.87 and x=56.24, respectively).

6.2 Reflexivity

     Rosen (1989:181-90) devotes considerable attention to the question of whether [+CC] is equally as common with reflexive and nonreflexive clitics, and concludes that reflexive clitics tend to remain attached to the infinitive, since they are part of the argument structure (i.e. lexicon) of the verb:

      (12a) OK los chicos empezaron a caerse (unos sobre otros)
(12b)?? los chicos se empezaron a caer (unos sobre otros)

To date there have been no corpus-based studies that have investigated this phenomenon. This study confirms that there is a lower degree of [+CC] with reflexive clitics (13a) than with nonreflexive clitics. In other words, the lexically dependent clitic tends to mirror that dependency in the syntax by staying with the governing infinitive (13b). The data is summarized in the second section of Table 3, in which the difference between reflexive and nonreflexive clitics is significant at the.001 level.

           (13a) «Mamá se tiene que ir mañana a la ciudad a donde llegamos primero. (Puerto Rico1:García Ramis:115)
(13b) ¿No le da miedo que vaya a convertirse en un jipi?(México-Popular:21:286)

6.3 Animacy

     Myhill is the only researcher to have looked at how the animacy of the clitic affects clitic climbing, and he finds that animate clitics climb more easily than nonanimate clitics (1988:357-61). For example, te/os have 73% [+CC], me/nos= 47%, third person animate = 33%, and third person nonanimate = 18%. Myhill attributes this to the fact that there is a relationship between animacy and topicality, and highly topical material («what were talking about»; often «you» (te/os), «us» (nos), or «me» (me)), tends to be placed towards the beginning of the sentence. This study has followed Myhill's four-way categorization of te/os, me/nos, third person animate, and third person nonanimate. Although it would have been possible to do so, I have not broken the categories down farther into «person» distinctions like me vs. nos, both because we want the data to be correlated to Myhill's, and because the four-way categorization already provides evidence for the general effect of «animacy».

[377]

     The data in the third section of Table 3 indicate that Myhill's hypothesis is confirmed in both the spoken and written portions of the corpus. Clitics with an animate referent (14a) tend to climb more easily than clitics with a nonanimate referent (14b), with the difference again being significant at the.001 level.

           (14a) pero como sólo estaba apoyado, con todo su peso, sobre un codo, los brazos le empezaron a temblar (México1: Elizondo:203)
(14b) Como son tan pocos, pues no lo pueden hacer, en realidad (Madrid:23:433)

6.4 Preceding material

     One final syntactic factor of Modern Spanish clitic climbing that has not been studied by any previous researcher, but which nevertheless impacts on clitic climbing, is the nature of the syntactic material that immediately precedes the clitic climbing construction. Several researchers have looked at this issue for older stages of Spanish (Ramsden 1963:55-103 and Keniston 1937b:89-96), and they report that in Old and Middle Spanish, clitics with finite verbs nearly always took preverbal placement when the material preceding the verb was a subordinating conjunction (15a). When it was a coordinating element, on the other hand, placement was usually postverbal (15b).

      (15a) que se pudiessen dantes esparzer por la tierra
(15b) et dixieron le que uieran una animalia

Warmer (1991) and Alemán (1985), among others, attribute this to the fact that in older stages of the languages the clitics tended to «rest» on the preceding element (enclisis), and that conjunctions provided a better «landing site» than coordinating elements. Although there are obviously other syntactic elements (such as subjects, adverbials, etc.) that can occupy this preceding slot, these researchers note that the greatest contrast is between subordinating and coordinating conjunctions, as seen in (15a-b).

     In applying these Old and Middle Spanish facts to Modern Spanish clitic climbing, this study finds that the difference based on the preceding element is still statistically significant, albeit at only the .05 level. The fourth section of Table 3 shows the degree of [+CC] when the preceding element is QUE (the most common subordinating conjunction, =16a) and when it is Y(the most common coordinating element, =16b).

           (16a) Y si Ud va allá pensando que se va a curar eso naturalmente lo... lo cura (Habana: 15:489).
(16b) y me tengo que retirar un poco y aplastar aún más la cara contra el soleado cristal (España1:Sueiro: 158).

As mentioned, the investigation in this case treats only one subordinating conjunction (que) and one coordinating conjunction (y), where, based on Old and Middle Spanish data, we would expect the effect to be the greatest. Future researcher might consider the effect of other preceding elements, where the effect would most likely be more subtle.



7. Conclusion

     The size and completeness of the study makes it possible to gain some insights into a number of questions that could not be fully answered in previous studies. The data suggests that a semantics-based model such as Napoli (1982), Myhill (1988), and Rosen (1989) allows quite well for the continuum-like nature of clitic climbing, as well as suggesting what classes of verbs would be most like to allow it. The study also confirms hypotheses of some previous researchers about the influence of the clitic itself and the syntactic environment in which the construction occurs.

     7. 1 Perhaps the most challenging question relating to clitic climbing, however, is accounting for the difference in acceptability between the spoken and the written registers, and suggesting how this fits in with the historical trajectory of clitic climbing in [378] Spanish.

This question, of course, could not have been asked until the present time, in which there exists for the first time reliable data on the extent of [+CC] in the two registers. Concerning the historical shifts, Wanner (1982) shows conclusively that in written Spanish there has been a gradual but continual decrease in [+CC] from Old Spanish to the present time. Therefore even in Modern Spanish there should be evidence of decreasing [+CC]. The handful of previous corpus-based studies do confirm the very gradual decrease in clitic climbing in written Spanish even during the past 150 years (cf. Spaulding 1927, Colburn 1928, Keniston 1937, Myhill 1988). This decrease in [+CC] since Old and Middle Spanish is indicated in Figure 1.

     Assuming the non-controversial position that spoken Spanish more accurately reflects the popular tendencies of the language (vs. the conservative tendencies of the written language), this would suggest that clitic climbing should be less common in spoken Modern Spanish than in written Modern Spanish. Surprisingly, however, the corpus shows just the opposite to be true; clitic climbing is more common in the spoken than in the written register. To account for this, one must assume one of two things. The first possibility (#1 in Figure 1) is that there has been a very recent and dramatic increase in clitic climbing, reversing the historical trend, and this is evidenced as of yet only in the spoken register. In this scenario written Spanish still has a low degree of [+CC], but soon it will be at the level of spoken Spanish. Assuming the correctness of this model, one would want to explain why there has been such a dramatic reversal in [+CC], and explain why no other studies have found evidence for this.

     A more plausible account, perhaps, is that there has been a syntactic bifurcation (probably since Middle Spanish), in which clitic climbing has become progressively less common in the written register, but has remained popular in spoken Spanish, at about the Old and Middle Spanish levels (#2 in Figure 1). This would allow for the difference between the two registers in Modern Spanish and yet suggests that the long-term diachronic shifts towards decreased [+CC] in the written register have continued on, with no sudden reversals in direction. The logical question, obviously, is why there [379] was a syntactic split between the two registers at an older stage of Spanish, a question that invites further research.



WORKS CITED

     Aissen, Judith and David Perlmutter. (1983) «Clause Reduction in Spanish». Studies in Relational Grammar. Ed. David Perlmutter. Chicago: U Chicago P. 360-403.

     Alemán, Iris. (1985) «The Position of Clitics in Old Spanish». Cornell Working Papers in Linguistics7: 1-16.

     Colburn, G.B. (1928) «The Complementary Infinitive and its Pronoun Object». Hispania 11: 424-29.

     Contreras, Heles. (1979) «Clause Reduction, the Saturation Constraint, and Clitic Promotion in Spanish». Linguistic Analysis 5: 161-82.

     Farrán, Neus Bonet. (1990-91) «Movimiento clítico en el español de Puerto Rico». Revista de Estudios Hispánicos 17-18: 401-18.

     Kayne, Richard. (1989) «Null Subjects and Clitic Climbing». The Null Subject Parameter, ed. O. Jaeggli and K. Safir. Dordrecht: Kluwer. 239-261.

     Keniston, Hayward. (1937a) Spanish Syntax List. New York: Henry Holt and Company.

     _____. (1937b) The Syntax of Castillian Prose: The Sixteenth Century. Chicago, U Chicago P.

     Luján, Marta. (1980) «Clitic Promotion and Mood in Spanish Verbal Complements». Linguistics 18: 381-484.

     Myhill, John. (1988) «The Grammaticalization of Auxiliaries: Spanish Clitic Climbing» Proceedings of the Berkeley Linguistics Society 14. Berkeley: BLS. 352-63.

     Napoli, Donna Jo. (1982) «Semantic Interpretation vs. Lexical Governance». Language 57:47-69.

     Pizzini, Quentin. (1982) «The Positioning of Clitic Pronouns in Spanish». Lingua 56: 47-69.

     Ramsden, Herbert. (1963) Weak Pronoun Position in the Early Romance Languages. Manchester: [380] Manchester UP.

     Rizzi, Luigi. (1982) «A Restructuring Rule». Issues in Italian Syntax. Foris: Dordrecht, 1982. 1-48.

     Rosen, Sara Thomas. (1989) Argument Structure and Complex Predicates. Unpublished dissertation. Brandeis Univ.

     Sankoff, David. (1988) «Sociolinguistics and Syntactic Variation». Linguistics: The Cambridge Survey. Ed. Frederick Newmeyer. Vol 4. Cambridge: Cambridge UP. 140-61.

     Spaulding, Robert K. (1927) «Puedo hacerlo versus lo puedo hacer and Similar Cases». Hispania 10: 342-48.

     Suñer, Margarita. (1980) «Clitic Promotion in Spanish Revisited». Contemporary Studies in Romance Linguistics: Proceedings of the Eighth Annual Symposium on Romance Languages. Ed. Frank Nuessel. Bloomington, IN: IULC.

     Warmer, Dieter. (1982) «A History of Spanish Clitic Movement». Proceedings of the Berkeley Linguistics Society 8. Berkeley: BLS. 135-47.

     _____. (1991) «The Tobler-Mussafia Law in Old Spanish». Current Studies in Spanish Linguistics. Ed. Fernando Martínez-Gil and Hector Campos. Washington, Georgetown U P. 313-78.

     WordCruncherV. 4.5. Computer Software. Johnston & Company Electronic Publishers, 1993.

[381]



ArribaAbajo

- 3 -



ArribaAbajo

Hispania Features



ArribaAbajo

Una Página del pasado/Una página do passado

A Female Writer and the Irony of Forgetting: «Concha Espina: A new Star Ascendant», Vol. 7.2 (1924)

[382]

[383]

ArribaAbajo

Contract for Publication in Hispania

(Upon receiving notification of acceptance, the author should sign two copies