¿La práctica discursiva condiciona la prosodia? Evidencia de una conferencia y una entrevista del español rioplatense

Resumen

En este trabajo se analizan las características prosódicas del habla espontánea condicionada por el tipo de práctica discursiva. Se compara el habla en dos prácticas discursivas distintas llevadas a cabo por un mismo hablante, una conferencia y una entrevista, ambas vinculadas con la divulgación científica de un mismo tema. Se analiza la prosodia como un fenómeno de interfaz entre la fonología entonativa y la pragmática: las configuraciones tonales nucleares y el fraseo en relación con su significado pragmático. Se tiene en cuenta cómo la entonación codifica la información de fondo o de primer plano y cómo codifica su procesamiento. Los resultados indican que existen diferencias con respecto al fraseo y a la frecuencia de ciertas configuraciones tonales. Se explican estas diferencias por medio de las características contextuales propias de cada práctica discursiva. Específicamente, se tiene en cuenta el grado de accesibilidad de los enunciados y la posibilidad de reparación comunicativa. De este modo, se sientan las bases para extender el análisis a otras situaciones comunicativas con diferentes participantes y modos de organización del discurso.

palabras clave: fraseo prosódico; configuraciones tonales nucleares; interpretación pragmática; práctica discursiva.

Abstract

This paper analyses the prosodic characteristics of spontaneous speech as conditioned by the type of discourse practice. Speech is compared in two different types of discourse by the same speaker, a conference and an interview, both related to popular science presentations on the same topic. Prosody is analysed at the prosody-pragmatics interface: nuclear tone configurations and phrasing in relation to their pragmatic meaning. In this line, intonation is studied in terms of the coding and processing of foreground and background information. Results show that there are differences in relation to phrasing and the frequency of occurrence of certain tonal configurations. These differences are explained taking into account the specific contextual characteristics of each discourse practice. Specifically, the degree of accessibility and the possibility of communicative repairs are considered. The findings pave the way for further research into other communicative situations with different speakers and different modes of discourse organisation.

keywords: prosodic phrasing; nuclear tonal configurations; pragmatic interpretation; discourse practice.

1. Introducción

La prosodia es uno de los recursos lingüísticos que utilizan las lenguas para comunicar mensajes orales de manera eficiente. Con respecto a los estudios de la prosodia del español rioplatense, existen numerosos antecedentes basados en datos de habla leída y semi-espontánea. Algunos autores han estudiado los contornos entonativos asociados a la estructura sintáctica de los enunciados (véase Granato 2005 y las referencias allí citadas). Por su parte, Gabriel et al. (2010) han abordado las configuraciones tonales en enunciados declarativos, exclamativos y preguntas con foco estrecho y foco amplio en datos de habla semi-espontánea. Las características del fraseo también han sido tratadas de manera experimental por Gabriel et al. (2011). Asimismo, se ha analizado la entonación y su significado pragmático utilizando datos del habla espontánea, extraídos de conversaciones telefónicas (Granato 2005), conferencias (Dabrowski et al. 2015) y entrevistas (Labastía 2016b, 2018; Labastía et al. 2016). En estos antecedentes el análisis siempre se circunscribe a un solo tipo de texto oral, sin analizar la incidencia que la tipología textual podría tener en la forma de la prosodia.

Hemos recurrido a los aportes de los estudios sobre discurso para delimitar y caracterizar los textos seleccionados para nuestro análisis. Tenemos en cuenta que los textos orales o escritos se pueden clasificar en distintas prácticas discursivas según los participantes, objetivos, modos y temas tratados, en una situación comunicacional en particular (Calsamiglia & Tusón Valls 2001; Ciapuscio 1994). Estas formas se han ido definiendo y ritualizando históricamente y son fácilmente identificadas por los hablantes en una comunidad lingüística, porque poseen formatos y reglas que están pactados por los hablantes (Maingueneau 1996 en Calsamiglia & Tusón Valls 2001:261).

En este trabajo buscamos comparar el fraseo y las configuraciones tonales en dos prácticas discursivas del español rioplatense —una conferencia y una entrevista llevadas a cabo por el mismo hablante— con el fin de establecer si existe algún tipo de relación entre la forma de la prosodia y el tipo de práctica discursiva. Este artículo se estructura de la siguiente manera: en la sección 2 presentamos el marco teórico prosódico para el análisis fonológico de los datos e incluimos los lineamientos teóricos pragmáticos para la descripción del significado de las distintas manifestaciones prosódicas. En la sección 3 describimos el corpus seleccionado y la metodología utilizada. En la sección 4 exponemos los resultados y el análisis acerca del fraseo y de las configuraciones tonales. Incluimos una breve reflexión final sobre los aportes realizados y las perspectivas de trabajo futuro en la sección 5.

2. Marco teórico

2.1. Marco teórico prosódico

El análisis prosódico de los datos se realiza en el marco del modelo métrico-autosegmental de la entonación (Ladd 2008; Pierrehumbert 1980) y se plasma a través del sistema de transcripción ToBI (Tones and Breaks Indeces ‘Tonos e índices de disyunción’) y su aplicación en el español Sp_ToBI (Sosa 2003; Prieto & Roseano 2010; Hualde & Prieto 2015). Con respecto a la organización prosódica de los enunciados, estos se estructuran en frases entonativas. Una frase entonativa puede estar compuesta por una o más frases intermedias (Beckman & Pierrehumbert 1986; Gabriel et al. 2011). El sistema ToBI clasifica los distintos tipos de frases por medio de niveles de disyunción: la frase intermedia corresponde a un nivel de disyunción 3, caracterizado por una pausa débil, y la frase entonativa se asocia a una disyunción 4, que equivale a una unidad prosódica mayor delimitada por pausas claramente perceptibles.

Por otra parte, en el modelo métrico-autosegmental, los contornos entonativos son el resultado de la concatenación de tonos altos H (high) y bajos L (low). Estos forman dos tipos de unidades: los acentos tonales (T*), asociados a las sílabas prominentes, y los tonos de final de frase, que aparecen al borde derecho de las unidades prosódicas: los acentos de frase (T-) marcan el final de la frase intermedia y los tonos de frontera (T%) marcan el final de la frase entonativa. Para la entonación del español se ha propuesto un tercer nivel, el tono de frontera M (mid), en el que la frecuencia fundamental (F0) se mantiene en el rango tonal medio del hablante (Beckman et al. 2002; Estebas Vilaplana & Prieto 2008).

En este trabajo, nos basamos en el análisis del español rioplatense propuesto por Gabriel et al. (2010) y Labastía (2018). Con respecto a los acentos tonales, estos autores proponen acentos monotonales, bitonales y un tritonal, que son relevantes para nuestro análisis y que mostramos en el Cuadro 1.

Acentos tonales
Monotonales	Bitonales	Tritonal
L* H*	L+H* H+L*	L+H*+L

Cuadro 1. Inventario de acentos tonales del español rioplatense.

En relación con los tonos de frontera, Gabriel et al. (2010) y Labastía (2018) también incorporan el nivel medio en sus inventarios. Sin embargo, Labastía (2018) lo representa por medio de !H%, con el fin de mostrar este tercer nivel y, a su vez, mantener la binariedad del sistema de notación. El signo de admiración de cierre (!) indica que el ascenso (H) no llega hasta la altura tonal máxima sino hasta un nivel medio en el rango tonal del hablante. Por otra parte, Labastía (2018) observa en sus datos un tono de frontera adicional, el bitonal L!H%, no encontrado en los datos de Gabriel et al. (2010) y que representa un ascenso desde una altura tonal baja hasta un nivel intermedio. En nuestro análisis hemos identificado este tono y lo hemos representado como LM%, dado que refleja con mayor fidelidad el rango tonal intermedio alcanzado, en consonancia con la notación de Gabriel et al. (2010) para el tono de frontera monotonal M%.

Por último, para el tono de frontera bitonal que comienza con un nivel alto y desciende hasta un nivel medio del rango tonal del hablante, proponemos la notación HM%. Si bien la representación de este tono es HL% para Gabriel et al. (2010) y H!H% para Labastía (2018), creemos que la opción HM% se ajusta más a la realidad fonética y, a su vez, permite establecer una correlación entre el análisis prosódico y la explicación pragmática de la entonación del español rioplatense (véase sección 2.2).

En función de lo expuesto sobre los tonos de frontera, resumimos el inventario que utilizamos en este trabajo en el Cuadro 2.

Tonos de frontera
Monotonales	Bitonales
L% H% M%	LM% HM%

Cuadro 2. Inventario de tonos de frontera del español rioplatense.

La combinación de un acento tonal nuclear y de un tono de frontera conforman un contorno melódico que denominamos configuración tonal nuclear, conocido también como contorno entonativo (por ejemplo, en Hualde 2014). Cuando el tono de frontera es L%, la configuración tonal nuclear es descendente, porque termina en el nivel de base del rango tonal del hablante. En cambio, las configuraciones tonales no-descendentes terminan en un tono de frontera con rango tonal medio (M%, HM%, LM%) o alto (H%). Véanse los Cuadros 5 y 6 con las configuraciones registradas.

2.2. Marco teórico pragmático

El análisis del significado de los datos se realiza dentro del marco de la Teoría de la Relevancia (Sperber & Wilson 1995; Wilson & Sperber 2004) y de su aplicación en la prosodia (House 1990; Escandell Vidal 2011). Para esta teoría cognitiva, los estímulos externos y las representaciones internas de los individuos se tornan relevantes cuando producen una mejora en la representación del mundo de un individuo. Un nuevo estímulo, que puede ser lingüístico (primer plano), se conecta con el contexto cognitivo del individuo (el fondo) y produce efectos cognitivos positivos en la medida en que este modifica su representación del mundo. Cuanto mayores sean los efectos cognitivos, mayor será la relevancia del enunciado. La teoría prevé también la existencia de elementos lingüísticos que guían el proceso inferencial denominados elementos procedimentales. Estos proporcionan instrucciones acerca de cómo procesar los enunciados para lograr su interpretación.

Dentro de este marco cognitivo, la entonación tiene las siguientes funciones: por un lado, dar instrucciones de procesamiento sobre qué partes del discurso deben ser consideradas fondo (postergando el procesamiento) o primer plano (indicando procesamiento) y, por el otro, dar instrucciones sobre la accesibilidad de los referentes en el discurso. Mientras que las configuraciones tonales descendentes marcan el enunciado como información de primer plano, las no descendentes indican que el contenido de ese enunciado es información de fondo. Por otra parte, en términos procedimentales, las unidades entonativas con configuraciones tonales suspensivas o ascendentes le indican al oyente que suspenda momentáneamente la derivación de los efectos cognitivos. Esta suspensión continuará hasta alcanzar una frase con tono descendente. Recién en este momento se procesará el conjunto de las frases acumuladas, evaluando su relevancia. Véanse, por ejemplo, Dabrowski et al. 2015; Labastía 2016a, 2016b, 2018; Labastía & Dabrowski 2011, para el análisis pragmático en la entonación del español rioplatense.

La interpretación de nuevos datos ocurre en un contexto específico del individuo e involucra la extensión de este contexto. Este es un subconjunto de los supuestos que un individuo ya posee y se combina con nuevos datos para dar lugar a efectos contextuales. Sin embargo, no toda la información de fondo es igualmente accesible en todo momento. Serán más accesibles aquellos conceptos que hayan intervenido en supuestos procesados recientemente en el discurso previo, como también lo será la información directamente observable. Entendemos por accesibles, entonces, a aquellos supuestos que son relativamente fáciles de recordar o que han intervenido en mayor medida en el procesamiento de otros supuestos. (Sperber & Wilson 1995).

En cuanto a la aplicación del concepto de accesibilidad en la entonación del español rioplatense, Labastía (2018) ha observado que las diferentes configuraciones tonales no descendentes indican distintos grados de accesibilidad y énfasis. La configuración tonal L* !H% denota un alto grado de accesibilidad, mientras que L+H* H% y L+H* L!H% marcan un grado menor. Por otro lado, la configuración L+H* H!H% marca una menor accesibilidad y, a su vez, advierte al oyente de la aparición inminente de información que, desde la perspectiva del hablante, resultará muy relevante. Resumimos esta idea en la Figura 1.

Figura 1. Configuraciones nucleares no-descendentes del español rioplatense según el grado de accesibilidad. Adaptado de Labastía (2018:201).

3. Corpus y metodología

Los encuentros orales implican una participación y presencia simultánea de los interlocutores y una negociación de la interacción basada en los roles e imágenes de los hablantes (cfr. Calsamiglia & Tusón Valls 2001). Podemos pensar el abanico de prácticas orales como un continuo con encuentros más elaborados y formales, por un lado, y encuentros menos elaborados e informales, por el otro: sermones, conferencias, juicios, clases, entrevistas, debates, diálogos entre amigos, peticiones, saludos, entre muchos otros.

Para nuestro análisis prosódico optamos por dos dispositivos de comunicación que han sido ampliamente definidos de manera socio-histórica (Maingueneau 1996 en Calsamiglia & Tusón Valls 2001:261): una conferencia y una entrevista llevadas a cabo por un mismo hablante. Nuestra informante es una mujer de aproximadamente 45 años de edad, hablante nativa del español rioplatense, con estudios universitarios y de postgrado. Es investigadora en educación y ciencias biológicas. Las dos prácticas discursivas seleccionadas corresponden a una conferencia TEDx (TEDx Talks 2017)¹ con una duración estimada de 14 minutos y una entrevista televisiva (Canal de la Ciudad 2016)² de aproximadamente 13 minutos. Se tuvo en cuenta que la base temática dominante de los dos textos fuera la misma: educación y biología.

Siguiendo la caracterización del discurso oral en Calsamiglia & Tusón Valls (2001), el Cuadro 3 sistematiza las similitudes y diferencias de las dos prácticas elegidas en el presente trabajo.

	Conferencia	Entrevista
Gestión	Monogestionada (monologada) - persona a audiencia	Plurigestionada (dialogada) - persona a persona
Proximidad de participantes	Distante (escenario y gradas)	Próxima (mesa en estudio televisivo)
Elementos no verbales	Sí (gestos, miradas, risas, etc.)	Sí (gestos, miradas, risas, etc.)
Canal	Cara a cara	Cara a cara
Ámbito	Académico (divulgación científica)	Periodístico (divulgación científica)
Tema	Educación y biología	Educación y biología
Registro	Semiformal	Semiformal
Relación entre participantes según conocimiento del tema	Asimétrica	Asimétrica
Apoyo de otros canales (visual o escrito)	No hay	No hay
Grado de elaboración³	Elaborada	Elaborada

Cuadro 3. Características de las dos prácticas discursivas del corpus.
Nota: en gris se señalan las diferencias.

Como el Cuadro 3 indica, tanto la conferencia como la entrevista presentan similitudes en cuanto a los elementos verbales, el canal y apoyos adicionales, el tema, el registro, la relación entre los participantes y el grado de elaboración. Las diferencias entre estas dos prácticas se vinculan con el tipo de gestión, la proximidad de los participantes y el ámbito. Es decir, la conferencia corresponde a una práctica discursiva monogestionada, en donde la persona cuya prosodia se analiza es la única participante que está a cargo de la oralidad y en la que la audiencia participa por medio de elementos no verbales tales como risas y gestos. La proximidad entre el emisor y los receptores es otro rasgo diferente en los dos discursos. Mientras en la conferencia existe una distancia corporal mayor (el hablante se encuentra en un escenario a un par de metros de la audiencia), en la entrevista hay una mayor cercanía (el entrevistador y el entrevistado están sentados en la misma mesa manteniendo un contacto visual directo). Por último, si bien la conferencia y la entrevista ocurren en un contexto de divulgación científica, la conferencia tiene lugar en un ámbito más académico y la entrevista, en cambio, se da en un ámbito periodístico.

Una vez caracterizadas las dos prácticas discursivas, se procedió a la selección de los fragmentos de habla. Para cada texto se identificaron las primeras 8 unidades temáticas, entendidas como la secuencia discursiva que mantiene una unidad temática y una cohesión interna. Con respecto a las frases delimitadas por tonos de fronteras, se analizó un total de 168 frases en la conferencia y un total de 153 frases en la entrevista.

El análisis perceptual de los textos se corroboró acústicamente por medio del programa Praat (Boersma & Weenink 2019). El rango tonal se ajustó entre los 100 y 500 hercios, rango adecuado para voces femeninas. En este programa se segmentaron los fragmentos de habla en frases intermedias y entonativas. Para determinar el nivel de disyunción se decidió tener en cuenta la interrupción en la fonación y, en los casos pertinentes, la realización del sonido /s/ con un punto de articulación alveolar [s] o glotal [h]. Es decir, una frase entonativa presenta interrupción de la fonación y realización del fonema /s/ a través del alófono [s]. En cambio, en el paso de una frase intermedia a otra, la fonación continúa y el fonema /s/ seguido de una consonante adyacente se realiza a través del alófono aspirado [h] (véanse los ejemplos de la sección 4.1 y la nota 4 al final). Luego se identificaron los acentos tonales sobre la base del inventario del español rioplatense (Gabriel et al. 2010; Labastía 2018). Para los fines de este trabajo, se tuvieron en cuenta únicamente las configuraciones tonales nucleares de frases intermedias y entonativas, dado que estas afectan el significado de la totalidad de la frase. Finalmente, se tabularon los resultados obtenidos y se realizó un tratamiento estadístico descriptivo de los datos.

4. Resultados y discusión

4.1. Fraseo

En primera instancia analizamos el tipo de fraseo teniendo en cuenta los niveles de disyunción en el habla seleccionada. Esto es, comparamos la cantidad de frases intermedias, con un índice de disyunción 3, y de frases entonativas, con un índice 4. La Figura 2 ejemplifica una secuencia de dos frases con nivel de disyunción 3 y una con nivel 4, mientras que la Figura 3 muestra una secuencia con tres frases con nivel de disyunción 4.⁴

Figura 2. Ejemplos de disyunción 3 (pero también con los hermanos, con los tíos) y disyunción 4 (con los abuelos) obtenidos de la conferencia.

Figura 3. Ejemplos de disyunción 4 (los chicos, hacen preguntas como éstas, todo el tiempo) obtenidos de la conferencia.

Como se puede observar en el Cuadro 4, el número de instancias de nivel de disyunción 4 es mayor en la conferencia (74%) y menor en la entrevista (63%). En otras palabras, la conferencia presenta un porcentaje levemente mayor de frases entonativas en relación con las frases intermedias.

	Conferencia	Entrevista
Disyunción 4	125 (74%)	97 (63%)
Disyunción 3	43 (26%)	56 (37%)

Cuadro 4. Niveles de disyunción en las frases analizadas según las prácticas discursivas.

La mayor cantidad de frases con disyunción 4 en la conferencia se puede atribuir a una manera de organizar la información que escoge el hablante para facilitar el procesamiento de la información por parte de la audiencia. Es decir, un fraseo con pausas de mayor duración posibilita la comprensión del mensaje, evitando dificultades en el entendimiento de la comunicación. En nuestros datos, existe una correlación entre este tipo de organización y la conferencia, que se caracteriza por ser monogestionada y con una distancia mayor entre hablante y audiencia. En este tipo de práctica discursiva los oyentes se encuentran en una situación en la que no pueden solicitar aclaraciones del mensaje de manera inmediata. Por el contrario, la entrevista presenta una mayor proximidad entre hablante y oyente, lo que permite al interlocutor solicitar aclaraciones o información en cualquier momento del diálogo. Esto se vería reflejado en la mayor proporción de frases con disyunción 3: 26% en la conferencia y 37% en la entrevista. Probablemente los hablantes pueden producir mensajes con niveles de pausa menores en la entrevista y poner en riesgo el procesamiento efectivo de la información, porque la reparación en línea es posible en todo momento.

4.2. Configuraciones

Dado que la proporción en la ocurrencia de las configuraciones tonales nucleares en el nivel de la frase intermedia resultó ser la misma que en el nivel de la frase entonativa,⁵ decidimos computar las configuraciones independientemente del nivel de disyunción. Es por ello que empleamos el símbolo % para indicar final de frase, sin tener en cuenta si éste corresponde a una frase intermedia o a una frase entonativa. A continuación, presentamos los datos de las configuraciones tonales agrupados en dos grandes categorías según el tipo de tono de frontera: configuraciones descendentes (L%) y configuraciones no-descendentes (M%, H%, LM% y HM%).

Para facilitar la interpretación de las configuraciones tonales nucleares, acompañamos la transcripción Sp_ToBI con flechas y esquemas que indican la dirección del movimiento tonal. Ilustramos las configuraciones registradas en el presente trabajo en el Cuadro 5 (configuraciones descendentes) y el Cuadro 6 (configuraciones no-descendentes).

Cuadro 5. Inventario de configuraciones nucleares descendentes del corpus.⁷

Cuadro 6. Inventario de configuraciones nucleares no-descendentes del corpus¹⁰.

Una primera comparación de los resultados de tonos ha revelado que existe un mayor porcentaje de configuraciones no-descendentes en los dos discursos. Tal como muestra el Cuadro 7, estas configuraciones ocurren en un 62% en la conferencia y en un 77% en la entrevista. En el marco de la Teoría de la Relevancia, este resultado es esperable debido a que en el habla natural, los hablantes presentan información de fondo para crear los contextos cognitivos que el oyente necesita para luego interactuar con la información de primer plano. La construcción de este contexto se logra a través de una secuencia de frases con información de fondo con tonos no-descendentes. Por lo general, esta secuencia culmina con una frase con configuración descendente, que indica información de primer plano que, a su vez, debe ser procesada para alcanzar los efectos contextuales esperados (cfr. Wilson & Sperber 2004).

	Conferencia	Entrevista
Descendente	64 casos (38%)	35 casos (23%)
No-descendente	104 casos (62%)	118 casos (77%)

Cuadro 7. Ocurrencias de tonos descendentes y no-descendentes en las dos prácticas discursivas.

Siguiendo con los resultados del cuadro 7, la conferencia presenta un 38% de tonos descendentes, mientras que la entrevista contiene un 23% de estos tonos. Creemos que este dato podría estar condicionado por el tipo de práctica discursiva y que esta diferencia se debe a que la mayor ocurrencia de tonos descendentes en la conferencia implica más cantidad de instancias de procesamiento de la información. Es decir, la distancia entre hablante y audiencia y la monogestión de la conferencia conducen a que la información deba ser procesada de manera más frecuente con el fin de asegurar el entendimiento efectivo del mensaje y evitar, así, que la audiencia sienta la necesidad de intervenir en el discurso.

4.2.1. Configuraciones descendentes

Un análisis más detallado de las configuraciones tonales revela similitudes y diferencias entre los dos discursos. En primera instancia, ejemplificamos las configuraciones descendentes del corpus en las Figuras 4, 5 y 6.

Figura 4. Ejemplo de configuración descendente alta H+L* L% obtenido de la conferencia.

Figura 5. Ejemplo de configuración descendente baja L* L% obtenido de la entrevista.

Figura 6. Ejemplo de configuración ascendente-descendente L+H*+L L% obtenido de la conferencia.

Las Figuras 7 y 8 contienen los resultados de frecuencia de aparición de los distintos contornos que culminan con L%.

Figura 7. Ocurrencias de tonos descendentes en la conferencia.

Figura 8. Ocurrencias de tonos descendentes en la entrevista.

De un total de 64 frases con tono descendente, la conferencia (Figura 7) presenta la configuración H+L* L% en un 58 por ciento de las frases. Le siguen en frecuencia la configuración L* L% (↘, 25 por ciento) y L+H*+L L% (↗↘, 17 por ciento). Por su parte, de un total de 35 frases con configuraciones nucleares descendentes, la entrevista (Figura 8) presenta la misma tendencia de porcentajes: en primer lugar aparece la configuración H+L* L% (↘, 51 por ciento), le sigue L* L% (↘, 26 por ciento) y, por último, se da la configuración L+H*+L L% (↗↘, 23 por ciento). Como podemos observar, existe similitud tanto en los tipos como en la frecuencia de aparición de las configuraciones descendentes en las dos prácticas discursivas analizadas. En otras palabras, tanto la conferencia como la entrevista recurren a las mismas configuraciones nucleares para señalar la información de primer plano y para indicar su procesamiento. Esta misma jerarquía de tonos (H+L* L% > L* L% > L+H*+L L%) está en consonancia con los datos del español rioplatense descriptos en Labastía (2018), por lo que podríamos suponer que la frecuencia de aparición de estas configuraciones corresponde a una característica general del habla espontánea.

Otro aspecto que hemos analizado es el modo en el que las frases entonativas se organizan en secuencias. Por lo general, estas comienzan con frases con configuraciones tonales no-descendentes y culminan con una frase con configuración descendente (Labastía 2018). Este agrupamiento de frases busca facilitar el procesamiento por parte del oyente de la información que transmite el hablante. Dado que la instrucción de evaluar la relevancia de los enunciados y el posterior logro de los efectos contextuales se indica a través del tono de frontera L% (cfr. sección 2.2), identificamos en primera instancia las secuencias de frases entonativas que finalizaban con este tono y que claramente sugerían el cierre de una idea. Posteriormente, computamos el número de frases entonativas e intermedias que precedían a cada tono L%¹¹. En el Cuadro 8 mostramos los resultados obtenidos.

	Conferencia	Entrevista
Cantidad de secuencias delimitadas con L%	51	26
Cantidad de frases previas a L%	113	127
Promedio de frases previas	2,2	4,9
Rango de frases previas	de 0 a 7	de 0 a 17

Cuadro 8. Secuencias de configuraciones delimitadas por un tono L% y configuraciones previas.

Los resultados del Cuadro 8 indican que en la conferencia los tonos L% están precedidos por un promedio de 2,2 frases con tonos en su mayoría no-descendentes, mientras que en la entrevista este promedio es de 4,9. Es decir, las secuencias en la conferencia son más cortas (con un máximo de 7 frases previas a L%) y el procesamiento ocurre con mayor frecuencia. Por otra parte, en la entrevista, las secuencias son más largas (con un máximo de 17 frases previas a L%) y la postergación del procesamiento es, en consecuencia, mucho mayor. Atribuimos esta diferencia entre las dos prácticas a que, en la conferencia, al no haber una relación directa con el oyente, el hablante trata de garantizar la comprensión del mensaje presentándolo en grupos de información más cortos e indicando el procesamiento de la relevancia de los nuevos datos con una frecuencia mayor. En cambio, la entrevista le ofrece al oyente la posibilidad de intervenir en la comunicación para pedir aclaraciones. Por lo tanto, el hablante en una entrevista se arriesga a transmitir la información en secuencias más largas, postergando en mayor grado el procesamiento de los enunciados. Resumimos esta idea en el Cuadro 9, en la que incluimos una secuencia representativa para cada discurso y el tipo de procesamiento que indica cada configuración.

	Conferencia			Entrevista
Ejemplo de secuencia	M%	M-	L%	M-	H-	M%	H-	M-	L%
Tipo de procesamiento	postergue		procese	postergue					procese

Cuadro 9. Ejemplos representativos de las secuencias de procesamiento delimitadas por L% (en gris oscuro).

4.2.2. Configuraciones no-descendentes

Ahora bien, con respecto a las configuraciones no-descendentes, la comparación de las dos prácticas discursivas muestra una mayor variedad de configuraciones que las halladas entre los tonos descendentes. Como ya se señaló, las configuraciones tonales no-descendentes señalan información de fondo e invitan al oyente a seguir procesando o atendiendo a la información (cfr. sección 2.2). A fin de facilitar la exposición de los resultados, mostramos un ejemplo con su respectivo análisis espectrográfico de las cuatro configuraciones tonales más frecuentes (Figuras 9-12).

Figura 9. Ejemplo de la configuración suspensiva L+H* M% obtenido de la conferencia.

Figura 10. Ejemplo de la configuración ascendente-descendente-ascendente L+H* LM% obtenido de la entrevista.

Figura 11. Ejemplo de la configuración ascendente baja L* M% obtenido de la entrevista.

Figura 12. Ejemplo de la configuración ascendente alta L+H* H% obtenido de la entrevista.

Si bien todas estas configuraciones aparecen en ambas prácticas discursivas, observamos una diferencia en su frecuencia de aparición. Las Figuras 13 y 14 muestran los resultados de las configuraciones tonales no-descendentes en la conferencia y en la entrevista, respectivamente.

Figura 13. Ocurrencias de configuraciones tonales no-descendentes en la conferencia.

Figura 14. Ocurrencias de configuraciones tonales no-descendentes en la entrevista.

De un total de 104 frases en la conferencia (Figura 13), la configuración más recurrente es L+H* M% (↗⟶, 67 por ciento), seguida de L+H* LM% (↗↘↗, 16 por ciento), L* M% (↗, 8 por ciento) y L+H* H% (↗, 6 por ciento). El resto de las configuraciones está formado por L+H* HM% (↗⟶↘) y H* M% (↗⟶), por debajo del 3 por ciento. Con respecto a la entrevista (Figura 14), sobre un total de 118 frases, las principales configuraciones corresponden a L+H* M% (↗⟶, 62 por ciento), L+H* H% (↗, 14 por ciento), L* M% (↗, 11 por ciento) y L+H* LM% (↗↘↗, 8 por ciento). Los demás porcentajes menores corresponden a L+H* HM% (↗⟶↘) y H* M% (↗⟶). El Cuadro10 muestra las cuatro configuraciones más frecuentes según el grado de aparición en cada discurso.

	1°	>	2°	>	3°	>	4°
Conferencia	L+H* M% (67 por ciento)		L+H* LM% (16 por ciento)		L* M% (8 por ciento)		L+H* H% (6 por ciento)
Entrevista	L+H* M% (62 por ciento)		L+H* H% (14 por ciento)		L* M% (11 por ciento)		L+H* LM% (8 por ciento)

Cuadro 10. Comparación de las cuatro configuraciones más frecuentes en las dos prácticas discursivas.

Como podemos observar en el Cuadro10, las configuraciones en el primer (1°) y tercer (3°) orden de frecuencia son similares en las dos prácticas discursivas, pero estas son distintas en el segundo (2°) y cuarto orden (4°). Es decir, mientras que en la conferencia la segunda configuración más frecuente es L+H* LM% (↗↘↗), en la entrevista la segunda configuración más frecuente es L+H* H% (↗). Por otra parte, la configuración menos frecuente en la conferencia es L+H* H% (↗), mientras que en la entrevista es L+H* LM% (↗↘↗) la que ocupa ese lugar en el ranking. En suma, los tipos de tonos son los mismos, pero la diferencia radica en la frecuencia de aparición. Creemos que esta última no es indiferente a la hora de procesar la información y su explicación se vincula con el grado de accesibilidad de los enunciados que serán procesados.

El tipo de configuración tonal que selecciona el hablante al presentar la información de fondo estaría ligado al grado de accesibilidad que ese enunciado tiene para el oyente. Tal como se expresó en la Figura 1 (sección 2.2), Labastía (2018) plantea el siguiente orden de configuraciones según el grado de accesibilidad que señalan, de más a menos accesibles: L* M% (↗), L+H* H% (↗), L+H* LM% (↗↘↗), L+H* HM%¹² (↗⟶↘). Los datos obtenidos en nuestra investigación muestran que una práctica discursiva como la conferencia parece favorecer la configuración ascendente-descendente-ascendente L+H* LM% (↗↘↗), mientras que la entrevista favorece la configuración ascendente L+H* H% (↗).

Al igual que en nuestro análisis sobre el fraseo (sección 4.1), consideramos que la alternancia en la frecuencia de aparición de estas dos configuraciones está motivada por algunas diferencias en el formato de ambas prácticas, como el tipo de gestión, la proximidad de los participantes y el ámbito en que ambas interacciones ocurren (véase Cuadro 3 en la sección 3). En este sentido, podemos decir que en la conferencia el hablante recurre más frecuentemente a la entonación ascendente-descendente-ascendente L+H* LM% (↗↘↗) para advertir a la audiencia acerca de la posibilidad de que ciertas frases podrían no ser tan accesibles y, de esta manera, adelantarse y garantizar el procesamiento de los enunciados. Recordemos que, en el contexto de una conferencia, la audiencia no tiene la posibilidad de hacer preguntas para reparar quiebres en la comunicación. La entrevista, por su parte, resulta ser un contexto más apropiado para tonos como L+H* H% (↗) que señalan una mayor accesibilidad de la información presentada. Esto es, en la entrevista los interlocutores establecen una interacción cara a cara en la que la negociación de la información es en línea y, por lo tanto, la reparación de posibles desajustes comunicativos es inmediata. El hablante, entonces, “arriesga” en suponer que la información de fondo puede ser altamente accesible y la presenta como tal.

5. Conclusión

Nuestro análisis brinda evidencia de que cada tipo de práctica discursiva favorece ciertas características prosódicas propias. La forma de gestión y la proximidad entre hablante y oyente parecen tener repercusión en las configuraciones tonales y el fraseo. En función de las características contextuales de una práctica discursiva (la imposibilidad o posibilidad de reparación comunicativa inmediata en la conferencia y en la entrevista, respectivamente), la prosodia ofrece una variedad de recursos que pueden garantizar una comunicación exitosa.

Por un lado, la gestión monologal y la lejanía entre los participantes en la conferencia requiere un número mayor de instancias de evaluación y procesamiento por parte del oyente. Nuestros datos reflejan el cumplimiento de este requerimiento a través de una mayor ocurrencia de disyunciones mayores (nivel 4) y del tono de frontera L%. A su vez, la información de fondo (con indicación de postergación del procesamiento) se presenta por medio de una menor cantidad de frases con configuraciones tonales no-descendentes. Al mismo tiempo, dentro de estas configuraciones no-descendentes prevalece la configuración L+H* LM%, advirtiendo al oyente que el grado de accesibilidad de la información transmitida es menor. Por otro lado, la gestión dialogal y la cercanía entre los participantes en la entrevista (que posibilitan la reparación ante un quiebre en la comunicación) favorecen las disyunciones menores (nivel 3) y la presencia de secuencias de contornos entonativos más largas, con un mayor número de frases no-descendentes que preceden a un tono L%. De este modo, el procesamiento de la información se posterga en mayor medida. A la vez, las configuraciones no-descendentes seleccionadas revelan un mayor grado de accesibilidad en la entrevista, como lo indica el predominio de la configuración L+H* H%.

Asimismo, la presencia de una mayor cantidad de configuraciones no-descendentes en ambas prácticas discursivas nos permite constatar que la construcción del fondo informativo juega un rol esencial en la interpretación de los enunciados. Este prepara al oyente para el procesamiento de la información de primer plano, que modificará el contexto cognitivo del oyente.

Creemos que este trabajo constituye un antecedente que sienta las bases para el análisis de la entonación condicionada por el tipo de práctica discursiva. Sin embargo, queda por investigar estos mismos aspectos prosódicos en otras prácticas discursivas a fin de poder corroborar nuestro análisis con respecto a la relación entre accesibilidad y entonación. Por último, los resultados de este estudio tienen repercusión tanto para la capacitación de los profesionales de la voz, cuya primera lengua sea el español, como para la enseñanza-aprendizaje de la prosodia del español como segunda lengua.

Notas

Conferencia a cargo de Melina Furman en el marco del programa de eventos TEDx (conferencias en vivo en donde se comparten ideas innovadoras).
Entrevista a Melina Furman en el programa televisivo “Efecto Mariposa” del Canal de la Ciudad, conducido por Sergio Elguezábal.
Si bien hemos considerado que el grado de elaboración en estas dos prácticas es similar (es decir, advertimos que existe una preparación previa en términos de organización de la información), suponemos que la entrevista admitiría un grado de improvisación mayor que la conferencia. En la entrevista se pautan previamente las grandes preguntas que serán abordadas, pero no están completamente establecidos el momento y el modo de las intervenciones del entrevistador. En la conferencia, en cambio, el hablante está a cargo de la totalidad de las decisiones de cómo transmitir el mensaje. Sería necesario estudiar la manera en que el nivel de improvisación impacta en las decisiones acerca del uso de la prosodia.
Tal como se adelantó en las cuestiones metodológicas (sección 3), hemos considerado la aspiración del sonido /s/ como una pista relevante para determinar el nivel de disyunción en las frases. En la Figura 2, observamos que existe aspiración de este sonido en los casos de frases intermedias (nivel de disyunción 3). Esto se puede observar por la falta de ruido en el espectrograma, como muestran los óvalos punteados. Sin embargo, en los finales de la última frase de la Figura 2 y de las frases de la Figura 3 que culminan con /s/ (con nivel de disyunción 4), no se observa la aspiración de este sonido, tal como se indica en los recuadros punteados en donde el sombreado es mayor, señalando la presencia de ruido en la frecuencia alta del espectrograma. Si bien es necesario estudiar más las pistas para los niveles de disyunción, creemos que estos datos significan un aporte a los estudios de la transcripción de la entonación, al menos para la variedad de español analizada.
Únicamente hemos observado que el acento nuclear L* ocurre con mayor frecuencia con los tonos de frontera L% (disyunción 4) y no así con L- (disyunción 3).
En la configuración L+H*+L L%, el F0 asciende y desciende en el ámbito de la sílaba tónica.
Los esquemas del movimiento del F0 se subdividen en columnas. La columna sombreada representa la sílaba tónica, la columna a su izquierda representa la sílaba pretónica y la/s columna/s a la derecha representa/n la/s sílaba/s postónica/s.
Las configuraciones con tonos suspensivos H* M% y L+H* M% podrían formar parte de la misma categoría fonológica. Sin embargo, hemos decidido mostrarlas por separado con el fin de destacar sus diferencias fonéticas tal como lo indican los gráficos respectivos.
En la configuración L+H* HM%, el F0 asciende en la sílaba tónica, continúa el ascenso en la primera postónica y luego desciende a un nivel medio en la segunda postónica.
Los esquemas del movimiento del F0 se subdividen en columnas. La columna sombreada representa la sílaba tónica, la columna a su izquierda representa la sílaba pretónica y la/s columna/s a la derecha representa/n la/s sílaba/s postónica/s.
Solamente consideramos L% como indicación de que el oyente debe procesar todas las frases presentadas hasta el momento, dado que es este tono de frontera el que representa el nivel más bajo del rango tonal del hablante. Por lo tanto, los casos en los que L- precede inmediatamente a L% (11 en la conferencia y 8 en la entrevista) no fueron tenidos en cuenta como instrucciones de procesamiento. Si bien hemos interpretado que un L% indica un cierre de ideas, intuitivamente no hemos percibido lo mismo ante la presencia de L-. Posiblemente esto se deba al hecho de que, en nuestros datos, los tonos L- están en un rango tonal al menos 10 hercios más altos que el tono L% de una misma secuencia. Teniendo en cuenta que esta es solamente una observación preliminar, sería necesario explorar la función procedimental de los acentos de frases con disyunción 3 a través del análisis acústico de más datos complementados con experimentos de percepción.
No discutimos la configuración L+H* HM% por ser muy poco frecuente en nuestro datos. Sin embargo, podríamos explicar su baja ocurrencia (2% en la conferencia y 3% en la entrevista) debido a la poca accesibilidad que señala. Queda pendiente el análisis de prácticas discursivas más informales y en ámbitos distintos a los estudiados en este trabajo.

Referencias

Beckman, M. E., Díaz-Campos, M., McGory, J. T. & T. A. Morgan. 2002. “Intonation across Spanish, in the Tones and Break Indices framework”, en: Probus 14(1). 9-36.

Beckman, M. E. & J. B. Pierrehumbert. 1986. “Intonational structure in Japanese and English”, en: Phonology 3. 255-309.

Boersma, P. & D. Weenink. 2019. Praat: doing phonetics by computer (Versión 6.1) [en línea]. Disponible en: http://www.praat.org/

Calsamiglia, H. & A. Tusón Valls. 2001. Las cosas del decir. Manual de análisis del discurso. Barcelona: Ariel.

Canal de la Ciudad. 2016. Educación y el nuevo paradigma + entrevista a Melina Furman en Efecto Mariposa [Video en línea]. Buenos Aires. Disponible en: https://www.youtube.com/watch?v=oVdQaU7hcsY&t=820s

Ciapuscio, G. E. 1994. Tipos Textuales. Buenos Aires: Eudeba.

Dabrowski, A., M. Guglielmone, M. P. Allende & L. Labastía. 2015. “Estructuración del discurso: declinación y selección tonal en español rioplatense”, en: Luchini, P. L., M. A. García Jurado & U. Kickhöfel Alves (eds.) Fonética y fonología: Articulación entre enseñanza e investigación, 244-255. Mar del Plata: Universidad Nacional de Mar del Plata.

Escandell Vidal, V. 2011. “Prosodia y Pragmática”, en: Studies in Hispanic and Lusophone Linguistics 4(1). 1-14.

Estebas Vilaplana, E. & P. Prieto. 2008. “La notación prosódica del español: una revisión del Sp-ToBI”, en: Estudios de Fonética Experimental 17. 263-283.

Gabriel, C., I. Feldhausen & A. Pešková. 2011. “Prosodic Phrasing in Porteño Spanish”, en: Gabriel, C. & C. Lleó (eds.) Intonational phrasing in Romance and German. Cross-linguistic and bilingual studies, 153-182. Amsterdam: Benjamins.

Gabriel, C., I. Feldhausen, A. Pešková, L. Colantoni, S.A. Lee, V., Arana & L. Labastía. 2010. “Argentinian Spanish Intonation”, en: Prieto, P. & P. Roseano (eds.) Transcription of Intonation of the Spanish Language, 285-317. Munich: Lincom Europa.

Granato, L. 2005. “Aportes de la entonación al significado del discurso”, en: Revista de la Sociedad Argentina de Lingüística 2005(1). 85-109.

House, J. 1990. “Intonation structures and pragmatic interpretation”, en: Ramsaran, S. (ed.) Studies in the pronunciation of English, 38-57. London: Routledge.

Hualde, J. I. & P. Prieto. 2015. “Intonational variation in Spanish: European and American varieties”, en: Frota, S. & P. Prieto (eds.) Intonation in Romance, 350-391. Oxford: Oxford University Press.

Hualde, J. I. 2014. “La entonación”, en: Núñez Cedeño, R. A., S. Colina & T. G. Bradley (eds.) Fonología generativa contemporánea de la lengua española (2a ed.), 267-290. Washington, DC: Georgetown University Press.

Labastía, L. 2016a. “Inglés británico estándar y español rioplatense: una comparación de la entonación”, en: Leiton, G. D. (ed.) III Jornadas Internacionales de Didáctica de la Fonética de las Lenguas Extranjeras, 119-146. San Antonio de Areco, Bs As: Universidad Nacional de San Martín.

Labastía, L. 2016b. “Declarative utterances in Buenos Aires Spanish”, en: Armstrong, M., N. Henriksen & M. Vanrell (eds.) Intonational Grammar in Ibero-Romance: Approaches through different subfields, 207-226. Amsterdam: John Benjamins.

Labastía, L. 2018. Entonación y estructura informativa en el español rioplatense. Tesis doctoral, Universidad Nacional de Educación a Distancia, España.

Labastía, L. & A. Dabrowski. 2011. “Entonación y relevancia en el discurso hablado del español rioplatense”, en: Revista de la Sociedad Argentina de Lingüística 2011. 7-26.

Labastía, L. Espinosa, G. E., Dabrowski, A. & M. Guglielmone. 2016. “Estructura informativa y prosodia en (pseudo)hendidas del español rioplatense y del inglés: implicancias para la adquisición de la prosodia en lengua extranjera”, en: Kickhöfel Alves, U. (ed.) Aquisição fonético-fonológica de língua estrangeira. Investigações rio-grandenses e argentinas em discussão, 393-417. Campinas, Brasil: Pontes Editores.

Ladd, D. R. 2008. Intonational Phonology. Cambridge: Cambridge University Press.

Maingueneau, D. 1996. Les termes clés de l’analyse du discours. Paris: Seuil.

Pierrehumbert, J. B. 1980. The Phonology and Phonetics of English Intonation. Tesis doctoral, MIT.

Prieto, P. & P. Roseano. (eds.) 2010. Transcription of Intonation of the Spanish Language. Munich: Lincom.

Sosa, J. M. 2003. “La notación tonal del español en el modelo Sp-ToBI”, en: Prieto, P. (ed.) Teorías de la entonación, 185-208. Barcelona: Ariel.

Sperber, D. & D. Wilson. 1995. Relevance. Communication and cognition (2a ed.). Cambridge: Blackwell.

TEDx Talks. 2017. Aprender en casa [Video en línea]. Buenos Aires. Disponible en: https://www.youtube.com/watch?v=bg1hKKdBkLc&t=96s

Wilson, D. & D. Sperber. 2004. “La teoría de la relevancia”, en: Revista de investigación lingüística VII. 237-286.

¿La práctica discursiva condiciona la prosodia? Evidencia de una conferencia y una entrevista del español rioplatense

Does discourse practice condition prosody? Evidence from a lecture and an interview in Rioplatense Spanish

Gonzalo Eduardo Espinosa
Universidad Nacional del Comahue / IPEHCS - CONICET

Alejandra Eva Dabrowski
Universidad Nacional del Comahue

¿La práctica discursiva condiciona la prosodia? Evidencia de una conferencia y una entrevista del español rioplatense

Does discourse practice condition prosody? Evidence from a lecture and an interview in Rioplatense Spanish

Gonzalo Eduardo EspinosaUniversidad Nacional del Comahue / IPEHCS - CONICET

Alejandra Eva DabrowskiUniversidad Nacional del Comahue

Gonzalo Eduardo Espinosa
Universidad Nacional del Comahue / IPEHCS - CONICET

Alejandra Eva Dabrowski
Universidad Nacional del Comahue