Resumen: El objetivo de este capítulo es mostrar en qué consiste la voz musical y, en especial, entender cómo la voz musical surge al establecer números y medidas sobre el movimiento de la voz propio de la prosodia en el habla.

Introducción

La tarea de la percepción musical no acaba con la identificación de los sonidos, sino que exige también la asignación de cada uno de ellos a un sujeto, a una voz. En efecto, la música requiere la organización en voces de todo el material sonoro. Para ello se sirve tanto de las marcas tímbricas que cada sonido posee, como de las leyes sintácticas del lenguaje musical, que son las que establecen los criterios de continuidad. Esta es la razón por la que para los antiguos teóricos musicales la voz era la primera categoría musical, de tal modo que los sonidos eran definidos a continuación como las partes más pequeñas de la voz musical. En ese mismo sentido, este capítulo pretende servir de puente entre la acústica y la teoría musical, cerrando, por un lado, el conjunto de nociones acerca del sonido que, a mi juicio, debería conocer un músico, e iniciando, por otro, el primer tema propiamente musical, la naturaleza específica de la voz musical y su origen en la prosodia del habla.

La voz musical se diferencia de la del habla en que mantiene las alturas tonales durante el tiempo suficiente como para que seamos capaces de percibir las notas y, en lugar de discurrir de forma continua, va a saltos a través de intervalos. A lo largo de este capítulo voy a mostrar que nuestro lenguaje musical es el resultado de la aplicación de números al movimiento continuo de la voz del habla, o dicho de otra manera, que la voz musical se origina a partir de la discretización de la prosodia del habla.

Para ilustrar el concepto de voz musical y para poder entender con claridad en qué sentido la música surge al establecer números sobre el movimiento de la voz, he elegido cuatro ejemplos que, debido a las características del instrumento y de la interpretación, muestran una progresión clara desde el movimiento totalmente continuo de la voz en el habla (ejemplo 1) hasta la estabilidad de las alturas tonales en el piano (ejemplo 4).

Por otra parte, para permitir apreciar cómo es la voz en cada caso he realizado mediante Matlab un tipo de representación gráfica que dibuja el movimiento de la voz, a la que podríamos llamar “melograma” (del griego mélos, melodía, y grámma, dibujo), y que atiende especialmente a nuestra cognición musical. Si el espectrograma se asemeja a la manera en la que nuestro sistema auditivo descompone el sonido, como hemos visto en el capítulo dedicado a la fisiología de la audición, esta forma de representación va a integrar de nuevo el objeto musical armónico y va a mostrar la evolución de sus parámetros a lo largo del tiempo.

Como en el espectrograma, también en el melograma la coordenada horizontal representará el tiempo, la vertical la frecuencia (traducida ahora a altura tonal y por ello expresada en cents) y la escala de color la mayor o menor intensidad, ahora vista como volumen sonoro. La transformación en altura tonal y en volumen sonoro de la frecuencia y la intensidad utilizará la escala logarítmica que vimos en el capítulo 5. Tomaré como punto de partida la nota la₀ a la que asignaré 0 cents y desde allí el número de cents irá incrementándose. Así, por ejemplo, 1.200 cents corresponderá a la₁, 2.400 a la₂, y así sucesivamente. Para mayor claridad, a la izquierda del número de cents figurará el nombre de la nota correspondiente en nuestra escala temperada. Respecto al volumen sonoro será el resultado de la traducción de la intensidad sonora a decibelios, expresados utilizando la misma escala de color, habitual ya en los espectrogramas.

Tenemos también que tener presente que el melograma sólo representa aquellos momentos en los que la voz está constituida por sonidos armónicos, es decir, en los que es posible definir una frecuencia y en consecuencia percibimos una altura tonal, mientras que aquellas partes en las que domina el ruido no están representadas, como es el caso de la mayoría de las consonantes o el del ataque inicial de las notas de piano.

El concepto de voz musical

Dos son las razones que justifican que el concepto de voz sea el fundamento de nuestra teoría musical. La primera y más importante es que el discurrir de la voz, y no los sonidos aislados, es la realidad más inmediata con la que nos encontramos en la música. La segunda es que el modelo sobre el que se ha construido nuestro lenguaje musical es la voz humana en el habla. En nuestra música hablamos de voz o voces para referirnos a las diferentes estructuras melódicas que conviven en el desarrollo de una pieza musical, pero que mantienen su identidad y su sentido. Y se llaman voz o voces precisamente porque su referencia es la voz humana en el habla, con toda su expresividad, emotividad y matices retóricos.

En efecto, la asignación de voces es la forma inicial en la que organizamos el material sonoro con la finalidad de hacerlo inteligible. Por naturaleza nuestra percepción busca siempre distinguir voces en medio del fondo sonoro, de la misma manera que busca figuras en las imágenes visuales. Es la manera de poner orden en el complejo sonoro que llega a nuestros oídos, de darle forma y dotarlo de significación. Si prestamos atención al ruido de tráfico de una carretera, por ejemplo, lo primero que nos surgen son "voces" en medio del ruido: la “voz” de la motocicleta, la “voz” del camión, etc. Organizamos cualquier material sonoro diverso en voces, es decir, en protagonistas, en “personajes”.

Encontramos, así pues, que la voz lleva asociada la idea de identidad, la de individualidad. La voz posee una marca, un distintivo, lo que hoy llamamos, precisamente por eso, un timbre, algo que le da una personalidad propia capaz de ser distinguida en medio de otras voces o de un ruido confuso. La palabra “voz” nos trae a la mente que hay un sujeto que está detrás, que hay un “alguien” que dice algo o, en música, que canta algo. Entre todas las informaciones que transmite la voz, hay una de especial relevancia: es su propio auto-identificador. La voz está diciendo constantemente “quién es”, y esto lo hace de múltiples maneras, de las cuales el timbre es quizás la más evidente. Por ejemplo, la voz del contralto puede ascender por encima de la del tiple y la del tiple, obviamente, descender por debajo de la del contralto, pero la voz del contralto seguirá siendo la del contralto y la del tiple la del tiple y el oyente no tiene ningún problema, incluso aunque se mezclen unas con otras, en reconocer cada una de esas voces.

En medio de una partitura, con sonidos simultáneos que suben y bajan y se entrelazan en todas las direcciones, podemos distinguir el desarrollo de cada una de las voces. No en vano “cantar las voces” es uno de los objetivos más importantes de todo instrumentista, muchas veces lo que diferencia al buen intérprete del mediocre. Por ejemplo, cualquiera que está aprendiendo a tocar el piano lo primero con lo que se encuentra es con la dificultad de dar las notas. Solo más tarde esas notas pasan a formar parte de “ideas musicales”, y todavía mucho más tarde, y después de mucho esfuerzo, surge en él la capacidad de entender y de contar la multiplicidad de “ideas” que laten en medio de la maraña de una partitura compleja y que se ponen de manifiesto en el juego de las diferentes voces. En efecto, estas ideas habitan la partitura de mil formas: unas veces en las voces intermedias, donde pasan casi desapercibidas; otras, perfiladas por notas que a veces están distanciadas entre sí por compases enteros; otras entre los extremos de los arpegios que acompañan muchas veces a las melodías; etc. Entonces es cuando la partitura comienza a tomar vida y deja de ser una amalgama de sonidos incomprensibles y mecánicamente ejecutados, para pasar a ser un conjunto de voces trabadas en el que cada una cumple su función y dice sus ideas. Esto, que puede parecer propio solo de los instrumentos capaces de dar notas simultáneas como el piano, se da también en instrumentos tan aparentemente poco dotados para la polifonía como el violín. ¡Cuántas veces hemos oído alabar la interpretación de un violinista diciendo que parecía un dueto! ¿Cómo podemos oír en un simple violín una fuga a tres voces? La música es cosa de voces y la tarea del instrumentista es “decir” las voces y expresar mediante ellas emociones y sentimientos. Algo parecido podríamos haber dicho del que aprende a escuchar música, porque aprender a escuchar música no es otra cosa que aprender a oír voces y a distinguir las ideas musicales que ellas van diciendo. Así es como cobra su pleno sentido la emoción de la música.

Dejando ya los aspectos cognitivos que justifican el carácter primigenio del concepto de voz en música, pasaré ahora a explicar en qué sentido digo que la voz humana ha sido el modelo sobre el que se ha construido nuestro sistema musical. La voz ha sido nuestra principal herramienta de comunicación con el mundo, en un proceso evolutivo que probablemente ha ido desde los primeros gruñidos, gritos y demás ruidos inarticulados, hasta las construcciones más elaboradas del habla y de la música.

En el habla la voz ha codificado principalmente tipos de ruidos distintos (las diferentes consonantes) y posiciones distintas de resonancias del órgano vocal (las diferentes vocales). Mediante combinaciones de ambos elementos hemos ido adquiriendo la capacidad de nombrar las cosas y de contar nuestras experiencias. Por ejemplo, si decimos la frase “quiero esto”, estamos utilizando el ruido “k” para empezar, luego el ruido “r”, después la especie de silbido “s”, y por último el ruido “t”. Para ayudarnos a articular estos ruidos, especialmente aquellos de muy corta duración, nos servimos de unos sonidos vocálicos, los cuales, a diferencia de los ruidos de las consonantes, sí poseen una altura tonal y tienen una duración suficiente. No obstante, no diferenciamos estos sonidos vocálicos por su altura tonal, sino por la manera en la que los hacemos resonar variando la posición de nuestro aparato fonador. En este ejemplo hemos utilizado tres conjuntos de resonancias vocálicas distintas: las propias de la “i”, las de la “e” y las de la “o”. No es posible explicar aquí qué son las resonancias específicas de cada vocal, ni cómo son ni en qué consisten las articulaciones de los sonidos que constituyen la cadena hablada; ahora nos interesa atender sólo a aquellos aspectos del habla que van a tener mayor repercusión en la música, en concreto, la altura tonal de los sonidos vocálicos.

Así pues, la voz hablada no consta sólo de ruidos, sino también de sonidos vocálicos que, aunque se distinguen por la forma de su resonancia (los denominados formantes propios de cada vocal) poseen una altura tonal. Pero en el habla la altura tonal en la mayoría de las lenguas no está prácticamente codificada y no lleva, por lo tanto, una parte importante de significación léxica. Aunque sí posee otra función muy importante: la altura tonal es la que organiza las palabras y las frases y, sobre todo, permite unir a la expresión de los conceptos los matices emotivos del hablante. La altura tonal, junto con la intensidad sonora y la duración temporal de las sílabas, constituyen los aspectos más importantes de lo que en general se denomina prosodia del habla.

En el caso de la música occidental el modelo sobre el que se ha construido el lenguaje musical ha sido la voz humana en el habla. Con esto no quiero decir que todo lenguaje musical tenga que surgir necesariamente ligado al habla, sino sólo que nuestro sistema musical lo ha hecho así: ha nacido en íntima relación con los aspectos prosódicos del griego antiguo, tanto en lo que concierne a las alturas tonales como a las duraciones. Los elementos de nuestro lenguaje musical (sonidos, intervalos, escalas, tiempos, compases) son el resultado de una abstracción de los aspectos prosódicos de la voz hablada, es decir, de aquellos aspectos que, como su nombre indica, son afines al canto (“prosodia” viene de ōdḗ, canto), los cuales son precisamente los que llevan en mayor medida la significación emotiva. Esta abstracción ha consistido en fijar numéricamente las alturas tonales y las duraciones, y en establecer entre ellas un sistema de proporciones. Con independencia de su evolución histórica, esta abstracción es un proceso lógico que ha dado lugar a un sistema de codificaciones capaz de expresar y transmitir una significación emotiva. Así pues, la voz musical, a diferencia de la voz del habla, es el resultado de la codificación de las alturas tonales de los sonidos y de sus duraciones.

El movimiento de la voz en el recitado de la primera estrofa de la Oda a la flor de Gnido de Garcilaso de la Vega

Comencemos examinando cómo es el movimiento de la voz en el habla. Veámoslo en la declamación de la primera estrofa del poema de Garcilaso de la Vega, Oda a la flor de Gnido. He elegido este poema como homenaje al instrumento sobre el que se basó la construcción de nuestro sistema musical, la lira. Garcilaso, además, es de los primeros poetas castellanos que vuelven su mirada al mundo antiguo, como queda reflejado claramente en el poema, y es el inventor de esta estrofa, la lira, en la que se combinan los versos endecasílabos, muy ligados al habla natural, con los de siete sílabas. Los versos son:

Si de mi baja lira
tanto pudiese el son que en un momento
aplacase la ira
del animoso viento
y la furia del mar y el movimiento,

Veamos en primer lugar un vídeo con el espectrograma del recitado de la estrofa entera.

Figura 1. Espectrograma de la primera estrofa de la Oda a la flor de Gnido de Garcilaso de la Vega.

La declamación es más lenta que lo habitual en un poema y las pausas entre versos son también muy exageradas, pues he pretendido principalmente mostrar con claridad cómo discurre el movimiento de la voz hablada. Pero hemos de tener en cuenta que la prosodia de la voz recitada ya tiene algo de musical: las palabras del poema han sido elegidas por el poeta teniendo en cuenta su sonoridad, su entonación y el ritmo que se deriva de la ordenación de los acentos (por eso se valora la musicalidad de una poesía). Así mismo, en un poema la rima establece la periodicidad del verso, sin necesidad de interrumpir de una manera tan grande como se ha hecho aquí la cadena hablada. Nada de esto se produce en el habla ordinaria, por lo que si hubiera elegido un fragmento del habla común, este tipo de formas que aquí apreciamos con claridad quedarían algo desdibujadas.

En el espectrograma vemos claramente separados los cinco versos de la estrofa y podemos distinguir también las diferentes sílabas, tal como han sido pronunciadas. Si nos fijamos, por ejemplo, en el primer armónico, en el componente más grave, podemos también hacernos una idea aproximada del movimiento de la voz.

Pero un espectrograma no es la forma de representación idónea para el movimiento de la voz, pues contiene mucha información que nos complica su observación. Ciertamente podemos apreciar que hay una relación clara entre lo que vemos y lo que oímos, pero a la hora de recuperar el mensaje sonoro nuestro cerebro da un paso más que no está recogido en el espectrograma. Como hemos visto en el módulo acerca de la percepción del sonido musical (enlace), nuestra mente integra el conjunto de armónicos para recuperar la unidad del sonido y seguir la evolución en el tiempo de los parámetros de ese sonido. Por eso nos viene muy bien utilizar el melograma, una forma de representación gráfica más apropiada para el movimiento de la voz, que reproduzca, aunque sea de manera aproximada, la evolución de los parámetros sonoros que realiza el intérprete y su recuperación por parte de nuestro cerebro. En el vídeo que presento a continuación se muestra el melograma del primer verso de este recitado. Al tratarse de un fragmento de escasa duración podemos apreciar con claridad los detalles del movimiento de la voz. Recordemos que los huecos de la gráfica se corresponden con los sonidos consonánticos que carecen de una altura tonal definida.

Figura 2: Vídeo con el melograma de la recitación del primer verso de la Oda a la flor de Gnido de Garcilaso de la Vega.

Pasemos ahora a analizar las características del movimiento de la voz en el habla que se pueden observar en el espectrograma y en el melograma del recitado de estos versos de Garcilaso, atendiendo especialmente a aquellas que poseen cierta validez general.

La primera y más destacada es la continuidad del movimiento de la voz en el habla. Si nos pidieran que a partir de estas gráficas precisáramos las notas que se han dado y cuándo, veríamos que esto es algo realmente imposible, pues la voz sube y baja continuamente sin detenerse nunca en ninguna altura determinada. Y eso que estamos ante un recitado, que si fuera en el habla cotidiana esta continuidad sería todavía más exagerada.

Por otra parte, el rango tonal del movimiento de la voz en el habla es reducido. En los vídeos vemos que incluso tratándose de un poema recitado, el rango total de la voz en el habla no excede de una octava. La altura tonal más aguda corresponde a la sílaba “fu” de “furia”, que vendría a ser un re3, y la más grave a la sílaba “ra” de “lira”, que en su punto más grave sería un re2. Desde la perspectiva musical nos interesa este dato porque es otro elemento a tener en cuenta a la hora de justificar la importancia del intervalo de octava y, especialmente, la importancia de las formas escalares de octava. Sin embargo, si atendemos solamente a cada sintagma, que en este caso coincide con cada verso (a excepción del segundo verso donde hay dos sintagmas), vemos que el rango es más reducido, situándose en torno a una cuarta o una quinta aproximadamente.

Así mismo, observamos que cada sintagma se encuentra definido prosódicamente por una fórmula cadencial descendente, es decir, la voz puede iniciarse en el punto más grave o en el medio, sube o baja, pero siempre termina en el punto más grave, habiendo abarcado un intervalo aproximado de cuarta o quinta. El modelo de cadencia descendente en torno a un intervalo de cuarta o quinta es de especial importancia, como se puede ver en el estudio de la teoría musical, para entender la construcción de nuestro sistema musical. El último verso, sin embargo, parece ser una excepción a este modelo. Encontramos que allí no se produce esta fórmula cadencial, sino que, por el contrario, la prosodia termina arriba. Esta ausencia de fórmula cadencial nos informa de que el sentido de la frase queda abierto, que la prosodia exige una continuación. En efecto, la estrofa entera constituye el antecedente de una oración condicional que va a reposar dos estrofas más allá.

Observamos también que, en general, el acento supone una elevación de la altura tonal respecto a la sílaba siguiente, junto a un incremento de la intensidad y una mayor duración de la sílaba. En castellano el acento es significativo a la hora de distinguir entre palabras distintas (por ejemplo, “público”, “publico” y “publicó”). Pero este acento se encuentra siempre supeditado e integrado dentro de la fórmula cadencial que organiza los sintagmas.

El movimiento de la voz en los compases iniciales del Lamento de Ariadna de Monteverdi

El siguiente ejemplo lo constituyen los seis primeros compases del Lamento de Ariadna de Claudio Monteverdi, compositor representativo de la nueva corriente musical que en la frontera de los siglos XVI y XVII intenta recuperar la música griega antigua y, en especial, el teatro musical griego. Podemos observar los rasgos de este intento en el carácter homófono de esta nueva forma de hacer música, caracterizada por una voz sola acompañada de un bajo continuo que lleva el soporte armónico y por el cromatismo intenso que intenta imitar los géneros cromático y enarmónico que se atribuían a la tragedia griega. La razón principal por la que he elegido este fragmento es por su proximidad a la prosodia del habla. En efecto, se trata de voz cantada, pero, al ser un lamento, es casi un recitativo: el tempo es lento, y el ritmo y la modulación de la voz son muy flexibles. Veamos primero la partitura y luego un espectrograma del fragmento entero y un melograma en el que podremos apreciar el detalle del movimiento de la voz de la segunda frase.

Figura 3. Partitura de los compases iniciales del Lamento de Ariadna de Monteverdi.

Figura 4. Espectrograma de los compases iniciales del Lamento de Ariadna de Monteverdi.

Figura 5. Melograma con el movimiento de la voz de la segunda frase del Lamento de Ariadna de Monteverdi.

Comenzaré por lo más evidente que podemos ver en ambas representaciones. El registro en el que se sitúa es mucho más alto que el recitado del poema de Garcilaso. Evidentemente la diferencia de altura tonal entre una voz de hombre y una de mujer es grande, aproximadamente una octava, pero la altura en la que se mueve este lamento es ya muy elevada para una voz hablada. Simplemente, si oyéramos hablar a alguien con una entonación en este registro nos resultaría como mínimo sorprendente.

Así mismo, el ámbito de esta idea musical es también superior al de la prosodia: a pesar de su austeridad, aquí recorre la octava entera con agilidad. Por otra parte, los saltos de altura tonal entre sílabas o palabras son impensables en la prosodia del habla (entre sib₄ y fa₄, entre mi₄ y si₄, y entre re₅ y fa₄). Solamente estos rasgos establecerían ya una diferencia clara entre este pasaje y el de la voz hablada.

Pero vamos ahora ya a lo que más nos interesa, el tipo de movimiento de la voz. Si nos fijamos en el melograma de la figura 5 vemos que la voz sigue teniendo un cierto carácter continuo, y de hecho no permanece fija prácticamente nunca. No obstante, hay una considerable diferencia con el movimiento de la voz en la declamación del poema anterior: en general, la voz tiende a mantener ahora unas líneas más o menos horizontales. El lenguaje musical ha construido estas “líneas” y ha definido las alturas tonales precisas sobre las que la voz se ha de mantener, o ha de girar en torno, durante un espacio de tiempo lo suficientemente prolongado para ser reconocidas como notas.

En este ejemplo, esta tendencia a la horizontalidad parece clara, hasta el extremo de que podríamos aventurar en el melograma las notas que constituyen la melodía. Ahora bien, su altura tonal se modifica a lo largo de la emisión, bien ascendiendo o descendiendo ligeramente, bien oscilando en torno a un valor medio. En la interpretación de estas notas vemos que, por un lado, la cantante ha tendido a imitar la continuidad de la prosodia hablada, deslizando la voz, pero, por otro, ha utilizado un recurso específicamente musical, un vibrato muy rápido y muy amplio.

Resumiendo, en la comparación de este fragmento cantado con la declamación anterior, vemos que hay acontecimientos definidos y, en general, separados, que nos permiten identificar como notas musicales cada una de los dibujos del melograma. Podemos también establecer un cierto valor medio en la altura tonal de las notas, pero las libertades expresivas de la interpretación hacen que la determinación precisa de la altura tonal no sea posible en todos los casos.

El movimiento de la voz en el inicio del Adagio de la Sonata para violín solo (BWV 1001) de J. S. Bach

El ejemplo siguiente corresponde al inicio del Adagio de la Sonata I para violín solo de J. S. Bach, BWV 1001. El violín —y lo mismo podríamos decir de los demás miembros de su familia— es el instrumento que más se asemeja en posibilidades expresivas a la voz humana. No en vano su desarrollo está muy ligado al estilo homofónico que triunfa a partir de 1600 (la seconda prattica que he mencionado a propósito del fragmento de Monteverdi). En efecto, al carecer de trastes, el violín puede dar cualquier altura tonal intermedia dentro de su tesitura (la primera dificultad a la que se enfrenta el violinista es la de afinar bien) y el intérprete puede modificarla con toda libertad a lo largo de su emisión, deslizando la voz de nota en nota o haciéndola oscilar a voluntad. También, al igual que en el canto, puede modificar libremente a lo largo de la emisión la intensidad del sonido e incluso la cualidad sonora, aumentando o disminuyendo el número de sus armónicos (enlace).

Veamos, igual que en el ejemplo anterior, la partitura, un vídeo con el espectrograma del fragmento entero y otro con el melograma en el que vemos el movimiento de la voz principal de la primera parte de la frase inicial. Como ahora el espectrograma es un poco más complicado, me ha parecido oportuno etiquetar las notas de la melodía.

Figura 6. Partitura de la primera frase del Adagio de la Sonata I para violín solo de J. S. Bach. — Figura 6. Partitura de la primera frase del *Adagio de la Sonata I para violín solo* (BWV 1001) de J. S. Bach.

Figura 7. Espectrograma de la primera frase del Adagio de la Sonata I para violín solo (BWV 1001) de J. S. Bach.

Figura 8. Melograma que representa el movimiento de la voz del inicio de la primera frase del Adagio de la Sonata I para violín solo (BWV 1001) de J. S. Bach.

Una comparación superficial de este ejemplo con el anterior nos muestra ahora una definición más clara de las alturas tonales y de las duraciones. Así mismo, salvo alguna pequeña excepción en notas muy rápidas y seguidas, el movimiento de la voz es interválico, es decir, la voz va a saltos. La voz se establece con claridad en una altura tonal determinada y procede a intervalos, de modo que resulta imperceptible la transición de una altura a otra, a excepción de la bordadura sib₄—la₄—sib₄ donde la ejecución es ligada. En este ejemplo estaríamos ya mucho más cerca de poder definir unas alturas tonales relativamente estables. Esto no se puede atribuir a un rasgo específico del instrumento, sino que ha sido la partitura elegida la que ha condicionado una interpretación más definida en las altura tonales. En lo que concierne a la duración de las notas, vemos también que mantienen un claro patrón de espaciamiento, es decir, una cierta regularidad rítmica. El hecho de que en el espectrograma algunas notas a veces parezcan superponerse a las siguientes es debido a la resonancia de la sala o, en su caso, a la posible reverberación añadida en la grabación.

No obstante, un examen más minucioso del espectrograma y del melograma nos permite observar varias características que contravienen esa aparente regularidad y que recuerdan al ejemplo anterior. En primer lugar, la altura de las notas que llevan el mismo nombre no siempre es exactamente la misma. En ocasiones el instrumentista tiende a aproximarse más a la nota inferior o a la superior, alejándose de la afinación temperada, para destacar más la atracción de las notas próximas. A modo de ejemplo, el segundo de los dos fa#₄ es casi un cuarto de tono más alto que el primero, lo que podríamos haber apreciado con más claridad que en el espectrograma si hubiera extendido un poco más la duración del movimiento de la voz en el melograma. Así mismo, en las notas cuya duración es más larga se aprecia con claridad una oscilación rápida de su altura tonal, que es el resultado del vibrato producido por el violinista, si bien este vibrato es mucho menos amplio que el que vimos en algunas notas del Lamento de Ariadna. El vibrato tiene principalmente dos finalidades: por un lado, dulcifica la aspereza de la cualidad sonora y, por otro, facilita la afinación, al posibilitar una cierta indeterminación de la altura tonal.

El movimiento de la voz en el inicio del Nocturno op. 9 nº 1 de Fr. Chopin

Como último ejemplo he elegido un pasaje muy cantabile, el inicio del Nocturno op. 9 nº 1 de Fr. Chopin. Presento en primer lugar la partitura y luego el espectrograma y la representación de las alturas tonales del movimiento melódico en el melograma.

Figura 9. Partitura del inicio del Nocturno op. 9 nº 1 de Fr. Chopin. — Figura 9. Partitura del inicio del *Nocturno op. 9 nº 1* de Fr. Chopin.

Figura 10. Vídeo con el espectrograma del inicio del Nocturno op. 9 nº 1 de Fr. Chopin.

Figura 11. Vídeo con el melograma del inicio del Nocturno op. 9 nº 1 de Fr. Chopin.

Las imágenes de ambos vídeos presentan unas características muy distintas de todo lo que hemos visto hasta ahora. En el espectrograma vemos que predomina la líneas horizontales, y en el melograma vemos con total claridad un conjunto de líneas horizontales que precisamente se superponen a la retícula que define las alturas tonales de nuestras notas del sistema temperado en el diapasón estándar.

Esta horizontalidad en este caso vienen determinada por la naturaleza del instrumento. El piano es un instrumento de afinación fija, en el que el principal parámetro sobre el que puede actuar el pianista es la velocidad de ataque, es decir, la rapidez con la que baja la tecla. Una vez que el macillo queda libre de la tecla mediante el mecanismo de escape ya no hay posibilidad alguna de modificar el sonido (salvo apagarlo antes o después al soltar la tecla y liberar el apagador). Por ello, la mayor parte de la información que el intérprete aporta queda condensada en las milésimas iniciales de su ataque.

Si en este ejemplo se nos pidiera de nuevo precisar las alturas tonales del movimiento de la voz utilizando solamente el espectrograma, la respuesta no plantearía ninguna dificultad. En el caso del espectrograma nos bastaría con trazar líneas horizontales que pasaran por el medio de cada figura o mancha de luz. En el melograma la respuesta sería todavía más evidente. Observamos, además, que, como es lógico, todas las notas con el mismo nombre están ahora a la misma altura tonal. Efectivamente, las alturas tonales están ahora totalmente definidas. Así pues, en este ejemplo podríamos asignar un número preciso a cada nota, su altura tonal expresada en cents. De hecho, realmente es al revés: es esta posibilidad de tener alturas tonales fijas, expresables numéricamente, la que nos permite dar nombre a las notas.

Podríamos observar también algunas pequeñas diferencias respecto al modelo ideal de líneas horizontales. Por ejemplo, las líneas correspondientes a las notas más agudas parecen estar ligeramente por encima de la retícula que marca la afinación temperada estándar (con el la₄ a 440 Hz). Esto se debe a la inarmonicidad del piano (enlace) que hace que la afinación de las notas superiores se vaya estirando un poco. Podríamos también apreciar algunas ligeras indecisiones en la afinación de algunas notas que parecen incluso oscilar ligeramente. Ello es debido al problema del derrame espectral (enlace) que unido al ruido que acompaña el ataque de cada nota provoca una cierta indeterminación en la precisión del reconocimiento de la frecuencia. Y todavía más, dejando al margen estas cuestiones, incluso las notas de un piano, en una escala minúscula cierto es, presentan también una cierta evolución en la frecuencia. Pero no es momento de tratar estas cuestiones ahora. Lo que nos interesa es que aquí si que vemos ya los elementos del lenguaje musical: las alturas tonales definidas con claridad que determinan las notas y que constituyen la referencia que se crea en nuestra mente musical y que nos permite entender y dar sentido incluso a los movimientos de la voz musicales que se alejan de este modelo y se acercan más al del habla.

Por otra parte, resulta también claro que aquí nos sería muy fácil especificar con toda seguridad la duración de cada nota (teniendo en cuenta, claro está, que lo que debemos medir es la distancia entre sucesivos ataques). Ya he explicado en el ejemplo del violín a qué se debe la superposición de algunas notas en el espectrograma. Aquí, en este ejemplo, la utilización del pedal hace que las notas tiendan a superponerse más que en el caso del violín. Pero también podría haber sucedido lo contrario, y la ejecución de las notas haber sido más picada. Ahora bien, desde el punto de vista métrico ambas situaciones son irrelevantes: afectan sólo al carácter de las notas, a la expresión, pero no al ritmo, es decir, no alteran la codificación métrica. Así mismo, resulta aquí también más clara todavía la existencia de una repetición de determinadas duraciones. Dar un paso más y ver que esas duraciones guardan entre sí las proporciones sencillas de doble, triple, etc., requeriría simplemente el uso de la regla.

Es importante destacar que en este ejemplo, en el que las altura tonales son claramente estables y definidas numéricamente, debemos seguir hablando de movimiento de la voz. Aunque sea a saltos, aunque ya estemos muy lejos de los rasgos de la prosodia, aunque no tengamos la versatilidad de la voz cantada, ni su imitación como hace la voz en el violín, también aquí hay un movimiento de la voz. El intérprete de piano tiene que hacer todo lo posible para que el instrumento “cante”. Sin el movimiento de la voz no existiría música en su sentido pleno, sino solamente una sucesión de sonidos carentes de significación. El piano es, de algún modo, el instrumento de referencia de nuestro sistema musical y en ese sentido tiene un papel equivalente al que tenía la lira en la Antigüedad.

Así pues, si volvemos al ejemplo del recitado del poema, donde la voz discurre sin solución de continuidad y la comparamos con el movimiento puramente interválico de la voz en un instrumento de afinación fija como es el piano, podemos ver cómo nuestro lenguaje musical es el resultado de la cuantificación de la altura tonal y, a partir de ella, de la duración.

El “espacio” de la significación musical

Para concluir este capítulo, y con ello este curso, voy hacer ahora una breve reflexión sobre lo que hemos observado en todas estas gráficas de los distintos tipos de movimiento de la voz.

Los melogramas nos han permitido intuir una noción muy próxima a la realidad sonora: el “espacio musical”, es decir, el “lugar” en el que se produce la significación de la música. El movimiento de la voz o de las voces discurre a lo largo del tiempo en un espacio sonoro que va del grave al agudo. Nuestro sistema notacional, nuestra partitura, representa de algún modo esta noción de espacio musical: el tiempo con la dimensión horizontal y la altura tonal con la dimensión vertical. Pero lo que tenemos en una partitura es la “obra musical”, la “idea musical”, una elaboración mental, no es su realización física, sonora, no es su interpretación. En el melograma, sin embargo, “vemos” el espacio de la música sonando, interpretada, hecha sonido.

Además, ese espacio musical, tal como queda representado en el melograma, es el espacio de nuestra sensación auditiva, no el del hecho físico, no es la vibración sonora. La música debe muchas de sus propiedades a la física del sonido, pero su verdadero punto de partida es nuestra sensación, la manera en la que nosotros percibimos los acontecimientos sonoros. El movimiento de la voz que hemos visto en todos los melogramas es movimiento respecto a nuestra percepción, es decir, es la variación dentro de una escala temporal adecuada a nuestra percepción de uno de los parámetros característicos del sonido: la frecuencia instantánea. Al margen de que desde el punto de vista físico el sonido sea movimiento —más exactamente movimiento vibratorio—, el movimiento que interesa a la música es el movimiento de la voz que percibimos, es decir, la variación en el tiempo de su altura tonal.

El melograma nos ha permitido también ilustrar con imágenes el proceso de abstracción que conduce desde la prosodia de la voz hablada hasta la constitución del sistema musical. La permanencia de la voz en alturas tonales determinadas permite establecer medidas y proporciones entre ellas. Estos números son los que codifican las alturas tonales y determinan un conjunto de intervalos a los que el sistema musical dará significación, organizando las escalas. El lenguaje musical se crea a partir del espíritu de la voz humana en el habla, pero adquiere su ordenación precisa —es decir, se codifica, se hace propiamente “sistema” (escala)— mediante un instrumento de afinación fija que permite precisar las alturas tonales. En el caso de su creación histórica, este instrumento fue la lira; hoy es el piano del que podemos considerar, en este sentido, que la lira fue un antecedente.

Por otra parte, hemos visto en el ejemplo del poema recitado dos características de la voz hablada que van a tener muchas consecuencias en la creación de nuestro sistema musical: una es el reducido ámbito tonal en el que se mueve la entonación de cada unidad sintagmática en el habla, un ámbito de aproximadamente una cuarta o una quinta; otra, la fórmula cadencial descendente con la que se delimitan estas unidades. Por las noticias que nos han llegado de los teóricos musicales y de los gramáticos antiguos, estas características se daban también en el griego antiguo, lengua que sirvió de fundamento a la construcción de nuestro sistema musical. La primera explicará en parte la importancia del tetracordio y de la consonancia de cuarta en las primeras formas escalares antiguas. La segunda se reflejará en el carácter descendente de todas las resoluciones: las cadencias descendentes van a dominar por completo el lenguaje musical de Occidente hasta la aparición de los primeros atisbos de la sensible ascendente en la música de los trovadores. Pero las consecuencias de esta cuestión pertenecen ya al estudio de la teoría musical.

Así mismo, estos ejemplos nos han permitido acercarnos mejor a un asunto que tiene que ver con la interpretación. Consideramos que una cualidad del intérprete es hacer hablar al instrumento. Mediante los melogramas hemos podido comprobar hasta qué punto esto es literal: hacer hablar al instrumento es acercarse a la prosodia del habla, es decir, alterar las alturas tonales o las duraciones de las notas que corresponderían al patrón escalar o rítmico, bien a través de inflexiones o desviaciones de la voz, bien a través de modificaciones de los tiempos (rubato, ritandando, etc.), para aproximarnos a la naturalidad del movimiento de la voz en el habla, adquiriendo mediante este pequeño alejamiento del código musical una alta significación emotiva.

Conclusión

Este capítulo ha tratado de mostrar que la música es esencialmente una cuestión de voz o de voces —entendiendo la palabra voz en su sentido más amplio— y que lo específico de nuestro lenguaje musical consiste en establecer números y medidas sobre ese movimiento de la voz. Al hacerlo así, al detenerse la voz durante algún tiempo en algún lugar del espacio sonoro, en alguna altura tonal concreta, surge el sonido musical, definido por los antiguos precisamente como la parte más pequeña de la voz melódica. El estudio de las relaciones entre esos sonidos —tanto las leyes que rigen su sucesión en cada una de las voces, como las de su reunión simultánea en los acordes— compete ya al estudio propio de la Teoría Musical.

Como dije al empezar, la finalidad de este curso ha sido proporcionar los fundamentos acústicos y psicoacústicos sobre los que se ha creado nuestro lenguaje musical. Por ello hemos ido examinando todos los aspectos que conciernen al sonido musical, desde su constitución física —como un movimiento mecánico que se transmite por un medio elástico cuyos parámetros frecuenciales cumplen unas características que las hacen adecuados para ser percibidos por el oído humano—, hasta su cualidad de ser el primer elemento de la melodía, el que se pone de manifiesto cuando el movimiento de la voz musical se detiene en un determinado punto del espacio sonoro. También hemos conocido, aunque haya sido someramente, cómo es y cómo actúa nuestro sistema auditivo a la hora de reconocer el sonido musical o armónico. Y de paso hemos aprendido a observar unas representaciones gráficas del sonido, el espectrograma y el melograma, que pueden ser de gran utilidad al músico y al musicólogo para realizar el análisis sonoro de una interpretación musical.

Aquí nos quedamos, pues, a las puertas del estudio de la Teoría Musical, que debe dar cuenta del lenguaje que permite dotar de sentido a los sonidos de la música.

- Capítulo anterior: Capítulo 13. Psicoacústica musical

Acústica Musical

Páginas

Capítulo 14. La voz musical