54. (Enero 2014) Similitud melódica como transformación de cadenas - III
Imprimir
Escrito por Paco Gómez Martín (Universidad Politécnica de Madrid)   
Lunes 20 de Enero de 2014

Con este artículo se acaba la serie sobre la similitud melódica como transformación de cadenas. Estamos tratando este tema principalmente a partir del artículo de Mongeau y Sankoff [MS90] Comparison of musical sequences. En los primeros artículos [Góm13aGóm13b] vimos cómo adaptar la distancia de edición, en principio pensada para computar la distancia entre cadenas de caracteres, a la distancia melódica. Esta adaptación incluyó ampliar la distancia con operaciones más complejas que la inserción, borrado y sustitución. En este artículo veremos cómo evaluaron la calidad de su distancia.

1. Evaluación de la distancia

En el artículo anterior vimos que el modelo de similitud melódica de Mongeau y Sankoff incluía una serie de parámetros que había que determinar de modo heurístico. Los autores lo hacen tomando pares de pieza cuya similitud melódica es fácilmente calculable. Esa pieza que eligen son las variaciones KV. 265 Ah, vous dirai-je maman, de Mozart. Se trata de un tema y 12 variaciones para piano; el tema es una canción infantil muy conocida. En el vídeo de abajo tenemos una interpretación en pianoforte, el instrumento original para el que se escribieron; el pianista es Steven Lubin.

Figura 1: Las variaciones KV. 265 de Mozart.

Sin embargo, Mongeau y Sankoff no usaron finalmente las variaciones originales de Mozart. Encontraron que tenían mucha variación entre sí como para afinar los parámetros de su modelo. Tomaron un arreglo del flautista de pico Duchesnes [Duc62] (páginas 69-72) de la misma obra de Mozart. La ventaja que tenía el arreglo de Duchesnes es que casi todas las variaciones tenían el mismo número, aproximadamente, de compases. Este arreglo contiene solo 9 variaciones en lugar de las 12 de Mozart. En la figura de abajo tenemos el tema principal y la variación número 5. Vemos que la variación consiste en figuraciones relativamente simples de la melodía. Las flechas muestran cómo se transforma cada nota del tema principal en la variación.

PIC

Figura 2: Relación entre la variación 5 y el tema principal.

El parámetro que necesitaban determinar Mongeau y Sankoff era k1 (véase [Góm13b]). Estudiaron varios pares de secuencias musicales para este fin y estos fueron: el tema principal y la variación 5, las variaciones 2 y 3, y las variaciones 3 y 7. Cada variación tiene un gran distinto de similitud. Sus pruebas dieron un valor final de k1 = 0,348.

Una vez tuvieron el algoritmo con todos los parámetros completos pudieron ejecutarlo y obtener las distancias entre el tema y las variaciones. La tabla de abajo muestra esas distancias. Observando la tabla se sigue que la variación 5 es la más similar al tema, con una distancia de 17,2, y la más diferente la variación 9, con distancia 45,1.


Tema Var. 1 Var. 2 Var. 3 Var. 4 Var. 5 Var. 6 Var. 7 Var. 8 Var. 9
Tema 0








Var. 1 19,1 0







Var. 2 29,1 29,1 0






Var. 3 17,2 22,7 26,6 0





Var. 4 33,1 33,3 33,2 33,5 0




Var. 5 17,6 20,0 30,3 21,0 34,0 0



Var. 6 33,1 41,8 44,1 39,1 46,7 34,8 0


Var. 7 40,5 41,7 49,5 45,1 44,5 45,0 40,3 0

Var. 8 41,5 43,9 44,4 39,7 42,1 40,1 47,4 54,4 0
Var. 9 45,1 48,3 49,2 38,1 45,9 46,8 44,7 49,3 38,0 0

Tabla 1: Tabla de con las disimilitudes.

A falta de métodos más modernos de agrupación, los autores llevaron a cabo un análisis de componentes principales tomando como datos de entrada la matriz de distancias. Los resultados están en la figura de abajo (es el análisis original que se encuentra en [MS90]). Se ven las variaciones 6 y 7 en un grupo, relativamente cercanas entre sí; las variaciones 8 y 9 en otro, aunque más alejadas entre sí; y por fin un gran grupo con el tema y el resto de las variaciones.

PIC

Figura 3: Análisis de componentes principales [MS90].

Las dos siguientes figuras muestran las variaciones 6 y 7. La variación 7 está construida sobre tresillos, salvo un par de negras con puntillo de final de frase, mientras que la variación 6 tiene más variación en la figuración rítmica (contiene corchea seguida de tresillo de semicorcheas, corchea seguida de cuatro fusas, corcheas con puntillo, negra ligada con semicorcheas). El lector puede apreciar la estructura de ambas variaciones y cómo se podría transformar una en otra en términos de la distancia de edición que hemos construido.

PIC

Figura 4: Variación 6 del arreglo de Duchesnes.

 

PIC

Figura 5: Variación 7 del arreglo de Duchesnes.

El análisis de componentes principales es una técnica estadística cuyo objetivo es reducir la dimensionalidad de los datos y así favorecer su visualización. La idea que hay detrás de esta técnica es hacer un cambio de base, por vía de una transformación lineal, de modo que en el primer elemento de la nueva base tenga la mayor varianza posible; el segundo, la segunda mayor varianza, y así sucesivamente. Después se proyectan los datos sobre la nueva base, que ha de tener menos elementos que el número original de variables. Cuando Mongeau y Sankoff escribieron el artículo corría el año 90 y no se conocían técnicas de visualización de datos provenientes de distancias; por ello, usaron el análisis de componentes principales. A mediados de los años 90 se empiezan a inventar técnicas específicas de visualización en Biología, en particular para visualizar las relaciones entre datos genéticos. Pronto esas técnicas se generalizan a otros campos, incluyendo la computación. En 1998 Huson [Hus98] lanza un paquete informático Splitstree que contiene los principales algoritmos para construir grafos filogenéticos; este es el nombre que reciben estas estructuras de visualización de datos. La última versión de su paquete se puede encontrar en [HB06]. Para construir un grafo filogenético se toma una matriz de entrada que contiene las distancias entre un conjunto de objetos (en nuestro caso piezas musicales, pero pueden especies animales, cadenas de caracteres, etc.). Un algoritmo típico filogenético devuelve un grafo plano en que la distancia entre dos nodos se corresponde tan fielmente como es posible con la distancia en la matriz. En principio, el algoritmo intenta ajustar la matriz a un árbol; si ello no es posible, introduce un número mínimo de nodos para realizar el ajuste y produce grafos con ciclos (que ya no son árboles). El algoritmo proporciona un índice de ajuste, el LS-fit, que indica el nivel de correspondencia entre las distancias en la matriz y las distancias en el grafo; se expresa como un porcentaje. Cuanto más alto, mayor es esa correspondencia. Para el caso que nos ocupa, el índice es LS-fit=99,85%, que indica que la correspondencia es muy alta.

La ventaja de los grafos filogenéticos sobre el análisis de componentes principales es que se basan en las distancias reales entre los objetos. El agrupamiento que se observa en el grafo es el que revela la propia distancia. Abajo tenemos el árbol filogenético asociado a la matriz de distancias.

PIC

Figura 6: Árbol de distancias.

Vemos que hay tres variaciones, la uno, la tres y la cinco, que están muy cercanas al tema. A mayor distancia de estas se encuentran las variaciones dos y cuatro; las más lejanas son las seis, siete, ocho y nueve. Las variaciones seis y siete son similares entre sí; lo mismo le ocurre a las variaciones ocho y nueve.

En la figura de abajo tenemos un filograma, que es un árbol filogenético donde la longitud de las ramas es proporcional a la distancia entre los objetos. Este tipo de grafo refleja mejor las relaciones de transformación entre las piezas musicales.

PIC

Figura 7: Filograma de distancias.

2. Conclusiones

Esta serie de artículos ha mostrado cómo usar la distancia de edición para medir la similitud melódica. Este fue uno de los artículos pioneros en el tema. Posteriormente, la investigación en este campo se desarrolló extraordinariamente y hoy en día se pueden encontrar decenas de artículos que proponen generalizaciones de la distancia de edición. Entre las más interesantes se encuentran las que han introducido resultados de cognición musical en el diseño de la distancia. En otra futura serie de artículos expondremos la filosofía y el funcionamiento de esas distancias.

 

Bibliografía

[Duc62] Mario Duchesnes. Méthodes de flûte à bec. BMI Canada Ltd., Toronto, 1962.

[Góm13a] F. Gómez. Similitud melódica como transformación de cadenas - I. http://divulgamat2.ehu.es/divulgamat15/index.php?option=com˙content&view=article&id=15541&directory=67, consultado en noviembre de 2013.

[Góm13b] F. Gómez. Similitud melódica como transformación de cadenas - II. http://divulgamat2.ehu.es/divulgamat15/index.php?option=com˙content&view=article&id=15633&directory=67, consultado en noviembre de 2013.

[HB06] D. H. Huson and D. Bryant. Application of phylogenetic networks in evolutionary studies. Molecular Biology and Evolution, 23(2):254–267, 2006.

[Hus98] Daniel H. Huson. SplitsTree: Analyzing and visualizing evolutionary data. Bioinformatics, 14:68–73, 1998.

[MS90] M. Mongeau and D. Sankoff. Comparison of musical sequences. Computers and the Humanities, 24:161–175, 1990.

 
Volver