57. (Mayo 2014) COFLA: la música flamenca y su estudio computacional - II
Imprimir
Escrito por F. Gómez, E. Gómez, J. Mora y J.M. Díaz-Báñez   
Jueves 01 de Mayo de 2014

1. El grupo COFLA

En la anterior entrega [1] dimos a conocer el grupo COFLA [3], un grupo de investigadores que estudian la música flamenca desde un enfoque interdisciplinar. En COFLA podemos encontrar expertos en flamenco, músicos, musicólogos, expertos en literatura, psicólogos, pero también ingenieros, informáticos y matemáticos. Cuando el objeto de estudio presenta tal complejidad como es el caso de la música, el enfoque multidisciplinar es imprescindible y esencial. También describimos en esa entrega la metodología del grupo COFLA y proporcionamos al lector una lista de los problemas de investigación en que trabaja el grupo. Esos problemas provenían del estudio del flamenco y proporcionaban material de investigación a las disciplinas implicadas, desde la musicología a la computación. Estudiaremos el problema de la similitud melódica en el marco de la clasificación de estilos.

2. Similitud melódica en el cante a palo seco del flamenco

Uno de los problemas que ha abordado COFLA es el de la clasificación de los cantes a palo seco. Recordamos de nuevo del artículo anterior [1] las características del cante flamenco a fin de que el lector aprecie la dificultad del problema.

  • Uso de grados conjuntos. El movimiento melódico ocurre casi siempre por grados conjuntos.
  • Escalas. Ciertas modos tales como el modo frigio y jónico son predominantes. En el caso del modo frigio, la subida cromática del tercer y séptimo grados es frecuente.
  • Ornamentación. Existe un alto grado de ornamentación, que es también muy compleja. Los melismas son uno de los recursos expresivos más importantes.
  • Microtonalidad. El uso de intervalos menores que los del sistema temperado de la música clásica occidental es habitual.
  • Escalas enarmónicas. Esto se refiere a las diferencias interválicas microtonales entre las notas enarmónicas.

En nuestro estudio tomamos tres subestilos de un estilo llamado tonás; esos tres subestilos fueron deblas, martinete-1 y martinete-2. Las tonás son cantes que se cantan con ritmo libre. Las escalas y melodías son típicamente modales. Los modos más frecuentes que encontramos en estos estilos son el modo mayor, el menor y el frigio; también es habitual la alternancia de modos dentro de un mismo cante. Las letras de estos cantes varían ampliamente en tema. Estos cantes presentan un alto grado de ornamentación; véase [7] y [6] para más información. En las figuras 1 y 2 se encuentran transcritas dos deblas.

figura 1

Figura 1: Interpretación de Mairena de En el barrio de Triana.

figura 2

Figura 2: Interpretación de Lobato de En el barrio de Triana.

Dado que no había partituras disponibles, el primer paso que dimos fue el de hacer la transcripción automática a partir de los ficheros de audio. El corpus estaba compuesto de 72 tonás, las cuales incluían deblas, martinete-1 y martinete-2. Para tal fin, usamos el sistema propuesto por Gómez y Bonada [2]. El proceso de transcripción melódica se estructura normalmente en tres pasos diferentes que se pueden ver en la figura 3. Se empieza por una extracción de los descriptores de bajo nivel; sigue una segmentación de notas basada en la posición de los ataques de las notas; y, por último, un proceso de etiquetado de las notas. Véase [2] y las referencias allí contenidas para más información sobre la parte técnica de este algoritmo de transcripción.

figura 3

Figura 3: Fases de la transcripción melódica automática.

La salida de este algoritmo es un fichero tipo MIDI que contiene la sucesión de notas con sus alturas y duraciones. Esta sucesión representa el contorno melódico. El corpus que se empleó para nuestra investigación se puede encontrar en [4]. En términos geométricos, esa sucesión se puede interpretar como una cadena poligonal. A partir de entonces, muchas técnicas matemáticas se pueden aplicar al problema de determinar la distancia de dos cantes. El problema de determinar cuán similar son dos cantes se ha transformado en el de determinar al distancia entre las cadenas poligonales dadas por los contornos melódicos. Existe una miriada de algoritmos para calcular la distancia entre dos cadenas de ese tipo (distancia de edición, n-grams, correlación de vectores, etc.). Sin embargo, la mayoría de esas medidas carecen de validación perceptual, esto es, no han sido comprobadas con sujetos. En 2004 Müllensiefen y Frieler [8] atacaron este problema, por otro lado, tan básico. El primer paso fue establecer un sistema de evaluación de la similitud bajo ciertas condiciones. Este sistema incluía una selección muy rigurosa de los sujetos. Se eligieron por su capacidad de ser consistentes en sus juicios musicales durante periodos de semanas. El segundo paso fue estudiar 34 medidas de similitud (o distancias de disimilitud) que encontraron en la bibliografía existentes para determinar las medidas más adecuadas en términos de validez perceptual. Dado que la combinación lineal de dos medidas de similitud da una nueva medida de similitud, estos autores calcularon tales combinaciones lineales. La mejor medida de similitud resultó ser la combinación de la distancia de edición en bruto y la medida n-grams. Nosotros seguimos sus resultados a la hora de definir y calcular las medidas de similitud entre los cantes. La matriz de distancias obtenida se usó para alimentar un algoritmo que calcula y construye grafos filogenéticos. Dada una matriz de distancia entre un conjunto de objetos, un grafo filogenético es un grafo cuyos nodos son los objetos del conjunto y tal que la distancia entre los nodos del grafo se corresponde con la distancia en la matriz; véase [5] para las definiciones y detalles técnicos de su construcción. El grafo resultante cuando aplicamos el algoritmo a nuestro conjunto de cantes se puede ver en la figura 4.

figura 4

Figura 4: The phylogenetic graph for the melodic contour distance.

A causa del problema de la ornamentación mencionado anteriormente (en la entrega anterior), el grafo filogenético produjo resultados pobres (había varios cantes mal clasificados). En efecto, dos cantes pueden tener las mismas notas principales y las ornamentaciones entre estas ser muy diferentes. Sin embargo, la distancia de edición daría una distancia alta entre ellos. Hacía falta poner más conocimiento y refinamiento en el problema para obtener mejores resultados.

Típicamente, los descriptores musicales se clasifican en tres categorías: los descriptores de bajo nivel, que están relacionados principalmente con propiedades tales como la frecuencia, el espectro o la intensidad; los descriptores de medio nivel, asociados con la altura del sonido, la melodía, los acordes, el timbre, la métrica o los patrones rítmicos; y finalmente los descriptores de alto nivel, típicamente relacionados con el significado y la expresividad, como por ejemplo el carácter y las respuestas afectivas y motoras. Para sortear el problema de la ornamentación en los cantes, definimos una distancia basada en descriptores de medio nivel. Los descriptores de medio nivel que usamos para todas las tonás de nuestro estudio fueron los siguientes:

  1. Nota inicial de la pieza;
  2. Simetría del grado más alto de la escala en el segundo hemistiquio;
  3. La frecuencia del grado más alto del segundo hemistiquio.;
  4. Presencia del clivis al final del segundo hemistiquio (clivis es un patrón melódico);
  5. Nota final en el segundo hemistiquio;
  6. Grado más alto en el cante;
  7. Duración del cante.

Como es obvio, si usásemos características peculiares de un estilo dado, el análisis estaría distorsionado, ya que el poder de discriminación sería muy alto. Nuestra intención fue seleccionar un conjunto pequeño de descriptores que fuesen capaces de discriminar entre los diferentes cantes. Nótese que estos descriptores tienen naturaleza eminentemente musical. El cálculo de los valores de estos descriptores requiere que la ornamentación se tenga en cuenta, razón por la cual se calcularon manualmente por expertos en flamenco. El grupo COFLA está trabajando actualmente en cómo calcularlas automáticamente (y aquí aparecen problemas muy duros, créanos el lector).

Definimos una nueva distancia que fue la combinación lineal entre la distancia del contorno melódico y la distancia de los descriptores de medio nivel. Los resultados al usar la nueva distancia mejoraron significativamente. La distancia del contorno melódico detectaba los cambios locales con precisión y la distancia de medio nivel medía adecuadamente los cambios globales. Presentamos el nuevo grafo filogenético a los expertos en flamenco y su evaluación fue positiva (el número de mal clasificados bajó a niveles aceptables). La nueva distancia también permitió el estudio intra-estilo, estudio que no era posible con la distancia del contorno melódico solo.

3. Conclusiones

En este artículo hemos querido presentar al lector un ejemplo de investigación interdisciplinar en el marco del grupo COFLA. En ese ejemplo hemos mostrado cómo atacar de modo interdisciplinar el problema de la similitud melódica en los cantes a palo seco. El corpus fue seleccionado por expertos en flamenco; los informáticos e ingenieros del grupo diseñaron los algoritmos para extraer las sucesiones melódicas a partir de los ficheros de audio; los matemáticos estudiaron el problema de la distancia de similitud. Como los resultados no fueron en un primer momento satisfactorios, cuando se uso solo la distancia del contorno melódico, los expertos en flamenco y los musicólogos del grupo diseñaron la distancia de medio nivel; de nuevo, los científicos del grupo la integraron con la distancia previa. Finalmente, los expertos en flamenco evaluaron los resultados.

Muchos problemas abiertos quedan por considerar en este ejemplo. Nuestra distancia, aunque da buenos resultados, todavía puede mejorarse. En particular, estamos trabajando en la generalización de la distancia de medio nivel a otros estilos flamencos. Una cuestión interesante es cuál es el mínimo número de variables (descriptores) que es necesario para medir la similitud melódica en el flamenco.

 

Referencias

[1] Gómez F., Gómez E., Mora J., and Díaz-Báñez J.M. COFLA: la música flamenca y su estudio computacional - I.

[2] Emilia Gómez and J Bonada. Towards computer-assisted flamenco transcription: An experimental comparison of automatic transcription algorithms as applied to a cappella singing. Computer Music Journal, 37:73–90, 2013.

[3] The COFLA group. The COFLA group. http://mtg.upf.edu/research/projects/cofla.

[4] The COFLA group. Corpus tonás. http://mtg.upf.edu/download/datasets/tonas, accessed in January, 2014.

[5] Daniel H Huson and David Bryant. Application of phylogenetic networks in evolutionary studies. Mol Biol Evol, 23(2):254–267, 2006.

[6] Cabrera J.J., Díaz-Bañez J.M., Escobar-Borrego F.J., and J. Gómez E., Mora. Comparative melodic analysis of a cappella flamenco cantes. In Fourth Conference on Interdisciplinary Musicology (CIM08), Tesalónica, Grecia, 2008.

[7] J. Mora, F. Gómez, E. Gómez, F. Escobar Borrego, and Díaz Báñez J.M. Characterization and melodic similarity of a cappella flamenco cantes. In ISMIR (International Symposium on Music Information Retrieval), Utrecht, Netherland, August 2010.

[8] D. Müllensiefen and J. Frieler, K. Cognitive adequacy in the measurement of melodic similarity: algorithmic vs. human judgments. Computing in Musicology, 13:147–176, 2004.

 

El grupo COFLA está financiado por el Proyecto de Excelencia de la Junta de Andalucia P12-TIC-1362.

 
Volver