Reto-Diarization-Banner-2

Reto 2018 Software de Diarization para el sistema de grabación CTLog®

INTRODUCIÓN

Esta competencia está organizada dentro del ámbito del proyecto Desarrollo de Software.

PATROCINADOR

CALLTECH S.A. compañía colombiana de desarrollo de Software en telecomunicaciones patrocina este concurso con el siguiente premio:

• Primer puesto: $ 4.200.000 para el pago de un semestre académico o pago en efectivo para estudiantes de decimo semestre
• Segundo puesto: $ 2.000.000 como abono para el pago de un semestre académico o pago en efectivo para estudiantes de decimo semestre.
• Tercer puesto: $ 1.000.000 como abono para el pago de un semestre académico o pago en efectivo para estudiantes de décimo semestre.

PLANTEAMIENTO DEL PROBLEMA:

Actualmente Calltech S.A. cuenta con un software de grabación de llamadas CTLog® que graba las llamadas telefónicas en formato Microsoft WAV mono (un solo canal de audio) y ha surgido la necesidad que dentro de la grabación se pueda identificar cada uno de los hablantes.

OBJETIVO GENERAL:

Desarrollar un Software de speaker diarization para el sistema de grabación CTLog® utilizando las herramientas disponibles que permita dividir un archivo de audio de entrada en un archivo de audio con dos canales de audio homogéneos de acuerdo con la identificación del hablante.

Realizar el análisis de las herramientas de speaker diarization que actualmente se encuentran disponibles en mercado y cuyo origen sea código abierto para definir cuál de estas herramientas es la más apropiada para ser usada por Calltech para integrar con su sistema de grabación CTLog®.

OBJETIVOS ESPECÍFICOS.:

- Realizar el estudio y comparación de por lo menos tres herramientas de diarization, algunas de estas pueden ser:

o pyAudioAnalysis: Python Audio Analysis Library
o Alizé.
o Lium.
o DiarTk.

- Elaborar un manual de instalación y uso de la herramienta elegida.

- Desarrollar un web service que permita el cargue del archivo de audio en formato wav (Microsoft GSM) y mp3 y entregue como resultado lo siguiente:
o Resultado del proceso de diarization en formato XML con los campos descritos en las métricas de evaluación.
o Archivo de salida en formato WAV formado estéreo con la separación en cada canal del audio de cada hablante.

- Desarrollar una aplicación web que permita gestionar el cargue de archivos de audio en formato WAV y MP3, para la reproducción del archivo de salida y visualización simultánea del proceso diarization con la identificando cada uno de los hablantes acorde a lo descrito en las métricas de evaluación.

MÉTRICAS DE EVALUACIÓN:

Los seleccionados serán evaluados por métricas que reflejen el cumplimiento de los objetivos anteriormente mencionados:

- Documento del resultado de la comparación de las herramientas evaluadas junto con su criterio de selección.

Este documento debe indicar nombre del participante y la dirección de correo electrónico correspondiente, una descripción de las herramientas / plataformas de software empleadas, una descripción de las metodologías empleadas e instrucciones sobre cómo utilizar la herramienta de proceso de diarization.

- Manual claro y completo de instalación y uso de la herramienta seleccionada.
- Manual claro y completo de la aplicación web creada.
- Eficiencia en el uso de recursos del sistema en el momento del proceso de diarization.
- La aplicación Web debe permitir:

o Visualizar el porcentaje total de confiabilidad del proceso de diarization.
o Visualizar el tiempo de procesamiento de la diarización de los audios.
o Visualizar la información de segmentación generada por la herramienta de diarization en formato XML, la cual debe contener como mínimo la identificación de género del hablante (femenino o masculino), identificación del hablante, el inicio de la segmentación y la longitud o fin de la segmentación y su porcentaje de confiabilidad. Adicionalmente, se puede incluir la transcripción del audio.
o Exponer un Webservice para ser utilizado por aplicaciones externas para cargar el archivo de audio en formato mono y recibir el archivo estéreo junto al XML con el resultado del proceso de diarization.
o Reproducir el audio y simultáneamente visualizar el cambio del hablante de manera gráfica. De manera opcional, visualizar la transcripción del audio simult.

Nota: los audios con los que se evaluará la herramienta son audios en idioma español colombiano, cuyas grabaciones son una muestra de diferentes regiones del país.

NORMAS DE COMPETENCIA:

Los participantes deben cumplir con las siguientes reglas:

• La evaluación de la herramienta será en Calltech S.A. o a través de una sesión remota, tomando como muestras archivos de grabación del Sistema CTLog® y los resultados deben ser reproducibles.

• Los organizadores de la competencia verificarán que las presentaciones de los participantes cumplan con las reglas de la competencia y efectuarán la evaluación de las herramientas a través de las muestras. Los participantes recibirán los resultados o podrán consultarlos en la página Web de Calltech S.A.. Estos resultados se considerarán definitivos para poder ser acreedores a uno de los premios.

• El participante deberá entregar a la empresa patrocinadora el código fuente y derechos de autor del desarrollo del Software Diarization que resulte ganador.

CRONOGRAMA:

A continuación, se describe el cronograma de actividades del reto: Software de Diarization para el sistema de grabación CTLog®.

ID

ACTIVIDAD

FECHA LÍMITE

1

Inscripción de participantes:

Los interesados deben enviar un correo electrónico a los organizadores del reto a:

Agosto 29 de 2018

2

Aclaración de dudas y alcance del reto:

Los organizadores programarán una sesión para aclarar las dudas y alcances del reto, esta será remota o presencial en las instalaciones de Calltech S.A.

Agosto 31 de 2018

3

Entrega de Software del proceso diarization:

Los participantes harán llegar a los organizadores los entregables del reto vía email para iniciar el proceso de evaluación y entrega de resultados.

Septiembre 21 de 2018

4

Evaluación de proyectos:

Los organizadores realizarán la evaluación técnica del software y documento junto a la presentación de resultados.

Septiembre 26 de 2018

5

Publicación de resultados

Septiembre 28 de 2018

6

Premiación

Octubre 5 de 2018