Ciberilatam 002

/ Segundo semestre 2024 56 Opinión Timbre. Refleja la calidad tonal de la señal. MFCC. Representan la envolvente del espectro de la señal y son útiles para caracterizar la calidad de la voz. Laboratorio En pruebas técnicas de laboratorio, pudimos observar que esta estructura permite capturar la esencia de la voz del usuario en solo 1,1 KB, proporcionando una representación acústica suficiente para la autenticación sin almacenar la grabación completa de la voz. La estructura de CVSP permite una transmisión de datos rápida y eficiente, ideal para sistemas que requieren au- tenticación en tiempo real. Comparado con un archivo de audio típico, que te- nía un tamaño de 550,6 KB en formato .WAV con cinco segundos de grabación, la compresión de información se logró a 1,1 KB que para el RAV representa una optimización significativa, logrando una reducción de aproximadamente el 99,8 por ciento. Esta ligereza en el peso facilita la in- tegración del protocolo en dispositivos y redes con recursos limitados, mientras que la reducción de datos minimiza los riesgos de privacidad al evitar el almace- namiento de la voz completa. Además, el peso reducido garantiza la escalabili- dad, permitiendo una implementación a gran escala sin sobrecargar las redes o comprometer la velocidad de respuesta en las verificaciones de identidad. Los parámetros acústicos capturados, como energía, duración promedio de silencio, entropía espectral promedio, tono, formantes (F1, F2, F3, F4), intensi- dad, variabilidad de frecuencia, proso- dia, jitter , shimmer , voceo, soplo, timbre y MFCC contribuyen a que, de alguna manera, podamos alcanzar una identi- ficación precisa y confiable, mejorando la eficacia del sistema de autenticación Energía. Mide la energía total del au- dio, lo que indica la intensidad de la señal. Duración promedio de silencio. Pro- medio del tiempo en que no hay acti- vidad sonora. Entropía espectral promedio. Indica la complejidad y variabilidad del es- pectro de la señal. Tono ( pitch ). Frecuencia fundamental de la señal, importante para identificar la voz. Formantes (F1, F2, F3, F4). Frecuen- cias resonantes que caracterizan el timbre de la voz. Intensidad. Mide la energía promedio de la señal RMS ( Root Mean Square ). Variabilidad de frecuencia. Mide la dispersión de las frecuencias en la se- ñal. Prosodia. Captura la variabilidad de la frecuencia a lo largo del tiempo. Jitter y shimmer . Indicadores de la variabilidad en el periodo y amplitud, respectivamente. Voceo y soplo. Miden características específicas de la voz. dependientemente de los cambios en el entorno de cada llamada. A medida que el usuario continúa comunicándose, el sistema reconoce patrones y reajusta la muestra acústica base, minimizando errores y mejorando la autenticación. Este modelo garantiza autenticidad en tiempo real al estudiar cada entorno acústico y adaptarse a las variaciones que ocurren naturalmente en la voz, aumentando así la eficacia del CVSP en la protección de las comunica- ciones. Registro acústico verificable El registro acústico verificable (RAV) es una toma de muestra de audio diseñada para su validación que contiene paráme- tros acústicos específicos que permiten comprobar su autenticidad. Este registro se compara con una muestra acústica base para determinar su veracidad. El RAV se compone de varios pará- metros que se extraen de un archivo de audio utilizando la solución de software desarrollada y otras técnicas de análisis de señales. Los parámetros incluyen: