Los programas de conversión de voz a texto se están volviendo más populares para tareas cotidianas como el dictado con manos libres, la asistencia a personas con discapacidad visual y la transcripción del habla para personas con discapacidad auditiva. Estas herramientas tienen muchos usos, y Bożena Kostek, investigadora de la Universidad Tecnológica de Gdańsk, está investigando cómo se puede utilizar mejor la STT en el campo médico. Al estudiar cómo el habla clara afecta la precisión del STT, espera mejorar su utilidad para los profesionales de la salud.

“La toma automatizada de notas de los datos de los pacientes es fundamental para los médicos y radiólogos, ya que les permite estar cara a cara con los pacientes y permite una mejor recopilación de datos”, afirma Kostek.

Kostek también explica los desafíos que enfrentan en este trabajo.

“Los modelos STT a menudo tienen problemas con la terminología médica, especialmente en polaco, ya que muchos han sido capacitados principalmente en inglés. Además, la mayoría de los recursos se centran en el lenguaje general, no en el vocabulario médico especializado. El ambiente ruidoso de los hospitales hace que esto sea aún más difícil, ya que los proveedores de atención médica Puede que no presione o hable claramente debido a la confusión.

Para abordar estos problemas, se creó un conjunto de datos de audio detallado con términos médicos polacos hablados por médicos y especialistas en campos como la cardiología y la neumología. Este conjunto de datos se analizó utilizando un modelo de reconocimiento automático de voz, tecnología que convierte comentarios en texto, para su transcripción. Se utilizaron varias métricas, como la tasa de error de palabras y la tasa de error de letras, para evaluar la calidad del reconocimiento de voz. Este análisis ayuda a comprender cómo la claridad y el estilo del habla afectan la precisión del STT.

Kostec presentará los datos el jueves 21 de noviembre a las 3:25 p.m. como parte de la 187.a reunión virtual de la Acoustical Society of America, que se llevará a cabo del 18 al 22 de noviembre de 2024.

“La terminología médica puede ser complicada, especialmente las siglas que difieren según las especialidades. Es una tarea más difícil cuando nos referimos a situaciones hospitalarias realistas donde la habitación no está preparada acústicamente”. Doctor Costek.

Actualmente, la atención se centra en el polaco, pero hay planes de ampliar la investigación a otros idiomas como el checo. Se está estableciendo una colaboración con el Hospital Universitario de Brno para desarrollar recursos de terminología médica con el fin de aumentar el uso de la tecnología STT en la atención sanitaria.

“Si bien la inteligencia artificial es útil en muchas situaciones, muchos problemas deberían investigarse de forma analítica en lugar de integral, centrándose en dividir el panorama completo en partes individuales”.

Source link