Sobre los desafíos de la interfaz de usuario de voz y las nuevas oportunidades que presenta

0
20
views

Mejora tu posicionamiento en las redes sociales con COOMMU!


La mayoría de las veces, Alexa, Siri y Bixby son prácticos asistentes para las tareas cotidianas, pero a veces la tecnología de voz que avanza rápidamente puede ser un obstáculo. La interfaz de usuario de voz (VUI) está de repente en todas partes, pero hay desafíos que superar con la tecnología en desarrollo. Si bien la voz no es ni una plataforma ni el paradigma de la interfaz de usuario del futuro, es una IU adicional que llegó para quedarse.

Encontrar los nichos en los que funciona mejor y jugar con los puntos fuertes de la voz son los principales desafíos que tendrán ahora los diseñadores y los especialistas en marketing. necesidad de superar.

Una interfaz de usuario en búsqueda de una aplicación

Han pasado años de trabajo para que Siri y el Asistente de Google respondan sus preguntas y actúen como un compañero de conversación con acceso a toda la información que pueda desear. A pesar de esto, prácticamente los usamos para verificar el clima, los puntajes del juego de anoche y tal vez plantear una consulta aleatoria o dos para Internet. Alexa apareció y nos dio una mayor capacidad para administrar nuestra experiencia de audio en el hogar, pero si somos honestos, VUI sigue siendo una novedad para la mayoría de las personas. Si bien es una herramienta poderosa, la mayoría de los usuarios no saben qué pueden hacer con ella ni cómo integrarla en sus vidas.

La antigua máxima en bienes raíces es que se trata de la ubicación, y VUI comparte esa calidad en la forma en que interactuamos con los dispositivos por voz está determinada en gran medida por nuestra ubicación. Conducir se ha convertido en el lugar más popular para VUI como un lugar manos libres y ocupados por los ojos donde la voz es excelente.

Alrededor del hogar, poder controlar tu música mientras cocinas o hacer otras tareas también ha demostrado ser popular, y la capacidad de obtener una respuesta rápida a una pregunta, sin tener que sacar su teléfono, es otro proceso útil.

Sin embargo, otras ubicaciones son menos susceptibles a VUI. La biblioteca, por ejemplo, ofrece una buena oportunidad para las interfaces gráficas de usuario (GUI), pero es un lugar pobre para cualquier comunicación por voz. Del mismo modo, una reunión de negocios o un entorno de conferencia es un entorno deficiente para VUI.

Donde VUI aún no se mide

Mientras que VUI ha recorrido un largo camino y continúa mejorando, sigue obstaculizado por dificultades que se vuelven cotidianas usuarios fuera.

Los problemas de precisión continúan plagando los principales sistemas activados por voz en los EE. UU .: el problema no es tanto el reconocimiento de voz (las mediciones recientes tienen Siri, Google, Cortana y Alexa en con más del 90% de precisión para que las palabras que hable correctamente), pero incluso cuando estos asistentes obtienen su opinión correcta, producen retornos a menudo hilarantes. Las consultas simples como "Necesito un médico" pueden arrojar una lista de médicos cercanos o una entrada de Wikipedia sobre médicos, mientras que las preguntas más complejas a menudo quedan fuera de su capacidad de procesamiento y comprensión. Esto es de esperar, tal vez, en esta etapa de desarrollo, pero sigue siendo una gran desconexión para los usuarios.

Ciertamente, si usa VUI para preguntar sobre el clima, la respuesta comenzará casi instantáneamente. Sin embargo, la información provista a menudo lleva más tiempo procesar que una respuesta visual. El Asistente de Google mostrará una tarjeta meteorológica en la pantalla si usted pregunta por el clima, y ​​en el tiempo que tarda Google en leer la información sobre dónde estoy, el pronóstico de hoy y la temperatura actual, he tenido suficiente tiempo para escanee toda esa información de la pantalla tres veces, y tenga una idea de los pronósticos de temperatura para las próximas horas.

Un artículo reciente se queja de la tendencia de Alexa a proporcionar mucha información cuando Pídale que toque una canción: Alexa no solo inicia la canción, sino que le dice la canción que está tocando, el artista que la interpreta, la fuente de la canción (Spotify, su biblioteca, etc.) y qué dispositivo está jugando. Para las canciones con múltiples artistas, esto puede resultar en una introducción de pesadilla cuando solo quieres escuchar algo de música.

Reading Lists Is Boring

Los diseñadores hablan sobre la carga cognitiva: esta es la cantidad de esfuerzo requerida para procesar la información provista. Los usuarios que interactúan con una GUI tienden a tener una cantidad constante y manejable de atención necesaria para procesar la información en pantalla. VUI, sin embargo, no exige atención cuando no interactúa activamente con él, y un alto grado de atención cuando el usuario hace una pregunta y tiene que escuchar una respuesta.

Esto presenta un problema cuando usa VUI para entregar información que viene volver en forma de una lista. Pida una receta rápida para la cena de pollo, y se le presentará una lista de opciones para reducirla. Desafortunadamente, la lista puede tener nueve entradas, y para cuando llegue al final, ya olvidó cuál era la tercera entrada. El cerebro simplemente no puede llevar esa información al mismo tiempo; de hecho, alrededor del séptimo elemento de una lista, es probable que se alcance su máxima atención y sus ojos comenzarán a brillar cuando se dirija hacia la más cercana GUI y renunciar a VUI.

Presentar el futuro

Por supuesto, hay soluciones a las dificultades que experimentan los usuarios con VUI, y muchas empresas están invirtiendo miles de millones de dólares para encontrarlas y mejorar la experiencia. Una forma en que la interacción de voz está mejorando es haciendo que la experiencia sea más conversacional para los usuarios. Como el diseño nos permite personalizar los resultados y responder de forma más natural, VUI conversacional hará que los usuarios se sientan más cómodos interactuando con la tecnología.

La incorporación de respuestas de voz y datos visuales de forma transparente entre la pantalla y el altavoz es clave para superar las limitaciones de VUI y la creación de una interacción más natural para el usuario. Actualmente, la respuesta de voz está solo marginalmente conectada a cualquier interacción visual, con dispositivos como Amazon's Echo que están casi completamente desconectados de cualquier pantalla. A medida que crezca el internet-of-things, será imprescindible que la información encuentre una forma de presentar tanto por voz como por pantalla para ajustarse a las necesidades del usuario.

Por supuesto, la tecnología siempre será propensa al error, pero administrando el faux pas verbal efectivamente puede tender a hacer que los usuarios se sientan más cómodos interactuando por voz. Esto significa ofrecer una mejor respuesta que "Lo siento, no lo entendí del todo", o adivinar ciegamente la respuesta cuando una consulta no se entiende bien. Al involucrar al usuario en el proceso de corrección de errores, el usuario aprende más sobre las limitaciones y tendrá más confianza para superar los límites.

Mejora, no un reemplazo

Aquellos que caen en el error de ver las interfaces de voz como una el reemplazo de la interfaz gráfica no puede aprender de la historia. Quizás la ciencia ficción puede ser nuestra guía en su lugar: en el Starship Enterprise, la tripulación del siglo 23 se comunica regularmente con la computadora por voz, al tiempo que también incorpora la interacción visual y táctil. Si bien es probable que superemos esos métodos en el siglo 23, todavía proporciona una imagen de cómo, en conjunto, imaginamos que debería tener lugar una interacción informática sin fisuras.

Nuestros mayores desafíos no son tanto elevar la tecnología. para acelerar, pero imaginando mejores formas de usar la tecnología. VUI nos proporciona otra herramienta para interactuar con la tecnología, cuando se usa bien.



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here