top of page
  • Foto do escritorJoão Paulo Alqueres

O que são Voice Apps?


Voice apps são habilidades que podem ser ensinadas a assistentes de voz.


Estas habilidades são desenvolvidas exatamente como um programa de computador, mas respeitam algumas regras específicas relativas a natureza dos assistentes de voz.


A primeira coisa a se saber é que uma boa prática para desenvolvimento de Voice Apps é fazer com que eles façam uma coisa muito bem ao invés de se preocupar em fazer varias coisas. Tendo em mente esta primeira orientação a gente pode falar um pouco sobre como funciona o fluxo de uso de um voice app.


Quando um usuário conversa com um assistente de voz o arquivo de audio é enviado para a nuvem. Lá é feita a transcrição da fala para escrita (ASR/STT), depois o processamento da escrita (NPL) e depois interpretação do que o usuário falou (NLU). Com esta informação as ações solicitadas são executadas e uma resposta é enviada de volta para o usuário. Um arquivo de texto com a transcrição do que será dito é enviado para o dispositivo do usuário e no dispositivo é feita a leitura da resposta (TTS). Isto tudo acontece em menos de um segundo.


O voice app por sua vez é composto de duas partes. Uma parte que fica exposta para o usuário (popularmente chamada de Front End) se encarrega de mapear tudo que o usuário poderá fazer na voice app com as frases que ele dirá para executar cada uma das ações e outra parte que fica atrás das cortinas que é onde todo o processamento dos pedidos dos usuários acontece. Esta parte é conhecida como Back End.


O Front End funciona baseado no conceito de intenções (intents), enunciados (utterances) e variáveis (slots). Um usuário expressa uma vontade falando uma frase. Esta frase é então interpretada usando a lógica descrita no Front End e uma ação é tomada baseada na lógica descrita no Back End. O Front End é feito em javascript, mas especificamente JSON.


O Back End pode ser escrito em diversas languages de programação e nele como dito anteriormente acontece o processamento do que o usuário disse e a preparação da resposta ao usuário. É possível também escrever o Back End sem utilização de código com ferramentas como o Voiceflow. Isto permite que você possa desenvolver um voice app do início ao fim sem usar uma linha de código.


Com esta introdução eu espero ter conseguido explicar para pessoas com backgrounds distintos como os voice apps funcionam. Me diga nos comentários se você achou esta introdução útil e quais são os voice apps que você planeja construir.


Abaixo alguns conteúdos interessantes e introdutórios sobre a terminologia para construção de voice apps para Alexa.







Um abraço,

João Paulo.


Posts recentes

Ver tudo
bottom of page