Anotação de Dados: In an audio file, the user says "Hey Siri, set a reminder for 5 p.m.", while another person says something unrelated in the background. What should you do?
In an audio file, the user says "Hey Siri, set a reminder for 5 p.m.", while another person says something unrelated in the background. What should you do?
Imagem 1
Captura de tela de uma interface de questionário com quatro opções de múltipla escolha apresentadas como botões de rádio; no canto superior direito há um indicador de tempo (um cronômetro) e à direita um botão "NEXT"; rodapé contém links em português como "Cláusula do RGPD" e "Política de Cookies".
Create a single segment including the user's command and the overlapping background speech
Create separate segments for each voice
Annotate only the background speech
Do not annotate any part of the audio
Em tarefas de segmentação/anotação de fala, quando há fala simultânea (overlap), a orientação geral é manter um único segmento cobrindo o intervalo em que ocorre a fala relevante do usuário, mesmo que exista outra voz ao fundo. Isso preserva o comando principal (“Hey Siri, set a reminder for 5 p.m.”) como um trecho contínuo e evita fragmentar o áudio em múltiplos segmentos por causa de interferências de fundo. Separar por vozes normalmente só é exigido quando a diretriz explicitamente pede diarização/segmentação por locutor, o que não é indicado aqui. Portanto, deve-se criar um único segmento que inclua o comando do usuário e a fala de fundo sobreposta.