Big Data: Em relação aos desafios do processamento de fluxo de dados, selecione a opção correta.
Em relação aos desafios do processamento de fluxo de dados, selecione a opção correta.
A) Dimensionar o projeto logo no início para evitar a necessidade de expansão posteriormente.
B) Aplicar recursos de redundância no projeto para reduzir a volatilidade dos dados.
C) Garantir a consistência da informação através da ordenação dos dados.
D) Garantir a qualidade dos dados através de ferramentas de controle que não aceitem qualquer inconsistência.
E) Usar algoritmos de criptografia nos dados para evitar o acesso indevido.
No processamento de fluxo de dados (stream processing), os eventos chegam continuamente, muitas vezes fora de ordem (out-of-order) e com atrasos variáveis. Isso cria um desafio central: manter resultados consistentes (por exemplo, agregações por janela de tempo) quando a ordem de chegada não é a mesma ordem de ocorrência.
Analisando as alternativas:
- A) Incorreta. Em streaming, é comum haver crescimento e variação de carga; dimensionar “logo no início” não elimina a necessidade de escalabilidade elástica.
- B) Incorreta. Redundância ajuda em tolerância a falhas/disponibilidade, mas não “reduz volatilidade dos dados” (volatilidade está ligada a variação, atraso, out-of-order, etc.).
- C) Correta. Um desafio típico é lidar com eventos fora de ordem. Para obter consistência nos resultados (principalmente em operações temporais), utiliza-se ordenamento por tempo do evento (event time), além de mecanismos como janelas e limites de atraso (ex.: watermarks). A ideia central da alternativa é justamente que a ordenação é usada para sustentar a consistência.
- D) Incorreta. Em fluxo, não é viável “não aceitar qualquer inconsistência” de forma rígida: há dados atrasados, incompletos, duplicados, necessidade de tolerância e reprocessamento. O desafio é tratar essas imperfeições, não simplesmente bloquear tudo.
- E) Incorreta. Criptografia é tema de segurança, não um desafio característico/central do processamento de fluxo em si (como ordenação, latência, exatamente-uma-vez, tolerância a falhas, etc.).
Assim, a alternativa que melhor representa um desafio típico do stream processing é a que trata da consistência diante de eventos fora de ordem, por meio de ordenação.
Alternativa correta: (C).