A respeito dos modelos de aprendizado de máquina, assinale a opção correta:
Questão
A respeito dos modelos de aprendizado de máquina, assinale a opção correta:
Alternativas
A) O agrupamento (ou clustering) realiza identificação de grupos de dados que apresentam co-ocorrência.
B) A classificação realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais.
C) A regressão ou predição promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados.
D) As regras de associação identificam grupos de dados, em que estes têm características semelhantes aos do mesmo grupo, e os grupos têm características diferentes entre si.
E) Os métodos de classificação supervisionada podem ser embasados em separabilidade (entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (support vector machines).
Explicação
Vamos confrontar cada alternativa com os conceitos clássicos de aprendizado de máquina:
A) Clustering (agrupamento) é uma técnica não supervisionada que busca grupos de objetos semelhantes (por distância/similaridade). “Co-ocorrência” é um termo mais associado a regras de associação (itens que aparecem juntos), não ao objetivo central de clustering. Logo, incorreta.
B) Classificação aprende uma função que mapeia entradas para classes discretas. A alternativa diz “mapear ... em um ou mais valores reais”, o que descreve regressão, não classificação. Incorreta.
C) Regressão/predição tipicamente mapeia entradas para valores numéricos contínuos (reais). A alternativa descreve mapeamento para “várias classes discretas” (isso é classificação) e mistura com tendências/padrões. Incorreta.
D) Regras de associação não “identificam grupos de dados semelhantes”; elas descobrem relações do tipo se X então Y (itens/atributos que ocorrem juntos), como em análise de cesta de compras. A descrição é de clustering. Incorreta.
E) Em classificação supervisionada, é comum:
- usar árvores de decisão e variantes com critérios de impureza/entropia (ganho de informação) para escolher divisões (separabilidade);
- usar SVM, que é um método de separação por hiperplano/margem (um tipo de abordagem baseada em fronteira/particionamento do espaço de atributos). A alternativa relaciona corretamente árvores (entropia) e SVM (particionamento do espaço). Correta.
Alternativa correta: (E).