Aprendizado de Máquina: O K-médias (K-means) é um método iterativo bastante utilizado para a realização de agrupamento de dados. Contudo, a inicialização aleatória dos centroides pode provocar uma fragilidade na constituição dos agrupamentos. Assinale entre as alternativas, aquela que identifica corretamente a fragilidade do K-means e como podemos mitigá-la:
O K-médias (K-means) é um método iterativo bastante utilizado para a realização de agrupamento de dados. Contudo, a inicialização aleatória dos centroides pode provocar uma fragilidade na constituição dos agrupamentos.
Assinale entre as alternativas, aquela que identifica corretamente a fragilidade do K-means e como podemos mitigá-la:
A) A fragilidade é criar agrupamentos desbalanceados, com valores de silhueta muito diferentes entre si. Para solucionar isso, aconselha-se a realização de múltiplas inicializações do algoritmo e a análise da silhueta dos clusters para identificar a melhor inicialização.
B) A fragilidade é criar agrupamentos com altos coeficientes de silhueta. Para solucionar isso, aconselha-se a realização de múltiplas iterações com diferentes quantidades de centroides.
C) A fragilidade é criar agrupamentos com muitas amostras. Para solucionar isso, basta realiza a Análise de Elbow para identificar a quantidade ideal de amostras.
D) A fragilidade é criar muitos agrupamentos. Para solucionar isso, aconselha-se a realização de múltiplas iterações com diferentes quantidades de centroides para reduzir a quantidade.
E) A fragilidade é criar agrupamentos com pouca separabilidade entre os grupos. Para isso, sugere-se utilizar diferentes métricas de dissimilaridade e realizar a análise do coeficiente de silhueta para identificar a qualidade da clusterização.
Desbloqueie explicações detalhadas
Assine o plano Premium e tenha acesso a explicações completas e análises aprofundadas de cada questão.