Considerando esses aspectos, avalie as afirmações seguintes sobre a prática de machine learning e identifique as verdadeiras e as falsas. ( ) A escolha do algoritmo em machine learning deve basear-se exclusivamente na familiaridade do desenvolvedor com a ferramenta, independentemente das características dos dados e do problema. ( ) A manutenção de um projeto de machine learning inclui atualizações regulares do modelo com novos dados, ajustes de código e o uso de controle de versão para gerenciar mudanças. ( ) A implementação de algoritmos de machine learning não necessita de uma fase de validação, uma vez que os modelos, uma vez treinados com dados de treino adequados, geralmente generalizam bem para novos dados.
Questão
Considerando esses aspectos, avalie as afirmações seguintes sobre a prática de machine learning e identifique as verdadeiras e as falsas.
( ) A escolha do algoritmo em machine learning deve basear-se exclusivamente na familiaridade do desenvolvedor com a ferramenta, independentemente das características dos dados e do problema.
( ) A manutenção de um projeto de machine learning inclui atualizações regulares do modelo com novos dados, ajustes de código e o uso de controle de versão para gerenciar mudanças.
( ) A implementação de algoritmos de machine learning não necessita de uma fase de validação, uma vez que os modelos, uma vez treinados com dados de treino adequados, geralmente generalizam bem para novos dados.
Alternativas
A) F, V, F.
B) V, V, V.
C) F, V, V.
D) F, F, V.
E) V, F, V.
Explicação
Vamos avaliar cada afirmação.
-
“A escolha do algoritmo ... deve basear-se exclusivamente na familiaridade do desenvolvedor ... independentemente das características dos dados e do problema.” Isso é falso. A escolha do algoritmo deve considerar natureza do problema (classificação, regressão, clusterização etc.), tipo e qualidade dos dados, tamanho do conjunto, necessidade de interpretabilidade, custo computacional, métricas de avaliação, entre outros. Familiaridade ajuda, mas não pode ser o critério exclusivo.
-
“A manutenção de um projeto ... inclui atualizações regulares do modelo com novos dados, ajustes de código e o uso de controle de versão...” Isso é verdadeiro. Em produção, é comum haver re-treinamento/atualização com novos dados (para lidar com drift), correções e melhorias de pipeline/código, e controle de versão (de código e, idealmente, de dados/modelos) para rastrear mudanças e permitir reprodutibilidade.
-
“A implementação ... não necessita de uma fase de validação, uma vez que os modelos ... geralmente generalizam bem para novos dados.” Isso é falso. A validação (e teste) é essencial para estimar generalização, detectar overfitting, ajustar hiperparâmetros e comparar modelos. Não se pode assumir que generalizará bem apenas por ter sido treinado.
Logo, a sequência é F, V, F.
Alternativa correta: (A).