Questão
O Spark possibilita a importação de bibliotecas para que ações possam ser realizadas da melhor forma possível. Com a importação de bibliotecas é possível realizar diversas ações, como importar arquivos para que os dados sejam recebidos e processados. Nesse sentido, analise o trecho a seguir:
%sh wget https://meudrive/pasta/dataset.csv df=spark.read.option("sep",",").option("header","true").option("inferSchema","true").csv("file:/pyspark/driver/dataset.csv")
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. A primeira linha refere-se a URL onde se encontra o arquivo que será importado.
Pois:
II. Na segunda linha é importado o cabeçalho, especificado por “header”, para dentro do diretório “driver”.
A seguir, assinale a alternativa correta:
- A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
- As asserções I e II são proposições falsas.
- As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
- A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
- As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
1
A asserção I é verdadeira porque a primeira linha usa o comando wget
para baixar um arquivo de uma URL especificada. A asserção II é falsa porque a segunda linha não importa o cabeçalho para o diretório 'driver'. Em vez disso, ela lê o arquivo CSV no Spark DataFrame, especificando que o arquivo possui um cabeçalho, mas não move o cabeçalho para o diretório 'driver'. Portanto, a alternativa correta é que a asserção I é verdadeira e a asserção II é falsa.