Prova Módulo 3¶
Coloque seu nome aqui
Enviar por e-mail até 13h para caiodesalopes@gmail.com
Prova com consulta a internet à vontade.
Parte Teórica - 1 ponto¶
1 - Cite dois atributos (que você acessa com .
) de um numpy array e o que são.
2 - Qual a diferença de qcut e cut? Quando devo usar um quando devou usar o outro?
3 - Resuma os principais passos e comandos git para criar se chegar a um pull request no GitHub.
4 - Explique o conceito de roteamento no Flask e para que serve.
Parte Prática - 9 pontos¶
Análise de dados.
Dados:
- Na pasta
dados_vendas
- 12 meses de dados de vendas de diversos produtos
- Tabela com os nomes dos produtos e preço de produtos
Perguntas:
(2,0) Limpeza e cruzamento dos dados
- caso não consiga efetuar essa etapa, usar os dados
dados_limpos/sales.csv
para responder as perguntas
- caso não consiga efetuar essa etapa, usar os dados
(0,25) Mostre um overview do dataset
- (0,5) Qual é a quantidade total de iPhone vendidas?
- (0,25) Crie uma coluna de receita
- (1,0) Mostre com uma visualização qual cidade teve a maior receita geral
- (1,0) Mostre com uma visualização o melhor mês de receita
- (1,0) Mostre com uma visualização a diferença nas vendas de celulares
- (1,0) Mostre com uma visualização a quantidade total de vendas de cada tipo de produto
- (1,0) Qual sua hipótese para a razão dos produtos que mais venderam? Mostre com um gráfico se possível
- escreva sua hipótese em uma célula markdown
- (1,5) A que horas devemos exibir anúncios para maximizar a probabilidade de compras? Mostre com um gráfico
- escreva sua sugestão em uma célula markdown
- (1,5) Quais produtos são frequentemente vendidos juntos?
- (1,0) Mostre um mapa de calor onde as linhas são cidades, as colunas são os produtos, e os valores são a soma da quantidade de produtos vendidos.
Total da prova: 12 pontos.
Observação:
- $Receita=Valor \cdot Qtd$
- Colocar as labels e títulos nos gráficos é bom para o leitor
1. (2,0) Limpeza e cruzamento dos dados¶
Leia os dados do diretório dados_vendas
Após finalizar a limpeza, você pode comparar com o dataframe dados_limpos/sales.csv
para ver se está correto, inclusive existem métodos de comparação como df.equals(another_df)
2. (0,5) Mostre um overview do dataset¶
Lembre-se que você pode partir de dados_limpos/sales.csv
3. (0,5) Qual é a quantidade total de iPhone vendidas?¶
4. (0,25) Crie uma coluna de receita¶
5. (1,0) Mostre com uma visualização qual cidade teve a maior receita geral¶
6. (1,0) Mostre com uma visualização o melhor mês de receita¶
7. (1,0) Mostre com uma visualização a diferença nas vendas de celulares¶
8. (1,0) Mostre com uma visualização da receita de cada tipo de produto¶
9. (1,0) Qual sua hipótese para a razão dos produtos que mais venderam? Mostre com um gráfico se possível¶
10. (1,5) A que horas devemos exibir anúncios para maximizar a probabilidade de compras?¶
11. (1,5) Quais produtos são frequentemente vendidos juntos?¶
12. (1,0) Mostre um mapa de calor onde as linhas são cidades, as colunas são os produtos, e os valores são a soma da quantidade de produtos vendidos.¶