Preparando o ambiente

Usando Docker:

Execute no terminal: docker build -t challenge .
Execute no terminal: docker run -p 5000:5000 challenge
Abra seu navegador no endereço: http://127.0.0.1:5000

Se nao tiver docker:

Certifique-se que tenha python instalado na sua máquina
Execute o arquivo "setup.sh" no terminal: ./setup.sh
Abra seu navegador no endereço: http://127.0.0.1:5000

Explicando as tecnologias

Decidi usar a linguagem python, por ser mais prática tanto no processamento dos dados, quanto na implementação de REST APIs.

Primeira parte do desafio: Processamento de dados

Na primeira parte do desafio, fiz um script para automaticamente baixar e deszipar o dataset que foi provido. Com os dados em mãos, usei a biblioteca pandas para ler os arquivos .csv. Analisando os dados de movies.csv, percebi que a informação do ano de lançamento estava junto com o titulo, entao separei-os em colunas diferentes. Além disso, no arquivo ratings.csv havia muita repetição de dados, o que levaria a consultas mais demoradas no sql, entao processei os dados de rating para cada filme classificado, criando uma outra tabela que teria apenas sua média de rating e o número de vezes que foi classificado. Após isso, criamos o banco de dados a partir desses arquivos csv, usando o banco SQLITE. Escolhi esta tecnologia por não precisar baixar nada para usá-la.

Segunda parte do desafio: Deixando os dados disponíveis

Decidi usar o framework "Flask", pois necessita de poucas linhas de código para rodar uma API. Então, levantei a rota /movies que recebe os parâmetros: title, year, genre e top. São feitas pesquisas em sql para filtrar os filmes por cada tipo de parâmetro dado. É retornado pela api um json com o id, titulo, genero, ano, rating, quantidade de ratings, e popularidade. A popularidade foi adicionada para levar em consideração não só os ratings, mas também a quantidade de classificações em cada filme. O cáuculo usado foi: rating médio x raiz quadrada da quantidade de classificações. O parâmetro "top" leva em consideração a popularidade em ordem decrescente.

Teste: /movies?title=Toy Story
Teste: /movies?year=1995&genres=Adventure
Teste: /movies?top=10

Terceira parte do desafio: Consumindo os dados

Como não precisamos de interfaces avançadas, decidi usar a biblioteca "Bootstrap" com o próprio flask para desenvolver o frontend.

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
processing		processing
server		server
.gitignore		.gitignore
Challenge.md		Challenge.md
Dockerfile		Dockerfile
README.md		README.md
requirements.txt		requirements.txt
setup.sh		setup.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Preparando o ambiente

Explicando as tecnologias

Primeira parte do desafio: Processamento de dados

Segunda parte do desafio: Deixando os dados disponíveis

Terceira parte do desafio: Consumindo os dados

About

Releases

Packages

Languages

Gugarauj07/LG-Challenge-FullStack

Folders and files

Latest commit

History

Repository files navigation

Preparando o ambiente

Explicando as tecnologias

Primeira parte do desafio: Processamento de dados

Segunda parte do desafio: Deixando os dados disponíveis

Terceira parte do desafio: Consumindo os dados

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages