TCC - UM ESTUDO DE CASO DE COLETA E PRÉ-PROCESSAMENTO DE DADOS NA APLICAÇÃO DE PROCESSAMENTO DE LINGUAGEM NATURAL

Aqui estão os códigos e arquivos gerados ao longo da elaboração do TCC para conclusão do curso de Engenharia de Telecomunicações na Universidade Federal do Rio Grande do Norte (UFRN) no semestre de 2022.01. O TCC está disponível no seguinte link do Repositório UFRN

Para o TCC foi feito o web crawling do jornal iJIM com um projeto criado utilizando o framework Scrapy. Nesse projeto foi desenvolvida a spider papers.py para fazer as coletas dos dados desejados que foram salvos no arquivo articles_dataset.csv.

A seguir foi desenvolvido o código mostrado no Jupyter Notebook dataset_modeling.ipynb onde se fez um tratamento do dataset para limpeza dos dados e análise de informações por meio de um estudo das palavras-chave dos artigos, do tf e tf-idf dos resumos deles, e a geração de uma nuvem de palavras dos textos dos resumos.

Com o tempo mais detalhes serão adicionados ao código para explicar melhor a geração de cada dataset contido na pasta iJIM desse repositório, o notebook other.ipynb contém alguns códigos que foram usados ao longo do projeto para estudar melhor o dataset, mas os mesmos foram removidos do notebook principal para simplificar o código utilizado para se chegar nos resultados que foram expostos no trabalho de monografia desenvolvido.

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
iJIM		iJIM
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TCC - UM ESTUDO DE CASO DE COLETA E PRÉ-PROCESSAMENTO DE DADOS NA APLICAÇÃO DE PROCESSAMENTO DE LINGUAGEM NATURAL

About

Releases

Packages

Languages

Gafiam/TCC

Folders and files

Latest commit

History

Repository files navigation

TCC - UM ESTUDO DE CASO DE COLETA E PRÉ-PROCESSAMENTO DE DADOS NA APLICAÇÃO DE PROCESSAMENTO DE LINGUAGEM NATURAL

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages