WebScrapper para extrair dados do site Teses da USP
Esse repositório tem por objetivo criar um script para, a partir de uma planilha de nomes de pesquisadores, buscar dados no Teses USP.
Inicialmente usou-se o ChatGPT com o prompt a seguir para elaboração de um programa em Python que leia dados a partir de uma planilha e consulte e extraia os dados a partir da consulta ao site Teses USP. A seguir o prompt que foi utilizado no ChatGPT:
Considerando que eu tenho uma planilha CSV contendo o nome do pesquisador e a data da defesa, consulte o endereço https://www.teses.usp.br/index.php?option=com_jumi&fileid=18&Itemid=85&lang=pt-br e a partir dele extraia o título da teste e o link para o download do trabalho através de um código em Python
A planilha inicial está na pasta dados e o resultado na pasta results