Skip to content

cem-usp/teses-USP-scrapper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Teses USP Scrapper

WebScrapper para extrair dados do site Teses da USP

Objetivo

Esse repositório tem por objetivo criar um script para, a partir de uma planilha de nomes de pesquisadores, buscar dados no Teses USP.

Método

Inicialmente usou-se o ChatGPT com o prompt a seguir para elaboração de um programa em Python que leia dados a partir de uma planilha e consulte e extraia os dados a partir da consulta ao site Teses USP. A seguir o prompt que foi utilizado no ChatGPT:

Considerando que eu tenho uma planilha CSV contendo o nome do pesquisador e a data da defesa, consulte o endereço https://www.teses.usp.br/index.php?option=com_jumi&fileid=18&Itemid=85&lang=pt-br e a partir dele extraia o título da teste e o link para o download do trabalho através de um código em Python

A planilha inicial está na pasta dados e o resultado na pasta results

About

WebScrapper para extrair dados do site Teses da USP

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published