
O Goop pode realizar pesquisas no Google sem ser bloqueado pelo CAPTCHA ou atingir qualquer limite de taxa.
Como funciona?
O Facebook fornece uma ferramenta de depuração para o seu raspador. Curiosamente, o Google não limita as solicitações feitas por este depurador (na lista de permissões?) E, portanto, ele pode ser usado para eliminar os resultados da pesquisa do Google sem ser bloqueado pelo CAPTCHA.
Como o facebook está envolvido, uma sessão do facebook Cookiedeve ser fornecida à biblioteca a cada solicitação.
Instalação de Uso
pip install goop
Exemplo
from goop import goop
page_1 = goop.search('red shoes', '<your facebook cookie>')
page_2 = goop.search('red_shoes', '<your facebook cookie>', page='1')
include_omitted_results = goop.search('red_shoes', '<your facebook cookie>', page='8', full=True)
O retornado é um dictdos seguintes estrutura
{
"0": {
"url": "https://example.com",
"text": "Example webpage",
"summary": "This is an example webpage whose aim is to demonstrate the usage of ..."
},
"1": {
...
cli.py demonstra o uso realizando pesquisas no Google a partir do terminal com o seguinte comando
python cli.py <query> <number_of_pages>

Legal & Disclaimer
Raspagem resultados de busca do google é ilegal. Esta biblioteca é meramente uma prova de conceito do bypass. O autor não é responsável pelas ações dos usuários finais.

