De acordo com as Leis 12.965/2014 e 13.709/2018, que regulam o uso da Internet e o tratamento de dados pessoais no Brasil, ao me inscrever na newsletter do portal DICAS-L, autorizo o envio de notificações por e-mail ou outros meios e declaro estar ciente e concordar com seus Termos de Uso e Política de Privacidade.
Usando metodos Track para o Googlebot
Colaboração: Giancarlo Rubio
Data de Publicação: 14 de Abril de 2006
O script abaixo serve para verificar como o google anda indexando suas paginas.
O objetivo do script e preparar ao webalizer, o log do apache, de forma que
ele possa ler apenas o que o Googlebot acessou.
Para instalar o webalizer, leia este excelente
tutorial
Segue o script!
#!/bin/sh
#Elaborado por Giancarlo Rubio
#Melhorias/Sugestoes giancarlo.rubio dot pucpr.br
#11/04/2006
# Aqui chamamos more para concatenar todo
# seu log de acesso atente em mudar o diretorio
# /home/site/logs para o do seu site
# Utilizamos grep para Capturar a palavra Googlebot (assinatura do robo Google)
# Dizemos que a saida deve ser gerada a um novo arquivo!!
/usr/bin/more /home/site/logs/access_log \|
grep Googlebot> /home/site/livronet/access_log_google
#Crie um arquivo site_google.conf no caso informando aonde esta seu arquivo de log
/usr/local/bin/webalizer -c /etc/webalizer/site_google.conf
Uma boa ideia seria colocar no crontab para executar diário ou como desejar.
È uma maneira muito simples de descobrir como essa importante ferramenta
trabalha em nosso servidores.