unaccent: Remoção de acentuação
Colaboração: Rubens Queiroz de Almeida
Data de Publicação: 02 de julho de 2014
É boa prática de SEO (Search Engine Optimization), que a url de um documento seja também uma descrição de seu conteúdo.
Se o título de um documento chama-se "unaccent: Remoção de acentuação", a url deveria ser algo como:
http://www.dicas-l.com.br/unaccent:_remocao_de_acentuacao.php
Para obter este valor, poderíamos fazer da seguinte forma:
$ echo "unaccent: Remoção de acentuação" | sed "s/ /_/g" | unaccent iso8859-1
unaccent:_Remocao_de_acentuacao
O comando sed
foi usado para converter os espaços em branco no caractere
subtraço ("_
").
Mas para facilitar a vida dos internautas, é conveniente também converter
todos os caracteres em caixa alta para caixa baixa. Para isto podemos
usar o comando tr
, como abaixo:
$ echo "unaccent: Remoção de acentuação" | sed "s/ /_/g" | tr '[:upper:]' '[:lower:]' | unaccent iso8859-1
unaccent:_remocao_de_acentuacao
Para que tudo isto funcione, o comando unaccent
precisa receber como
parâmetro a codificação do texto (UTF8 ou ISO-8859-1).
É claro que todos estes exemplos se aplicam para sites em que a montagem das páginas é automatizada, como a Dicas-L.