De acordo com as Leis 12.965/2014 e 13.709/2018, que regulam o uso da Internet e o tratamento de dados pessoais no Brasil, ao me inscrever na newsletter do portal DICAS-L, autorizo o envio de notificações por e-mail ou outros meios e declaro estar ciente e concordar com seus Termos de Uso e Política de Privacidade.


Conversão de arquivos com codificação UTF-8 para ISO-8859-1

Colaboração: Rubens Queiroz de Almeida

Data de Publicação: 08 de setembro de 2020

Para pessoas como eu, que ainda não migraram todos os seus arquivos para o formato UTF-8, e que usam um ambiente configurado para a codificação ISO-8859-1, às vezes nos deparamos com documentos em que os caracteres acentuados assumem uma forma estranha:

(Este é um pequeno trecho das legendas em português do filme Contato, de 1997, com Jodie Foster)

Vejamos qual a codificação utilizada neste arquivo:

$ file arquivo.txt
arquivo.txt: UTF-8 Unicode (with BOM) text, with CRLF line terminators

Para alterar a codificação do arquivo, eu uso o comando iconv:

$ iconv -c -f utf-8 -t iso-8859-1 arquivo.txt -o arquivo-iso-8859-1.txt 

A diretiva -f indica a codificação original e a diretiva -t indica a codificação de destino. A diretiva -c indica ao programa iconv para descartar os caracteres que não puderem ser convertidos. Neste caso, o comportamento padrão do programa é interromper o processamento ao encontrar estes caracteres. E finalmente, a diretiva -o especifica o arquivo destino. Se esta diretiva não for especificada, a saída é ecoada para a tela.

Adicionar comentário

* Campos obrigatórios
5000
Powered by Commentics

Comentários

Nenhum comentário ainda. Seja o primeiro!


Veja a relação completa dos artigos de Rubens Queiroz de Almeida