Python, Línguas e História da Arte

Spread the love

Vamos, que hoje estou me sentindo um pouco Indiana Jones digital! ;-D

Uma das coisas que tenho feito por aqui é a coleta de textos disponíveis para consulta pública online – é sempre bom deixar claro que não coleto textos privados sem a devida permissão -, sendo a maioria massiva digitalizada como imagem, muitas vezes com uma qualidade bastante ruim, mas suficiente para que se possa trabalhar mesmo com algun esforço adicional.

Os textos que coleto são do século XIX e tratam de Arqueologia e Arte Antiga em idiomas diferentes. Alguns em Português, outros em Italiano e alguns em Francês e as extrações online são feitas em Python, no idioma original, assim, o resultado do meu trabalho são arquivos e mais arquivos de texto puro que precisam ser traduzidos para um único idioma, o que me lembra duas histórias interessantes…

A Torre de Babel

A lenda da Torre de Babel é uma das histórias da Bíblia que mais marcou minha infância, numa época em que meu pai, que deveria ser um simples mecânico de precisão, tinha como um de seus melhores amigos o próprio chefe, um engenheiro químico alemão e ainda estava entendendo porque ele “falava estranho”.

Na Gênesis a lenda fala da tentativa dos descendentes de Noé em construir uma torre tão alta que pudesse alcançar os céus. Deus, percebendo a audácia e a unidade do povo, confundiu a linguagem deles, fazendo com que cada um falasse uma língua diferente, o que resultou em pessoas incapazes de se entenderem, dispersas por toda a Terra.

A Pedra de Roseta

Descoberta em 1779 no Egito por soldados franceses durante a campanha do Egito de Napoleão Bonaparte, a Pedra de Roseta é um artefato histórico, um bloco de granito escuro com inscrições em três diferentes scripts: grego antigo, egípcio demótico e hieróglifos egípcios.

A Pedra Rosetta foi a chave para que o linguista francês Jean-François Champollion conseguisse decifrar os hieróglifos – um sistema de escrita usado no antigo Egito por mais de três mil anos – em 1822.

Biblioteca googletrans-py39

Nos dias de hoje, aqui estou eu, tal e qual muitos outros programadores dedicados à coleta e processamento de textos históricos, entre códigos e mais códigos que facilitem a vida de novos Champollions.

A biblioteca googletrans-py39 (pip install googletrans-py39) tem resultado bastante eficiente para tradução de textos processados em Python. Disponível no PyPI, ela oferece uma interface simples para acessar o serviço de tradução do Google, permitindo a tradução automática de textos entre diversos idiomas.

O uso dessa biblioteca é bastante intuitivo, usando o método translate() para realizar a tradução do texto desejado, como no exemplo abaixo, em que traduzo 'Hello, Indiana!' do inglês para o italiano.

from googletrans import Translator
translator = Translator()
translated_text = translator.translate('Hello, Indiana!', src='en', dest='it')
print(translated_text.text)

É assim que, mais uma vez, programação em Python entra como parte do processo de processamento textual para pesquisa científica em História da Arte e Arqueologia, numa das áreas que mais me fascinam: as Humanidades Digitais.

Por aqui, sigo guardando códigos em Python enquanto me pergunto se não estamos contruindo outra Torre de Babel.

Um dia, descubriremos.

Translate »