Chapter 7. Filtros de arquivos

1. Caixa de diálogo 'Filtros de arquivos'
2. Opções de filtro
3. Caixa de diálogo 'Editar filtro'
3.1. Tipo de arquivo fonte, padrão do nome de arquivo
3.2. Codificação dos arquivos fonte e destino
3.3. Nome de arquivo traduzido

O OmegaT apresenta filtros com grandes recursos de customização, assim você pode configurar a maioria dos detalhes do seu funcionamento. Os filtros de arquivos são partes do código e podem:

Para ver que formatos de arquivo são compatíveis com o OmegaT, veja o menu Opções > Filtros de arquivo…

A maior parte dos usuários achará as opções padrão de filtro de arquivo suficientes. Se não for o caso, selecione o menu Opções -> Filtros de arquivos… para abrir a caixa de diálogo principal. Também é possivel ativar filtros de arquivo específicos por projeto, que somente serão usados no projeto atual, selecionando a opção Filtros de arquivos… em Propriedade do projeto.

Você pode ativar filtros específicos por projeto em Projeto → Propriedades…. Clique em Filtros de arquivos e ative a caixa de seleção Ativar filtros específicos por projeto. Uma cópia da configuração de filtros será gravada com o projeto neste caso. Se você modificar filtros mais tarde, apenas os filtros do projeto serão atualizados, enquanto os filtros de usuário ficam inalterados.

Atenção! Se você modificar opções de filtro enquanto um projeto estiver aberto, você deve recarregar o projeto para aplicar as modificações.

1. Caixa de diálogo 'Filtros de arquivos'

Este diálogo enumera filtros de arquivo disponíveis. Se deseja não usar OmegaT para traduzir arquivos de certo tipo, pode apagar o filtro correspondente desativando a caixa de seleção junto ao seu nome. O OmegaT então omitirá tais arquivos ao carregar os projetos e irá apenas copiá-los, sem nenhuma intervenção, quando criar os documentos traduzidos. Quando quiser usar o filtro de novo, basta marcar a caixa de seleção. Clique em Restaurar padrões para restaurar os filtros às configurações padrões. Para editar os arquivos e a codificação que o filtro processará, selecione o filtro na lista e clique em Editar.

2. Opções de filtro

Vários filtros (arquivos de texto, arquivos XHTML, arquivos HTML e XHTML, arquivos de OpenDocument e arquivos de Microsoft Open XML) têm uma ou várias opções específicas. Para modificar as opções, selecione o filtro na lista e clique em Opções. As opções disponíveis são:

Arquivos de texto

  • Segmentação de parágrafos por quebras de linha, linhas vazias ou nunca:

    se as regras de segmentação por frases estiverem ativadas, o texto será segmentado de acordo com a opção selecionada.

Arquivos PO

  • Permitir traduções em branco no arquivo destino:

    Se for ativado, quando um segmento PO (que pode ser um parágrafo inteiro) não é traduzido, a tradução ficará vazia no arquivo destino. Falando tecnicamente, o segmento msgstr no arquivo destino PO, se criado, será deixado vazio. Como esse é o comportamento padrão de arquivos PO, já vem marcado. Se a opção for desligada, o texto fonte será copiado para o segmento destino.

  • Ignorar cabeçalho PO

    O cabeçalho PO será ignorado e mantido inalterado, se esta opção for marcada.

  • Substituir automaticamente 'nplurals=INTEGER; plural=EXPRESSION;' no cabeçalho

    A opção permite que o OmegaT ignore a especificação no cabeçalho do arquivo PO e use o padrão para o idioma de destino selecionado.

Arquivos XHTML

  • Acrescentar ou regravar a declaração de codificação nos arquivos HTML e XHTML: frequentemente os arquivos alvo devem ter o conjunto de caracteres de codificação diferente daquele no arquivo original (seja definido explicita ou implicitamente). Usar esta opção permite que o tradutor especifique se os arquivos destino devem incluir a declaração de codificação. Por exemplo, se o filtro de arquivo especifica que o UTF8 é o esquema de codificação dos arquivos destino, selecionar a opção Sempre assegurará que esta informação seja incluída nos arquivos traduzidos.

  • Traduzir os seguintes elementos: os elementos selecionados aparecerão como segmentos na janela Editor.

  • Iniciar um novo parágrafo: a tag <br> do HTML criará um parágrafo para fins de segmentação.

  • Pular texto que corresponde à expressão regular: o texto correspondendo à expressão regular será ignorado. É exibido em vermelho no validador de tags. O texto no segmento fonte correspondente é exibido em itálico.

  • Não traduzir o atributo de conteúdo das meta-tags … : As seguintes meta-tags não serão traduzidas.

  • Não traduzir o atributo de conteúdo das tags com os seguintes pares de atributo key-value (separados por vírgulas): caso haja correspondência na lista de pares de valor da chave, o conteúdo das tags será ignorado

    Às vezes é útil poder deixar algumas tags intraduzíveis baseado no valor de atributos. Por exemplo, <div class="hide"> <span translate="no"> É possível definir pares de valor da chave de tags a não serem traduzidas. Para o exemplo acima, o campo conteria: class=hide, translate=no

Arquivos Microsoft Open XML

É possivel selecionar quais elementos devem ser traduzidos. Eles aparecerão como segmentos separados na tradução.

  • Word: texto de instrução não-visível, comentários, notas, notas de fim, notas de rodapé

  • Excel: comentários, nomes de planilhas

  • Power Point: comentários de slides, slides mestre, layouts de slides

  • Global: tabelas, diagramas, desenhos, WordArt

  • Outras opções:

    • Agregar tags: se selecionado, as tags sem texto traduzível entre elas serão agregadas em tags únicas.

    • Preservar espaço para todas as tags: se selecionado, preserva o "espaço branco" (isto é, os espaços e novas linhas), mesmo se não estabelecido tecnicamente no documento

Arquivos HTML e XHTML

  • Acrescentar ou regravar a declaração de codificação nos arquivos HTML e XHTMLSempre (padrão), Somente se o arquivo (X)HTML tiver um cabeçalho, Somente se o arquivo (X)HTML tiver uma declaração de codificação, Nunca

  • Traduzir os seguintes elementos: os elementos selecionados aparecerão como segmentos na janela Editor.

  • Iniciar um novo parágrafo: a tag <br> do HTML criará um parágrafo para fins de segmentação.

  • Pular texto que corresponde à expressão regular: o texto correspondendo à expressão regular será ignorado.

  • Não traduzir o atributo de conteúdo das meta-tags … : As seguintes meta-tags não serão traduzidas.

  • Não traduzir o atributo de conteúdo das tags com os seguintes pares de atributo key-value (separados por vírgulas): caso haja correspondência na lista de pares de valor da chave, o conteúdo das tags será ignorado

Arquivos de texto

  • Segmentação de parágrafos por quebras de linha, linhas vazias ou nunca:

    se as regras de segmentação por frases estiverem ativadas, o texto será segmentado de acordo com a opção selecionada.

Arquivos de Open Document Format (ODF)

  • É possível selecionar quais dos itens seguintes devem ser traduzidos:

    entradas de índice, marcadores de páginas, referências de marcadores, notas, comentários, notas de apresentação, links (URL), nomes de planilhas

3. Caixa de diálogo 'Editar filtro'

Este diálogo permite configurar os padrões de nome de arquivo fonte a serem processados pelo filtro, personalizar os nomes de arquivos traduzidos e selecionar quais codificações devem ser usadas para carregar o arquivo e salvar o seu correspondente traduzido. Para modificar um padrão de filtro de arquivo, modifique os campos diretamente ou clique em Editar. Para acrescentar um novo padrão de filtro de arquivo, clique em Adicionar. A mesma caixa de diálogo é usada para acrescentar um padrão ou editar um padrão específico. A caixa de diálogo é útil porque inclui um editor especial de padrões de nomes de arquivo destino, no qual é possível personalizar os nomes dos arquivos de saída.

3.1. Tipo de arquivo fonte, padrão do nome de arquivo

Quando o OmegaT encontra um arquivo na sua pasta source, ele tenta selecionar o filtro de acordo com a extensão do arquivo. Mais precisamente, o OmegaT tenta corresponder os tipos de arquivo fonte de cada filtro com o nome do arquivo. Por exemplo, o padrão *.xhtml corresponde a qualquer arquivo com a extensão .xhtml. Se for encontrado o filtro apropriado, ele é associado ao arquivo para processamento. Por exemplo, como padrão, os filtros XHTML são usados para processar arquivos com a extensão .xhtml. É possível alterar ou adicionar padrões de nome do arquivo para cada arquivo. Os tipos de arquivo fonte usam curingas iguais aos usados nas Buscas. O caractere '*' corresponde a zero ou mais caracteres. O caractere '?' corresponde exatamente a um caractere. Todos os outros caracteres correspondem a eles mesmos. Por exemplo, se você quiser que o filtro de texto processe os arquivos leiame (leiame, leia.me e leiame.txt) use o padrão leia*.

3.2. Codificação dos arquivos fonte e destino

Apenas uma quantidade limitada de formatos de arquivos requer codificação obrigatória. Os formatos de arquivos que não especificam sua própria codificação usarão aquela que for definida para a extensão correspondente aos seus nomes. Por exemplo, por padrão os arquivos .txt serão carregados usando a codificação padrão do sistema operacional. A codificação fonte pode ser modificada para cada tipo de arquivo fonte diferente. Tais arquivos podem também ser processados sem nenhuma codificação. Por padrão, a codificação do arquivo traduzido é a mesma que a do arquivo fonte. Os campos de codificação fonte e destino usam caixas combinadas com todas as combinações suportadas incluídas. <auto> deixa a opção de codificação para o OmegaT. É assim que funciona:

  • O OmegaT identifica a codificação do arquivo fonte usando sua declaração de codificação, se houver (arquivos HTML, arquivos baseados em XML).

  • O OmegaT está configurado para usar uma codificação obrigatória para alguns formatos de arquivo (propriedades Java, etc.)

  • E usa a codificação padrão do sistema operacional para os arquivos de texto.

3.3. Nome de arquivo traduzido

Se quiser, você poderá renomear automaticamente os arquivos que traduz, por exemplo, acrescentando o código de idioma após o nome do arquivo. O tipo de arquivo traduzido usa uma sintaxe especial, portanto se você quiser editar este campo, clique em Editar… para acessar a caixa de diálogo 'Editar padrão'. Se você quiser voltar à configuração padrão do filtro, clique em Restaurar padrões. Também é possível modificar o nome diretamente no campo de tipo de arquivo traduzido, na caixa de diálogo dos filtros de arquivos. A caixa de diálogo Editar padrão contém as seguintes opções:

  • Padrão é ${filename}– nome completo do arquivo fonte com extensão, portanto o nome do arquivo traduzido é o mesmo que o nome do arquivo fonte.

  • ${nameOnly}– permite-lhe inserir apenas o nome do arquivo fonte sem extensão

  • ${extension} – a extensão do arquivo original

  • ${targetLocale}– o código do local destino (em forma de "xx_YY").

  • ${targetLanguage}– o idioma destino e o código de país juntos (em forma de "XX-YY").

  • ${targetLanguageCode} – apenas o idioma destino ("XX").

  • ${targetCountryCode}– apenas o código do país destino ("YY")

  • ${timestamp-????} – data e hora do sistema na criação, em vários padrões

    Veja documentação da Oracle para ter exemplos de padrões "SimpleDateFormat"

  • ${system-os-name}– sistema operacional do computador usado

  • ${system-user-name}– nome do usuário do sistema

  • ${system-host-name} – nome do host do sistema

  • ${file-source-encoding} – codificação do arquivo fonte

  • ${file-target-encoding}– codificação do arquivo destino

  • ${targetLocaleLCID}- local destino Microsoft

Variantes adicionais estão disponíveis para variáveis ${nameOnly} e ${Extension}. Caso o nome do arquivo seja ambivalente, é possível aplicar variáveis na forma ${name only-extension number} e ${extension-extension number} . Se, por exemplo, o arquivo original tiver o nome Documento.xx.docx, as seguintes variáveis darão os seguintes resultados:

  • ${nameOnly-0} Documento

  • ${nameOnly-1} Documento.xx

  • ${nameOnly-2} Documento.xx.docx

  • ${extension-0} docx

  • ${extension-1} xx.docx

  • ${extension-2} Documento.xx.docx