Recuperar (La)TeX a partir de DVI etc.

O trabalho simplesmente não pode ser feito automaticamente: DVI, PostScript e PDF são formatos “finais”, supostamente não suscetíveis a uma nova edição — as informações sobre de onde as coisas vieram foram descartadas. Então, se você perdeu seu original (La)TeX (ou nunca teve a fonte de um documento no qual você precisa trabalhar), você está com um sério trabalho nas mãos. Em muitas circunstâncias, a melhor estratégia é reescrever todo o documento, mas esta estratégia deve ser ponderada considerando o tamanho do documento e as habilidades dos potenciais digitadores.

Se assistência automática for necessária, é improvável que seja possível recuperar algo além de texto; a marcação (La)TeX que cria os efeitos tipográficos do documento terá que ser recriada editando.

Se o arquivo que você possui estiver no formato DVI, muitas das técnicas para converting (La)TeX para ASCII são aplicáveis. Considere dvi2tty, crudetype e catdvi. Lembre-se de que é provável que haja problemas para encontrar materiais incluídos (como figuras PostScript incluídas, que não aparecem no próprio arquivo DVI), e é improvável que a matemática seja convertida facilmente.

Para recuperar texto de arquivos PostScript, a ferramenta ps2ascii (parte da distribuição ghostscript) está disponível. Pode-se tentar aplicar esta ferramenta em PostScript derivado de um arquivo PDF usando pdf2ps (também da distribuição ghostscript), ou o próprio Acrobat Reader; uma alternativa é o pdftotext, que é distribuído com o xpdf.

Outra possibilidade disponível para aqueles com um arquivo PDF que querem processar é oferecida pelo Adobe Acrobat (versão 5 ou posterior): você pode fazer do arquivo PDF um documento bem estruturado, daí exportar para um XHTML bem formado, e então importar o resultado para o Microsoft Word (2000 ou posterior). A partir daí, pode-se converter para (La)TeX por uma das técnicas discutidas em “Converter de e para (La)TeX”.

O resultado será tipicamente (na melhor das hipóteses) mal marcado. Problemas também podem surgir da esquisitice das codificações típicas de fontes do TeX (especialmente as das fontes de matemática), que o Acrobat não sabe como mapear para sua representação Unicode padrão.

catdvi
catdvi
crudetype
crudetype
dvi2tty
dvi2tty
xpdf
Browse xpdf

This answer last edited: 2013-04-16


Do you have any question? Ask on: latex.net.br - we love qood questions!