O trabalho simplesmente não pode ser feito automaticamente: DVI, PostScript e PDF são formatos “finais”, supostamente não suscetíveis a uma nova edição — as informações sobre de onde as coisas vieram foram descartadas. Então, se você perdeu seu original (La)TeX (ou nunca teve a fonte de um documento no qual você precisa trabalhar), você está com um sério trabalho nas mãos. Em muitas circunstâncias, a melhor estratégia é reescrever todo o documento, mas esta estratégia deve ser ponderada considerando o tamanho do documento e as habilidades dos potenciais digitadores.
Se assistência automática for necessária, é improvável que seja possível recuperar algo além de texto; a marcação (La)TeX que cria os efeitos tipográficos do documento terá que ser recriada editando.
Se o arquivo que você possui estiver no formato DVI, muitas das técnicas para converting (La)TeX para ASCII são aplicáveis. Considere dvi2tty, crudetype e catdvi. Lembre-se de que é provável que haja problemas para encontrar materiais incluídos (como figuras PostScript incluídas, que não aparecem no próprio arquivo DVI), e é improvável que a matemática seja convertida facilmente.
Para recuperar texto de arquivos PostScript, a ferramenta ps2ascii (parte da distribuição ghostscript) está disponível. Pode-se tentar aplicar esta ferramenta em PostScript derivado de um arquivo PDF usando pdf2ps (também da distribuição ghostscript), ou o próprio Acrobat Reader; uma alternativa é o pdftotext, que é distribuído com o xpdf.
Outra possibilidade disponível para aqueles com um arquivo PDF que querem processar é oferecida pelo Adobe Acrobat (versão 5 ou posterior): você pode fazer do arquivo PDF um documento bem estruturado, daí exportar para um XHTML bem formado, e então importar o resultado para o Microsoft Word (2000 ou posterior). A partir daí, pode-se converter para (La)TeX por uma das técnicas discutidas em “Converter de e para (La)TeX”.
O resultado será tipicamente (na melhor das hipóteses) mal marcado. Problemas também podem surgir da esquisitice das codificações típicas de fontes do TeX (especialmente as das fontes de matemática), que o Acrobat não sabe como mapear para sua representação Unicode padrão.
This answer last edited: 2013-04-16
This question on the Web: http://latex.net.br/faq/FAQ-recovertex.html
Do you have any question? Ask on: latex.net.br - we love qood questions!