Conversão de (La)TeX para HTML

TeX e LaTeX são adequados para produzir documentos eletronicamente publicáveis. No entanto, é importante perceber a diferença entre o layout da página e a marcação funcional. O TeX é capaz de definir um layout de página extremamente detalhado; o HTML não, porque o HTML é uma linguagem de marcação funcional e não uma linguagem de layout de página. A renderização exata do HTML não é especificada pelo documento que é publicado, mas é, até certo ponto, deixada a critério do navegador. Se você precisa que seus leitores vejam uma réplica exata de como você vê seu documento, então você não pode usar HTML devendo optar por algum outro formato de publicação, como PDF. Isso vale para qualquer ferramenta de criação de HTML.

As excelentes capacidades matemáticas do TeX continuam sendo um desafio no que diz respeito à conversão para HTML. Existem apenas duas técnicas geralmente confiáveis para gerar matemática na web: criar bitmaps de bits de composição tipográfica que não podem ser interpretados e usar símbolos e tabelas. Nenhuma dessas técnicas é inteiramente satisfatória. Bitmaps levam a uma profusão de arquivos minúsculos, são lentos para carregar e são inacessíveis para aqueles com deficiência visual. As fontes de símbolos oferecem uma cobertura insuficiente de matemática e seu uso requer a configuração do navegador. O futuro da matemática nos navegadores pode ser mais promissor — veja future Web technologies.

Atualmente, os pacotes possíveis são:

LaTeX2HTML
um pacote de script Perl que suporta apenas o LaTeX e gera matemática (e outras coisas “difíceis”) usando bitmaps. A versão original foi escrita por Nikos Drakos para sistemas Unix, mas o pacote agora ostenta uma lista ilustre de coautores e também está disponível para sistemas Windows. Michel Goossens e Janne Saarela publicaram uma discussão detalhada do LaTeX2HTML, e de como adaptá-lo, na TUGboat 16(2).

Uma lista de correspondência para usuários pode ser encontrada em http://tug.org/mailman/listinfo/latex2html

TtH
um programa compilado que suporta o LaTeX ou o Plain TeX, e usa a técnica de fonte/tabela para representar matemática. Foi escrito por Ian Hutchinson, usando flex. A distribuição consiste em um único código fonte C (ou um executável compilado), que é fácil de instalar e muito rápido em execução.
TeX4ht
um programa compilado que suporta o LaTeX ou Plain TeX, pelo processamento de um arquivo DVI; ele usa bitmaps para matemática, mas também pode usar outras tecnologias, quando apropriado. Escrito por Eitan Gurari, ele analisa o arquivo DVI gerado quando você executa o (La)TeX em seu arquivo com as macros do tex4ht. Como resultado, ele é bastante robusto em relação às macros que você inclui no seu documento, e também é muito rápido.
plasTeX
uma estrutura de processamento de documentos LaTeX baseada em Python. Ele dá acesso semelhante ao de DOM a um documento LaTeX, bem como a capacidade de gerar múltiplos formatos de saída (por exemplo, HTML, DocBook, tBook etc.).
TeXpider
um programa comercial da Micropress, que está descrito em http://www.micropress-inc.com/webb/wbstart.htm; ele usa bitmaps para equações
Hevea
um programa compilado que suporta apenas o LaTeX e usa a técnica de fonte/tabela para equações (na verdade, toda a sua abordagem é muito semelhante à do TtH). Foi escrito em Objective CAML por Luc Maranget. O Hevea não é arquivado no CTAN; detalhes (incluindo os pontos de download) estão disponíveis em http://pauillac.inria.fr/ maranget/hevea/
Um interessante conjunto de amostras, incluindo a conversão do mesmo texto pelos quatro programas gratuitos listados acima, está disponível em http://www.mayer.dial.pipex.com/samples/example.htm; há um a link para uma página que fornece listas de prós e contras para fins de comparação.

O World Wide Web Consortium mantém uma lista de “filtros” para HTML, com seções sobre (La)TeX e BibTeX — veja http://www.w3.org/Tools/Word_proc_filters.html

latex2html
Browse latex2html
plasTeX
Browse plastex
tex4ht
tex4ht (but see http://tug.org/tex4ht/)
tth
tth


Do you have any question? Ask on: latex.net.br - we love qood questions!