Publishing in Mathematics and theoretical areas in Computer Science and Physics has been predominantly using TeX/LaTeX as a formatting language in the last two decades. This large corpus of born-digital material is both a boon—LaTeX is semi-semantic format where the source often contains indications of the author’s intentions—and a problem—TeX is Turing-complete and authors use this freedom to use thousands of styles and millions of user macros.
Several tools have been developed to convert TeX/LaTeX documents to XML-based. Different DML projects use different tools, and the selection seems largely accidental. To put the choice of converters for DML projects onto a more solid footing and to encourage competition and feature convergence we survey the market. In this paper we investigate and compare five LaTeX-to-XML transformers in three dimensions: a) ergonomic factors like documentation, ease of installation, b) coverage, and c) quality of the resulting documents (in particular the MathML parts).
Depuis une vingtaine d’années, la publication de textes de mathématiques, informatique ou physique théorique s’est faite de façon prédominante à l’aide de systèmes de composition basés sur TeX/LaTeX. Ceci est à la fois un atout — LaTeX est un format à demi sémantique qui capture dans une certaine mesure les intentions de l’auteur — et un problème — TeX est à peu près Turing-complet, ce dont les auteurs abusent en recourant à des centaines d’extensions et à des millions de macros personnelles.
Plusieurs outils ont été développés pour convertir des documents TeX/LaTeX vers des dialectes XML, plus adaptés au web, mais aussi à des traitements automatisés s’appuyant sur la sémantique. Les projets DML utilisent des outils différents, la sélection ne semblant pas reposer sur des critères objectifs. Nous avons passé l’offre actuelle en revue dans le but de fonder ces choix sur des bases plus rationnelles, et d’encourager la compétition ouverte et la convergence vers un socle de fonctionnalités utiles. Dans cet article, nous passons en revue cinq programmes qui transforment des sources TeX/LaTeX en XML en passant les formules en MathML selon trois dimensions : a) les paramètres ergonomiques comme la documentation ou la facilité d’installation ; b) l’étendue des constructions supportées ; c) la qualité du document produit (notamment le code MathML).
@article{CG_2008___51_7_0, author = {Stamerjohanns, Heinrich and Ginev, Deyan and David, Catalin and Misev, Dimitar and Zamdzhiev, Vladimir and Kohlhase, Michael}, title = {Conversion d{\textquoteright}articles en {LaTeX} vers {XML} avec {MathML~:} une \'etude comparative}, journal = {Cahiers GUTenberg}, pages = {7--28}, publisher = {Association GUTenberg}, number = {51}, year = {2008}, language = {fr}, url = {http://www.numdam.org/item/CG_2008___51_7_0/} }
TY - JOUR AU - Stamerjohanns, Heinrich AU - Ginev, Deyan AU - David, Catalin AU - Misev, Dimitar AU - Zamdzhiev, Vladimir AU - Kohlhase, Michael TI - Conversion d’articles en LaTeX vers XML avec MathML : une étude comparative JO - Cahiers GUTenberg PY - 2008 SP - 7 EP - 28 IS - 51 PB - Association GUTenberg UR - http://www.numdam.org/item/CG_2008___51_7_0/ LA - fr ID - CG_2008___51_7_0 ER -
%0 Journal Article %A Stamerjohanns, Heinrich %A Ginev, Deyan %A David, Catalin %A Misev, Dimitar %A Zamdzhiev, Vladimir %A Kohlhase, Michael %T Conversion d’articles en LaTeX vers XML avec MathML : une étude comparative %J Cahiers GUTenberg %D 2008 %P 7-28 %N 51 %I Association GUTenberg %U http://www.numdam.org/item/CG_2008___51_7_0/ %G fr %F CG_2008___51_7_0
Stamerjohanns, Heinrich; Ginev, Deyan; David, Catalin; Misev, Dimitar; Zamdzhiev, Vladimir; Kohlhase, Michael. Conversion d’articles en LaTeX vers XML avec MathML : une étude comparative. Cahiers GUTenberg, no. 51 (2008), pp. 7-28. http://www.numdam.org/item/CG_2008___51_7_0/