Conversion du format MARC en BibTeX

Il est commode de se servir de BibTeX pour disposer d'une base de donnée bibliographique dans LaTeX. Cependant, les recherches sur le serveur OPALE de la BNF produisent des entrées au format INTERMARC ou UNIMARC pour les thèses et les ouvrages qui y sont répértoriés. De même, les recherches dans la base de donnée de la bibliothèque du Congrès des États-Unis produisent aussi un format MARC (différent des deux précités).

Un enregistrement UNIMARC typique ressemble à ceci: 000 nam 22 3n 450 001FRBNF318809770000000 003http://catalogue.bnf.fr/ark:/12148/cb31880977m 039 $oCRI$aSU019904460001P 100 $a19970701d1924 m y0frey50 ba 1010 $afre 102 $aFR 105 $a||||z 00||| 106 $ar 2001 $a^G. Bruhat, professeur à la Faculté des sciences de l'Université de Lille. o/ooCours d'électricité à l'usage de l'enseignement supérieur scientifique et technique$bTexte imprimé 210 $aTours, impr. Deslis frère, R. et P. Deslis$aParis, Masson et Cie, éditeurs, 120, boulevard Saint-Germain$d1924. In-8, [...]II-712 p. avec figures. [5025] 700 |$312163000$aBruhat$bGeorges$f1887-1944$4070 801 0$aFR$bFR-751131015$c19970701$gAFNOR$hFRBNF318809770000000$2intermrc L'enregistrement BibTeX correspondant est: @Book{Bruhat:1924, author={Bruhat, Georges}, title={Cours d'électricité à l'usage de l'enseignement supérieur scientifique et technique}, volume={}, series={}, issn={}, edition={}, year={1924}, publisher={Masson et Cie, éditeurs}, address={120, boulevard Saint-Germain Paris}, note={} }

Les programmes AWK suivants permettent de réaliser une conversion automatique des formats MARC en format BibTeX:

  1. umarc2bib UNIMARC vers BibTeX
  2. imarc2bib INTERMARC vers BibTeX
  3. lmarc2bib (Library of Congress) MARC vers BibTeX

Pour les utiliser, il suffit de copier-coller les enregistrements au fomat MARC dans un fichier texte intermarc.txt, puis d'utiliser la commande

imarc2bib < intermarc.txt > intermarc.bib

Le fichier intermarc.bib contient les enregistrements au format BibTeX. Il est en général nécessaire d'éditer le fichier pour s'assurer que les clés de citation sont uniques. En effet, les clés de citations sont du type Auteur:Année et il est possible qu'un même auteur ait publié plusieurs livres dans la même année. D'autre part, les enregistrements MARC ne contiennent pas toujours les informations nécessaires pour distinguer un livre d'une thèse ou d'un rapport. Par défaut, le programme suppose que l'enregistrement correspond à un livre, et il peut être nécessaire de remplacer @Book par @Booklet (si l'éditeur n'est pas renseigné) @Manual (dans le cas d'un manuel technique) ou @techreport (dans le cas d'un rapport publié par un organisme). Enfin, le programme cherche à donner le maximum d'informations dans le fichier BibTeX et il peut être utile d'éliminer les informations redondantes.

Les programmes sont téléchargeables sous forme d'une archive au format .tar.gz. Ils ont été testés avec gawk (GNU AWK) sur Linux, mais ils devraient fonctionner sur n'importe quelle version d'Unix, BSD ou MacOSX. Ils sont distribués selon les termes de la licence CeCILL.