3. Correcció i format

Aquesta part del projecte Pedrolo Digital consisteix a editar i etiquetar el text digitalitzat.

El primer que fareu serà enganxar el text digitalitzat al document de text del vostre google drive que correspongui al número de pàgina que esteu editant.

Tot seguit haureu de comprovar que no hi hagi errors tipogràfics al text. Un bon mètode per fer això és treballar amb la fotografia de la pàgina original al vostre mòbil mentre reviseu el text a l’ordinador. D’aquesta manera podeu comparar ambdós textos més còmodament.

Els errors típics que trobareu seran d’accentuació i puntuació, ja que depenent de la qualitat de la versió d’impremta, l’eina OCR pot confondre fàcilment caràcters que s’assemblen entre ells. Un exemple molt clar és la “à” amb accent obert, que sovint es confon amb la lletra “d”.

Un cop tingueu el text corregit, començarem la primera part de l’etiquetatge, que consisteix a definir l’estructura de la pàgina:

Indicarem on comencen i acaben els paràgrafs amb l’etiqueta <p> (comença el paràgraf) i l’etiqueta </p> (acaba el paràgraf).

Exemple:

Captura de pantalla 2015-09-25 a les 19.14.47

Fragment de: Manuel de Pedrolo. “Mecanoscrit del segon origen“.

Si hi trobeu un títol, com per exemple un nou capítol, utilitzarem l’etiqueta <h1> (comença el títol) i </h1> (acaba el títol)

Utilitzarem les etiquetes des de <h1> fins a <h6> depenent de la jerarquia d’aquests títols. Aquestes etiquetes ens seran útils quan trobem segments titulats “Llibre 1”, “Part 1”, a banda de l’estructura més comuna “Capítol 1”.

Exemple:

Captura de pantalla 2015-09-25 a les 19.15.19

Fragment de: Manuel de Pedrolo. “Mecanoscrit del segon origen“.

Aquí acaba la fase de correcció i etiquetatge de format. Ja podeu passar a la Fase 4.

Leave a Reply