4. Etiquetatge semàntic

La segona part de l’etiquetatge consisteix a trobar totes les paraules al vostre text que representin algun tipus de lloc a l’espai, des d’un poble o ciutat, passant per un riu, una muntanya o una platja, fins a un edifici, un bar, una església, etc.

Com ja vam explicar a la Fase 2, l’etiqueta general que utilitzarem per totes les paraules que designin espai serà <lloc>, seguida obligatòriament de <toponim> o <notoponim> depenent de la naturalesa del mot. També haureu d’incloure l’etiqueta <nom> a un nivell inferior, on posareu la paraula a definir.

Com ja deiem, aquests tres elements composen l’estructura mínima que necessitarem per conformar l’etiquetatge XML.

Recordem els dos exemples mencionats anteriorment, un topònim i un no topónim:

Exemple d’un mot topònim: L’AranyòtoponimvsnotoponimExemple d’un mot(s) no topònim: El poble on va nèixer Pedrolo

Però com volem filar més prim i donar una miqueta més d’informació sobre els mots que trobem al nostre text, afegirem subelements que ens ajudaran a classificar les paraules segons diferents criteris.

Leave a Reply