21 mayo 2024
Inicio > Número 13 > Els diccionaris en línia entrellaçats de l’Institut d’Estudis Catalans i el ‘Diccionari de sinònims’ d’Albert Jané

Els diccionaris en línia entrellaçats de l’Institut d’Estudis Catalans i el ‘Diccionari de sinònims’ d’Albert Jané

La Secció Filològica de l’Institut d’Estudis Catalans ha posat en marxa un pla de digitalització i interconnexió d’obres lexicogràfiques cabdals per a la llengua catalana, dins el qual hi ha la tercera edició del Diccionari de sinònims d’Albert Jané, que és obert al públic gratuïtament, de manera efectiva, des del mes de desembre del 2015. Tots aquests recursos seran molt útils per a la traducció, la redacció i la correcció de textos.

1. La digitalització i la interconnexió d’obres lexicogràfiques de l’Institut d’Estudis Catalans

La Secció Filològica de l’Institut d’Estudis Catalans ha emprès darrerament un pla de digitalització i d’interconnexió en línia de diferents obres lexicogràfiques de gran qualitat (el Diccionari de la llengua catalana, que és el diccionari normatiu per a tot el domini lingüístic; el Diccionari català-valencià-balear, d’Antoni M. Alcover i Francesc de B. Moll; el Diccionari descriptiu de la llengua catalana de l’IEC; el Diccionari de sinònims, d’Albert Jané, i el cercador de terminologia de la pàgina web CiT. Terminologia de Ciències i Tecnologia, també de l’IEC), amb la qual cosa ha aconseguit que es puguin consultar un mot o una expressió, inicialment, en una d’aquestes aquestes obres i, a continuació, poder anar de l’una a altra amb un clic del ratolí. També es pot consultar cada obra independentment i altres recursos igualment interessants que no es poden veure en la figura 1, per bé que aquests darrers no estan interconnectats encara.

Diccionaris de l'IEC
Figura 1. Detall de la pantalla de cerca dels diccionaris enllaçats

2. La utilitat dels diccionaris de sinònims

La redacció i la correcció de textos exigeix sovint haver de trobar la paraula o l’expressió adequades al context que estem redactant o corregint, perquè les que hi ha o les que ens vénen al cap no compleixen els requisits que exigeix la frase. En aquest sentit, són molt útils els diccionaris de sinònims o d’idees afins, sobretot quan han estat elaborats a partir d’una coneixença aprofundida del cabal lèxic de la llengua, com és el cas del Diccionari de sinònims (DSIN) d’Albert Jané. El fet que hagi estat reeditat per tercera vegada recentment encara fa més valuosa aquesta eina de treball i d’enriquiment professional (vegeu la figura 3).

Ara, aquest diccionari té la particularitat que també ens mostra, d’una manera completa i explícita, la forma femenina de cada sinònim (si en té), en contrast amb els diccionaris de sinònims tradicionals, que només en presenten una forma (generalment, masculina).

3. La gènesi del DSIN

El punt de partida de la tercera edició d’aquesta obra (la primera en línia) va ser el text en paper de la segona edició, publicada per l’editorial Barcanova l’any 1995, que contenia un total de 26 500 articles; la primera edició havia estat publicada per l’editorial Aedos l’any 1972, amb una extensió similar i un contingut gairebé idèntic. Per raó de l’època en què foren realitzades les dues primeres edicions, no se’n van poder conservar fitxers informàtics de cap classe.

La tercera edició del DSIN disposa, essencialment, de les mateixes informacions que figuraven en les edicions en paper: cada article del diccionari consta d’una entrada (el lema, que és la forma que l’identifica i encapçala) i d’una o diverses llistes de sinònims, disposades per accepcions (els diferents sentits o significats de l’entrada). Aquesta edició, però, hi afegeix altres informacions, com ara la categoria lexicogramatical, adscripció que va portar a crear homògrafs en el cas de les entrades que funcionen amb categories diferents.

Per tant, va caldre dur a terme un conjunt de treballs que van permetre traslladar les dades del mer paper a una aplicació informàtica flexible que facilités les consultes per Internet. En primer lloc, es van escanejar totes les pàgines de la segona edició del diccionari, les quals foren sotmeses posteriorment a un reconeixedor òptic de caràcters (OCR), operació que va fer possible passar el que només era una imatge a un fitxer de text més o menys estructurat. El pas següent va ser comprovar que el text escanejat es corresponia totalment amb l’original de la segona edició; durant aquest procés, hom s’adonà que calia actualitzar l’ortografia de diverses paraules, pel temps que havia transcorregut des de la segona edició i per les novetats que comportà en aquest sentit l’aparició, per la tardor del 1995, del Diccionari de la llengua catalana de l’Institut d’Estudis Catalans, especialment pel que fa a l’ús del guionet i al canvi d’algunes lletres (*sots-llogater > sotsllogater, *dríade > dríada, *eixarmins > eixermims, *ahuc > aüc,per exemple).

D’altra banda, es van haver de prendre decisions de caire estructural amb el vistiplau de l’autor, com ara: numerar les entrades homògrafes i les diverses accepcions dels articles que en tenen més d’una; distribuir les accepcions en articles diferents que tenen la mateixa entrada (amb homògrafs numerats consecutivament) segons la categoria lexicogramatical que es podia inferir de la llista de sinònims que les constituïen (s’hi van mantenir, però, els homògrafs amb la mateixa categoria procedents de la segona edició del diccionari en paper); afegir les formes femenines dels noms masculins, dels adjectius, dels quantificadors i dels indefinits que figuraven en la segona edició del diccionari, tant a les entrades com a les sèries de sinònims; agrupar les categories lexicogramaticals en funcions sintàctiques per tal de poder posar restriccions a les cerques que, altrament, podrien donar resultats excessius en nombre (el sinònim ha de complir el requisit de fer la mateixa funció sintàctica o sintagmàtica que el mot o l’expressió que ha de substituir); crear un camp d’ordenació alfabètica pel sistema discontinu amb partícules perquè els articles quedin ben endreçats per l’entrada quan es llisten com a resultat d’una consulta, i dur a terme altres tasques menors amb la finalitat de facilitar les cerques i l’obtenció dels resultats esperats. Només cal dir que cada registre de la base de dades definitiva, creada inicialment amb l’aplicació MS Excel®, consta de vint-i-un camps (incloent-hi el número de registre), nou dels quals són de treball i el contingut llur no és visible, molt lluny dels dos blocs d’informació que inicialment tenia el diccionari.

Pel que fa a les categories lexicogramaticals, aquesta tercera edició ha partit de les categories lèxiques fixades per la nova gramàtica normativa de l’Institut d’Estudis Catalans (la qual sembla que, definitivament, es posarà a la venda abans d’acabar l’any 2016) i, a més, ha tingut en compte els avenços que hi ha hagut en fraseologia quant a les unitats fraseològiques (és a dir, unitats pluriverbals o equivalents).

En la revisió sistemàtica de tots els mots i expressions del diccionari van aparèixer un nombre considerable de casos que no figuraven en el diccionari normatiu actual, però que, des d’un punt de vista etimològic, ortogràfic, morfològic i d’ús semblaven perfectament acceptables. Per tal de no incórrer en una possible subjectivitat de les tres persones que han preparat l’edició (l’autor, l’excel·lent correctora Marta Llobet i jo mateix), s’acordà de constituir un corpus d’exclusió (que, en aquest cas concret, és de fet un «corpus d’inclusió»), format pel Diccionari de la llengua catalana de l’IEC, el Diccionari.cat d’Enciclopèdia Catalana, el Diccionari català-valencià-balear d’Antoni M. Alcover i Francesc de B. Moll i el Diccionari descriptiu de la llengua catalana de l’IEC: tot mot o expressió que figura en una d’aquestes obres sense cap indicació d’incorrecció o de manlleu poc recomanable fou admesa d’antuvi. Els mots i les expressions no consignats en cap d’aquestes obres van ser sotmesos a la decisió de l’autor, juntament amb alguna proposta de substitució normativa, sempre que va semblar escaient. Així, es van revisar, un per un, tots els mots i sintagmes diferents que conté aquesta obra lexicogràfica i, a més, s’hi van afegir les formes femenines (noms, adjectius, quantificadors i indefinits) corresponents a les formes que figuraven en la segona edició.

La present edició del diccionari de sinònims conté 33 025 formes diferents aplegades en 27 542 articles, amb un total de 34 377 accepcions (sentits) diferents; els articles tenen entre una i tretze accepcions (p. ex., passar), i un 18 % dels articles contenen més d’una accepció. D’altra banda, hi ha 1 475 lemes que tenen homògrafs, amb un total de 3 144 formes amb homografia; els homògrafs varien d’un a cinc, a més del lema principal (p. ex., coral).

4. Els tipus de consulta

El programari del Diccionari de sinònims permet de fer dos tipus de consulta, que en la interfície de cerques podem veure representades segons el quadre següent.

Cerques del DSIN
Figura 2. Quadre de cerques del DSIN

4.1. La consulta general

La consulta general permet fer, al seu torn, dos tipus de cerca: la cerca arreu i la cerca a l’entrada.

4.1.1. La cerca arreu

La cerca arreu de la consulta general és la més exhaustiva, i troba articles que contenen la cadena de caràcters que li hem demanat, tant a l’entrada com a la llista de sinònims (tant masculins com femenins).

Diccionari de sinònims
Figura 3. Resultat ofert pel DSIN després d’haver cercat arreu el mot traductor

4.1.2. La cerca a l’entrada

La cerca a l’entrada de la consulta general permet trobar totes les entrades (però no els sinònims) que compleixen una d’aquestes condicions:

  1. que contenen una cadena de caràcters determinada («Conté»);
  2. que comencen per una cadena de caràcters determinada («Comença per»);
  3. que acaben en una cadena de caràcters determinada («Acaba en»).

4.2.   La consulta per funció sintàctica

La consulta per funció sintàctica, a diferència de la consulta general, només permet fer el tipus de cerca arreu.

4.2.1. La cerca arreu

La cerca arreu de la consulta per funció sintàctica permet trobar articles que contenen una cadena de caràcters determinada, tant a l’entrada com a la llista de sinònims, segons la funció sintàctica del mot o expressió de l’entrada. Aquesta restricció de cerca és una eina molt útil, si tenim en compte que, quan es busca un sinònim en un context determinat, el que es vol trobar és una peça lèxica que faci la mateixa funció que el mot o l’expressió que es vol substituir.

La llista completa de les funcions sintàctiques (o sintagmàtiques) possibles és la següent:

Funcions sintàctiques

FuncióCategories lexicogramaticals que engloba
nominalnom
adjectivaladjectiu
pronominalpronom
determinantdeterminant
quantificadoraquantificador
verbalverb
prepositivapreposició
adverbialadverbi
conjuntivaconjunció
interjectivainterjecció (enunciat fraseològic que és una fórmula rutinària de valor interjectiu)
oracionaloració, locució clausal i enunciat fraseològic (altre que la fórmula rutinària de valor interjectiu)
paremialparèmia (enunciat fraseològic de valor específic, citació o refrany —aquest darrer inclou el proverbi, l’aforisme, la sentència i l’adagi—; en aquest diccionari, de moment l’hem inclosa dins la funció oracional)
formulàriafórmula rutinària (enunciat fraseològic que pot ser discursiu o psicosocial; en aquest diccionari, de moment l’hem inclosa dins la funció oracional, però n’hem exclòs, per raons pràctiques, la que té valor interjectiu)

5. Cloenda

Espero que amb aquesta breu exposició us he temptat de visitar el Diccionari de sinònims i tots els altres recursos a què he fet referència. Us animo a consultar-los i a «jugar-hi» per treure’n el màxim profit. Concretament, pel que fa al Diccionari de sinònims, les instruccions d’ús detallades que figuren en la mateixa pàgina web del diccionari us hi ajudaran sens dubte.

Referències

Alcover, Antoni M.; Moll, Francesc de B. Diccionari català‑valencià‑balear [en línia]. 2a ed. Palma de Mallorca: Moll, 1978. [Consulta: 30 maig 2006].

Alegret, Salvador (dir.). CiT: Terminologia de ciències i tecnologia [en línia]. Barcelona: Institut d’Estudis Catalans, 2013. [Consulta: 30 abril 2014].

Diccionari.cat [en línia]. Barcelona: Enciclopèdia Catalana, 2008. [Consulta: 19 setembre 2010].

Institut d’Estudis Catalans. Diccionari de la llengua catalana [en línia]. 2a ed. Barcelona: Edicions 62: Enciclopèdia Catalana, 2007. [1a ed., 1995] [Consulta: 19 abril 2007]. Esmenes introduïdes en la 2a reimpr. (novembre 2007). [Consulta: 6 abril 2009].

Diccionari descriptiu de la llengua catalana [en línia]. Barcelona: IEC, 2002-2015. [Consulta: 22 novembre 2007].

— «Llengua». A: Institut d’Estudis Catalans [en línia]. Barcelona: IEC, 2016. [Consulta: 10 juny 2016].

Jané, Albert. Diccionari de sinònims [en línia]. 3a ed. Barcelona: Institut d’Estudis Catalans, setembre 2015. [Consulta: 10 desembre 2015].

Josep M. Mestres
+ artículos

Josep M. Mestres (Barcelona, 1956) és llicenciat en filologia catalana i doctor en lingüística aplicada, a més de traductor intèrpret jurat entre català i espanyol. Corrector redactor del Parlament de Catalunya en excedència, des del 1991 és el cap del Servei de Correcció Lingüística de l’Institut d’Estudis Catalans. Professor de traducció jurídica i administrativa i de correcció de textos, actualment imparteix redacció jurídica i documental en el grau en Dret de la Universitat Pompeu Fabra, de Barcelona. Ha publicat, en col·laboració, el Diccionari d’abreviacions (1992, 2001), La redacció de les lleis (1995) i Manual d’estil. La redacció i l’edició de textos (1995, 1996, 2000, 2007 i 2009), i, individualment, Cent anys de correcció de textos i normalització a l’Institut d’Estudis Catalans (1907-2007) (2012), a més de nombrosos articles sobre lingüística i tipografia. Des de l’obertura (juliol del 2014), coordina, juntament amb Sílvia López, l’espai web Critèria.

Josep M. Mestres
Josep M. Mestres
Josep M. Mestres (Barcelona, 1956) és llicenciat en filologia catalana i doctor en lingüística aplicada, a més de traductor intèrpret jurat entre català i espanyol. Corrector redactor del Parlament de Catalunya en excedència, des del 1991 és el cap del Servei de Correcció Lingüística de l’Institut d’Estudis Catalans. Professor de traducció jurídica i administrativa i de correcció de textos, actualment imparteix redacció jurídica i documental en el grau en Dret de la Universitat Pompeu Fabra, de Barcelona. Ha publicat, en col·laboració, el Diccionari d’abreviacions (1992, 2001), La redacció de les lleis (1995) i Manual d’estil. La redacció i l’edició de textos (1995, 1996, 2000, 2007 i 2009), i, individualment, Cent anys de correcció de textos i normalització a l’Institut d’Estudis Catalans (1907-2007) (2012), a més de nombrosos articles sobre lingüística i tipografia. Des de l’obertura (juliol del 2014), coordina, juntament amb Sílvia López, l’espai web Critèria.

Redes Sociales

956me gustaMe gusta
10,638seguidoresSeguir

Último número

- Advertisement -spot_img

Artículos relacionados