Ghid pentru structurare

De la dexonline wiki
Sari la navigare Sari la căutare

Prin structurarea definițiilor înțelegem crearea unei structuri pentru fiecare intrare (cuvânt) care să includă, frumos categorisite, toate informațiile din toate definițiile pentru acea intrare: sensurile cuvântului, locuțiuni și expresii, exemple de folosire, etimologie, variante, relații cu alte cuvinte (sinonime, antonime), silabisiri, pronunții, toate formele flexionare și altele. Această structură va fi un mare pas înainte față de reprezentarea curentă a definițiilor, pentru două motive principale:

  1. În prezent definițiile sunt simple bucăți de text cu marcaje de formatare (bold, italic etc.). În această reprezentare, toate elementele de mai sus sunt amestecate și imposibil de analizat separat.
  2. Definiția structurată va elimina redundanța (asemănările) între diversele dicționare folosite, care încarcă inutil pagina.

În principiu, o intrare are asociate:

  • unul sau mai mulți arbori de sensuri;
  • unul sau mai multe lexeme;
  • una sau mai multe definiții.

Această pagină este în lucru. Urmăriți și discuția aferentă paginii pentru idei nedefinitivate sau neimplementate.

Interfață

Structurarea are multe componente și vă poate descuraja. Partea bună este că puteți experimenta fără să apăsați butoanele „Salvează”. Atunci nimic nu se salvează pe server, deci nu puteți strica nimic. Puteți apăsa butoanele „Reafișează” pentru a vedea efectul modificărilor propuse.

Procesul de structurare are mai multe etape, care se realizează în pagini separate:

  • pagina de editare a intrării;
  • pagina de editare a arborilor;
  • pagina de editare a lexemului;
  • pagina de editare a unei definiții.

Vă recomandăm să deschideți paginile necesare în ferestre separate, pentru a putea trece ușor de la una la alta pentru a vedea anumite detalii sau pentru a copia fragmente de text (definiții, etimologii).

Să le examinăm pe rând, luând ca exemplu o intrare în curs de structurare (privitor).

Pagina de editare a intrării

Pagina de editare a intrării

În partea superioară există următoarele câmpuri:

  • Descriere - de regulă cuvântul definit. Pot exista și precizări în cazul omonimelor (de exemplu pentru sol putem avea „notă muzicală”, „emisar”, monedă” etc.).
  • Structurare - starea actuală a procesului.
  • Structurist - moderatorul care și-a rezervat-o pentru structurare.
  • Lexeme - lexemul (lexemele) asociat(e).
  • Arbori - arborele (arborii) asociat(i).

Urmează un rând de butoane a căror funcționalitate este ușor de intuit, apoi o zonă în care sunt afișați arborii (fiecare având un link către pagina de editare) și apoi definițiile asociate.

Definițiile pot fi disociate de intrarea respectivă, dar înainte de această operație, verificați dacă sunt asociate cu alt lexem (vezi Pagina de editare a unei definiții).

Deasupra listei există și trei selectori prin care puteți filtra ce definiții doriți să vedeți și în ce reprezentări.

Pagina de editare a arborilor

Fereastra de editare a arborilor

Efortul principal în structurarea unui lexem este confruntarea și comasarea definițiilor. În final, rezultă o ierarhie de sensuri primare, pe baza cărora iau naștere sensuri secundare, expresii și locuțiuni. Această ierarhie se numește arborele de sensuri.

În această fereastră aveți:

  • Câmpurile:
    • Descriere - de regulă identică cu intrarea, dacă este un singur arbore;
    • Stare - de regulă vizibil;
    • Intrări - (un arbore poate avea mai multe intrări?)
  • Rândul de butoane;
  • Zona de afișare a sensurilor create;
  • Zona de editare a sensurilor.

În această fereastră puteți:

  • crea un sens nou sau un subsens;
  • șterge un sens sau un subsens;
  • reordona sensurile și subsensurile, inclusiv prin promovarea și retrogradarea în ierarhie.
Fereastra de editare a arborilor

Zona de editare a sensurilor

Deoarece editarea unui sens poate fi complexă, ea nu se petrece direct în arborele de sensuri, ci în această fereastră separată. Această fereastră este inactivă până când dați click pe un sens. Atunci elementele sensului sunt copiate în zona de editare, iar câmpurile devin active (editabile).

Elementele unui sens sunt:

  • Sensul propriu-zis: el este copiat sau compilat din una sau mai multe definiții.
  • Etimologie: indică proveniența sensului. Și ea este copiată sau compilată din definiții.
  • Comentariu: când observăm neclarități în definiții, nu le corectăm direct (decât în situații evidente), ci facem adnotări în acest câmp.
  • Surse: aici enumerăm toate dicționarele din care a fost copiat sau compilat acest sens.
  • Etichete: diverse precizări despre acest sens (registre de folosire, disciplina de aplicare etc.).
  • Relații: sinonime, antonime, diminutive și augmentative pentru acest sens.

Când acceptați modificările făcute, ele vor deveni vizibile în arborele de sensuri. Atenție! Modificările nu sunt încă salvate pe disc. Apăsați butonul „Salvează” pentru a salva întregul arbore, inclusiv sensurile.

Fereastra de editare a lexemului

Pagina de editare a lexemului

Aici arătăm cum se flexionează acest lexem. Flexionarea este un termen general pentru conjugări (eu merg, tu mergi, el merge) și declinări (copil, copii, copilul, copiii).

Fiecare lexem are un model de flexiune. Vedem că privitor are modelul A66 (roditor), adică se declină la fel ca roditor: privitor, privitoare, privitori, privitoare.

Unele lexeme pot avea mai multe modele de flexiune. De exemplu, vis are un model cu pluralul în -e (vise, visele, viselor) și altul cu pluralul în -uri (visuri, visurile, visurilor). În acest caz trebuie create două lexeme omonime, fiecare cu modelul său de flexiune.

Această pagină are un rând de butoane, două zone de editare (Proprietăți și Model de flexiune) și o zonă de afișare a paradigmei.

  1. Rolul butoanelor este ușor de intuit. Câteva precizări în josul paragrafului.
  2. Zona Proprietăți
    1. Formă
      • Accentul trebuie indicat chiar și pentru lexemele monosilabice, altfel paradigma nu va conține deloc accente.
      • Valoarea acestui câmp este folosită la căutări și este vizibilă public la afișarea flexiunilor unui cuvânt.
      • Odată ce un lexem a fost inclus în LOC, numele și descrierea lexemului mai pot fi modificate numai de către moderatorii LOC.
    2. Necesită accent
      • Majoritatea lexemelor necesită accent. Acesta se marchează cu un apostrof înaintea vocalei accentuate, iar căsuța „necesită accent” trebuie să fie bifată.
      • Dacă accentul nu este cunoscut (denumirile științifice de animale și plante, numele proprii etc.) sau sunt mai multe vocale accentuate (cuvinte compuse), lăsați căsuța nebifată.
    3. Descriere
      • O scurtă descriere, vizibilă public, pentru diferențierea omonimelor. În cazul lui sol am putea folosi descrierile „notă muzicală”, „emisar”, „monedă”...
    4. Număr
      • Opțional, pentru numerotarea omonimelor.
    5. Intrare
      • Intrarea asociată (valoare unică).
    6. Silabisiri, pronunții
      • Opționale, despărțite prin virgule.
    7. Etichete
      • Se pot adăuga etichete ilustrative (învechit, regional etc.) sau eticheta [admite vocativul], care activează afișarea formelor de vocativ dacă este cazul (persoane - băiat, doctor -, animate - cal, codru -, personificabile - râu, vânt).
      • Formă principală
        • Căsuță implicit bifată. Se debifează pentru variante (doftor = doctor).
      • Ignoră la căutările full-text
        • Căsuță implicit debifată. Se bifează în cazul cuvintelor care au o mare frecvență în texte, pentru a fi omise la căutări full-text (de, și, la etc.).
  3. Zona Model de flexiune
    Fiecare lexem are minim un model de flexiune. Ex. privitor are modelul A66 (roditor), adică se declină la fel ca roditor: privitor, privitoare, privitori, privitoare.
    Unele lexeme pot avea mai multe modele de flexiune. De exemplu, vis are un model cu pluralul în -e (vise, visele, viselor) și altul cu pluralul în -uri (visuri, visurile, visurilor). În acest caz lexemul trebuie clonat.
    1. Tip + număr
      • Când adăugați un model nou, puteți căuta prin lista de modele unul care să se potrivească (selectați întâi tipul - ex. A -, apoi numărul - ex. 66). Alternativ, puteți indica un lexem care se declină similar. Pentru privitor, acestea ar putea fi amăgitor, ascultător etc.
      • Modelul T1 este special, având semnificația „nu știm cum se flexionează acest lexem”. Se întâmplă mai des decât ați crede!
    2. Restricții
      • Litere din setul:
        • Singular;
        • Plural;
        • Unipersonal;
        • Impersonal;
        • Trecut;
        • V (vocativ masculin/neutru forma 1);
        • v (vocativ masculin/neutru forma 2);
        • W (vocativ feminin forma 1);
        • w (vocativ feminin forma 2).
      • Restricțiile se interpretează în sensul „numai...” (ex. S = numai formele de singular).
      • Atenție! Dacă folosiți metoda indicării unui lexem similar, verificați corectitudinea elementelor de mai sus!
    3. Inclus în LOC
      • dexonline menține Lista Oficială de Cuvinte a Federației Române de Scrabble. Acest câmp poate fi modificat numai de către un set restrâns de administratori ai LOC.
    4. Surse
      • Dicționarul (dicționarele) care menționează paradigma (doar dacă sunt surse mai puțin cunoscute; nu menționați DOOM, DEX etc.).
    5. Precizări
      • O scurtă clasificare, vizibilă public, care marchează sursa flexiunii. Pentru cuvintele cu flexiuni în DOOM-ul curent (DOOM2 în acest moment), ea poate fi vidă. Sursele pot reprezenta dicționare, autori cunoscuți, inclusiv părerea moderatorului, dar trebuie documentate clar aceste situații.
    6. Comentariu
      • Opțional, invizibil public. Dacă observați greșeli în paradigmă, notați-le în acest câmp și ele vor fi semnalate celorlalți moderatori. Dacă sunteți sigur de greșeală și o puteți corecta, nu ezitați!
  4. Zona Paradigma
    • Aici puteți vedea modificările. Verificați corectitudinea tuturor formelor înainte de a salva.
  5. Butoanele
    1. Reafișează
      • Folosiți-l pentru a vedea modificările făcute, fără a le salva.
    2. Salvează
      • Salvați modificările făcute.
    3. Clonează
      • Clonarea creează un lexem aproape identic cu cel în curs de editare. El va avea același nume și aceeași intrare asociată. Descrierea noului lexem va fi prefixată cu cuvântul CLONĂ. Clona va fi creată fără flexiuni (modelul de flexionare T1), chiar dacă lexemul original avea flexiuni.
      • Folosiți clonarea pentru a sparge un lexem nediferențiat în două lexeme omonime. De exemplu, dacă inițial toate definițiile pentru episcop sunt reunite într-o singură intrare cu un singur lexem, puteți să clonați acest lexem și să adăugați descrierile „prelat” și „aparat”. Apoi trebuie să asociați definițiile în mod corect cu cele două lexeme.
    4. Renunță
      • Renunțați la modificările făcute.
    5. Șterge
      • Șterge lexemul. Intrarea cu care el era asociat (și definițiile corespunzătoare) nu va fi ștearsă, dar, dacă nu este asociată cu niciun alt lexem, ea va deveni neasociată, ceea ce înseamnă că definițiile nu vor fi niciodată afișate ca rezultat al unei căutări. Probabil trebuie să vă asigurați că intrarea respectivă este asociată cu un alt lexem înainte de a-l șterge pe acesta.
      • Lexemele care sunt parte din LOC nu pot fi șterse, pentru a preveni modificarea accidentală a LOC. Scoateți întâi lexemul din LOC (dacă aveți dreptul), după care îl puteți șterge.
Fereastra de editare a unei definiții

Pagina de editare a unei definiții

Fiecare definiție are:

  • id: un identificator numeric unic;
  • sursa: dicționarul din care face parte definiția;
  • starea: de obicei definițiile sunt active, dar în rare ocazii pot fi șterse, ascunse sau temporare (adică așteaptă să fie moderate);
  • etichete: ;
  • intrări: ;
  • conținut: zona în care puteți edita definiția;
  • comentariu (opțional): ;

Butonul „arată TinyMCE” comută între reprezentarea lizibilă (HTML) și cea folosită intern de dexonline.


Ghid

Chestiuni preliminare

  • Nu uitați să salvați des!
  • Acest ghid nu va fi niciodată complet. Structurarea implică și luarea unor decizii, nu doar urmarea mecanică a unor pași.
  • Dacă o definiție vi se pare greu de structurat, nu vă descurajați. Lăsați-o neterminată și vom cere ajutorul unui lexicograf de profesie. Putem face progrese uriașe și cu definiții lipsite de complicații.

Alegeți un lexem

Aveți trei metode pentru a alege un lexem pe care să-l structurați:

Corectați lista de definiții

Un lexem este o unitate de bază a semnificației. De aceea, el trebuie să fie asociat cu toate definițiile care îl explică și doar cu acelea. Pentru aceasta, poate fi necesar:

  • Să spargeți lexemul în mai multe lexeme. Pentru aceasta, clonați lexemul, adăugând numerotare și descrieri adecvate.
    • exemplu: Un lexem nu are voie să cuprindă mai multe părți de vorbire. Pe vremuri, „da” ca afirmație și „a da” ca verb erau un singur lexem. L-am scindat în două lexeme diferite.
  • Să unificați două sau mai multe lexeme.
    • exemplu: Două lexeme care dau forme diferite de plural pentru un cuvânt (consilii / consiliuri) au clar aceeași semnificație și trebuie unificate într-un singur lexem, care va avea ambele modele de flexiune.
  • Să includeți în analiză și omonimele cuvântului, dacă apar listate în fereastra „Proprietăți”.

Pentru lexemul rezultat (sau pentru fiecare dintre lexemele rezultate), examinați fereastra „Definiții asociate”. Disociați definițiile care nu au ce căuta acolo. Nu vă speriați, definiția nu va fi ștearsă, ci doar disociată de lexemul în cauză. Ideal ar fi să editați și respectiva definiție și să o asociați cu lexemele corecte.

Fereastra „Proprietăți”

  • Verificați dacă există un accent (în rubrica „nume”). Dacă nu, adăugați-l sau debifați căsuța „necesită accent”, după caz.
    • În cazul lexemelor cu variante de accentuare (ex.: agriș/agriș), unificați întâi lexemele - dacă e cazul -, păstrând varianta principală (indicată pe prima poziție de DOOM sau DEX), apoi indicați cealaltă/celelalte variantă(e) în rubrica „pronunție”.
  • Verificați dacă definițiile (în special cele din DOOM, DOR) dau indicații de silabisire și pronunție, completând rubricile respective.
  • Pentru variante:
    • dacă lexemul este o variantă a altui lexem, indicați acest lexem în rubrica "variantă a lui";
    • dacă definițiile indică existența unor variante, verificați pentru fiecare să nu aibă definiții cu sensuri diferite, apoi adăugați-le în rubrica "variante".
  • Marcați stadiul structurării ca „în lucru”.

Fereastra „Paradigmă”

  • Verificați/corectați/stabiliți modelul de flexiune. Pentru multe cuvinte acest pas este deja făcut.
  • Asigurați-vă că definițiile menționează într-adevăr formele din modelul de flexiune, și numai pe acelea.
  • Dacă definițiile menționează forme pe care paradigma curentă nu le reflectă, adăugați modele de flexiune noi, după caz.
  • Adăugați în rubrica „surse” sursele (dicționarele) care menționează respectivele flexiuni.
    • Acest pas este opțional pentru modelele agreate de majoritatea dicționarelor. Doar opiniile minoritare trebuie consemnate.
  • Dacă nu știți ce model de flexiune să alegeți, nu vă impacientați. Specificați, în rubrica „Comentarii despre paradigmă” un text de genul „este necesar un model pentru forma de plural ...”.
  • Nu modificați bifa „inclus în LOC” și nu atingeți paradigmele care poartă această bifă. Teoretic ar trebui să nu aveți dreptul să faceți aceasta, dar orice program are greșeli. :-)
  • Dacă definițiile specifică restricții („numai la singular”, „impersonal” etc.), completați rubrica „restricții” conform precizărilor (secțiunea 4).

Structurarea sensurilor

Aici este greul procesului de structurare. Începeți cu una dintre definiții, preferabil din DEX.

  • Citiți-o cu atenție și decideți unde trebuie ea „decupată” în sensuri, sensuri secundare, expresii etc. Există marcaje și indicații care vă ajută: romburile, numerotările, mențiunile explicite ca „locuțiune prepozițională” etc.
  • Pentru fiecare sens:
    • Apăsați butonul „adaugă sens” (în fereastra „Sensuri”).
    • Veți observa că rubricile din fereastra „Editorul de sensuri” au devenit active (editabile).
    • Introduceți în fereastra "Editorul de sensuri" bucata respectivă din definiție
    • Vedeți subcapitolul „Formatarea sensurilor” pentru instrucțiuni detaliate de formatare a sensului.
    • Adăugați în rubrica „surse” sursa definiției, eventuale sinonime/antonime și etichete (ex. la verbe etichetați tipul de verb - tranzitiv, intranzitiv etc.).
    • Folosim etichete pentru mențiuni ca p. restr., p. ext., fig., pop. etc., pentru utilizarea în anumite contexte (tehn., inform., lingv. etc.) sau pentru exemple.
    • Dacă o etichetă nu există, o puteți crea din pagina de etichete.
    • Apăsați butonul "acceptă".
  • Adăugați în mod similar celelalte sensuri și/sau subsensuri.
  • Adăugați etimologia/etimologiile ca în rubrica „etimologie” a primului sens principal. Dacă alte sensuri sau subsensuri au etimologii separate, adăugați-le la fiecare sens. Folosiți formularea „Din limba ... xxx” sau „Din xxx + sufixul yyy”. În cazul în care definiția face trimitere la alt lexem („V. xxx”), preluați etimologia de la acesta, completând eventual sufixul.
  • Folosiți săgețile din fereastra „Sensuri” pentru a ordona și ierarhiza corect sensurile. Pe cât posibil, urmăriți ierarhia din definiție.
  • Recitiți definiția și verificați că fiecare parte a ei este consemnată în rubrica potrivită. Nu uitați că unele bucăți din definiție au fost deja structurate în secțiunile anterioare: modelul de flexiune, valoarea morfologică, silabisirea, pronunția, variantele.
  • Bifați definiția ca structurată.

Alegeți apoi alte definiții din sursele moderne, una câte una, compilând (cumulând) explicațiile furnizate de toate sursele moderne și aducând la zi sursele, sinonimele etc.

Încă nu am luat o decizie în privința abordării dicționarelor vechi, a Dicționarului Enciclopedic și a Dicționarului Etimologic.

Formatarea sensurilor

Dorim ca lexemul structurat să arate unitar, nu ca un mișmaș de formatări preluate din diversele dicționare. Iată standardul nostru:

  • Folosiți ortografia și punctuația corectă (indiferent cum e în surse).
  • Nu menționați partea de vorbire (s.m., adj., vb. etc.), aceasta fiind specificată la paradigmă.
  • Puneți întotdeauna majusculă la începutul sensului și punct la final (chiar dacă sensul este o frază incompletă).
  • Expandați toate abrevierile, cu excepțiile: s.m., s.f., s.n., adj.. Acestea sunt foarte frecvente, bine cunoscute, iar expandarea lor ar îngreuna citirea.
  • Uneori definiția constă dintr-un singur cuvânt, practic un sinonim (exemplu: antimonit). Atunci lăsați sensul gol și listați doar sinonimul (și sursele, desigur).
  • Mențiune

Menționarea altor sensuri

menționarea unui sens anume al lui monitor

Uneori dorim să evidențiem, în cadrul unui sens, că un cuvânt este folosit cu un sens anume. De exemplu, monitor poate însemna o duzină de lucruri distincte. Dacă vreodată întâlniți cuvântul monitor într-o definiție și doriți să clarificați la ce sens se referă, procedați astfel:

  • Tastați cuvântul (în editorul de sensuri)
  • Imediat după el, fără spațiu, tastați o paranteză pătrată deschisă „[”.
  • Va apărea o fereastră cu maxim 10 sensuri cunoscute pentru monitor.
  • Tastați un număr de ordine (cum ar fi 2.6) pentru a rafina căutarea sau folosiți săgețile pentru a naviga printre sensuri.
  • Apăsați Enter sau dați clic pe sensul dorit.
  • Sistemul va include automat în text un identificator numeric unic al sensului și va închide paranteza pătrată.
  • După ce salvați lexemul, dacă survolați peste monitor în arborele de sensuri, veți observa un popup cu explicația sensului 2.6.

Încheiere

Când ați terminat de încorporat toate definițiile moderne, lexemul este structurat! Treceți-l în starea „așteaptă moderarea” și un moderator îl va examina în curând.

Este acceptabil să treceți un lexem în această stare chiar dacă unele dintre definiții nu sunt încă structurate. Când luăm o decizie despre dicționarele sus-menționate, ne va fi ușor să identificăm și să reprocesăm lexemele deja structurate.