Diferență între revizuiri ale paginii „Ghid pentru structurare”

De la dexonline wiki
Sari la navigare Sari la căutare
Linia 76: Linia 76:


* Verificați dacă există un accent (în rubrica „nume”). Dacă nu, adăugați-l sau debifați căsuța „necesită accent”, după caz.
* Verificați dacă există un accent (în rubrica „nume”). Dacă nu, adăugați-l sau debifați căsuța „necesită accent”, după caz.
** În cazul lexemelor cu variante de accentuare (ex.: agr'''i'''ș/'''a'''griș), unificați întâi lexemele - dacă e cazul -, păstrând varianta principală (indicată pe prima poziție de DOOM sau DEX), apoi indicați cealaltă/celelalte variantă(e) în rubrica „pronunție”.
* Verificați dacă definițiile (în special cele din DOOM, DOR) dau indicații de silabisire și pronunție, completând rubricile respective.
* Verificați dacă definițiile (în special cele din DOOM, DOR) dau indicații de silabisire și pronunție, completând rubricile respective.
** În cazul lexemelor cu variante de accentuare (ex.: agr'''i'''ș/'''a'''griș), unificați întâi lexemele - dacă e cazul -, păstrând varianta principală (indicată pe prima poziție de DOOM sau DEX), apoi indicați cealaltă/celelalte variantă(e) în rubrica „pronunție”.
* Pentru variante:
* Pentru variante:
** dacă lexemul este o variantă a altui lexem, indicați acest lexem în rubrica "variantă a lui";
** dacă lexemul este o variantă a altui lexem, indicați acest lexem în rubrica "variantă a lui";

Versiunea de la data 2 februarie 2016 15:00

Prin structurarea definițiilor înțelegem crearea unei structuri pentru fiecare lexem (cuvânt) care să includă, frumos categorisite, toate informațiile din toate definițiile pentru acel lexem: sensurile cuvântului, locuțiuni și expresii, exemple de folosire, etimologie, variante, relații cu alte cuvinte (sinonime, antonime), silabisiri, pronunții și altele. Această structură va fi un mare pas înainte față de reprezentarea curentă a definițiilor, pentru două motive principale:

  1. În prezent definițiile sunt simple bucăți de text cu marcaje de formatare (bold, italic etc.). În această reprezentare, toate elementele de mai sus sunt amestecate și imposibil de analizat separat.
  2. Definiția structurată va elimina redundanța (asemănările) între diversele dicționare folosite, care încarcă inutil pagina.


Ghid pentru structurare

Această pagină este în lucru. Momentan înșirăm în prima parte idei care ne vin, iar în final încercăm să schițăm viitoarele instrucțiuni.

  • Ne trebuie norme pentru punctuație și majuscule la copierea unui segment din definiție. Punem majusculă? Punem punct final? Dar dacă segmentul include mai multe propoziții?
    • Punem întotdeauna majusculă și punct final. Idem în cazul mai multor propoziții.
  • Când punem etichete și când lăsăm paranteza respectivă?
    • Cred că ar trebui încet-încet să creăm etichete pentru toate parantezele.
  • Vrem să păstrăm abrevieri în unele cazuri? Ex. s.m., s.f., s.n., adj.
    • Da, unele abrevieri sunt foarte frecvente, bine cunoscute, expandarea lor creând disconfort la citire (sunt relativ lungi).
  • Pe primul nivel se pune o definiție cât mai cuprinzătoare, având în vedere atât DEX cât și celelalte surse. Pe nivelul următor se adaugă sensuri restrânse, expresii, exemple etc. etichetate ca atare.
    • [Matei] Eu aş merge pe varianta cu definiţie succintă (explicaţiile mai ample se pot consulta în sursele menţionate). Redactarea unei definiţii cuprinzătoare e anevoioasă (şi subiectivă).
  • Etimologiile se adaugă ca subsens la fiecare sens (dacă sunt diferite) sau ca subsens la sensul principal (dacă e aceeași). Trebuie văzut cum vor fi afișate pe pagina de consultare a lexemului.
  • Lexemele omonime, sensurile (și subsensurile) ar trebui numerotate, altfel trimiterile dintr-o definiție nu mai au sens. V. aalenian. De stabilit modul de numerotare pentru diferitele paliere.
    • Asta creează probleme când trimiterea e la un alt lexem.
    • Ar fi bine dacă s-ar automatiza numerotarea; ușurează munca și reface numerotarea când se mută (sub)sensurile. E posibil? Creează alte probleme cu trimiterile.
    • [cata] cred că partea asta este gata. Avem număr pentru fiecare lexem, precum și mențiuni de genul aalenian[.... Aceste mențiuni duc la un sens anume (ca tooltip, nu ca link, dar asta se poate schimba oricând) și se păstrează în cazul reordonării sensurilor.
  • Unificarea lexemelor MF. [cata, Matei] sunt de acord cu asta
  • Uneori definiția constă dintr-un singur cuvânt, practic un sinonim (vezi antimonit). Atunci mai punem acel cuvânt și în sens? Eu ([cata]) propun să lăsăm sensul gol și să listăm doar sinonimul (și sursele, desigur). [Matei] e de acord.

Funcții noi de implementat:

  • Probleme cu arborele de sensuri:
    • La apăsarea butonului "Salvare", nivelul 2 dispare, iar sensuri șterse reapar - pare că s-a rezolvat.
    • Apăsarea butonului "Reafișează" produce dublări și mutări ale unor subsensuri.
    • Când trag un sens X peste altul Y și îi dau drumul, X devine ultimul fiu al lui Y. Asta e greu de văzut, trebuie documentat în ghid.
    • Între două cazuri este o distincție foarte vagă: vreau să-l fac pe X fiu al lui Y sau vreau să-l fac pe X frate al lui Y, imediat următor lui Y.
    • [cata] Da, modulul pe care îl folosesc pentru arborele de sensuri are foarte multe probleme. Sunt tentat să renunț la el și să scriu de la zero ceva cu o interfață mai robustă (fără tras cu mouse-ul, doar butoane cu săgeți).
    • [cata] Am terminat înlocuirea. Cred că toate cele trei probleme anterioare sunt rezolvate.
  • (posibil) Link în pagina de editare pentru selectarea altui lexem, fără a mai trece prin pagina moderatorului.
  • Crearea unor rubrici noi pentru "diminutive" și "augmentative" (similar cu sinonime / antonime).
    • Atenţie! Diminutivele, antonimele, ca de altfel şi variantele, etimologiile, pronunţiile sau modelele de flexiune pot fi valabile doar pentru anumite sensuri. Cum rezolvăm?
  • Adăugarea unui „deținător” al lexemului, pentru ca fiecare să poată vedea lista sa de lexeme, inclusiv cele care i se întorc neavizate de la moderator.
  • Indicarea surselor pentru variante. Trebuie să arătăm cine le atestă, dar prin design variantele nu pot avea sensuri.
  • Rubrică separată pentru etimologii, ca să uşurăm editarea.
  • Crearea unui câmp separat pentru partea de vorbire. Există cazuri de adj. fem. (ex. vectoare), care în prezent sunt încadrate eronat (s.f.).
    • [Matei] Poate ar fi bine ca un lexem să poată avea multiple forme de bază (cu modele de flexiune diferite), ca să evităm crearea de lexeme multiple (eu nu văd rostul unui lexem separat vieţuitoare s.f. pe lângă vieţuitor adj. - având practic acelaşi sens).
    • [cata] Da, trebuie generalizată un pic structura. Tot aici aș include și variantele de accentuare (agríș / ágriș).
    • [cata] Și da, aș separa funcția morfologică (o listă de posibilități) de modelul de flexiune. Avem o mulțime de adjective care sunt și substantive și e absurd să dublăm la toate A(număr)/MF(număr).
  • Pentru variante de accent, ghidul recomandă să unificăm lexemele și să păstrăm varianta secundară doar în rubrica „pronunții”. Chiar vrem asta? Efectul va fi că se pierd formele flexionare care includ varianta secundară de accent.

Ghid

Chestiuni preliminare

  • Nu uitați să salvați des!
  • Acest ghid nu va fi niciodată complet. Structurarea implică și luarea unor decizii, nu doar urmarea mecanică a unor pași.
  • Dacă o definiție vi se pare greu de structurat, nu vă descurajați. Lăsați-o neterminată și vom cere ajutorul unui lexicograf de profesie. Putem face progrese uriașe și cu definiții lipsite de complicații.

Alegeți un lexem

Aveți două metode pentru a alege un lexem pe care să-l structurați:

Corectați lista de definiții

Un lexem este o unitate de bază a semnificației. De aceea, el trebuie să fie asociat cu toate definițiile care îl explică și doar cu acelea. Pentru aceasta, poate fi necesar:

  • Să spargeți lexemul în mai multe lexeme. Pentru aceasta, clonați lexemul, adăugând numerotare și descrieri adecvate.
    • exemplu: Un lexem nu are voie să cuprindă mai multe părți de vorbire. Pe vremuri, „da” ca afirmație și „a da” ca verb erau un singur lexem. L-am scindat în două lexeme diferite.
  • Să unificați două sau mai multe lexeme.
    • exemplu: Două lexeme care dau forme diferite de plural pentru un cuvânt (consilii / consiliuri) au clar aceeași semnificație și trebuie unificate într-un singur lexem, care va avea ambele modele de flexiune.
  • Să includeți în analiză și omonimele cuvântului, dacă apar listate în fereastra „Proprietăți”.

Pentru lexemul rezultat (sau pentru fiecare dintre lexemele rezultate), examinați fereastra „Definiții asociate”. Disociați definițiile care nu au ce căuta acolo. Nu vă speriați, definiția nu va fi ștearsă, ci doar disociată de lexemul în cauză. Ideal ar fi să editați și respectiva definiție și să o asociați cu lexemele corecte.

Fereastra „Proprietăți”

  • Verificați dacă există un accent (în rubrica „nume”). Dacă nu, adăugați-l sau debifați căsuța „necesită accent”, după caz.
    • În cazul lexemelor cu variante de accentuare (ex.: agriș/agriș), unificați întâi lexemele - dacă e cazul -, păstrând varianta principală (indicată pe prima poziție de DOOM sau DEX), apoi indicați cealaltă/celelalte variantă(e) în rubrica „pronunție”.
  • Verificați dacă definițiile (în special cele din DOOM, DOR) dau indicații de silabisire și pronunție, completând rubricile respective.
  • Pentru variante:
    • dacă lexemul este o variantă a altui lexem, indicați acest lexem în rubrica "variantă a lui";
    • dacă definițiile indică existența unor variante, verificați pentru fiecare să nu aibă definiții cu sensuri diferite, apoi adăugați-le în rubrica "variante".
  • Marcați stadiul structurării ca „în lucru”.

Fereastra „Paradigmă”

  • Verificați/corectați/stabiliți modelul de flexiune. Pentru multe cuvinte acest pas este deja făcut.
  • Asigurați-vă că definițiile menționează într-adevăr formele din modelul de flexiune, și numai pe acelea.
  • Dacă definițiile menționează forme pe care paradigma curentă nu le reflectă, adăugați modele de flexiune noi, după caz.
  • Pentru modelele mai rar întâlnite, adăugați în rubrica „surse” sursele (dicționarele) care menționează respectivele modele.
  • Dacă nu știți ce model de flexiune să alegeți, nu vă impacientați. Specificați, în rubrica „Comentarii despre paradigmă” un text de genul „este necesar un model pentru forma de plural ...”.
  • Nu modificați bifa „inclus în LOC” și nu atingeți paradigmele care poartă această bifă. Teoretic ar trebui să nu aveți dreptul să faceți aceasta, dar orice program are greșeli. :-)
  • Dacă definițiile specifică restricții („numai la singular”, „impersonal” etc.), completați rubrica „restricții” conform precizărilor (secțiunea 4).

Structurare

Aici este greul procesului de structurare.

  • Începeți cu una dintre definiții, preferabil din DEX.
  • Citiți-o cu atenție și decideți unde trebuie ea „decupată” în sensuri, sensuri secundare, expresii etc. Există marcaje și indicații care vă ajută: romburile, numerotările, mențiunile explicite ca „locuțiune prepozițională” etc.
  • Pentru fiecare sens:
    • Apăsați butonul „adaugă sens” (în fereastra „Sensuri”).
  • Se introduce în fereastra "Editorul de sensuri" textul definiției, compilând (cumulând) explicațiile furnizate de toate sursele moderne (începând cu DEX). Aici trebuie să stabilim ce facem cu cele vechi, DE.
    • Nu se menționează partea de vorbire (s.m., adj., vb. etc.), aceasta fiind specificată la paradigmă.
      • [cata] Pentru asta ar fi bine să creăm mai multe părți de vorbire, în special pentru adverbe, prepoziții etc. Dacă nicăieri în definiție nu va mai apărea „adverb”, este important ca flexiunea să menționeze asta. [Matei] Mda.
    • Se folosește ortografia și punctuația corectă (indiferent cum e în surse).
    • Se adaugă (în dreapta) sursele utilizate, eventuale sinonime/antonime și etichete (ex. la verbe se etichetează tipul de verb - tranzitiv, intranzitiv etc.).
  • Se apasă butonul "acceptă".
  • Se adaugă în mod similar alte sensuri și/sau subsensuri. Se folosesc etichete pentru mențiunile de genul p. restr., p. ext., fig., pop. etc., pentru utilizarea în anumite contexte (tehn., inform., lingv. etc.) sau pentru exemple.
  • Se adaugă etimologia/etimologiile ca (sub)sens separat. Se folosește formularea "Din limba ... xxx" sau "Din xxx + sufixul yyy". În cazul în care sursa face trimitere la alt lexem (V. xxx), se preia etimologia de la acesta, completând eventual sufixul.
    • [Matei] Propun ca etimologia să aibă rubrică separată (ca sinonimele etc.).

Observații Cătălin

Structurez lexeme „ușoare” (cu definiții puține și scurte). Menționez ce observ.

  • Unde punem mențiunea tranzitiv / intranzitiv / reflexiv pentru verbe? Momentan am creat etichete, ceea ce este bine pentru că diverse sensuri pot necesita diverse mențiuni. Se poate mai bine?
  • Unde punem grupa verbului (I-IV)? Și cred că asta se poate generaliza la pronume nehotărâte, demonstrative etc.
  • Punem absolut toate sursele la „surse care atestă flexiunea”? Cred că ar fi prea mult zgomot. Poate doar pentru flexiunile mai rare.
  • Ce facem dacă un cuvânt este variantă a altuia, dar unele surse mai vechi îi dau și sensuri? Ex. ținterim este variantă a lui țintirim, dar Șăineanu îi dă și sensuri. Propun să mutăm sensurile la forma de bază (modernă).
  • Ce facem dacă variantele unui cuvânt au registru de folosire? Ex. ciot are variantele (popular) cioată, (rar) ciotur. Deocamdată am să le listez în sensul unic al variantelor, cel care indică sursa.