Ghid pentru structurare

Prin structurarea definițiilor înțelegem crearea unei structuri pentru fiecare lexem (cuvânt) care să includă, frumos categorisite, toate informațiile din toate definițiile pentru acel lexem: sensurile cuvântului, locuțiuni și expresii, exemple de folosire, etimologie, variante, relații cu alte cuvinte (sinonime, antonime), silabisiri, pronunții și altele. Această structură va fi un mare pas înainte față de reprezentarea curentă a definițiilor, pentru două motive principale:

  1. În prezent definițiile sunt simple bucăți de text cu marcaje de formatare (bold, italic etc.). În această reprezentare, toate elementele de mai sus sunt amestecate și imposibil de analizat separat.
  2. Definiția structurată va elimina redundanța (asemănările) între diversele dicționare folosite, care încarcă inutil pagina.


Ghid pentru structurare

Această pagină este în lucru. Momentan înșirăm în prima parte idei care ne vin, iar în final încercăm să schițăm viitoarele instrucțiuni.

  • Ne trebuie norme pentru punctuație și majuscule la copierea unui segment din definiție. Punem majusculă? Punem punct final? Dar dacă segmentul include mai multe propoziții?
    • Punem întotdeauna majusculă și punct final. Idem în cazul mai multor propoziții.
  • Când punem etichete și când lăsăm paranteza respectivă?
    • Cred că ar trebui încet-încet să creăm etichete pentru toate parantezele.
  • Vrem să păstrăm abrevieri în unele cazuri? Ex. s.m., s.f., s.n., adj.
    • Da, unele abrevieri sunt foarte frecvente, bine cunoscute, expandarea lor creând disconfort la citire (sunt relativ lungi).
  • Pe primul nivel se pune o definiție cât mai cuprinzătoare, având în vedere atât DEX cât și celelalte surse. Pe nivelul următor se adaugă sensuri restrânse, expresii, exemple etc. etichetate ca atare.
    • [Matei] Eu aş merge pe varianta cu definiţie succintă (explicaţiile mai ample se pot consulta în sursele menţionate). Redactarea unei definiţii cuprinzătoare e anevoioasă (şi subiectivă).
  • Etimologiile se adaugă ca subsens la fiecare sens (dacă sunt diferite) sau ca subsens la sensul principal (dacă e aceeași). Trebuie văzut cum vor fi afișate pe pagina de consultare a lexemului.
  • Lexemele omonime, sensurile (și subsensurile) ar trebui numerotate, altfel trimiterile dintr-o definiție nu mai au sens. V. aalenian. De stabilit modul de numerotare pentru diferitele paliere.
    • Asta creează probleme când trimiterea e la un alt lexem.
    • Ar fi bine dacă s-ar automatiza numerotarea; ușurează munca și reface numerotarea când se mută (sub)sensurile. E posibil? Creează alte probleme cu trimiterile.
    • [cata] cred că partea asta este gata. Avem număr pentru fiecare lexem, precum și mențiuni de genul aalenian[.... Aceste mențiuni duc la un sens anume (ca tooltip, nu ca link, dar asta se poate schimba oricând) și se păstrează în cazul reordonării sensurilor.
  • Unificarea lexemelor MF. [cata, Matei] sunt de acord cu asta
  • Uneori definiția constă dintr-un singur cuvânt, practic un sinonim (vezi antimonit). Atunci mai punem acel cuvânt și în sens? Eu ([cata]) propun să lăsăm sensul gol și să listăm doar sinonimul (și sursele, desigur). [Matei] e de acord.

Funcții noi de implementat:

  • Scroll separat în fiecare fereastră, căci este incomod de plimbat prin fereastra principală - rezolvat.
  • Probleme cu arborele de sensuri:
    • La apăsarea butonului "Salvare", nivelul 2 dispare, iar sensuri șterse reapar - pare că s-a rezolvat.
    • Apăsarea butonului "Reafișează" produce dublări și mutări ale unor subsensuri.
    • Când trag un sens X peste altul Y și îi dau drumul, X devine ultimul fiu al lui Y. Asta e greu de văzut, trebuie documentat în ghid.
    • Între două cazuri este o distincție foarte vagă: vreau să-l fac pe X fiu al lui Y sau vreau să-l fac pe X frate al lui Y, imediat următor lui Y.
    • [cata] Da, modulul pe care îl folosesc pentru arborele de sensuri are foarte multe probleme. Sunt tentat să renunț la el și să scriu de la zero ceva cu o interfață mai robustă (fără tras cu mouse-ul, doar butoane cu săgeți).
    • [cata] Am terminat înlocuirea. Cred că toate cele trei probleme anterioare sunt rezolvate.
  • Posibilitatea adăugării mai multor modele de flexiune pentru un lexem (evitând clonarea lexemelor cu flexiune multiplă: monedă - monede/monezi, șchiopăta - șchioapăt/șchiopătez).
    • Trebuie avută în vedere eticheta "LOC" (poate să apară doar la unul din modele).
    • [cata] rezolvat.
  • Link în pagina de editare pentru revenirea la pagina moderatorului sau selectarea altui lexem. - rezolvat.
    • Prima variantă e mai lentă, pagina se încarcă greu (multe contorizări).
    • [cata] Așa este, pagina moderatorului se încarcă infernal de greu. Am deschis un tichet pe GitHub.
    • [cata] Tichetul este rezolvat. Dacă tot este lent (la ore de vârf), voi adăuga și un link de navigare directă la alt lexem.
  • Crearea unor rubrici noi pentru "diminutive" și "augmentative" (similar cu sinonime / antonime).
    • Atenţie! Diminutivele, antonimele, ca de altfel şi variantele, etimologiile, pronunţiile sau modelele de flexiune pot fi valabile doar pentru anumite sensuri. Cum rezolvăm?
  • Adăugarea unui „deținător” al lexemului, pentru ca fiecare să poată vedea lista sa de lexeme, inclusiv cele care i se întorc neavizate de la moderator.
  • Indicarea surselor pentru variante. Trebuie să arătăm cine le atestă, dar prin design variantele nu pot avea sensuri.
  • Rubrică separată pentru etimologii, ca să uşurăm editarea.
  • Crearea unui câmp separat pentru partea de vorbire. Există cazuri de adj. fem. (ex. vectoare), care în prezent sunt încadrate eronat (s.f.).
    • [Matei] Poate ar fi bine ca un lexem să poată avea multiple forme de bază (cu modele de flexiune diferite), ca să evităm crearea de lexeme multiple (eu nu văd rostul unui lexem separat vieţuitoare s.f. pe lângă vieţuitor adj. - având practic acelaşi sens).

Ghid

Alegerea și pregătirea unui lexem

Aveți două metode pentru a alege un lexem pe care să-l structurați:

Apoi trebuie ca lexemul să fie într-adevăr o unitate de bază a semnificației. Pentru aceasta, ar putea fi necesar să spargeți lexemul în mai multe lexeme sau, invers, să unificați două sau mai multe lexeme. Exemple:

  • Un lexem nu are voie să cuprindă mai multe părți de vorbire (de exemplu, substantiv și adjectiv). Dacă este cazul, clonați lexemul, adăugând numerotare, descrieri adecvate și disociind, pentru fiecare din lexemele rezultate, definițiile care nu corespund.
  • Două lexeme care dau forme diferite de plural pentru un cuvânt (consilii / consiliuri) au clar aceeași semnificație și trebuie unificate într-un singur lexem, care va avea ambele paradigme (vedeți secțiunea Fereastra „Paradigme”).

Fereastra „Proprietăți”

  • Se verifică dacă definițiile existente (în special cele din DOOM, DOR) dau indicații de silabisire și pronunție, completând rubricile respective.
  • Se verifică existența accentului (în fereastra "Proprietăți"), adăugându-l sau debifând căsuța "necesită accent", după caz.
    • În cazul lexemelor cu variante de accentuare (ex.: agriș/agriș), se vor unifica întâi lexemele - dacă e cazul -, păstrând varianta principală (indicată pe prima poziție de DOOM sau DEX), apoi se va/vor indica cealaltă/celelalte variantă(e) în rubrica "pronunție".
  • Pentru variante:
    • dacă lexemul este o variantă a altui lexem, se indică acest lexem în rubrica "variantă a lui";
    • dacă definițiile indică existența unor variante, se verifică pentru fiecare să nu aibă definiții cu sensuri diferite, apoi se vor adăuga în rubrica "variante".


Fereastra „Paradigmă”

  • Se verifică/corectează/stabilește modelul de flexiune (în fereastra "Paradigmă").


Structurare

  • Se apasă butonul "adaugă sens" (în fereastra "Sensuri").
  • Se introduce în fereastra "Editorul de sensuri" textul definiției, compilând (cumulând) explicațiile furnizate de toate sursele moderne (începând cu DEX). Aici trebuie să stabilim ce facem cu cele vechi, DE.
    • Nu se menționează partea de vorbire (s.m., adj., vb. etc.), aceasta fiind specificată la paradigmă.
      • [cata] Pentru asta ar fi bine să creăm mai multe părți de vorbire, în special pentru adverbe, prepoziții etc. Dacă nicăieri în definiție nu va mai apărea „adverb”, este important ca flexiunea să menționeze asta. [Matei] Mda.
    • Se folosește ortografia și punctuația corectă (indiferent cum e în surse).
    • Se adaugă (în dreapta) sursele utilizate, eventuale sinonime/antonime și etichete (ex. la verbe se etichetează tipul de verb - tranzitiv, intranzitiv etc.).
  • Se apasă butonul "acceptă".
  • Se adaugă în mod similar alte sensuri și/sau subsensuri. Se folosesc etichete pentru mențiunile de genul p. restr., p. ext., fig., pop. etc., pentru utilizarea în anumite contexte (tehn., inform., lingv. etc.) sau pentru exemple.
  • Se adaugă etimologia/etimologiile ca (sub)sens separat. Se folosește formularea "Din limba ... xxx" sau "Din xxx + sufixul yyy". În cazul în care sursa face trimitere la alt lexem (V. xxx), se preia etimologia de la acesta, completând eventual sufixul.
    • [Matei] Propun ca etimologia să aibă rubrică separată (ca sinonimele etc.).


Observații Cătălin

Structurez lexeme „ușoare” (cu definiții puține și scurte). Menționez ce observ.

  • Unde punem mențiunea tranzitiv / intranzitiv / reflexiv pentru verbe? Momentan am creat etichete, ceea ce este bine pentru că diverse sensuri pot necesita diverse mențiuni. Se poate mai bine?
  • Unde punem grupa verbului (I-IV)? Și cred că asta se poate generaliza la pronume nehotărâte, demonstrative etc.
  • Punem absolut toate sursele la „surse care atestă flexiunea”? Cred că ar fi prea mult zgomot. Poate doar pentru flexiunile mai rare.
  • Ce facem dacă un cuvânt este variantă a altuia, dar unele surse mai vechi îi dau și sensuri? Ex. ținterim este variantă a lui țintirim, dar Șăineanu îi dă și sensuri. Propun să mutăm sensurile la forma de bază (modernă).
  • Ce facem dacă variantele unui cuvânt au registru de folosire? Ex. ciot are variantele (popular) cioată, (rar) ciotur. Deocamdată am să le listez în sensul unic al variantelor, cel care indică sursa.