Discuție:Ghid pentru structurare: Diferență între versiuni

De la Dexonline wiki
Jump to navigation Jump to search
Linia 2: Linia 2:
  
 
=== Etichete ===
 
=== Etichete ===
 +
 +
* Când punem etichete și când lăsăm paranteza respectivă?
 +
** Cred că ar trebui încet-încet să creăm etichete pentru toate parantezele.
 +
 +
'''[cata]''' Cred că avem nevoie de o ierarhie de etichete, nu doar de o listă. Am vorbit și cu Radu, care e de aceeași părere. De exemplu:
 +
* parte de vorbire
 +
** substantiv
 +
*** s.f.
 +
*** s.m.
 +
*** s.n.
 +
*** s.m. și f.
 +
** adjectiv
 +
** verb
 +
*** verb tranzitiv
 +
*** verb reflexiv
 +
*** verb intranzitiv
 +
* regionalism
 +
** Moldova
 +
** Banat
 +
** Bucovina
 +
 +
Putem aplica pe un sens și etichete-părinte („regionalism”), dacă nu știm exact care dintre etichetele-copil se aplică.
 +
 +
Asta rezolvă problemele de mai jos:
 +
 +
* Unde punem mențiunea tranzitiv / intranzitiv / reflexiv pentru verbe?
 +
** '''[cata]:''' o etichetă „verb tranzitiv” pe un sens se va aplica tuturor subsensurilor, în afară de cazul când ele însele sunt marcate „verb reflexiv” sau altcumva.
 +
* Crearea unui câmp separat pentru '''partea de vorbire'''. Există cazuri de adj. fem. (ex. ''vectoare''), care în prezent sunt încadrate eronat (s.f.).
 +
** '''[Matei]''' Poate ar fi bine ca un lexem să poată avea multiple forme de bază (cu modele de flexiune diferite), ca să evităm crearea de lexeme multiple (eu nu văd rostul unui lexem separat ''vieţuitoare'' s.f. pe lângă ''vieţuitor'' adj. - având practic acelaşi sens).
 +
** '''[cata]''' Da, trebuie generalizată un pic structura. Tot aici aș include și variantele de accentuare (''agríș / ágriș'').
 +
** Aceasta nu mai trebuie rezolvată. Tipul I este invariabil, iar din etichetele pe sens vom diferenția prepoziții, conjuncții etc. '''[cata]''' Pentru asta ar fi bine să creăm mai multe părți de vorbire, în special pentru adverbe, prepoziții etc. Dacă nicăieri în definiție nu va mai apărea „adverb”, este important ca flexiunea să menționeze asta. '''[Matei]''' Mda.
 +
 +
=== Separarea între partea de vorbire și modelul de flexiune ===
 +
 +
'''[cata]''' Propun ca partea / părțile de vorbire să fie etichete pe fiecare sens, ca mai sus. Modelul de flexiune va servi doar ca să arate lista de forme generate, nu și partea de vorbire. Asta va rezolva cazurile ca MF și A (ar fi aberant să avem două modele de flexiune practic identice) sau „gravidă” care este adjectiv, dar încadrat la F.
 +
 +
Ca și restul etichetelor, partea de vorbire se aplică la toți descendenții în arbore (care nu își aplică o altă etichetă din aceeași categorie).
 +
 +
=== Standardul de formatare a sensurilor ===
 +
 +
* '''[cata]''' Ce standard adoptăm pentru ordonarea subsensurilor și a exemplelor? De exemplu, un lexem are un sens cu două subsensuri și trei exemple. Propun ca subsensurile să fie primele (deci 1.1 și 1.2), iar exemplele 1.3, 1.4, 1.5. Are dezavantajul că exemplele se îndepărtează de sensul pe care îl definesc, mai ales dacă cele două subsensuri au și ele exemple sau altceva care să le lungească. Are însă avantajul că toate sensurile și subsensurile vor fi numerotate începând cu 1. Deci nu va apărea o situație în care sensul 1 are subsensurile 1.4 și 1.5 (dacă afișăm structura fără exemple).
 +
  
 
=== Neclasificate ===
 
=== Neclasificate ===
  
* Când punem etichete și când lăsăm paranteza respectivă?
 
** Cred că ar trebui încet-încet să creăm etichete pentru toate parantezele.
 
 
* Pe primul nivel se pune o definiție cât mai cuprinzătoare, având în vedere atât DEX cât și celelalte surse. Pe nivelul următor se adaugă sensuri restrânse, expresii, exemple etc. etichetate ca atare.
 
* Pe primul nivel se pune o definiție cât mai cuprinzătoare, având în vedere atât DEX cât și celelalte surse. Pe nivelul următor se adaugă sensuri restrânse, expresii, exemple etc. etichetate ca atare.
 
** '''[Matei]''' Eu aş merge pe varianta cu definiţie succintă (explicaţiile mai ample se pot consulta în sursele menţionate). Redactarea unei definiţii cuprinzătoare e anevoioasă (şi subiectivă).
 
** '''[Matei]''' Eu aş merge pe varianta cu definiţie succintă (explicaţiile mai ample se pot consulta în sursele menţionate). Redactarea unei definiţii cuprinzătoare e anevoioasă (şi subiectivă).
 
* Lexemele omonime, sensurile (și subsensurile) ar trebui numerotate, altfel trimiterile dintr-o definiție nu mai au sens. V. aalenian. De stabilit modul de numerotare pentru diferitele paliere.
 
* Lexemele omonime, sensurile (și subsensurile) ar trebui numerotate, altfel trimiterile dintr-o definiție nu mai au sens. V. aalenian. De stabilit modul de numerotare pentru diferitele paliere.
 
** Asta creează probleme când trimiterea e la un alt lexem.
 
** Asta creează probleme când trimiterea e la un alt lexem.
** Ar fi bine dacă s-ar automatiza numerotarea; ușurează munca și reface numerotarea când se mută (sub)sensurile. E posibil? Creează alte probleme cu trimiterile.
 
** '''[cata]''' cred că partea asta este gata. Avem număr pentru fiecare lexem, precum și mențiuni de genul ''aalenian[...''. Aceste mențiuni duc la un sens anume (ca tooltip, nu ca link, dar asta se poate schimba oricând) și se păstrează în cazul reordonării sensurilor.
 
 
* Unificarea lexemelor MF. '''[cata, Matei]''' sunt de acord cu asta
 
* Unificarea lexemelor MF. '''[cata, Matei]''' sunt de acord cu asta
  
Linia 18: Linia 56:
  
 
* (posibil) Link în pagina de editare pentru selectarea altui lexem, fără a mai trece prin pagina moderatorului.
 
* (posibil) Link în pagina de editare pentru selectarea altui lexem, fără a mai trece prin pagina moderatorului.
* Crearea unor rubrici noi pentru "diminutive" și "augmentative" (similar cu sinonime / antonime).
+
* '''Atenţie!''' Diminutivele, antonimele, ca de altfel şi variantele, etimologiile, pronunţiile sau modelele de flexiune pot fi valabile doar pentru anumite sensuri. Cum rezolvăm?
** '''Atenţie!''' Diminutivele, antonimele, ca de altfel şi variantele, etimologiile, pronunţiile sau modelele de flexiune pot fi valabile doar pentru anumite sensuri. Cum rezolvăm?
 
 
* Adăugarea unui „deținător” al lexemului, pentru ca fiecare să poată vedea lista sa de lexeme, inclusiv cele care i se întorc neavizate de la moderator.
 
* Adăugarea unui „deținător” al lexemului, pentru ca fiecare să poată vedea lista sa de lexeme, inclusiv cele care i se întorc neavizate de la moderator.
* Indicarea surselor pentru variante. Trebuie să arătăm cine le atestă, dar prin design variantele nu pot avea sensuri.
 
* Rubrică separată pentru etimologii, ca să uşurăm editarea.
 
* Crearea unui câmp separat pentru '''partea de vorbire'''. Există cazuri de adj. fem. (ex. ''vectoare''), care în prezent sunt încadrate eronat (s.f.).
 
** '''[Matei]''' Poate ar fi bine ca un lexem să poată avea multiple forme de bază (cu modele de flexiune diferite), ca să evităm crearea de lexeme multiple (eu nu văd rostul unui lexem separat ''vieţuitoare'' s.f. pe lângă ''vieţuitor'' adj. - având practic acelaşi sens).
 
** '''[cata]''' Da, trebuie generalizată un pic structura. Tot aici aș include și variantele de accentuare (''agríș / ágriș'').
 
** '''[cata]''' Și da, aș separa funcția morfologică (o listă de posibilități) de modelul de flexiune. Avem o mulțime de adjective care sunt și substantive și e absurd să dublăm la toate A(număr)/MF(număr).
 
** '''[cata]''' Pentru asta ar fi bine să creăm mai multe părți de vorbire, în special pentru adverbe, prepoziții etc. Dacă nicăieri în definiție nu va mai apărea „adverb”, este important ca flexiunea să menționeze asta. '''[Matei]''' Mda.
 
 
* Pentru variante de accent, ghidul recomandă să unificăm lexemele și să păstrăm varianta secundară doar în rubrica „pronunții”. Chiar vrem asta? Efectul va fi că se pierd formele flexionare care includ varianta secundară de accent.
 
* Pentru variante de accent, ghidul recomandă să unificăm lexemele și să păstrăm varianta secundară doar în rubrica „pronunții”. Chiar vrem asta? Efectul va fi că se pierd formele flexionare care includ varianta secundară de accent.
 
* Trebuie să stabilim ce facem cu definițiile vechi, cele din DE etc.
 
* Trebuie să stabilim ce facem cu definițiile vechi, cele din DE etc.
Linia 35: Linia 65:
 
Structurez lexeme „ușoare” (cu definiții puține și scurte). Menționez ce observ.
 
Structurez lexeme „ușoare” (cu definiții puține și scurte). Menționez ce observ.
  
* Unde punem mențiunea tranzitiv / intranzitiv / reflexiv pentru verbe? Momentan am creat etichete, ceea ce este bine pentru că diverse sensuri pot necesita diverse mențiuni. Se poate mai bine?
 
 
* Unde punem grupa verbului (I-IV)? Și cred că asta se poate generaliza la pronume nehotărâte, demonstrative etc.
 
* Unde punem grupa verbului (I-IV)? Și cred că asta se poate generaliza la pronume nehotărâte, demonstrative etc.
 
* Punem absolut toate sursele la „surse care atestă flexiunea”? Cred că ar fi prea mult zgomot. Poate doar pentru flexiunile mai rare.
 
* Punem absolut toate sursele la „surse care atestă flexiunea”? Cred că ar fi prea mult zgomot. Poate doar pentru flexiunile mai rare.
 
* Ce facem dacă un cuvânt este variantă a altuia, dar unele surse mai vechi îi dau și sensuri? Ex. {{d|ținterim}} este variantă a lui {{d|țintirim}}, dar Șăineanu îi dă și sensuri. Propun să mutăm sensurile la forma de bază (modernă).
 
* Ce facem dacă un cuvânt este variantă a altuia, dar unele surse mai vechi îi dau și sensuri? Ex. {{d|ținterim}} este variantă a lui {{d|țintirim}}, dar Șăineanu îi dă și sensuri. Propun să mutăm sensurile la forma de bază (modernă).
 
* Ce facem dacă variantele unui cuvânt au registru de folosire? Ex. {{d|ciot}} are variantele (popular) ''cioată'', (rar) ''ciotur''. Deocamdată am să le listez în sensul unic al variantelor, cel care indică sursa.
 
* Ce facem dacă variantele unui cuvânt au registru de folosire? Ex. {{d|ciot}} are variantele (popular) ''cioată'', (rar) ''ciotur''. Deocamdată am să le listez în sensul unic al variantelor, cel care indică sursa.

Versiunea de la data 3 februarie 2016 16:58

[cata] Încerc să împart pe capitole chestiile astea.

Etichete

  • Când punem etichete și când lăsăm paranteza respectivă?
    • Cred că ar trebui încet-încet să creăm etichete pentru toate parantezele.

[cata] Cred că avem nevoie de o ierarhie de etichete, nu doar de o listă. Am vorbit și cu Radu, care e de aceeași părere. De exemplu:

  • parte de vorbire
    • substantiv
      • s.f.
      • s.m.
      • s.n.
      • s.m. și f.
    • adjectiv
    • verb
      • verb tranzitiv
      • verb reflexiv
      • verb intranzitiv
  • regionalism
    • Moldova
    • Banat
    • Bucovina

Putem aplica pe un sens și etichete-părinte („regionalism”), dacă nu știm exact care dintre etichetele-copil se aplică.

Asta rezolvă problemele de mai jos:

  • Unde punem mențiunea tranzitiv / intranzitiv / reflexiv pentru verbe?
    • [cata]: o etichetă „verb tranzitiv” pe un sens se va aplica tuturor subsensurilor, în afară de cazul când ele însele sunt marcate „verb reflexiv” sau altcumva.
  • Crearea unui câmp separat pentru partea de vorbire. Există cazuri de adj. fem. (ex. vectoare), care în prezent sunt încadrate eronat (s.f.).
    • [Matei] Poate ar fi bine ca un lexem să poată avea multiple forme de bază (cu modele de flexiune diferite), ca să evităm crearea de lexeme multiple (eu nu văd rostul unui lexem separat vieţuitoare s.f. pe lângă vieţuitor adj. - având practic acelaşi sens).
    • [cata] Da, trebuie generalizată un pic structura. Tot aici aș include și variantele de accentuare (agríș / ágriș).
    • Aceasta nu mai trebuie rezolvată. Tipul I este invariabil, iar din etichetele pe sens vom diferenția prepoziții, conjuncții etc. [cata] Pentru asta ar fi bine să creăm mai multe părți de vorbire, în special pentru adverbe, prepoziții etc. Dacă nicăieri în definiție nu va mai apărea „adverb”, este important ca flexiunea să menționeze asta. [Matei] Mda.

Separarea între partea de vorbire și modelul de flexiune

[cata] Propun ca partea / părțile de vorbire să fie etichete pe fiecare sens, ca mai sus. Modelul de flexiune va servi doar ca să arate lista de forme generate, nu și partea de vorbire. Asta va rezolva cazurile ca MF și A (ar fi aberant să avem două modele de flexiune practic identice) sau „gravidă” care este adjectiv, dar încadrat la F.

Ca și restul etichetelor, partea de vorbire se aplică la toți descendenții în arbore (care nu își aplică o altă etichetă din aceeași categorie).

Standardul de formatare a sensurilor

  • [cata] Ce standard adoptăm pentru ordonarea subsensurilor și a exemplelor? De exemplu, un lexem are un sens cu două subsensuri și trei exemple. Propun ca subsensurile să fie primele (deci 1.1 și 1.2), iar exemplele 1.3, 1.4, 1.5. Are dezavantajul că exemplele se îndepărtează de sensul pe care îl definesc, mai ales dacă cele două subsensuri au și ele exemple sau altceva care să le lungească. Are însă avantajul că toate sensurile și subsensurile vor fi numerotate începând cu 1. Deci nu va apărea o situație în care sensul 1 are subsensurile 1.4 și 1.5 (dacă afișăm structura fără exemple).


Neclasificate

  • Pe primul nivel se pune o definiție cât mai cuprinzătoare, având în vedere atât DEX cât și celelalte surse. Pe nivelul următor se adaugă sensuri restrânse, expresii, exemple etc. etichetate ca atare.
    • [Matei] Eu aş merge pe varianta cu definiţie succintă (explicaţiile mai ample se pot consulta în sursele menţionate). Redactarea unei definiţii cuprinzătoare e anevoioasă (şi subiectivă).
  • Lexemele omonime, sensurile (și subsensurile) ar trebui numerotate, altfel trimiterile dintr-o definiție nu mai au sens. V. aalenian. De stabilit modul de numerotare pentru diferitele paliere.
    • Asta creează probleme când trimiterea e la un alt lexem.
  • Unificarea lexemelor MF. [cata, Matei] sunt de acord cu asta

Funcții noi de implementat:

  • (posibil) Link în pagina de editare pentru selectarea altui lexem, fără a mai trece prin pagina moderatorului.
  • Atenţie! Diminutivele, antonimele, ca de altfel şi variantele, etimologiile, pronunţiile sau modelele de flexiune pot fi valabile doar pentru anumite sensuri. Cum rezolvăm?
  • Adăugarea unui „deținător” al lexemului, pentru ca fiecare să poată vedea lista sa de lexeme, inclusiv cele care i se întorc neavizate de la moderator.
  • Pentru variante de accent, ghidul recomandă să unificăm lexemele și să păstrăm varianta secundară doar în rubrica „pronunții”. Chiar vrem asta? Efectul va fi că se pierd formele flexionare care includ varianta secundară de accent.
  • Trebuie să stabilim ce facem cu definițiile vechi, cele din DE etc.

Observații Cătălin

Structurez lexeme „ușoare” (cu definiții puține și scurte). Menționez ce observ.

  • Unde punem grupa verbului (I-IV)? Și cred că asta se poate generaliza la pronume nehotărâte, demonstrative etc.
  • Punem absolut toate sursele la „surse care atestă flexiunea”? Cred că ar fi prea mult zgomot. Poate doar pentru flexiunile mai rare.
  • Ce facem dacă un cuvânt este variantă a altuia, dar unele surse mai vechi îi dau și sensuri? Ex. ținterim este variantă a lui țintirim, dar Șăineanu îi dă și sensuri. Propun să mutăm sensurile la forma de bază (modernă).
  • Ce facem dacă variantele unui cuvânt au registru de folosire? Ex. ciot are variantele (popular) cioată, (rar) ciotur. Deocamdată am să le listez în sensul unic al variantelor, cel care indică sursa.