Diferență între revizuiri ale paginii „Discuție:Ghid pentru structurare”

fără descrierea modificării
Linia 1: Linia 1:
=== Principiu general: atomicitate ===
=== Principiu general: atomicitate ===


'''[cata]''' Am vorbit cu Radu și m-a convins să adoptăm un model atomic. Oriunde o etichetă sau proprietate se aplică doar unei părți a arborelui de sensuri, spargem arborele în două. La afișare, încărcăm toți arborii relevanți și îi afișăm.
'''[cata]''' Am vorbit cu Radu și m-a convins să adoptăm un model atomic. Oriunde o etichetă sau proprietate se aplică doar unei părți a arborelui de sensuri, spargem arborele în două. La căutări, încărcăm toți arborii relevanți și îi afișăm.
 
De aici rezultă schema: un lexem este asociat cu (exact un) arbore de sensuri, dar mai multe lexeme pot fi asociate cu același arbore.


=== Propuneri de rezolvări ===
=== Propuneri de rezolvări ===
Linia 11: Linia 13:
* Numerotarea sensurilor, exemplelor și etimologiilor
* Numerotarea sensurilor, exemplelor și etimologiilor
** '''[cata]''' Scheme diferite de numerotare, folosind prefixele 'E' pentru etimologii și 'X' pentru exemple. De exemplu, dacă un sens are două subsensuri și trei exemple, acestea vor fi numerotate 1.1, 1.2, 1.X1, 1.X2, 1.X3. Dacă o etimologie E1 are la rândul ei o sub-etimologie pentru completări (nu exclud posibilitatea), aceasta s-ar numi E1.E1.
** '''[cata]''' Scheme diferite de numerotare, folosind prefixele 'E' pentru etimologii și 'X' pentru exemple. De exemplu, dacă un sens are două subsensuri și trei exemple, acestea vor fi numerotate 1.1, 1.2, 1.X1, 1.X2, 1.X3. Dacă o etimologie E1 are la rândul ei o sub-etimologie pentru completări (nu exclud posibilitatea), aceasta s-ar numi E1.E1.
** '''[cata]''' La afișare găsim o formulă mai bună de prezentare, căci s-ar putea să speriem utilizatorii. Putem ascunde numerotările pentru exemple și etimologii.
** '''[cata]''' La afișare arătăm doar numerotările pentru sensuri, ca nu speriem utilizatorii.
 
=== Neclasificate ===


* Unificarea lexemelor MF. '''[cata, Matei]''' sunt de acord cu asta
* Unificarea lexemelor MF. '''[cata, Matei]''' sunt de acord cu asta
** '''[cata]''' Nu mai știu cu ce sunt de acord. :-) Ce presupune unificarea?
** '''[Matei]''' Unificarea presupune să nu avem lexeme separate pentru ''inginer s.m.'' și ''ingineră s.f.'' (DOOM2), ci un singur lexem '''inginer''' s.m. și f.
** '''[Matei]''' Unificarea presupune să nu avem lexeme separate pentru ''inginer s.m.'' și ''ingineră s.f.'' (DOOM2), ci un singur lexem '''inginer''' s.m. și f.
* '''[Matei]''' Poate ar fi bine ca un lexem să poată avea multiple forme de bază (cu modele de flexiune diferite), ca să evităm crearea de lexeme multiple (eu nu văd rostul unui lexem separat ''vieţuitoare'' s.f. pe lângă ''vieţuitor'' adj. - având practic acelaşi sens).
 
** '''[cata]''' Mă gândesc. Da, trebuie generalizată un pic structura. Tot aici aș include și variantele de accentuare (''agríș / ágriș'').
* Forme de bază multiple
** '''[cata]''' Apropo de variante de accent, recomandarea curentă nu este fantastică. Ghidul spune să unificăm lexemele și să păstrăm varianta secundară doar în rubrica „pronunții”. Dar astfel se pierd formele flexionare pentru varianta secundară de accent.
** '''[cata]''' Se rezolvă prin faptul că mai multe lexeme pot fi asociate cu același arbore de sensuri. Asta include și variantele de accent (''agríș / ágriș'').
** '''[Matei]''' Minunat ar fi să se genereze flexiunea și pentru varianta secundară! Ar fi posibil așa ceva?
 
*** '''[cata]''' Da, sigur. Ar fi aceeași situație ca și acum, când un lexem poate avea mai multe modele. Am renunța doar la restricția ca modelele să pornească de la aceeași formă de bază.
* Ce facem cu DER, DE, și într-o mai mică măsură Scriban și Șăineanu.
* Trebuie să stabilim ce facem cu DER, DE, și într-o mai mică măsură Scriban și Șăineanu.
** '''[cata]''' Este ok să aștepte până în „versiunea 2”. Dacă structurăm DEX-urile, NODEX, DN, MDN, DLRLC, Ortografic, DOOM2, deja vom fi redus enorm redundanța. '''[Matei]''' Cred că da.
** '''[cata]''' Este ok să aștepte până în „versiunea 2”. Dacă structurăm DEX-urile, NODEX, DN, MDN, DLRLC, Ortografic, DOOM2, deja vom fi redus enorm redundanța. '''[Matei]''' Cred că da.


Linia 41: Linia 39:


=== Nerezolvate ===
=== Nerezolvate ===
* Diferite dicționare consideră diferite variante ca fiind forma principală (''ținterim, țintirim'' sau ''ciot, cioată''). Dacă le preluăm ca atare, atunci va apărea redundanță la afișare: două definiții care ambele zic, în esență, ''cimitir'', respectiv ''parte rămasă''
** '''[cata]''' Radu se opune unificării arborilor, pentru că se pierd informații istorice.
** '''[cata]''' Aș vrea să văd un exemplu concret pentru ''ciot / cioată / ciotur''.


* Variantele care au registru de folosire? Ex. {{d|ciot}} are variantele (popular) ''cioată'', (rar) ''ciotur''.
* Variantele care au registru de folosire? Ex. {{d|ciot}} are variantele (popular) ''cioată'', (rar) ''ciotur''.