Diferență între revizuiri ale paginii „Discuție:Ghid pentru structurare”
Sari la navigare
Sari la căutare
Linia 1: | Linia 1: | ||
=== Principiu general: atomicitate === | === Principiu general: atomicitate === | ||
'''[cata]''' Am vorbit cu Radu și m-a convins să adoptăm un model atomic. Oriunde o etichetă sau proprietate se aplică doar unei părți a arborelui de sensuri, spargem arborele în două. La | '''[cata]''' Am vorbit cu Radu și m-a convins să adoptăm un model atomic. Oriunde o etichetă sau proprietate se aplică doar unei părți a arborelui de sensuri, spargem arborele în două. La căutări, încărcăm toți arborii relevanți și îi afișăm. | ||
De aici rezultă schema: un lexem este asociat cu (exact un) arbore de sensuri, dar mai multe lexeme pot fi asociate cu același arbore. | |||
=== Propuneri de rezolvări === | === Propuneri de rezolvări === | ||
Linia 11: | Linia 13: | ||
* Numerotarea sensurilor, exemplelor și etimologiilor | * Numerotarea sensurilor, exemplelor și etimologiilor | ||
** '''[cata]''' Scheme diferite de numerotare, folosind prefixele 'E' pentru etimologii și 'X' pentru exemple. De exemplu, dacă un sens are două subsensuri și trei exemple, acestea vor fi numerotate 1.1, 1.2, 1.X1, 1.X2, 1.X3. Dacă o etimologie E1 are la rândul ei o sub-etimologie pentru completări (nu exclud posibilitatea), aceasta s-ar numi E1.E1. | ** '''[cata]''' Scheme diferite de numerotare, folosind prefixele 'E' pentru etimologii și 'X' pentru exemple. De exemplu, dacă un sens are două subsensuri și trei exemple, acestea vor fi numerotate 1.1, 1.2, 1.X1, 1.X2, 1.X3. Dacă o etimologie E1 are la rândul ei o sub-etimologie pentru completări (nu exclud posibilitatea), aceasta s-ar numi E1.E1. | ||
** '''[cata]''' La afișare | ** '''[cata]''' La afișare arătăm doar numerotările pentru sensuri, ca să nu speriem utilizatorii. | ||
* Unificarea lexemelor MF. '''[cata, Matei]''' sunt de acord cu asta | * Unificarea lexemelor MF. '''[cata, Matei]''' sunt de acord cu asta | ||
** '''[Matei]''' Unificarea presupune să nu avem lexeme separate pentru ''inginer s.m.'' și ''ingineră s.f.'' (DOOM2), ci un singur lexem '''inginer''' s.m. și f. | ** '''[Matei]''' Unificarea presupune să nu avem lexeme separate pentru ''inginer s.m.'' și ''ingineră s.f.'' (DOOM2), ci un singur lexem '''inginer''' s.m. și f. | ||
* | |||
** '''[cata]''' | * Forme de bază multiple | ||
** '''[cata]''' Se rezolvă prin faptul că mai multe lexeme pot fi asociate cu același arbore de sensuri. Asta include și variantele de accent (''agríș / ágriș''). | |||
* Ce facem cu DER, DE, și într-o mai mică măsură Scriban și Șăineanu. | |||
* | |||
** '''[cata]''' Este ok să aștepte până în „versiunea 2”. Dacă structurăm DEX-urile, NODEX, DN, MDN, DLRLC, Ortografic, DOOM2, deja vom fi redus enorm redundanța. '''[Matei]''' Cred că da. | ** '''[cata]''' Este ok să aștepte până în „versiunea 2”. Dacă structurăm DEX-urile, NODEX, DN, MDN, DLRLC, Ortografic, DOOM2, deja vom fi redus enorm redundanța. '''[Matei]''' Cred că da. | ||
Linia 41: | Linia 39: | ||
=== Nerezolvate === | === Nerezolvate === | ||
* Diferite dicționare consideră diferite variante ca fiind forma principală (''ținterim, țintirim'' sau ''ciot, cioată''). Dacă le preluăm ca atare, atunci va apărea redundanță la afișare: două definiții care ambele zic, în esență, ''cimitir'', respectiv ''parte rămasă'' | |||
** '''[cata]''' Radu se opune unificării arborilor, pentru că se pierd informații istorice. | |||
** '''[cata]''' Aș vrea să văd un exemplu concret pentru ''ciot / cioată / ciotur''. | |||
* Variantele care au registru de folosire? Ex. {{d|ciot}} are variantele (popular) ''cioată'', (rar) ''ciotur''. | * Variantele care au registru de folosire? Ex. {{d|ciot}} are variantele (popular) ''cioată'', (rar) ''ciotur''. |