Diferență între revizuiri ale paginii „Discuție:Ghid pentru structurare”
Sari la navigare
Sari la căutare
Linia 20: | Linia 20: | ||
** '''[Matei]''' Unificarea presupune să nu avem lexeme separate pentru ''inginer s.m.'' și ''ingineră s.f.'' (DOOM2), ci un singur lexem '''inginer''' s.m. și f. | ** '''[Matei]''' Unificarea presupune să nu avem lexeme separate pentru ''inginer s.m.'' și ''ingineră s.f.'' (DOOM2), ci un singur lexem '''inginer''' s.m. și f. | ||
** '''[cata]''' S-ar putea să nu putem fi riguroși. Avem un model pentru MF care să facă femininul în ''-iță'', cum ne trebuie la ''sudoriță''? | ** '''[cata]''' S-ar putea să nu putem fi riguroși. Avem un model pentru MF care să facă femininul în ''-iță'', cum ne trebuie la ''sudoriță''? | ||
*** '''[Matei]''' Nu avem, dar putem crea. Sau le lăsăm ca atare și adăugăm la structurare câte o mențiune: la ''sudor'' adăugăm ''fem. sudoriță'' și reciproc. | |||
* Forme de bază multiple | * Forme de bază multiple | ||
Linia 29: | Linia 30: | ||
* Diminutive, antonime, variante, etimologii, pronunții, modelele de flexiune valabile doar pentru anumite sensuri. | * Diminutive, antonime, variante, etimologii, pronunții, modelele de flexiune valabile doar pentru anumite sensuri. | ||
** '''[cata]''' Matei, ai niște exemple pentru fiecare? M-ar ajuta mult. | ** '''[cata]''' Matei, ai niște exemple pentru fiecare? M-ar ajuta mult. | ||
*** '''[Matei]''' ''Doctor'' - doar sensul DEX-1 are var. ''doftor'' și dim. ''doctoraș''. Cred că s-a rezolvat. | |||
** '''[cata]''' Abordarea atomică ar fi să spargem arborele de sensuri astfel încât fiecare arbore rezultat să admită proprietatea pe toate sensurile sale. | ** '''[cata]''' Abordarea atomică ar fi să spargem arborele de sensuri astfel încât fiecare arbore rezultat să admită proprietatea pe toate sensurile sale. | ||
** '''[cata]''' Diminutivele, antonimele și etimologiile deja există la nivel de sens. | ** '''[cata]''' Diminutivele, antonimele și etimologiile deja există la nivel de sens. | ||
Linia 42: | Linia 44: | ||
* Nu e totuși nevoie de o asociere ''many-to-many'' între lexeme și arbori de sensuri? Mai exact, nu e niciodată nevoie ca un lexem să fie asociat cu mai mulți arbori? | * Nu e totuși nevoie de o asociere ''many-to-many'' între lexeme și arbori de sensuri? Mai exact, nu e niciodată nevoie ca un lexem să fie asociat cu mai mulți arbori? | ||
* Diferite dicționare consideră diferite variante ca fiind forma principală (''ținterim, țintirim'' sau ''ciot, cioată''). Dacă le preluăm ca atare, atunci va apărea redundanță la afișare: două definiții care ambele zic, în esență, ''cimitir'', respectiv ''parte rămasă'' | * Diferite dicționare consideră diferite variante ca fiind forma principală (''ținterim, țintirim'' sau ''ciot, cioată''). Dacă le preluăm ca atare, atunci va apărea redundanță la afișare: două definiții care ambele zic, în esență, ''cimitir'', respectiv ''parte rămasă''. | ||
** '''[cata]''' Radu se opune unificării arborilor, pentru că se pierd informații istorice. | ** '''[cata]''' Radu se opune unificării arborilor, pentru că se pierd informații istorice. | ||
** '''[cata]''' Aș vrea să văd un exemplu concret pentru ''ciot / cioată / ciotur''. | ** '''[cata]''' Aș vrea să văd un exemplu concret pentru ''ciot / cioată / ciotur''. | ||
Linia 61: | Linia 63: | ||
*** „cuirasată” [MDN]; | *** „cuirasată” [MDN]; | ||
*** „destinată luptei împotriva obiectivelor de pe mal” [MDN]. | *** „destinată luptei împotriva obiectivelor de pe mal” [MDN]. | ||
**** '''[Matei]''' Mi se pare ok. | |||
* '''[Matei]''' Flexiune pentru lexemele compuse. Ca profan, nu mi se pare greu. Trebuie detectată prezența cratimei sau a spațiului și creată posibilitatea combinării a două modele de flexiune (unul pentru prima parte și unul pentru ultima parte; lexemele cu mai mult de 2 părți au invariabilă partea din mijloc; invariabilă poate fi și ultima parte; cazul pentru prima parte invariabilă este rezolvat). | * '''[Matei]''' Flexiune pentru lexemele compuse. Ca profan, nu mi se pare greu. Trebuie detectată prezența cratimei sau a spațiului și creată posibilitatea combinării a două modele de flexiune (unul pentru prima parte și unul pentru ultima parte; lexemele cu mai mult de 2 părți au invariabilă partea din mijloc; invariabilă poate fi și ultima parte; cazul pentru prima parte invariabilă este rezolvat). | ||
Linia 66: | Linia 69: | ||
*** '''[Matei]''' Păi astea se încadrează la invariabile, nu văd necesitatea bifei. | *** '''[Matei]''' Păi astea se încadrează la invariabile, nu văd necesitatea bifei. | ||
**** '''[cata]''' Da, dădeam doar un exemplu că nu tot ce conține bifă trebuie automat tratat ca lexem compus (pot fi și nume proprii etc.). | **** '''[cata]''' Da, dădeam doar un exemplu că nu tot ce conține bifă trebuie automat tratat ca lexem compus (pot fi și nume proprii etc.). | ||
**** '''[Matei]''' Păi nu tratăm automat. Etichetarea se face manual. Pentru nume proprii avem (creăm) modele. Totul e să putem pune 2 etichete (ex. M1+I, F1+AF1 etc.). Ar mai trebui implementate și 2 restricții: A - numai forme articulate; N - numai forme nearticulate. | |||
== Rezolvate == | == Rezolvate == | ||
Linia 115: | Linia 119: | ||
* 2.2 [verb reflexiv] ... | * 2.2 [verb reflexiv] ... | ||
* 2.3 ... | * 2.3 ... | ||
** '''[Matei]''' Și dacă sensul 2.2 este '''și''' tranzitiv? Ar fi mai bine să judecâm „global”: o etichetă se aplică tuturor subsensurilor (chiar dacă poartă și o altă etichetă). Iar dacă subsensurile nu au o etichetă comună, sensul nu are niciuna (sau creăm una generală [verb]). | |||
Asta ar rezolva (toate!) problemele de mai jos: | Asta ar rezolva (toate!) problemele de mai jos: | ||
Linia 132: | Linia 137: | ||
* Punem absolut toate sursele la „surse care atestă flexiunea”? | * Punem absolut toate sursele la „surse care atestă flexiunea”? | ||
** '''[cata]''' Cred că ar fi prea mult zgomot. Mai bine doar acolo unde nu toate dicționarele sunt de acord. '''[Matei]''' Da, sursele „normative” (DOOM, DEX, Ortografic) n-ar trebui menționate. | ** '''[cata]''' Cred că ar fi prea mult zgomot. Mai bine doar acolo unde nu toate dicționarele sunt de acord. '''[Matei]''' Da, sursele „normative” (DOOM, DEX, Ortografic) n-ar trebui menționate. | ||
<!-- | |||
* Lexemele omonime, sensurile (și subsensurile) ar trebui numerotate, altfel trimiterile dintr-o definiție nu mai au sens. V. aalenian. De stabilit modul de numerotare pentru diferitele paliere. | * Lexemele omonime, sensurile (și subsensurile) ar trebui numerotate, altfel trimiterile dintr-o definiție nu mai au sens. V. aalenian. De stabilit modul de numerotare pentru diferitele paliere. | ||
** Asta creează probleme când trimiterea e la un alt lexem. | ** Asta creează probleme când trimiterea e la un alt lexem. | ||
** '''[cata]''' Despre ce paliere este vorba? Avem suport pentru numerotare, cred că această bulină este rezolvată. '''[Matei]''' Cred că da, putem șterge bulina. | ** '''[cata]''' Despre ce paliere este vorba? Avem suport pentru numerotare, cred că această bulină este rezolvată. '''[Matei]''' Cred că da, putem șterge bulina. | ||
--> |