Diferență între revizuiri ale paginii „Discuție:Ghid pentru structurare”

fără descrierea modificării
Linia 20: Linia 20:
** '''[Matei]''' Unificarea presupune să nu avem lexeme separate pentru ''inginer s.m.'' și ''ingineră s.f.'' (DOOM2), ci un singur lexem '''inginer''' s.m. și f.
** '''[Matei]''' Unificarea presupune să nu avem lexeme separate pentru ''inginer s.m.'' și ''ingineră s.f.'' (DOOM2), ci un singur lexem '''inginer''' s.m. și f.
** '''[cata]''' S-ar putea să nu putem fi riguroși. Avem un model pentru MF care să facă femininul în ''-iță'', cum ne trebuie la ''sudoriță''?
** '''[cata]''' S-ar putea să nu putem fi riguroși. Avem un model pentru MF care să facă femininul în ''-iță'', cum ne trebuie la ''sudoriță''?
*** '''[Matei]''' Nu avem, dar putem crea. Sau le lăsăm ca atare și adăugăm la structurare câte o mențiune: la ''sudor'' adăugăm ''fem. sudoriță'' și reciproc.


* Forme de bază multiple
* Forme de bază multiple
Linia 29: Linia 30:
* Diminutive, antonime, variante, etimologii, pronunții, modelele de flexiune valabile doar pentru anumite sensuri.
* Diminutive, antonime, variante, etimologii, pronunții, modelele de flexiune valabile doar pentru anumite sensuri.
** '''[cata]''' Matei, ai niște exemple pentru fiecare? M-ar ajuta mult.
** '''[cata]''' Matei, ai niște exemple pentru fiecare? M-ar ajuta mult.
*** '''[Matei]''' ''Doctor'' - doar sensul DEX-1 are var. ''doftor'' și dim. ''doctoraș''. Cred că s-a rezolvat.
** '''[cata]''' Abordarea atomică ar fi să spargem arborele de sensuri astfel încât fiecare arbore rezultat să admită proprietatea pe toate sensurile sale.
** '''[cata]''' Abordarea atomică ar fi să spargem arborele de sensuri astfel încât fiecare arbore rezultat să admită proprietatea pe toate sensurile sale.
** '''[cata]''' Diminutivele, antonimele și etimologiile deja există la nivel de sens.
** '''[cata]''' Diminutivele, antonimele și etimologiile deja există la nivel de sens.
Linia 42: Linia 44:
* Nu e totuși nevoie de o asociere ''many-to-many'' între lexeme și arbori de sensuri? Mai exact, nu e niciodată nevoie ca un lexem să fie asociat cu mai mulți arbori?
* Nu e totuși nevoie de o asociere ''many-to-many'' între lexeme și arbori de sensuri? Mai exact, nu e niciodată nevoie ca un lexem să fie asociat cu mai mulți arbori?


* Diferite dicționare consideră diferite variante ca fiind forma principală (''ținterim, țintirim'' sau ''ciot, cioată''). Dacă le preluăm ca atare, atunci va apărea redundanță la afișare: două definiții care ambele zic, în esență, ''cimitir'', respectiv ''parte rămasă''
* Diferite dicționare consideră diferite variante ca fiind forma principală (''ținterim, țintirim'' sau ''ciot, cioată''). Dacă le preluăm ca atare, atunci va apărea redundanță la afișare: două definiții care ambele zic, în esență, ''cimitir'', respectiv ''parte rămasă''.
** '''[cata]''' Radu se opune unificării arborilor, pentru că se pierd informații istorice.
** '''[cata]''' Radu se opune unificării arborilor, pentru că se pierd informații istorice.
** '''[cata]''' Aș vrea să văd un exemplu concret pentru ''ciot / cioată / ciotur''.
** '''[cata]''' Aș vrea să văd un exemplu concret pentru ''ciot / cioată / ciotur''.
Linia 61: Linia 63:
*** „cuirasată” [MDN];
*** „cuirasată” [MDN];
*** „destinată luptei împotriva obiectivelor de pe mal” [MDN].
*** „destinată luptei împotriva obiectivelor de pe mal” [MDN].
**** '''[Matei]''' Mi se pare ok.


* '''[Matei]''' Flexiune pentru lexemele compuse. Ca profan, nu mi se pare greu. Trebuie detectată prezența cratimei sau a spațiului și creată posibilitatea combinării a două modele de flexiune (unul pentru prima parte și unul pentru ultima parte; lexemele cu mai mult de 2 părți au invariabilă partea din mijloc; invariabilă poate fi și ultima parte; cazul pentru prima parte invariabilă este rezolvat).
* '''[Matei]''' Flexiune pentru lexemele compuse. Ca profan, nu mi se pare greu. Trebuie detectată prezența cratimei sau a spațiului și creată posibilitatea combinării a două modele de flexiune (unul pentru prima parte și unul pentru ultima parte; lexemele cu mai mult de 2 părți au invariabilă partea din mijloc; invariabilă poate fi și ultima parte; cazul pentru prima parte invariabilă este rezolvat).
Linia 66: Linia 69:
*** '''[Matei]''' Păi astea se încadrează la invariabile, nu văd necesitatea bifei.
*** '''[Matei]''' Păi astea se încadrează la invariabile, nu văd necesitatea bifei.
**** '''[cata]''' Da, dădeam doar un exemplu că nu tot ce conține bifă trebuie automat tratat ca lexem compus (pot fi și nume proprii etc.).
**** '''[cata]''' Da, dădeam doar un exemplu că nu tot ce conține bifă trebuie automat tratat ca lexem compus (pot fi și nume proprii etc.).
**** '''[Matei]''' Păi nu tratăm automat. Etichetarea se face manual. Pentru nume proprii avem (creăm) modele. Totul e să putem pune 2 etichete (ex. M1+I, F1+AF1 etc.). Ar mai trebui implementate și 2 restricții: A - numai forme articulate; N - numai forme nearticulate.


== Rezolvate ==
== Rezolvate ==
Linia 115: Linia 119:
* 2.2 [verb reflexiv] ...
* 2.2 [verb reflexiv] ...
* 2.3 ...
* 2.3 ...
** '''[Matei]''' Și dacă sensul 2.2 este '''și''' tranzitiv? Ar fi mai bine să judecâm „global”: o etichetă se aplică tuturor subsensurilor (chiar dacă poartă și o altă etichetă). Iar dacă subsensurile nu au o etichetă comună, sensul nu are niciuna (sau creăm una generală [verb]).


Asta ar rezolva (toate!) problemele de mai jos:
Asta ar rezolva (toate!) problemele de mai jos:
Linia 132: Linia 137:
* Punem absolut toate sursele la „surse care atestă flexiunea”?
* Punem absolut toate sursele la „surse care atestă flexiunea”?
** '''[cata]''' Cred că ar fi prea mult zgomot. Mai bine doar acolo unde nu toate dicționarele sunt de acord. '''[Matei]''' Da, sursele „normative” (DOOM, DEX, Ortografic) n-ar trebui menționate.
** '''[cata]''' Cred că ar fi prea mult zgomot. Mai bine doar acolo unde nu toate dicționarele sunt de acord. '''[Matei]''' Da, sursele „normative” (DOOM, DEX, Ortografic) n-ar trebui menționate.
<!--
* Lexemele omonime, sensurile (și subsensurile) ar trebui numerotate, altfel trimiterile dintr-o definiție nu mai au sens. V. aalenian. De stabilit modul de numerotare pentru diferitele paliere.
* Lexemele omonime, sensurile (și subsensurile) ar trebui numerotate, altfel trimiterile dintr-o definiție nu mai au sens. V. aalenian. De stabilit modul de numerotare pentru diferitele paliere.
** Asta creează probleme când trimiterea e la un alt lexem.
** Asta creează probleme când trimiterea e la un alt lexem.
** '''[cata]''' Despre ce paliere este vorba? Avem suport pentru numerotare, cred că această bulină este rezolvată. '''[Matei]''' Cred că da, putem șterge bulina.
** '''[cata]''' Despre ce paliere este vorba? Avem suport pentru numerotare, cred că această bulină este rezolvată. '''[Matei]''' Cred că da, putem șterge bulina.
-->
Lingviști
617 modificări