Diferență între revizuiri ale paginii „Discuție:Curățenie prin lexeme”

Sari la navigare Sari la căutare
 
(Nu s-au afișat 17 versiuni intermediare efectuate de același utilizator)
Linia 60: Linia 60:
# Există modele pentru '''nume proprii de persoane''' (invariabile) și pentru altele care pot fi flexionate (ex. unele '''toponime''': '''''Berlinul''''', '''''Angliei''''' etc.). Există însă și toponime exotice, care probabil nu pot fi flexionate. Trebuie doar parcursă lista și etichetate (eventual adăugate modele noi)...
# Există modele pentru '''nume proprii de persoane''' (invariabile) și pentru altele care pot fi flexionate (ex. unele '''toponime''': '''''Berlinul''''', '''''Angliei''''' etc.). Există însă și toponime exotice, care probabil nu pot fi flexionate. Trebuie doar parcursă lista și etichetate (eventual adăugate modele noi)...
# Ar mai fi de discutat modelul de flexiune pentru cele cu aspect de ''plural'' (București, Adunați etc.). Le flexionăm la singular sau la plural (''Bucureștiului, Adunațiul'', sau ''Bucureștilor, Adunații'')? Poate unele au ambele forme (Iași)... [[Utilizator:Matei GALL|Matei GALL]] ([[Discuție Utilizator:Matei GALL|discuție]])
# Ar mai fi de discutat modelul de flexiune pentru cele cu aspect de ''plural'' (București, Adunați etc.). Le flexionăm la singular sau la plural (''Bucureștiului, Adunațiul'', sau ''Bucureștilor, Adunații'')? Poate unele au ambele forme (Iași)... [[Utilizator:Matei GALL|Matei GALL]] ([[Discuție Utilizator:Matei GALL|discuție]])
#* Hm, acesta ar fi un argument bun pentru etichete „nume propriu”. Modelele SP sunt de fapt modele M / F / N cu restricții. Ar fi mai simplu să avem Iași cu modelul M123 și etichetat cu „nume propriu” (pe care chiar îl putem rafina: „oraș”, „râu”, „persoană”). [[Utilizator:Cătălin.Frâncu|Cătălin.Frâncu]] ([[Discuție Utilizator:Cătălin.Frâncu|discuție]]) 26 noiembrie 2015 11:42 (EET)
Propun să asociem toate definițiile referitoare la persoane astfel:
* Pentru persoane române sau al căror nume de botez este util de avut ca lexem (Mihai, Vasile etc.), folosim două lexeme: numele și prenumele.
* Pentru persoane străine sau al căror nume de botez nu este util ca lexem în sine, dar care sunt cunoscute și prin numele complet (ex. Michael Jackson), folosim două lexeme: numele de familie (Jackson) și combinația prenume-nume (Michael Jackson).
* Pentru persoane care sunt arareori descrise prin numele complet (ex. Niels Henrik Abel, matematician), folosim doar un lexem: numele de familie (Abel).
Acestea trebuie create cu un model diferit de T1 (folosim I3 dacă nu avem altul mai clar). Astfel putem avea o evidență a lexemelor încă neprocesate. [[Utilizator:Cătălin.Frâncu|Cătălin.Frâncu]] ([[Discuție Utilizator:Cătălin.Frâncu|discuție]]) 7 decembrie 2015 11:05 (EET)
=== Convențiile lui Cătălin ===
Am trecut prin vreo 5.000 de lexeme și am urmat aceste convenții. Sunt multe cazuri mărunte. Sunt de acord cu orice modificări.
* '''Scopuri principale:'''
** Definițiile să poată fi găsite la căutări.
** Un corector ortografic construit cu datele noastre să știe și numele proprii frecvente (''Mihai'', ''București'').
** Nu facem un scop din a aduna cât mai multe nume proprii. Există enciclopedii specializate pentru aceasta.
* '''Majuscule:''' lexemele proprii trebuie scrise cu majusculă / majuscule / cratime. Întrucât DE scrie tot termenul cu majuscule, recomand Wikipedia pentru edificare.
* '''Accent:''' este util să-l adăugați, dar nu faceți un efort pentru asta. Avem unealta pentru adăugarea asistată a accentelor, care accelerează procesul.
* '''Model pentru lexemele proprii:''' dacă nu știți exact, folosiți I3 pentru nume proprii, I4 pentru termeni străini, I6 pentru abrevieri, simboluri chimice etc. Vom rafina în viitor modelul I3.
* '''Model pentru lexemele comune:''' dacă nu știți exact, lăsați-le T1 și un moderator se va ocupa de ele.
{|class="wikitable"
! tipul de definiție
! exemplu
! lexeme create
! explicații
|-
| persoane române
| Arghezi, Tudor
| Arghezi; Tudor
| lexem pentru numele de familie; lexem pentru numele mic, dacă este rezonabil de des întâlnit
|-
| persoane române cu nume mic obscur
| Mihăescu, Gib
| Mihăescu
| lexem doar pentru numele de familie
|-
| persoane străine
| Cauchy, Augustin Louis
| Cauchy
| lexem doar pentru numele de familie
|-
| persoane străine cunoscute și prin numele complet
| Jackson, Michael Joseph
| Jackson; Michael Jackson
| lexem pentru numele de familie; lexem pentru numele complet
|-
| toponimice
| Brașov
| Brașov
| lexem pentru nume
|-
| toponimice care au sens și ca cuvânt comun
| Aliman
| Aliman (I3); aliman (N1)
| lexem propriu; lexem comun
|-
| toponimice compuse din cuvinte comune
| Coarnele Caprei<br>Piatra Mare<br>Coasta de Azur
| corn (N11); capră (F11)<br>piatră; mare<br>coastă; azur
| lexem pentru fiecare cuvânt comun
|-
| toponimice compuse cu cuvinte subordonate
| Bolintin Deal
| Bolintin (I3); deal (N24)
| lexem pentru numele de bază; lexem comun pentru calificativ
|-
| toponimice cu determinant
| Munții Dobrogei
| Dobrogea (I3); munte (M46)
| lexem propriu doar pentru numele propriu-zis; lexem comun pentru determinant
|-
| toponimice străine
| Ciudad Bolivar
| Ciudad Bolivar (I3)
| lexem pentru numele întreg
|-
| nume proprii cu mai multe ortografii
| Clistene / Cleisthenes
| Clistene
| Lexem doar pentru prima formă. Eventual restul formelor vor fi consemnate ca definiții cu trimitere, dacă există.
|-
| simboluri chimice
| Cf
| Cf (I6)
| Lexem cu modelul I6, cu literă mare. Se aplică și când există deja un lexem (''confer'', în acest caz).
|-
| substanțe chimice
| cloruri
| clorură (F43)
| DE are obiceiul să le treacă la plural. Dacă există și lexemul la singular, asociați definiția doar cu acela.
|-
| specii
| ascomicete
| ascomicetă (F43)
| DE are obiceiul să le treacă la plural. Dacă există și lexemul la singular, asociați definiția doar cu acela.
|-
| expresii în limbi străine
| aquila non capit muscas
| vultur; prinde; muscă
| Lexemele corespunzătoare în românește, cu excepția celor de legătură, prepoziții, conjuncții, verbul ''a fi'', unele adverbe etc.
|}


=== Sistem de etichete (ca la sensuri) ===
=== Sistem de etichete (ca la sensuri) ===


Aici ne interesează eticheta „nume propriu”, dar am mai avea utilizări pentru un astfel de sistem: „ieșit din uz”, „vocabular de bază”. [[Utilizator:Cătălin.Frâncu|Cătălin.Frâncu]] ([[Discuție Utilizator:Cătălin.Frâncu|discuție]])
Aici ne interesează eticheta „nume propriu”, dar am mai avea utilizări pentru un astfel de sistem: „ieșit din uz”, „vocabular de bază”. [[Utilizator:Cătălin.Frâncu|Cătălin.Frâncu]] ([[Discuție Utilizator:Cătălin.Frâncu|discuție]])

Meniu de navigare