Articol/Diverse/De unde provin cuvintele românești
Articol de Radu Borza (vezi și aici)
Pornind de o discuție cu profesorul Emil Ionescu în cadrul seminarului Limba română în era globalizării (înregistrarea completă poate fi găsită aici), am sistematizat clasificarea cuvintelor din DEX 2009[1] după etimologia indicată de autori.
În plus, cum ne puteam aștepta, etimologiile nu sînt clar definite de DEX (acesta fiind un dicționar explicativ), uneori apar mai multe surse, alteori se oferă numai corespondențe cu alte limbi („cf.”). Totuși, chiar dacă nu-s exacte, rezultatele trebuie să fie corecte măcar ca ordin de mărime!
| Limba de origine | Număr de cuvinte | Procent |
|---|---|---|
| dezvoltare în limba română | 28659 | 42.85% |
| franceză | 21076 | 31.51% |
| franceză, latină | 3780 | 5.65% |
| latină | 2266 | 3.39% |
| etimologie necunoscută | 1159 | 1.73% |
| slavonă | 1084 | 1.62% |
| germană | 1001 | 1.50% |
| engleză | 967 | 1.45% |
| turcă | 949 | 1.42% |
| italiană | 645 | 0.96% |
| franceză, germană | 582 | 0.87% |
| engleză, franceză | 577 | 0.86% |
| bulgară | 548 | 0.82% |
| neogreacă | 544 | 0.81% |
| maghiară | 449 | 0.67% |
| franceză, italiană | 440 | 0.66% |
| rusă | 366 | 0.55% |
| ucraineană | 240 | 0.36% |
| italiană, latină | 137 | 0.20% |
| franceză, italiană, latină | 124 | 0.19% |
| franceză, rusă | 100 | 0.15% |
| franceză, germană, latină | 85 | 0.13% |
| albaneză | 79 | 0.12% |
| franceză, germană, italiană | 59 | 0.09% |
| germană, latină | 57 | 0.09% |
| franceză, neogreacă | 53 | 0.08% |
| rusă, ucraineană | 51 | 0.08% |
| germană, italiană | 51 | 0.08% |
| spaniolă | 45 | 0.07% |
| germană, rusă | 37 | 0.06% |
| țigănească | 33 | 0.05% |
| altele | 635 | 0.95% |
| TOTAL | 66878 | 100.00% |
Dacă luăm limbile separat (evident, în cazul acesta suma procentelor va fi mai mare de 100% pentru că unele cuvinte corespund mai multor limbi) „clasamentul” devine:
| Limba de origine | Număr de cuvinte | Procent |
|---|---|---|
| dezvoltare în limba română | 28659 | 42.85% |
| franceză | 27721 | 41.45% |
| latină | 11131 | 16.64% |
| germană | 2972 | 4.44% |
| italiană | 2387 | 3.57% |
| engleză | 1638 | 2.45% |
| slavonă | 1229 | 1.84% |
| turcă | 1116 | 1.67% |
| neogreacă | 998 | 1.49% |
| rusă | 979 | 1.46% |
| bulgară | 681 | 1.02% |
| maghiară | 523 | 0.78% |
| ucraineană | 432 | 0.65% |
| spaniolă | 127 | 0.19% |
| albaneză | 95 | 0.14% |
| țigănească | 37 | 0.06% |
| greacă (veche) | 34 | 0.05% |
| portugheză | 23 | 0.03% |
| latină (populară) | 20 | 0.03% |
| altele | 28 | 0.04% |
Trebuie făcute următoarele observații:
- este vorba de cuvintele care au reușit să pătrundă în DEX (există sute de cuvinte împrumutate din engleză care nu apar în dicționare);
- este vorba doar de cuvinte diferite, care apar în dicționare, nu am luat în calcul frecvența cuvintelor: astfel și sau în apar cu aceeași pondere precum sternocleidomastoidian (există mai multe analize de acest tip mai vechi, dar înainte de puternica influență a limbii engleze de acum, vezi aici);
- cuvintele tehnice, deși figurează cu origine engleză sau franceză (rareori germană), provin de obicei din rădăcini grecești și latine (inclusiv cele care încă nu au intrat în dicționare, dar care se folosesc în vorbirea curentă);
Desigur, cineva ar putea susține că cele circa 65.000 de cuvinte din DEX 2009 reprezintă numai o parte din vocabularul limbii române și ar avea dreptate – numai în baza de date dexonline există peste 260.000 de cuvinte de bază distincte (care generează 1.500.000 de forme flexionare), din care avem ceva mai mult de 6000 cuvinte compuse –, dar, cum ne dorim o statistică a vocabularului folosit în ziua de azi, DEX 2009 este sursa ideală pentru a obține cel mai bun rezultat.
Referințe
- ↑ DEX 2009 = Dicționarul explicativ al limbii române, Editura Univers Enciclopedic Gold, București 2009