Articol/Diverse/De unde provin cuvintele românești
Stimulat de o discuție cu profesorul Emil Ionescu în cadrul seminarului Limba română în era globalizării (înregistrarea completă poate fi găsită aici), am purces la sistematizarea unor cercetări mai vechi de-ale mele în care pur și simplu făceam un exercițiu simplu de clasificare (automată) a cuvintelor din DEX (2009) după etimologia indicată de autori.
Cum ne puteam aștepta, etimologiile nu sînt clar definite de DEX (acesta fiind un dicționar explicativ), uneori apar mai multe surse, alteori se oferă numai corespondențe cu alte limbi („cf.”). Totuși, chiar dacă nu-s exacte, rezultatele trebuie să fie corecte măcar ca ordin de mărime!
| Limba de origine | Număr de cuvinte | Procent |
|---|---|---|
| dezvoltare în limba română | 28659 | 42.85% |
| franceză | 21076 | 31.51% |
| franceză, latină | 3780 | 5.65% |
| latină | 2266 | 3.39% |
| etimologie necunoscută | 1159 | 1.73% |
| slavonă | 1084 | 1.62% |
| germană | 1001 | 1.50% |
| engleză | 967 | 1.45% |
| turcă | 949 | 1.42% |
| italiană | 645 | 0.96% |
| franceză, germană | 582 | 0.87% |
| engleză, franceză | 577 | 0.86% |
| bulgară | 548 | 0.82% |
| neogreacă | 544 | 0.81% |
| maghiară | 449 | 0.67% |
| franceză, italiană | 440 | 0.66% |
| rusă | 366 | 0.55% |
| ucraineană | 240 | 0.36% |
| italiană, latină | 137 | 0.20% |
| franceză, italiană, latină | 124 | 0.19% |
| franceză, rusă | 100 | 0.15% |
| franceză, germană, latină | 85 | 0.13% |
| albaneză | 79 | 0.12% |
| franceză, germană, italiană | 59 | 0.09% |
| germană, latină | 57 | 0.09% |
| franceză, neogreacă | 53 | 0.08% |
| rusă, ucraineană | 51 | 0.08% |
| germană, italiană | 51 | 0.08% |
| spaniolă | 45 | 0.07% |
| germană, rusă | 37 | 0.06% |
| țigănească | 33 | 0.05% |
| altele | 635 | 0.95% |
| TOTAL | 66878 | 100.00% |
Dacă luăm limbile separat (evident, în cazul acesta suma procentelor va fi mai mare de 100% pentru că unele cuvinte corespund mai multor limbi) „clasamentul” devine:
| Limba de origine | Număr de cuvinte | Procent |
|---|---|---|
| dezvoltare în limba română | 28659 | 42.85% |
| franceză | 27721 | 41.45% |
| latină | 11131 | 16.64% |
| germană | 2972 | 4.44% |
| italiană | 2387 | 3.57% |
| engleză | 1638 | 2.45% |
| slavonă | 1229 | 1.84% |
| turcă | 1116 | 1.67% |
| neogreacă | 998 | 1.49% |
| rusă | 979 | 1.46% |
| bulgară | 681 | 1.02% |
| maghiară | 523 | 0.78% |
| ucraineană | 432 | 0.65% |
| spaniolă | 127 | 0.19% |
| albaneză | 95 | 0.14% |
| țigănească | 37 | 0.06% |
| greacă (veche) | 34 | 0.05% |
| portugheză | 23 | 0.03% |
| latină (populară) | 20 | 0.03% |
| altele | 28 | 0.04% |
Trebuie făcute măcar trei observații:
- este vorba de cuvintele care au reușit să pătrundă în DEX (suspectez că există cel puțin o mie de cuvinte împrumutate din engleză care nu apar în dicționare);
- este vorba doar de cuvinte diferite, care apar în dicționare, nu am luat în calcul frecvența cuvintelor: astfel și sau în apar cu aceeași pondere precum sternocleidomastoidian (există mai multe analize de acest tip mai vechi, dar înainte de puternica influență a limbii engleze de acum, vezi aici);
- cuvintele tehnice, deși figurează cu origine engleză sau franceză (rareori germană), provin de obicei din rădăcini grecești și latine (inclusiv cele care încă nu au intrat în dicționare, dar se folosesc în vorbirea curentă);