Diferență între revizuiri ale paginii „Chestiuni de discutat și de rezolvat”

fără descrierea modificării
Linia 60: Linia 60:
*Matei: Parcă ziceaţi că aveţi şi alte dicţionare în format digital (MDN); acestea nu pot fi plasate aici ca să le putem accesa?
*Matei: Parcă ziceaţi că aveţi şi alte dicţionare în format digital (MDN); acestea nu pot fi plasate aici ca să le putem accesa?
**Radu: O să pun aici tot ce am, încetul cu încetul. Recunosc că am făcut o pauză, dar dacă îmi mai zici (semn că folosește cineva !) îl mai aduc la zi!
**Radu: O să pun aici tot ce am, încetul cu încetul. Recunosc că am făcut o pauză, dar dacă îmi mai zici (semn că folosește cineva !) îl mai aduc la zi!
=== Abrevieri, simboluri ===
*Matei: Cred că ar trebui să convenim o "politică" în privinţa diferitelor abrevieri, simboluri chimice, sigle etc. Unele apar în surse cuvânt-titlu, altele sunt menţionate doar în explicaţii. Drept urmare unele figurează ca lexem, altele nu (şi nu pot fi găsite la căutare nici măcar bifând "căutare în tot textul"). Eu cred că n-ar fi rău să avem lexem pentru fiecare (asociat cu definiţia în care apare, dacă nu e cuvât-titlu). Pentru asta ar trebui făcută o căutare în baza de date pentru a găsi cuvinte prezente în explicaţii care nu au lexem asociat. Vom găsi în acest fel şi unele forme incorecte (greşeli de tipar) strecurate în definiţii...
**Radu: Perfect de acord. La final putem avea și un dicționar de abrevieri :) Și, în plus, putem parsa definițiile mai bine. Într-un mod similar ar trebui să procedăm și cu operele citate (există cel puțin în DLRLC). Avem două tipuri de abrevieri:
**:- cele ale unui anume dicționar (în principiu cam toate dicționarele au o listă de abrevieri) – p-astea sigur merită să le prelucrăm;
**:- restul: putem crea un dicționar de prescurtări pe care să îl construim în timp – aici trebuie discutat, dar sigur nu ne doare să creăm sursa (în cel mai rău caz nu o să punem abrevieri acolo);
***Cătălin: Am apucat să generez lista de unități de măsură. O includ la sfârșit. Unele trebuie puricate manual, dar în rest pot crea automat lexemele, dacă vi se pare că arată în regulă. Includ la sfârșit și interogarea MySQL folosită, pentru posteritate. [select concat('http://dexonline.ro/definitie/', lexicon), substr(internalRep, locate('#simb.#', internalRep) + length('#simb.# ')) from Definition where status = 0 and sourceId = 19 and internalRep like '%simb.%' and lexicon in (select lexicon from Definition where status = 0 and sourceId = 1 and internalRep like '%unitate%de măsură%') order by lexicon into outfile '/tmp/simboluri.txt';]
=== Linkuri incorecte ===
*Matei: Funcţia "clic pentru a naviga la acest cuvânt" dă rezultate aproximative în cazul cuvintelor neasociate cu un lexem. E normal să fie aşa. Problema e "supărătoare" - şi cred că poate fi eliminată - în cazul etimologiilor, la cuvintele străine. Poate găsiţi o cale de a dezactiva funcţia în astfel de situaţii (dacă cuvântul e precedat de o abreviere gen "fr.", "lat." etc.). Iată un exemplu: http://dexonline.ro/definitie/fuzet%C4%83/875213 - clic pe fusette duce la musette.
**Cătălin: Asta e una din problemele pe care n-aș rezolva-o cu cazuri particulare, „dacă ești după abreviere atunci fă asta” etc. Problema va fi rezolvată corect de structurare -- pur și simplu, clicul pe cuvânt nu trebuie să meargă pentru sensurile etichetate „etimologie”.
=== Flexiuni arhaice ===
*Matei: Referitor la flexiunile arhaice, sunt multe în Scriban (gen înădi, înoi etc.) și au create lexemele respective. Cred că ar trebui asociate cu lexemul modern și șterse formele arhaice.
**Cătălin: Am apucat să scriu un progrămel care să extragă lexemele asociate doar cu definiții din Scriban. Surpriză! Sunt aproape 10.000. :-) Din acestea, vreo 1.700 sunt scrieri cu „î” în loc de „â”, iar vreo 300 sunt substantive terminate în „-izm” în loc de „-ism”. Pentru restul de 8.000 mă aștept să mai găsim reguli, dar nu-mi sar în ochi. Încerc să rezolv astăzi câteva zeci, ca să-mi fac o idee. Ar fi perfect să creez o pagină cu toate, inclusiv cu aceste situații frecvente, ca să le putem rezolva printr-un singur click. Am creat pagina [http://wiki.dexonline.ro/wiki/Discu%C8%9Bie:Cur%C4%83%C8%9Benie_prin_lexeme Curățenie prin lexeme].
Lingviști
617 modificări