Spis treści Artykuł originalny « Poprzedni artykul Nastepny artykul »

Tłumaczenie maszynowe z języka polskiego do Esperanto

Maŝina tradukado el pola lingvo al Esperanto

Orignał w języku EsperantoMaszynowe tłumaczenie na język polski

Mi ne planis programi maŝinan tradukadon el pola lingvo, tamen nun mi dum longa tempo laboris pri tiu temo, kaj la venonta versio de Esperantilo enhavos unuan fojon la maŝinan tradukadon el pola lingvo al esperanta lingvo. La ĉefa kaŭzo pri mia frua rezisto je tiu temo estis, ke mi pritraktis la sintaksan analizon de pola lingvo kiel tre komplika, tro komplika por miaj rimedoj. Post kelkaj eksperimentoj mi konstatis, ke plena (profunda) sintaksa analizo ne estas tiel necesa por pola lingvo. Ekzistas ankaŭ la libera projekto morfologik kaj la s_fsa, kiuj oferas polan etiketilon. Do mi povis reuzi jam ekzistantan programaron. Tamen la vortprovizo de projekto morfologik, kvankam ĝi estas tre abunda, enhavis multe da eraroj. Do mi devis unue purigi tiun provizon. Por tiu tasko mi produktis de vortaro de Esperantilo ĉiujn fleksiajn formojn. Tiujn funkciojn mi jam bezonis por tradukado al pola lingvo. Feliĉe la laborkvanto ne estis tiel granda kaj mi povis rapide atingi unuajn rezultojn.

Ĉe tiu temo mi frontis unufoje la problemon de ambiguo de naturaj lingvoj. Por bona tradukado oni bezonas bonan senambiguilon (angle: disambigulation). La sendisambiguo koncernas ĉefe du problemojn.

  • Trovi la bazan vorton
  • Trovi unusencan gramatikan etiketon

Mi frue eĉ ne supozis, kiom da ambigueco ekzistas en pola lingvo. Mi pensas, ke nia cerbo faras tiun taskon tiel rapide, ke la ambigueco ne iĝas konscia. Do mi rimarkis tiun ambiguon nur dum la testado de tradukado.

Mi donas kelkajn ekzemplojn.

mam - verbo (mieć-havi), substatnivo (mama-patrino)
bez - konjukcio (sen), substantivo (sambuko)
jak - konjunkcio (kiel), substantivo (gruntbovo)

Ankaŭ la pola fleksio estas parte tre ambigua.

książki - baza vorto: książka
singularo, genetivo
pluralo, nominativo
pluralo, akuzativo

En pola lingvo akuzativo kaj nominativo por senvivaj substantivoj de vira genro estas samaj. Do mi devis uzi multajn diferencajn teknikojn por difini la gramatikan funkcion de vortoj en pola frazo. Pola lingvo havas ankaŭ komplikajn trajtojn ĉe negado kaj numeraloj. Jen la tabelo, kiu montras kelkajn defiojn de pola lingvo.

Ja mam książkę. Mi havas libron.
Ja nie mam książki. (genetivo-singularo) Mi ne havas libron.
Ja mam książki. (akuzativo-pluralo) Mi havas librojn.
Cena książki jest wysoka. (genetivo-singularo) Prezo de libro estas alta.

En tiu ekzemplo la vorto “książki” devas esti tradukita depende de kunteksto al “libron, librojn aŭ de libro”.
Tamen ĉiujn tiujn frazojnj la programo nun povas korekte traduki. Do mi esperas, ke la tradukado el pola lingvo estus ankaŭ iam utila. Mi pensas, ke se la traduko estus komprenebla, tiam jam multaj esperantistoj povus kompreni polajn tekstojn. Do tiu direkto de tradukado estus eble pli interesa ol tradukado de Esperanto al pola lingvo. Tiu okupo estas pro mi bona okazo ekkoni la polan lingvon. Tiun scion oni nur tre malfacile atingas per legado de gramatikaj libroj. Eble ankaŭ la cerboj de polaj gramatikistoj malkaŝas al ili kelkajn gravajn fenomenojn de pola lingvo.

Nie planowałem programować tłumaczenie maszynowe z języka polskiego, jednak teraz w czasie długiego czasu pracowałem nad tym tematem, i przyszła wersja Esperantilo będzie mieścić pierwszy raz tłumaczenie maszynowe z języka polskiego do esperanckiego języka. Główny powód o moim wczesnym oporze o tym temacie był, że zajmowałem się syntaktyczną analizę polskiego języka jak bardzo skomplikowanego, zbyt skomplikowanego dla moich sposobów. Po kilku doświadczeniach stwierdzałem, że pełna (głęboki) syntaktyczna analiza nie jest tak konieczna dla języka polskiego. Istnieje także wolny projekt {morfologik} i {s_fsa}, którzy ofiarują {etiketilon} polski. Więc mogłem użytkować ponownie już istniejące oprogramowanie. Jednak słownictwo projektu {morfologik}, aczkolwiek ono jest bardzo rzęsiste, mieściło wiele omyłek. Więc musiałem po pierwsze oczyścić to zaopatrzenie. Dla tego zadania produkowałem od słownika Esperantilo wszystkie kondycje fleksyjne. Te czynności już potrzebowałem dla tłumaczenia do języka polskiego. Szczęśliwie {laborkvanto} nie był tak duży i mogłem szybko osiągnąć pierwsze wyniki.

Przy tym temacie spotykałem się pewnego razu z problemem {ambiguo} naturalnych języków. Dla dobrego tłumaczenia potrzebuje się dobry {senambiguilon} (z angielskiego: disambigulation). {sendisambiguo} tyczy się głównie dwóch problemów.

  • Znaleźć słowo kluczowe
  • Znaleźć jednoznaczną gramatyczną etykietę

Wcześnie nawet nie przypuszczałem, ile dwuznaczności istnieje w języku polskim. Myślę, że nasz mózg robi to zadanie tak szybko, że dwuznaczność nie staje się poczytalna. Więc zauważałem ten {ambiguon} jedynie w czasie testowania tłumaczenia.

Daję kilka przykładów.

mam - verbo (mieć-havi), substatnivo (mama-patrino)
bez - konjukcio (sen), substantivo (sambuko)
jak - konjunkcio (kiel), substantivo (gruntbovo)

Także fleksja polska jest częściowo bardzo dwuznaczna.

książki - baza vorto: książka
singularo, genetivo
pluralo, nominativo
pluralo, akuzativo

W języku polskim biernik i mianownik dla nieżywych rzeczowników męskiego rodzaju są takie same. Więc musiałem użytkować liczne różne techniki aby definiować gramatyczną czynność słów w zdaniu polskim. Język polski ma także skomplikowane cechy przy zaprzeczeniu i liczebnikach. Oto tablica, która pokazuje kilka wyzwań polskiego języka.

Wszakże {mam} {książkę}. Mam książkę.
Wszakże {nie} {mam} {książki}. ({genetivo-singularo}) Nie mam książki.
Wszakże {mam} {książki}. (liczba mnoga biernika) Mam książki.
{Cena} {książki} {jest} {wysoka}. ({genetivo-singularo}) Cena książki jest wysoka.

W tym przykładzie słowo “ {książki}” musi zostać przetłumaczone zależnie kontekstu do “ książkę, książki albo od książki”.
Jednak wszystkich tych {frazojnj} program teraz może poprawnie tłumaczyć. Więc mam nadzieję, że tłumaczenie z języka polskiego byłoby także kiedyś użyteczne. Myślę, że jeśli tłumaczenie byłoby zrozumiałymi, wtedy już licznymi esperantystami mogłoby rozumieć teksty polskie. Więc ten kierunek tłumaczenia byłby przypuszczalnie więcej interesujący aniżeli tłumaczenie Esperanto do języka polskiego. Tym zajęciem jest z powodu mnie dobra okazja rozpoznawać język polski. Tą wiedza jedynie bardzo trudno osiąga się lekturą gramatycznych książek. Przypuszczalnie także mózgi polskich {gramatikistoj} ujawniają do nich kilka ważnych zjawisk polskiego języka.

Artukuł został przetłumaczony w pełni maszynowo przez wolny program Esperantilo
Adres kontaktowy:
mail@xdobry.de