Spis treści Artykuł originalny « Poprzedni artykul Nastepny artykul »

Obecne problemy z maszynowym tłumaczeniem do języka niemieckiego

Nunaj problemoj kun maŝina tradukado al germana lingvo

Orignał w języku EsperantoMaszynowe tłumaczenie na język polski

Nun mi havas du eblojn sisteme testi la kvaliton de maŝina tradukado. Unue mi havas la aron de ekzemplaj frazoj (germanaj ekzemploj). Mi havas ankaŭ la ilon, kiu aŭtomate rekonas ŝanĝojn en tradukado post ŝanĝoj en programo.
Tiel mi frue povas ekkoni, ĉu ŝanĝoj en programo ne havas pliajn eble negativajn influojn ol tiuj, kiujn mi celis.

Sed mi rimarkis, ke la vera kvalito de maŝina tradukado estas videbla nur en realaj tekstoj kompare al realaj homaj tradukoj. Tial mi programis la medion por facile kompari tradukadojn (ekzemplo Ekzemplo de tradukado).

Mi nun malrapide trarigardas la rezultojn. Nun mi devas konstati, ke la kvalito de germanaj tradukoj estas la plej
malaltaj de ĉiuj. Kelkaj frazoj estas eĉ tiel fuŝe tradukitaj, ke la senco de frazo ne estas rekonebla.
Mi analizis kelkajn frazojn, kaj devas konstati, ke la germana lingvo havas kelkajn specialaĵojn, kiu malfaciligas la tradukadon. Tiujn kelkajn specialaĵojn mi eĉ ĝis nun tute ne pritraktis en programo. Germana lingvo postulas ankaŭ pli bona kvalito de analizo de esperantaj frazoj, ol pola aŭ angla lingvoj.

(relative clause extraposition) - Relativsatzextraposition

Esperante oni povus nomi tiun fenomenon: kroma pozicio de relativa subfrazo.
Bonan priskribon en germana lingvo oni trovas ĉi tie.

En germana lingvo oni ofte devas transloki kelkajn verbajn specojn al fino de frazo:

Ekzemploj:


Ich möchte das Buch lesen. (Mi volas legi la libron.)

Er wird sich mit dem Mächchen morgen nicht treffen. (Li ne renkontos la knabinon morgaŭ).

Er reist morgen ab (verbo: abreisen). (Li forveturos morgaŭ)

Tiu okazas ĉe:

  • helpaj verboj (wollen, müssen, …)
  • estonta tempo
  • tranĉeblaj verboj (Trenbare Verben)

La programo en nuna eldono 0.84 bone tradukas tiujn specialaĵojn por facilaj frazoj, sed tute fiaskas ĉe kompleksaj frazoj kun subfrazoj.

Ekzemploj de kroma pozicio de relativa subfrazo:


Mi legos la libron, kiun mi hieraŭ aĉetis.

Sen kroma pozicio

Ich werde das Buch, das ich gestern gekauft habe, lesen.

Kun kroma pozicio

Ich werde das Buch lesen, das ich gester gekauft habe.

En la lasta frazo la relativa frazo ne staras direkte apud la substantivo ‘Buch’. Ambaŭ frazoj estas gramatike tute korektaj. Ne estas tre klare evidente, kiam la kroma pozicio devas esti aplikata. La ĝenerala tendenco estas, ke por longaj subfrazoj eble multoblaj la kroma pozicio estas preferigita.

nfvp - non finite verb pharases

La dua problemo en la nuna eldona estas ne korekte analizitaj i-frazpartoj (engle: non finite verb pharese).

Ekzemplo:

Mi volas paroli pri tiu libro.

Ankaŭ en tiuj i-frazpartoj en germana lingvo la verbo venas al fina pozicio.

Traduko:


Ich will über dieses Buch sprechen.

Nun la sintaksa analizo en la programo ne povas korekte ekkoni tutajn i-frazpartojn, sed teknike tio estas ebla
kaj mi certe tion faros en venonta eldono de programo.

i-frazpartoj en sintaksa analizo


Mi volas vidi vin. (korekte)

Mi volas paroli pri tio. (malkorekte)
Tial la tradukado modulo de germana lingvo ne translokigis la verbon de i-frazparto al fino de tiu frazparto, sed al fino de ĉefa frazo. Tiu funkcias bone por facilaj frazoj, kvankam la baza sintaksa analizo ne estas korekta.

Mi volas paroli pri tio. Ich will darüber sprechen

La problemojn faras kompleksaj frazoj kun multaj i-frazpartoj. Nun la programo tradukas:

Mi venas paroli pri tio, vidi vin kaj la libron legi. Ich komme über dem, dich und das Buch lesen, zu zu sehen sprechen.

La traduko estas fiaska. Ŝajnas ke mi devas investi tempon por plibonigi la sintaksan analizon. I-frazpartoj ne estas bone rekonataj. Poste mi devos adapti la tradukan modulon por germana lingvo.

La alia problemo estas la germana glosaro (vortaro)

Ŝajne la vortaro estas tre vasta, sed aliflanke por maŝina tradukado, oni ne bezonas ĉiujn eblajn sinonimojn por unu esperanta vorto, sed unu traduko, kiu estas taŭga por plej granda nombro de tradukoj.
Ekzemple por vorto ‘fari’ la glosaro enhavas sekvantajn tradukojn: machen, erschaffen, anfertigen, herstellen, tun, vollbringen, schließen, hinkriegen, tätigen, leiten, zurücklegen.
Kelkajn de ili oni uzas en tre maloftaj situacioj. En la kampo “ordo” oni povas specifi, kiu traduko havas la plej altan prioritaton, sed por multaj vortoj tiu ĝis nun ne estas farita.

Teraz mam dwie możliwości systematycznie testować jakość maszynowego tłumaczenia. Po pierwsze mam grupę przykładowych zdań (niemieckie przykłady). Mam także przyrząd, który automatycznie rozpozna zmiany w tłumaczeniu po zmianach w programie.
Tak wcześnie mogę poznać, czy zmiany w programie nie mają dalsze przypuszczalnie przeczących wpływów aniżeli ci, do których dążyłem.

Lecz zauważyłem, że prawdziwa jakość maszynowego tłumaczenia jest widoczna jedynie w rzeczywistych tekstach w zrównaniu do rzeczywistych człowieczych tłumaczeń. Dlatego programowałem środowisko aby lekko porównywać tłumaczenia (przykład Przykład tłumaczenia).

Teraz powoli przejrzę wyniki. Teraz muszę stwierdzać, że jakość niemieckich tłumaczeń jest
najniższa od wszystkich. Kilka zdań jest nawet tak błędnie przetłumaczone, że znaczenie zdania nie jest rozpoznawalne.
Rozpatrywałem kilka zdań, i muszę stwierdzać, że język niemiecki ma kilka specjalności, które utrudnia tłumaczenie. Tych kilku specjalności nawet do teraz całkiem nie zajmowałem się w programie. Język niemiecki wymaga także lepsza jakość analizy esperanckich zdań, aniżeli polskie albo angielskie języki.

(względnie {clause} {extraposition}) - Relativsatzextraposition

W języku esperanto można by było nazwać to zjawisko: dodatkowa pozycja relatywnego zdania podrzędnego.
Dobry opis w języku niemieckim znajduje się tutaj.

W języku niemieckim często trzeba zmienić miejsce kilka czasownikowych rodzajów do końca zdania:

Przykłady:


Ich möchte das Buch lesen. (Mi volas legi la libron.)

Er {wird} {sich} {mit} {dem} Mächchen {morgen} {nicht} {treffen}. (On nie będzie natrafiać dziewczyny jutro).

Er reist morgen ab (verbo: abreisen). (Li forveturos morgaŭ)

Ten odbywa się przy:

  • posiłkowe czasowniki (wollen, müssen, …)
  • przyszły czas
  • czasowniki możliwe do cięcia (Trenbare Verben)

Program w obecnej lini bazowej 0.84 dobrze tłumaczy te specjalności dla łatwych zdań, lecz całkiem spełznie na niczym przy skąplikowanych zdaniach ze zdaniami podrzędnymi.

Przykłady dodatkowej pozycji relatywnego zdania podrzędnego:


Mi legos la libron, kiun mi hieraŭ aĉetis.

Bez dodatkowej pozycji

Ich werde das Buch, das ich gestern gekauft habe, lesen.

Z dodatkową pozycją

Ich werde das Buch lesen, das ich gester gekauft habe.

W ostatnim zdaniu relatywne zdanie nie stoi w kierunku obok rzeczowniku ‘Buch’. Obydwa zdania są gramatycznie całkiem korektowe. Nie jest bardzo jasno oczywiście, kiedy dodatkowa pozycja musi być stosowana. Ogólna skłonność jest, że dla długich zdań podrzędnych przypuszczalnie wielokrotnych dodatkowa pozycja jest {preferigita}.

{nfvp} - non finite verb pharases

Drugi problem w obecnym {eldona} jest nie poprawnie wcześniej rozpatrywane i-części zdania ({engle}: my-? zakończywszy {verb} {pharese}).

Przykład:

Mi volas paroli pri tiu libro.

Także w tych i-częściach zdania w języku niemieckim czasownik przychodzi do końcowej pozycji.

Tłumaczenie:


Ich will über dieses Buch sprechen.

Teraz syntaktyczna analiza w programie nie może poprawnie poznać całe i-części zdania, lecz technicznie to jest możliwe
i z pewnością to zrobię w przyszłej lini bazowej programu.

i-części zdania w syntaktycznej analizie


Mi volas vidi vin. (korekte)

Chcę mówić o tym. (na opak)
Dlatego tłumaczenie moduł języka niemieckiego nie przeprowadziło czasownika i-części zdania do końca tej części zdania, lecz do końca głównego zdania. Ten funkcjonuje dobrze dla łatwych zdań, aczkolwiek kluczowa syntaktyczna analiza nie jest korektowa.

Mi volas paroli pri tio. Ich will darüber sprechen

Problemy robią skąplikowane zdania z licznymi i-częściami zdania. Teraz program tłumaczy:

Mi venas paroli pri tio, vidi vin kaj la libron legi. Ich komme über dem, dich und das Buch lesen, zu zu sehen sprechen.

Tłumaczenie jest {fiaska}. Wydaje się, że muszę inwestować czas aby ulepszyć syntaktyczną analizę. I-części zdania nie są dobrze rozpoznane. Potem będę musiał zastosować moduł tłumaczeniowy dla języka niemieckiego.

Inny problem jest glosariuszem niemieckim (słownik)

Na pozór słownik jest bardzo rozległy, lecz skądinąd dla tłumaczenia maszynowego, nie potrzebuje się wszystkich możliwych bliskoznaczników dla jednego esperanckiego słowa, lecz jedno tłumaczenie, które jest zdatne dla najbardziej dużej liczby tłumaczeń.
Na przykład dla słowa ‘zrobić’ glosariusz mieści następujące tłumaczenia: machen, erschaffen, anfertigen, herstellen, tun, vollbringen, schließen, hinkriegen, tätigen, leiten, zurücklegen.
ich Kilku użytkuje się w bardzo rzadkich położeniach. W zakresie “ład” może wyliczać, który tłumaczenie ma najwyższe pierwszeństwo, lecz dla licznych słów ten do teraz nie jest zrobiony.

Artukuł został przetłumaczony w pełni maszynowo przez wolny program Esperantilo
Adres kontaktowy:
mail@xdobry.de