Orignał w języku Esperanto | Maszynowe tłumaczenie na język polski |
---|---|
Ofte Esperanto estas proponita, kiel tiel nomata interlingvo por maŝina tradukado. DLT estas projekto, kiu reale tion provis. Ĝis nun neniu projekto rezultigis uzeblan sistemon. Esperantistoj ofte mem sugestas la uzadon de Esperanto por tiuj kialoj. Mi devas konstati, ke kvankam ideo de interlingvo estas tre avantaĝa, Esperanto vere ne taŭgas por tiu tasko. Esperanto estas kreita kiel facile lernebla (por eŭropanoj) lingvo por internacia komunikado inter homoj. Tial Esperanto havas kelkajn specialajn trajtojn por atingi tiun celon. La plej granda problemo ĉe komputila prilaboro de naturaj lingvoj estas multnivela multsenco de natura lingvo.
Maŝina tradukado ĝis nun praktike pritraktas nur du nivelojn. Ŝajne la kreinto de Esperanto volis malaltigi unuflanke la multsencojn ĉe leksikona nivelo, sed aliflanke la sintaksa multsenco estas alta, ĉar tio ebligis facilan gramatikon. La perfekta interlingvo por kialoj de maŝina tradukado devas ne havi mulsencojn. Ĝi devas havi la saman kapablon konservi informojn kiel ĉiuj lingvoj, ĉar oni volas eviti informoperdon ĉe tradukado jam pro maltaŭga interlingvo. Mi volas prezenti kelkajn ekzemplojnLeksikona multsenco
Vorto ‘observi’ havas 3 sencojn. Malfeliĉe en pola lingvo oni devas uzi por 2 sencoj tute aliajn tradukojn. Sintaksa multsenco Ŝi ricevis florojn de sia patro. (pole: Ona otrzymała kwiaty ojca, aŭ Ona otrzymała kwiaty od ojca) Perdo de informojLa informo-enhavo de gramatikaj strukturoj estas por naciaj lingvoj tre diferencaj. Tio malfaciligas la tradukadon.
En pola lingvo fleksio de verboj signifas ankaŭ genron de subjekto. Por preskaŭ ĉiu pola verbo ekzistas 2 variantoj, kun signifo, ĉu la tasko estas plenumigita. Alia ekzemplo estas la pronomo ‘vi’, kiu en Esperanto povas esti singulara aŭ plurala. Aliaj teknikaj kialojEsperanto ne estas ankaŭ ideala por sintaksa analizo. Kelkajn vortetoj povas havi multajn rolojn en frazo.
Tiuj vortetoj devas esti tradukitaj al pola lingvo depende de rolo tute alie.
Esperanto ne estas normitaEsperanta lingvo lasas al la uzantoj tre grandan liberecon de sia uzado. Fundamento preskaŭ tute ne pritraktas la sintakson de la lingvo. La frazoj devas esti laŭ fundamento kompreneblaj, sed ĝi ne difinis de kiu. Ofte Esperantistoj nur kopias sian nacian lingvon. Tiaj frazoj estas korektaj sed certe ne kutimaj. La maŝina traduko estas tre malfacila. En projekto DLT fine oni kreis propran normitan (regulitan) lingvon, kiu baziĝas sur Esperanto. Sed kial krei novan lingvon de Esperanto, se oni povas uzi por tiu alian nacian lingvon, kun pli bonaj vortaroj, kun pli vasta tekstaro, kaj kun pli ampleksaj lingvistikaj iloj. La ideala interlingvo por maŝina tradukado devas havi trajtojn de formalaj lingvoj konataj de komputila scienco (ekzemple programaj lingvoj). Aldonaj priskriboj de tekstoEbla teknika solvo de tiuj problemoj estas pliriĉigo de tekstoj per aldonaj priskriboj. La kvanto de bezonataj aldonaj priskriboj dependas de cela lingvo de traduko.
Imageble estas ankaŭ, ke komputilo aŭtomate aldonos tiujn priskribojn (uzante statistikajn metodojn aŭ profundan semantikan analizon) , kaj poste homo nur ekzamenos la rezulton. Softvaraj patentoj pri EsperantoEĉ se la uzo de Esperanto kiel interlingvo en maŝina tradukado ne estas tiel avantaĝa, kiel oni ofte pensas, ekzistas |
Często Esperanto jest zaproponowane, jak tak zwana lingua franca dla tłumaczenia maszynowego. DLT jest projektem, który realnie to próbował. Do teraz żaden projekt nie rezultował w zdatnym systemie. Esperantyści często samą podsuwają użycie Esperanto dla tych motywów. Muszę stwierdzać, że aczkolwiek pomysł linguy franca jest bardzo przyjazny, Esperanto naprawdę nie nadaje się dla tego zadania. Esperanto jest stworzone jak lekko możliwy do nauki (dla europejczyków) język dla międzynarodowej komunikacji pomiędzy ludźmi. Dlatego Esperanto ma kilka specjalnych cech aby osiągnąć ten cel. Największy problem przy obróbce komputerowej naturalnych języków jest {multsenco} wielopoziomowym naturalnego języka.
Tłumaczenie maszynowe do teraz w praktyce zajmuje się jedynie dwa poziomy. Na pozór twórca Esperanto chciał spuszczać z jednej strony {multsencojn} przy leksykalnym poziomie, lecz skądinąd syntaktyczny {multsenco} jest wysoki, ponieważ to umożliwiło łatwą gramatykę. Perferkcyjna lingua franca dla motywów tłumaczenia maszynowego nie może mieć {mulsencojn}. Ono musi mieć taką samą umiejętność dochować informacje jako wszystkie języki, ponieważ chce się unikać utratę informacji przy tłumaczeniu już z powodu zdatnej inaczej linguy franca. Chcę prezentować kilka przykładówLeksykalny {multsenco}
Słowo ‘obserwować’ ma 3 znaczenia. Nieszczęśliwie w języku polskim trzeba użytkować dla 2 znaczeń całkiem inne tłumaczenia. Syntaktyczny {multsenco} Ŝi ricevis florojn de sia patro. (pole: Ona otrzymała kwiaty ojca, aŭ Ona otrzymała kwiaty od ojca) Utrata informacjiZawartość informacji gramatycznych struktur jest dla narodowych języków bardzo różnych. To utrudnia tłumaczenie.
W języku polskim fleksja czasowniki znaczy także rodzaj subiekta. Dla nieomal każdego czasownika polskiego istnieją 2 warianty, ze znaczeniem, czy zadanie jest wcześniej dopełniane. Inny przykład jest zaimkiem ‘ty’, który w Esperanto może być pojedynczy albo {plurala}. Inne techniczne motywyEsperanto nie jest także idealne dla syntaktycznej analizy. Kilku słówka mógą mieć liczne role we zdaniu.
Tiuj vortetoj devas esti tradukitaj al pola lingvo depende de rolo tute alie.
Esperanto nie jest unormowaneEsperancki język pozwala do użytkowników bardzo dużą swobodę swojego użycia. Fundament nieomal całkiem nie zajmuje się synktaktyki języka. Zdania muszą być według fundament zrozumiałe, lecz ono nie definiowało od kogo. Często Esperantyści jedynie kopiują swój narodowy język. Takie zdania są korektowe lecz z pewnością nie zwyczajne. Tłumaczenie maszynowe jest bardzo trudne. W projekcie DLT w końcu stworzyło własnego unormowany (nastawionego) język, który opiera się na Esperanto. Lecz dlaczego stworzyć nowy język Esperanto, jeśli można użytkować dla tego inny narodowy język, z lepszymi słownikami, z rozleglejszą grupą tekstów, i z przestronniejszymi lingwistycznymi przyrządami. Idealna lingua franca dla tłumaczenia maszynowego musi mieć cechy przepisowych języków znanych przez komputerową wiedzę (na przykład programowe języki). Dodatkowe opisy tekstuMożliwe techniczne rozwiązanie tych problemów jest wzbogacaniem tekstów dodatkowymi opisami. Ilość potrzebnych dodatkowych opisów zależy od docelowego języka tłumaczenia.
imageble estas ankaŭ, ke komputilo aŭtomate aldonos tiujn priskribojn (uzante statistikajn metodojn aŭ profundan semantikan analizon) , kaj poste homo nur ekzamenos la rezulton. softvaraj patentoj pri esperantoeĉ se la uzo de esperanto kiel interlingvo en maŝina tradukado ne estas tiel avantaĝa, kiel oni ofte pensas, ekzistas |