История машинного перекладу

Тип работы:
Реферат
Предмет:
История техники


Узнать стоимость

Детальная информация о работе

Выдержка из работы

История машинного перевода

Е. М. Филинов

Впервые думка про можливості машинного перекладу висловив Чарльз Бэббидж (1791−1871), який розробив в 1836—1848 рр. проект цифровий аналітичної машини — механічного прототипу електронних цифрових обчислювальних машин, що з’явилися через100 років. Ідея Ч. Бэббиджа зводилася до того, що обсягом 1000 50-разрядных десяткових чисел (по 50 зубчастих коліс у кожному регістрі) можна використовуватиме зберігання словників. Ч. Бэббидж навів згадану ідею як обгрунтування запиту у англійського уряду коштів, необхідні фізичного втілення аналітичної машини, що йому не вдалося побудувати (див. Апокин та інших. Чарльз Бэббидж. М., Наука, 1981).

Фактически історія машинного перекладу починається з «Джорджтаунського експерименту «. У 1954 р. відбулася перша публічна демонстрація машинного перекладу з російської англійською, здійсненого машиною ИБМ-701. Повідомлення про катастрофу було опубліковано у журналі Computers and Automation, 1954, № 2. А реферат цих слів, зроблений Д. Ю. Пановим, виник РЖ ВІНІТІ «Математика », 1954, № 10: «Переклад з однієї мови в інший з допомогою машини: звіт перший успішне випробування ».

Это повідомлення стало поштовхом до початку робіт з машинному перекладу у СРСР. Д. Ю. Панов, що тоді директором ВІНІТІ (тоді Інституту інформації - ІНІ) привернула до роботам по машинному перекладу І. До. Бельскую, які потім очолила групу машинного переведення гривень у ИТМ і ЗТ АН СРСР. Досвід перекладу з англійської російською з допомогою машини БЭСМ було отримано вже під кінець 1955 р. Програми для БЭСМ становили М. П. Трифонов і Л. М. Корольов, кандидатська дисертація якого було присвячена методам побудови словників для машинного перевода.

Другое напрям робіт виникла відділенні прикладної математики Математичного інституту АН СРСР (нині ІПМ їм. М. У. Келдиша РАН) з ініціативи А. А. Ляпунова. До цих робіт по машинному перекладу математичних текстів з французької мови російською він залучив Про. З. Кулагину, аспірантку МИАН, своїх учениць Т. Д. Вентцель і М. М. Рікко. З кінця 1955 р. у цих роботах брала участь Т. М. Молошная, які потім розпочала самостійної роботі над алгоритмом англо-росіянина перекладу. А. А. Ляпунов і Про. З. Кулагіна своє уявлення про використанні обчислювальних машин для перекладу з однієї мови в інший було опубліковане у журналі «Природа », 1955, № 8. Перші програми машинного перекладу, розроблені цим колективом, були реалізовані машиною «Стріла ».

Первое покоління систем машинного перекладу базувалося на алгоритми послідовного перекладу «слово по слову », «фраза за фразою «. Можливості таких систем визначалися доступними розмірами словників, прямо залежними від обсягу пам’яті комп’ютера. Переклад тексту здійснювався окремими пропозиціями, смислові зв’язок між ними неможливо враховувалися. Такі системи називають системами прямого перекладу. На зміну їм з часом прийшли системи наступних поколінь, у яких переклад від мови мови здійснювався лише на рівні синтаксичних структур. У алгоритми перекладу використовувався набір операцій, дозволяє шляхом аналізу перекладного пропозиції побудувати його синтаксичну структуру за правилами граматики мови вхідного пропозиції (як і, як вчать дітей мови у неповній середній школі), та був перетворити їх у синтаксичну структуру вихідного пропозиції з синтезувати вихідний пропозицію, підставляючи потрібне слово з словника. Такі системи називаються Т-системами (Т — від англійського слова «transfer — перетворення »).

Наиболее досконалим вважається підхід побудувати систем машинного перекладу з урахуванням отримання деякого, незалежного від мов, смислового уявлення вхідного пропозиції шляхом його семантичного аналізу. Потім виконується синтез вихідного пропозиції щодо одержаному смисловому уявленню. Такі системи називають И-системами (І - від слова «интерлингва »). Вважається, що такі покоління систем машинного перекладу ставитимуться до класу И-систем.

Как великий учений, якому властиве бачити всю проблему загалом, А. А. Ляпунов з початку робіт з машинному перекладу характеризував перекладі шляхом вилучення сенсу перекладного тексту та її уявлення про будь-якою іншою мовою. Але така постановка проблеми перекладу опинилася у той час передчасної. Понад те, вона розв’язано нелегку для загальному вигляді світової інформатикою й у час, незважаючи на зусилля, предпринимавшиеся Міжнародної федерацією IFIP — світовим співтовариством у сфері обробки інформації. Проте багато хто приватні результати, пов’язані з семантичним аналізом текстів, отримали і було опубліковано у працях IFIP.

Первый досвід створення програм машинного перекладу показав, що потрібно вирішувати ці завдання які і по частям.

Слишком багато труднощів і неясностей було того, як треба формалізувати і будувати алгоритми до роботи з текстами, які словники треба вводити в чужу машину, які лінгвістичні закономірності варто використовувати при машинному перекладі і які взагалі ці закономерности.

Выяснилось, що традиційна лінгвістика немає ні фактичним матеріалом, ні ідеями і уявленнями, потрібні побудови систем машинного перекладу, які використовували б сенс перекладного текста.

Традиционная лінгвістика не дати вихідні уявлення у частини семантики, а й у частини синтаксису. Ні на одне мови тоді немає переліків синтаксичних конструкцій, були вивчені умови їхнього поєднуваності і взаємозамінності, були розроблено правила створення великих одиниць синтаксичної структури з дрібніших. По суті на будь-який питання, проведений зв’язки Польщі з побудовою систем машинного перекладу, традиційна лінгвістика в 50-і роки не дати ответа.

Потребность в створенні теоретичних основ машинного перекладу призвела до формування нового напрями у лінгвістиці, званого структурної, прикладної, математичної лінгвістикою. Формування цього напряму у СРСР віднесено до другої половині 1950-х років. Провідну роль ньому зіграли математики А. А. Ляпунов, У. А. Успенський, (учень А. М. Колмогорова), Про. З. Кулагіна, лінгвісти У. Ю. Розенцвейг, П. З. Кузнєцов, А. А. Реформатський, І. А. Мельчук, У. У. Иванов.

6 травня 1960 р. було винесено Постанова Президії АН СРСР «Про розвиток структурних і математичних методів дослідження мови », на виконання якого було створено підрозділ з структурної лінгвістиці сьогодні в Інституті мовознавства, Інституті російської АН СРСР. У Постанові Президії АН СРСР зазначалося, що «недостатнє розвиток теоретичних досліджень, у області структурних і математичних методів у лінгвістичних установах гальмує практично важливі роботи з теорії та практиці машинного перекладу, побудові інформаційних мов і культур інформаційних машин, логічного семантикою і іншим додатків мовознавства, розроблюваним нині у низці технічних і математичних науково-дослідними інститутами «. З 1960 р. почалося підготування кадрів у сфері автоматичної переробки текстів на філологічному факультеті МДУ, у Ленінградському і Новосибірському університетах, МГПИИЯ. Під математичної лінгвістикою розумілося вивчення мови як абстрактної знаковою системи із єдиною метою побудови теоретичної основи машинного перекладу і шляхом створення конкретних алгоритмів перекладу. У цьому розумінні математична лінгвістика становила частина семіотики — загальної теорії знакових систем.

Задача аксиоматизации лінгвістики було висунуто однією з найвизначніших лінгвістів московської школи П. З. Кузнєцовим як завдання формалізації граматики, що сягала ідеям видатного російського мовознавця Ф. Ф. Фортунатова (1848−1914).

Исследованию формальної теорії граматик, присвячувалася дисертація Про. З. Кулагиной, виконана під керівництвом А. А. Ляпунова.

Заметим, що у ті роки формальна теорія граматик розвивалася в працях М. Хомского, стали класичними області штучних мов, зокрема мов программирования.

Двадцатилетие (1956−1976) одного з засновників напрями математик У. А. Успенський у спогадах назвав «срібним століттям «структурної, прикладний та математичної лінгвістики у СРСР (певне, за аналогією з «срібним століттям «російської поэзии).

В 70-ті роки розробку основ технології машинного перекладу продовжила група фахівців у ВІНІТІ під керівництвом професора Р. Р. Белоногова. У результаті 1993 р. було створено промислова версія системи RETRANS фразеологического машинного перекладу з російської англійською і навпаки, яка в міністерствах оборони, шляхів, науку й технологій, і навіть у ВНТИЦ.

Практическое застосування принципів смислового аналізу текстів знадобилося під час створення систем машинного перекладу з ієрогліфічних мов (китайського, японського і ін.). Питання створення таких систем розробив дисертації У. М. Зелко в 80-х годах.

Первые комерційні продукти машинного перекладу, знайшли практичне використання, з’явилися торік у середині 1980-х років. Вони повинні були реалізовані на персональних комп’ютерах і були системами прямого перекладу, можливості яких базувалися на величезних (проти першими системами) словниках, а чи не на умінні аналізувати і синтезувати тексты.

Современные комерційні продукти машинного перекладу пропонують вітчизняні фирмы:

" Віста Текнолоджиз «і «Адвентис », освічені 1991 р. колективом розробників, виділилися з ВІНІТІ;

ПРОМТ, створена 1991 р. ;

" Медіа Лінгва ".

Однопользовательская «коробкова «версія продукту Retrans Vista фірми «Віста текнолоджиз «варта автоматизованого перекладу текстів з російської англійською і навпаки. У ній використано оригінальні алгоритми стискування словникових баз й пошуку перекладних еквівалентів, дозволяють транслювати «на льоту «як фрагменти тексту, імпортовані з текстового редактора MS Word, а й Web-страницы.

В словниках Retrans Vista зберігаються мільйони понять, до яких належать як традиційні стійкі фразеологічні обертів, але, передусім, словосполучення, використовувані у повсякденній промови. З іншого боку, є програма концептуального аналізу, автоматично выделяющая з тексту нові словосполучення й включає в словник. Основні словники системи Retrans Vista містять терміни і фразеологічні одиниці із природничих і технічним наук, економіці, бізнесу та політиці. Обсяг політематичного машинного словника — близько 3,4 млн. слів (1,8 млн. в російсько-англійської частини, 1,6 млн. — в англо-російської), причому 20% є словами, а 80% - стійкими словосполученнями з середньої «довжиною «в 2,2 слова.

Продукт Retrans Vista реалізований на ПК з процесором, у яких частоту від 166 МГц і ОЗУ від 32 МБ і від і жорстким диском від 170 МБ. Продукт працює під керівництвом ОС Windows 98/NT/2000.

Фирма ПРОМТ (internet) розробила та поставляє Интернет-переводчик PROMT Internet Translation Server, який би переклад «на льоту «Web-страниц, запитів до пошукових системам або до баз даних, поданих у Интернете.

Для корпоративних мереж багатонаціональних корпорацій фірма ПРОМТ пропонує аналогічний продукт PROMT Intranet Server.

Модуль перекладу PROMT Internet вбудовується в браузер Microsoft Internet Explorer, створюючи засіб для синхронного перекладу Web-страниц Web View. У цьому можна встановлювати для перекладу різні мовні пари: англійський — російський; англійський — німецький; англійський — іспанський; французький — англійський; французький — німецький. Безкоштовний онлайновий перекладач PROMT доступний в Інтернеті за адресою: internet.

PROMT Internet Translator Server установлено в пошукової системі Voila, що належить оператору France Telecom.

Для систем офісної автоматизації пропонується комерційний пакет PROMT Lingvo OFFICE — результат співробітництва двох лідерів російського ринку лінгвістичного програмного забезпечення — ПРОМТ і ABBYY.

Компания «Медіа Лінгва «випустила електронними словниками серії «МультиЛекс 3.5. Новий великий англо-російський словник «і «МультиЛекс3.5. Англійський. Економіка право «. Такі словники, працюючі під керівництвом операційними системами Windows CE чи PalnOS, можуть бути на кишенькових компьютерах.

С практичної погляду, маю на увазі якість результуючого тексту і його відповідності вихідному, програми машинного перекладу поділяють втричі категории:

полностью автоматичний переклад;

автоматизированный машинний переклад з участю людини;

перевод, здійснюваний людиною з допомогою комп’ютера.

Программы машинного перекладу перша з названих категорій є справою далекого майбутнього, що у загальному вигляді не було вирішено проблеми автоматичного розуміння, перекладу і синтезу текстов.

Программы другої категорії розробники називають МТ-программы (від Machine translation — машинний переклад). Реально автоматизований (з участю людини) машинний переклад можливий лише умовах штучно обмеженого, як у словниковому запасу, і по граматиці, языка.

В ролі реального успішного проекту МТ-программы завжди називають німецьку систему Meteo, виконує переклад метеопрогнозов із французької англійською і обратно.

К МТ-программам належить і продукти машинного перекладу фірми ПРОМТ, згадані вище, у цьому числі програми для перегляду вмісту Web-страниц у мережі Інтернет зі метою пошуку потрібного документа.

Программы третьої категорії розробники називають ТМ-программы (від translation memory — пам’ять перекладу). Цю категорію програм застосовують професійні перекладачі, усвідомили виграш від автоматизації його роботи з допомогою комп’ютерів. Основу ТМ-программ становлять спеціалізовані словники, відповідні тематиці перекладного тексту. При перекладі використовуються конструкції і значення російських слів і стійких словосполучень, обрані професійним перекладачем і що є в словники системи, а отриманий текст піддається інтенсивному редагування. Словники вже перекладені фрагменти текстів, запоминаемые в ТМ-системе, може бути повторно використані у великих колективних проектах, ними можна обмінюватися. Тому ТМ-системы є важливе засіб автоматизації праці професійних переводчиков.

Часто ТМ-программы використав поєднані із МТ-программами. Найбільш популярним в світі ТМ-инструментарием є Translation «p.s Workbench фірми Trados (для стислості часто також званий Trados).

За 17 років свого існування фірма Trados продала 45 тис. ліцензій зважується на власну систему. Усі вони придбано професійними перекладачами. Наприкінці 2001 р. Російська фірма ПРОМТ, відома своїми продуктами машинного перекладу категорії МТ, оголосила про набуття статусу ексклюзивного дистриб’ютора системи Trados у Росії інших країн СНД. Для спільного використання своїх МТ-программ і продуктів Trados фірма ПРОМТ пропонує спеціальні кошти їх сопряжения.

История машинного перекладу налічує трохи більше 50 років. Упродовж цього терміну змінилося кілька поколінь систем машинного перекладу — від перших програм, використовували обмежені універсальних комп’ютерів першого покоління до сучасних продуктів, використовують потужні ресурси серверів і персональних комп’ютерів, включаючи ПК, у яких можна розміщувати кишенькові словники, і навіть комп’ютерні сети.

По мері зняття технічних обмежень, що накладаються можливостями комп’ютерів по продуктивності і пам’яті, ставало зрозуміло, що проблему перекладу тексту з одного природної мови в інший принципово не зводиться лише перекодировке слів. Для подолання основних труднощів проблеми машинного перекладу би мало бути вирішені завдання автоматизованого уявлення контексту, змісту перекладного тексту, знання поняттях предметної області, до якої належить замінюваний текст.

Вместе про те сучасні досягнення у галузі обчислювальної техніки, інформаційних технологій і технологій телекомунікацій дозволяють висувати з перспективи практичні завдання пошуку істини та вибору необхідної інформації, представленої на користуємося різними мовами, з різнорідних джерел, що у корпоративних і глобальних інформаційно-телекомунікаційних сетях.

В ролі прикладу такий перспективної завдання можна навести системи запитів до інформаційних ресурсів мереж, наприклад до баз даних, із можливістю формування відповідей телефоном формі усної промови. І тому потрібно поєднання систем машинного перекладу з системами розпізнавання і синтезу речи.

Список литературы

Ляпунов А. А., Кулагіна Про. З. Використання обчислювальних машин для перекладу з однієї мови в інший. Природа, 1955, № 8.

Кузнецов П. З., Ляпунов А. А., Реформатський А. А. Основні проблеми машинного перекладу. Питання мовознавства, 1956, № 5.

Панов Д. Ю., Ляпунов А. А., Мухін І. З. Автоматизація перекладу з однієї мови в інший. У рб.: Сесія по наукових проблем автоматизації виробництва. М., Вид. АН СРСР, 1956.

Кулагина Про. З. Про роль А. А. Ляпунова у розвитку робіт з машинному перекладу у СРСР. Проблеми кібернетики, 1977, вип. 32 (в переробленому і доповненому варіанті - у книзі «Нариси історії інформатики у Росії «. Новосибірськ, ОИГГМ ЗІ РАН, 1998)

Кулагина Про. З. Дослідження з машинному перекладу. М., Наука, 1979.

Молошная Т. М. Алгоритм перекладу з англійської мови на російський. Проблеми кібернетики, 1960, вип. 3.

Багриновская Р. П., Кулагіна Про. З., Ляпунов А. А. Про патентування деяких методологічних питаннях, які стосуються машинному перекладу. У рб.: Про деякі неясні питання теоретичної кібернетики і алгоритми програмування. Новосибірськ, Вид. ЗІ АН СРСР, 1971.

Успенский У. А. Срібний вік структурної, прикладний та математичної лінгвістики у СРСР і У. Ю. Розенцвейг Як це починалося (нотатки очевидця) в кн.: Нариси історії інформатики у Росії. Новосибірськ, НДЦ ОИГГМ ЗІ РАН, 1998.

Панов Д. Ю. Автоматичний переклад. М., Вид. АН СРСР, 1958 (перше видання — 1956.)

Стеблин-Каменский М. І. Значення машинного перекладу для мовознавства. У рб.: Матеріали по машинному перекладу. Рб. 1. Л., Вид. ЛДУ, 1958

Зелко У. І. Автореферат кандидатську дисертацію.

MacDonald N. Language translation by machine — a report of the first successful trial. Computors and automation. 1954, v. 3, № 2, p. 6−10.

Машинный переклад. Рб. статей. М., АН СРСР, 1958.

Кулагина Про. З. Машинний переклад: сучасний стан. У рб.: Семіотика і інформатика. Вип. 29. М., ВІНІТІ, 1989.

Иванов У. У. Деякі запитання машинного переведення гривень у СРСР. Доповіді Конференції з обробки інформації, машинному перекладу і автоматичному читання тексту. М., ВІНІТІ АН СРСР, 1961. Вип. 10.

Компьютерра, 2002, № 21. Тема номери: «Ти мене розумієш? «Проблеми машинного перекладу, з. 26−37. Статті: Жигалов У. Тестер Тьюринга; Жигалов У. Відкладений розмова; Ножов І. Синтаксичний аналіз; Сокурко А. Майбутнє машинного перекладу.

ПоказатьСвернуть
Заполнить форму текущей работой