11 Часть I. Компоненты 14 Глава Компьютерная



бет14/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   10   11   12   13   14   15   16   17   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute
Латын тілі 4,5 - дәріс 2, 169-182 фил, Вопросы на русском языке, 6 үж
Частичная лексическая омонимия — это совпадение отдельных форм слов, они называются омоформами. Слово физики может обозначать группу ученых-физиков или быть родительным падежом слова физика.


Грамматическая омонимия — совпадение форм одного слова. На- пример, у слова дочь совпадают формы именительного и родительного падежей: Дочь обедает и Вижу дочь.
Сложные случаи неоднозначности могут быть вызваны конверсией. Так называется переход слова из одной части речи в другую. В русском языке наиболее частым примером конверсии является переход из прилага- тельного в существительное, например, слово слепой.
Сложность для анализа могут представлять также омографы — оди- наковые по написанию слова, имеющие разное звучание и значение. На- пример, это первое слово в сочетании большая часть (большАя или бОль- шая?). В устной речи им соответствуют омофоны — одинаковые по зву- чанию слова, отличающиеся по написанию. Например, сочетание ко злу (или козлу?) в предложении Можно ли быть равнодушным ко злу. Но омо- фоны — это проблема распознавания речи, которой посвящена третья гла- ва.
В живом общении люди редко замечают языковую неоднозначность. Это говорит о том, что в языке есть эффективные способы уменьшения уровня неоднозначности. Вот некоторые их них:

  1. Использование знаний о мире. Например, в предложении Съешь лук человек не проинтерпретирует слово лук как оружие для стрельбы — мы не рассматриваем здесь маловероятный случай сказочной исто- рии, в которой чудовищу советуют обезоружить средневекового луч- ника, проглотив его оружие.

  2. Использование контекста. Легко понять, о каком луке идет речь, если у нас есть сочетание лук со стрелами или картошка с луком.

  3. Предпочтение самых частых форм. В предложении Мужик купил по- рося вряд ли кому-то придет в голову рассматривать слово порося как деепричастие от глагола поросить, хотя оно вполне может оказаться деепричастием.

  4. Использование интонации — увы, этот метод не подходит для обыч- ных письменных текстов.

Реализовать эти и другие способы борьбы с неоднозначностью — это одна из важных задач лингвиста-практика. Разрешение морфологической омонимии рассматривают как отдельную задачу, т. к. для неё необходимы дополнительные данные, в то время как её результат нужен не всегда. Ме- тоды разрешения морфологической неоднозначности разнообразны: они могут быть основаны на контекстных алгоритмах, на выводимых из текста правилах или на вероятностных моделях (обучение с учителем и без учи- теля), или использовать гибридные методы [Brill 1992; Protopopova, Bocharov 2013; Karlsson 1995; Shmidt 1994]. Во многих случаях (напри- мер, для последующего синтаксического анализа) наличие нескольких

гипотез, одна из которых с большой степенью достоверности (> 99,9 %) является правильной, предпочтительнее однозначного ответа, ошибочного даже в 0,1 % случаев. Достижимая в настоящий момент точность при ав- томатическом снятии морфологической неоднозначности описана в ста- тье [Шаров и др. 2015].






  1. Достарыңызбен бөлісу:
1   ...   10   11   12   13   14   15   16   17   ...   197




©www.engime.org 2024
әкімшілігінің қараңыз

    Басты бет