ГлавнаяРегистрацияВход www.багумян.рф Четверг, 01.10.2020, 11:08
  Каталог статей Приветствую Вас Гость | RSS

 
 
Главная » Статьи » Мои статьи

ГЕНЕРИРОВАНИЕ СЕМАНТИЧЕСКОГО ЗНАЧЕНИЯ ТЕКСТА В ЛИНГВИСТИЧЕСКИХ ЭКСПЕРТНЫХ СИСТЕМАХ
ГЕНЕРИРОВАНИЕ СЕМАНТИЧЕСКОГО ЗНАЧЕНИЯ ТЕКСТА
В ЛИНГВИСТИЧЕСКИХ ЭКСПЕРТНЫХ СИСТЕМАХ

(формальный анализ)

БАГУМЯН Е.В.
 


    The article furnishes a formal apparatus for step-by-step generating of semantic meaning in a word, sentence, phrase and text as a whole by means of componental, distributional and transformational procedures. The resultant formal models let find out more about a language-form basis for (1) setting up and analysing semantic distributions relevant in the given text, (2) establishing syntax-semantics interface in terms of formal logic, (3) implementing the apparatus for making expert data analysis easier in case of content misinterpretation.


                                                     
Среди широкого круга вопросов, которыми занимается современная прикладная лингвистика, одно из центральных мест занимают проблемы лингвистических экспертиз, связанные с установлением авторства в тексте, автоматической переработкой текстов, политическим консультированием, речевыми правонарушениями, криминалистической деятельностью, медицинскими исследованиями и т.д. [Баранов 2004: 2–4].
Лингвистическая экспертиза спорных текстов, проводимая с целью разрешения "семантических конфликтов”, возникающих при интерпретации текстов читателями, осуществляется непосредственно специалистом-филологом или с помощью современной вычислительной техники [Кушнерук 2007: 35]. Разрешение данной лингвистической проблемы начинается с формального определения экспертом минимального "вакуумного” значения текста, при котором происходит сегментация текста на структурные единицы с последующим приращиванием "квантов” их значений [Левицкий 2006: 87] для дальнейшего вывода возможных смыслов. Полученная таким образом семантическая матрица принимается в качестве минимального логико-семантического значения текста, где не учитываются намерения автора, цели создания текста, возможности адресата, что предопределяет относительно объективный характер исследования самого текста.  
Актуальность данной статьи составляет рассмотрение одного из способов разрешения неоднозначности текстовой интерпретации через проведение формального анализа языковой формы текста как основы для порождения ее возможных смыслов.
Целью исследования является описание методики формального вывода значения текста с использованием классических и инновационных методов структурной лингвистики, формальной логики; а также рассмотрение некоторых лингвистических и экстралингвистических факторов, осложняющих формальный анализ текста.  
 В современной лингвистической науке существуют два основных направления исследования семантики текста – сильной (внешней) и слабой (внутренней) его семантики [Quine 1973]. Сильная формальная семантика базируется на идеях американского логика Ричарда Монтегю и выделяет в качестве своего объекта изучения выводимость значения предложений из значений составляющих их слов, описание языкового выражения значения и смысла текста сводится к формулированию правил соответствия между формой и значением текста. Слабая семантика считает значения языковых выражений ментальными сущностями, принадлежащими не описываемому миру, а сознанию человека [Кобозева 2007: 25–26].   
С позиций формальной семантики текст анализируется как целостная вероятностная система, в которой относительно стабильно распределяются текстовые единицы, находящиеся в устойчивых внутрисистемных корреляциях, и описывается следующей моделью:
Текст =  {M+ R+T+S+G,
где  M – множество языковых элементов, R – набор отношений между элементами, T – тема, S – ситуация, G – порождающий механизм, { – знак системы [Тулдава 1987: 29].
Элементарное содержания текста определяется лингвистами как сумма элементарных значений и смыслов текста:
cодержание текста  = значение + смысл,
где под значением понимается определенная информация, связываемая с ее носителем X конвенционально, т.е. согласно общепринятым правилам использования X в качестве средства передачи информации; под смыслом понимается информация, связываемая с Х в сознании Y в период времени Т, когда Y производит или воспринимает Х в качестве средства передачи информации [Кобозева 2007: 13].   
В классической лингвистике слово определяется как "единица различной формальной организации и выражения содержания текста” [Алиференко 2005: 13], как языковой знак, который не является простым мысленным отражением какого-либо объекта. Значение слова "зависит от свойства той части речи, той грамматической категории, к которой принадлежит слово, от общественно опознанных и отстоявшихся контекстов его употребления, от конкретных лексических связей его с другими словами, обусловленными присущими данному языку законами сочетания словесных знаний, от семантического соотношения этого слова с синонимами и вообще с близкими по значению и оттенкам словами, от экспрессивной и стилистической окраски слова” [Виноградов 1954: 7]. При этом общее в слове индивидуализируется, многозначность переходит в однозначность, семантическое значение трансформируется в прагматическое, объективное субъективируется [Гарпушкин 1977: 139].
В соответствии с формальной теорией знака Р.Г.Пиотровского слово рассматривается как элемент динамической системы [Пиотровский 1999: 35–85], содержащий два самостоятельных компонента – денотат и десигнат. Денотат присоединяется к имени и является целостным, неделимым отражением референта, десигнат (сигнификат) представляет собой смысловую единицу, выражающую концепт, особую сущность всех предметов, принадлежащих к классу, обозначаемому данным конкретным именем [Шрейдер 1976: 42]. По мнению других ученых, в структуре слова содержится коннотат как одна из его составляющих, которая надстраивает вторичные смысловые оттенки и оценки над денотатом и десигнатом [Алиференко 2005: 42; Телия 1986: 15–20]. В современных когнитивных исследованиях взаимодействия разных видов значения слова, проведенных  Дж.Дизом, рассматривается ассоциативное значение слова [Залевская 2005: 217 ], не учитываемое при формальном анализе текста.
Под значением слова-знака мы понимаем отношение, сложившееся между именем соответствующего знака и компонентами означаемого этого знака (денотатом, десигнатом и коннотатом).      
В общей лингвистике предложение рассматривают как внеязыковую ситуацию (референтную концепцию), структуру мысли в виде предметно-атрибутивного суждения или в виде пропозициональной функции (логической концепции), verbum finitum и его грамматических категорий (морфологической концепции). Под смыслом предложения понимается отражение и обобщение в сознании человека некоторого фрагмента действительности, представленного в виде некоторой простейшей ситуации или события [Гак 1976: 22–26; Кацнельсон 1972: 141–142]. В смысле предложения выделяют денотативную, десигнативную и прагматическую составляющие. Денотат предложения – это представление об определенном классе ситуаций, которое формируется в человеческом сознании путем отвлечения от множества однотипных ситуаций [Гак 1977: 232]. Прагматический аспект предложения шире коннотативного аспекта слова, поскольку первый включает в себя дополнительно информативную (в аспекте актуального членения) или коммуникативную составляющую [Костюшкина 1981: 5]. При формальном анализе учитывается как семантика отдельных слов предложения, так и семантические отношения между конкретыми словами. В этом случае основополагающим выступает оязыковленное соотношение между лицом и его состоянием, названное в падежной грамматике Филлмора "Экспериенцер”, или "Датив”. В разных системах формально-семантического описания выделяют 6 семантических отношений – "глубинные падежи” Ч.Филлмора; 25 семантических отношений в исследованиях Ю.Д.Апресяна [Апресян 1974: 125–126] или 100 семантических отношений в информационном языке Н.Н. Леонтьева [Кобозева 2007: 138].       
 Таким образом, семиотическую структуру предложения можно представить в виде следующей формулы: S = Ds + Cs + Кs + Is + Вs, где S – предложение, Ds – денотат предложения, Cs – десигнат предложения, Кs – коннотат предложения, Is – информационный аспект предложения, Вs – синтаксический аспект предложения. Данная формула позволяет определить понятие смысл предложения как отражение в сознании человека отношения линейной последовательности имен предложения к пяти вышеуказанным компонентам означаемого.
Основным семантическим отношением между предложениями, с помощью которого могут быть определены все другие семантические отношения, является отношение следования, частными разновидностями которого выступают импликация и пресуппозиция. Импликацией называется такой вид следования, который подчиняется закону контрапозиции: Р имплицирует Q (или Q является импликацией P) тогда и только тогда, когда Р влечет Q и отрицание Q влечет отрицание Р (Мальчику удалось повесить картинку на стену. : Мальчик повесил картинку на стену.). Пресуппозицией называется такой вид следования, когда не только утверждение Р, но и его отрицание ~P влечет Q (Он знает что Иван приехал. : Иван приехал) [Кобозева 2007: 210–211].   
     При объединении двух и более предложений в сверхфразовое единство (СФЕ) или сложное синтаксическое целое (ССЦ) устанавливается его смысл путем объединения в определенную иерархическую сеть тем, подтем и микротем в составе текста [Жинкин 1970: 15]. Такое объединение оказывается возможным при определенных условиях построения и взаимосвязи предложений, а именно: 1) предложения должны описывать одну микротему, т.е. в составе денотативных и коннотативных значений слов их составляющих, должны быть общие компоненты; 2) предложения должны иметь между собой специальные лексические средства связи, а между предложениями должны быть определенные синтаксические связи [Новиков 1983: 55]. Тогда структуру смысла СФЕ можно представить таким образом: Uph = Du + Сu + Ku +Bu + Iu + Tu + Fu, где Uph – общий смысл СФЕ, Du – денотат СФЕ, т.е. совокупность предметов конкретной ситуации; Сu– десигнат СФЕ, представление о тех множествах предметов, которые могут образовывать такую же микроситуацию, которая представлена в данном СФЕ; Ku – коннотативный аспект СФЕ, Вu – синтаксический аспект СФЕ; Iu – информационный аспект СФЕ, Tu – тематический аспект СФЕ, связанный с единством темы всего текста; Fu– межфразовый аспект СФЕ, отражающий наличие в СФЕ специальных несинтаксических средств связи между предложениями. Под содержанием СФЕ понимается отражение в сознании человека отношения линейной последовательности имен СФЕ к микроситуации, отраженной в сознании в виде совокупности представленных в семиотической структуре СФЕ семи компонентов обозначаемого знака [Зубов 2007: 91–92].  
На этапе генерирования семантического значения и выведения смыслов всего текста, структурированного рядом СФЕ, отмечается поливекторность организации его содержания. Вертикальная организация содержания, осуществляемая при укрупнении микротем в макротему, не только не противоречит ее горизонтальной организации (синтагматические связи текстовых единиц), но и дополняет ее. Дополнение понимается в том смысле, что объединение всех значений и связей текстовой единицы, присутствующих в горизонтальной и вертикальной семантической организации данного текста, образует максимальную экспликацию для этого текста [Леонтьева 1981: 21].        
Основной вопрос формального направления лингвистики "Как текст значит?” решается с использованием методов компонентного, дистрибутивного, трансформационного анализа, метода редукции и т.п., которые составляют методику генерирования семантического значения текста.
Метод компонентного анализа ставит целью выявление предельных составляющих (компонентов) языковой единицы как дифференциальных признаков, способных отличать разные языковые единицы одного уровня друг от друга. Исходным положением при применении компонентного анализа на семантическом уровне является признание существования таких единиц, в которых данное содержание закономерно связывается с данным выражением [Основы … 1969: 6–7].
Классическими методами структурного анализа языковых единиц являются дистрибутивный, трансформационный анализы и анализ по непосредственно составляющим. Метод дистрибутивного анализа, основоположником которого является американский дискриптивист З. Харрис, опирается на понятие дистрибуции – общую совокупность всех возможных окружений исследуемого языкового объекта. Анализ предполагает вычленение текстовых единиц определенного текстового уровня, объединение их в соответствующие классы и установление отношений между выделенными классами [Русанівський 1965: 71–85]. Дальнейший анализ полученных результатов проводится с помощью метода анализа по непосредственно составляющим, авторами которого являются Ч.Хоккет, Р.Уеллз и С.Четмен. В основу этого анализа положена идея постепенного членения высказывания на составляющие, пределом которого является установление неделимых его единиц [Коптілов 1965: 86–97].  Неоднозначность определения текстовых единиц, установленная с помощью дистрибутивных моделей, уточняется на основании метода трансформационного анализа, при котором толкование языковой конструкции (т.е. перефразирование с сохранением смыслового инварианта) позволяет разграничивать значения многозначной текстовой единицы. Данный метод был разработан Н.Хомским и З.Харрисом [Перебійніс 1965: 98–107].
Одним из методов формализации при описании терминов, номенклатурных слов является метод редукции, основоположником которого стал Ф. Лаусбери, использовавшим его при сопоставительном описании систем родства у индейцев племен Омаха и Кроу. Суть данного метода состоит в индуктивном обобщении денотатов лексических единиц, передающих сложный тип родства, и дальнейшей заменой такой модели ключевым термином [Lounsbury 1961].  
При генерировании содержания всего текста в формальной лингвистике также используется также метод ситуативно-ролевого вывода, где микроситуации определяются как элементарные составляющие текста и задается их определенная последовательность, иерархическое наполнение соответствующими денотатами. Качественная детализация микроситуации осуществляется путем предварительного анализа "свободных” слов-наполнителей, сопровождающих опорные слова или словосочетания (атрибутивные, адвербиальные, именные) [Зубов 2007: 98].  
Формальное представление смысла текста через опорные слова и словосочетания (топики, смысловые вершины, дескрипторы, ключевые слова, фокальные точки, ядра и т.д.), которые пронизывают весь текст от начала до конца, сталкивается с рядом проблем. Использование трех основных методов – логических правил вывода, вывода с использованием семантических сетей или фреймов – не позволяет создать полноценную денотативную структуру всего текста, так как при ее моделировании привлекается эмпирическая информация, не содержащаяся в тексте [Новиков 1983: 70-71].  
Метод осевой согласованности, или семантической преемственности, предложенный Н.Н.Леонтьевой для автоматической обработки семантики текста, дает возможность разрешать локальную неоднозначность и проводить поиск антецедентов местоимений фундаментально, не основываясь на случайных или статистических закономерностях. На каждом локальном участке текста можно привлекать весь набор свойств и характеристик, которыми обладает к данному моменту рассматриваемая единица. Если дублирование и локальная полнота свидетельствуют о формальной связности текста, то осевая согласованность говорит о содержательной связности текста [Леонтьева 1981: 24–26].    
Дальнейшее истолкование экспертами смыслов и значений, составляющих содержание текста, предполагает исследование его эвфонетических, прагматических, идеологических, модальных, концептуальных и т.д. характеристик, базирующихся на результатах формального вывода вакуумного значения текста. При этом проводятся тесты на свободную интерпретацию текста, импликативный, вопросно-ответный тест [Кобозева 2007: 183–185] и пр.   
Метод описания семантики текстовых единиц с формулированием выводов, умозаключений, импликаций и т.п. возник в задачах моделирования понимания естественного языка в системах искусственного интеллекта. Идея применения правил логического вывода к анализу текстов заимствована из формальной логики. При семантико-логическом анализе каждое правило вывода устанавливает, при каких условиях одна формула (лингвистическая модель), называемая заключением правила, может быть выведена из некоторых других формул, называемых посылками правил [Дикарева 1987: 30–31].
В процессе исследования текста лингвист-эксперт сталкивается с рядом проблем компонентного, функционального и комбинаторного характера. При дистрибуции слов и исследовании их как минимальных смысловых единиц текста затруднительным является определения основного значения отдельно взятого слова. "Основным значением слова является такое из его значений, которое наиболее обусловлено парадигматически и наименее – синтагматически” [Шмелев 2006: 212]. Известно, что основное значение слова может генерироваться из дифференциальных или интегральных признаков, например: общие признаки слова "стол” – предмет мебели, с широкой доской, с ножкой или ножками; несовпадающие признаки слова "стол” – горизонтальное положение доски, древесина, используется для того, чтобы что-либо класть и т.д., происхождение которых основано на функционально-оценочном опыте человека [Залевская 2005: 176]. При вычленении основного значения слова из его производных значений, сложность составляет разнообразие способов наращивания семантики первичного значения – как лингвистических, так и экстралингвистических. Так, изменения в семантике слова могут происходить в результате прикрепления этого слова к более конкретному и "специальному” действию или явлению (плакать – плачущая ива), в результате уподобления отвлеченных явлений конкретным предметам, признакам, действиям (порог – болевой порог); в результате устойчивости/ неустойчивости в историческом плане (принтер/ материнская забота – материнская плата), при обозначении совокупности объектов существительным в единственном числе (зал зааплодировал); происходить по метонимическим моделям (целое – часть, материал – предмет из данного материала, действие – результат, имя собственное – имя нарицательное и др.) или метафорическим моделям (на сходстве или подобии функции, формы означаемых явлений) и т.п.  В семантике одного и того же слова возможны различные типы семантических связей (бросить камень, бросить взгляд, бросить жену, бросить курить). Значения эмоций могут быть выражены словами, которые сами по себе обозначают определенные эмоции и переживания (любить, тосковать); словами, эмоциональная значимость которых создается при помощи словообразовательных средств (песочек, здоровущий); словами, в собственно лексическом значении которых заключена определенная оценка обозначаемых ими явлений (тунеядец) [Петровский 1959: 246]. Как в диахроническом так и синхроническом плане возможны относительно регулярные (толкать → двигать) и нерегулярные (лиса → зверь, рыжий, хитрый) соотношения между разными значениями слов. Наконец, анализируемое слово может входить в словосочетание, которое является фразеологизмом, для которого характерна семантическая нерасчлененность значения (водить за нос – обманывать). В таком случае целесообразной является замена фразеологизма семантически тождественным словом-синонимом [Новиков 1983: 27].
    Эксперты сталкиваются с функционально-семантическими проблемами исследования текста. Лексическая и синтаксическая неполнота текстовых единиц, возникшая, например, вследствие замены полнозначных слов местоимениями или употребления эллиптических предложений, приводит к смысловой недоопределенности, что влечет за собой смысловую компрессию на поверхностном текстовом уровне [Леонтьева 1981: 24–26]. Например,   
    А если уж слишком поэта доймет
            Московский, чумной, девятнадцатый год, –  
            Что ж, – мы проживем и без хлеба!
             Недолго ведь с крыши – на небо.
                                              (М. Цветаева),
где "недолго ведь с крыши – на небо” – эллиптическое предложение, в котором отсутствует часть языковой формы, необходимая для передачи полного объема содержания текста, что ведет к частичной недоопределенности извлекаемой из текста информации.      
    Таким образом, решение проблем неоднозначной интерпретации текста в современных экспертных лингвистических системах основано на результатах формального вывода значения текста с последующим процедурным приращиванием его смыслов. Линейное и вертикальное генерирование значений единиц текста осуществляется с помощью классических методик структурного анализа, их усовершенствованных вариантов, а также методов формальной логики. Процесс формального текстового анализа осложнен рядом экстралингвистических и функциональных факторов, являющихся предметом дальнейших лингвистических исследований.       



ЛИТЕРАТУРА
Алефиренко Н.Ф. (2005). Спорные проблемы семантики: Монография. – М.: Гнозис.
Апресян Ю.Д. (1974). Лексическая семантика. – М.: Наука.
Баранов А.Н. (2004). Теория лингвистических экспертиз как направление прикладной лингвистики. – http://www.dialog-21.ru/Archive/2004/Baranov.htm
Виноградов В.В. (1954). Некоторые задачи изучения синтаксиса простого предложения // Вопросы языкознания. №1. – М. – С. 3–29.
Гак В.Г. (1976). О семантическом инварианте предложения // Проблемы синтаксической семантики. Материалы науч. конф. – М.: МГПИИЯ им. М.Тореза. – С. 22–26.
Гак В.Г. (1977). К типологии лингвистических номинаций. Языковая номинация. – М.: Наука. – С. 230–293.
Гарпушкин В.Е. (1977). Прагматический аспект знаков и человеческое взаимопонимание // Философские науки.  №1. – С.132–143.
Дикарева С.С. (1987). Семантика анафоры // Структурная и прикладная лингвистика: Сб. ст. – Вып. 3. – Л.: ЛГУ им. Жданова. – С. 29-35.
Жинкин Н.И. (1970). Замысел речи. Планы и модели будущего в речи (материалы к обсуждению). – Тбилиси. – С. 13–15.
Залевская А.А. (2005). Психолингвистические исследования. Слово. Текст: Избранные труды. – М.: Гнозис.
Зубов А.В., Зубова И.И. (2007). Основы искусственного интеллекта для лингвистов. – М.:Логос.
Кацнельсон С.Д. (1972). Типология языка и речевое мышление. – Л.: Наука.
Кобозева И.М. (2007). Лингвистическая семантика. – М.: КомКнига.
Коптілов В.В. (1965). Метод безпосередніх складників // Проблеми та методи структурної лінгвістики: лекції, прочитані на республіканському семінарі викладачів мовознавчих кафедр педагогічних інститутів Української РСР. – К. – С. 86–96.
Костюшкина Г.М. (1981). Формально-семантическое выделение некоторых видов придаточных предложений во французском языке (на материале придаточных, вводимых формантом qua). Автореф. дис. канд. филол. наук. – Л.
Кушнерук С.П. (2007). Документная лингвистика. – Волгоград: ГЛЭДИС.
Левицкий Ю.А. (2006). Лингвистика текста. – М.: Высшая школа.
Леонтьева Н.Н. (1981). Семантика связного текста и единицы информационного анализа // Информационный анализ. – НТИ, Сер.2. – №1. – С. 21-29.  
Новиков А.И. (1983). Семантика текста и ее формализация. – М.: Наука.
Основы компонентного анализа: Уч. пособ. (1969) / под ред. Э.М. Медниковой. – М.: МГУ.
Перебійніс В.І. (1965). Трансформаційний аналіз // Проблеми та методи структурної лінгвістики: лекції, прочитані на республіканському семінарі викладачів мовознавчих кафедр педагогічних інститутів Української РСР. – К. – С. 98–107.   
Петровский В.И. (1959). О стилистической дифференциации лексики современного русского языка. – Львов.
Пиотровский Р.Г. (1999). Лингвистический автомат и его речемыслительное обоснование. – Минск: Изд-во МГЛУ.
Русанівський В.М. (1965). Дистрибутивний аналіз // Проблеми та методи структурної лінгвістики: лекції, прочитані на республіканському семінарі викладачів мовознавчих кафедр педагогічних інститутів Української РСР. – К. – С. 70–85.
Телия В.Н. (1986). Коннотативный аспект семантики номинативных единиц. – М.: Наука.
Тулдава Ю. (1987). Проблемы и методы квантитативно-системного исследования лексики. – Таллин: Валгус.
Шмелев Д.Н. (2006). Проблемы семантического анализа лексики. – М.: КомКнига.
Шрейдер Ю.А. (1976). Текст, автор, семантика // Семиотика и информатика. – М.: ВИНИТИ. – С. 153–169.
Lounsbury F.G. (1961). Equivalence principles of reduction rules in the analysis of kinship systems / Paper report at the annual meeting of American Anthropological Association. – Philadelphia.
Quine W. (1973). The Roots of Reference. – L.





Категория: Мои статьи | Добавил: Helen (08.01.2010)
Просмотров: 2030 | Рейтинг: 5.0/5
 
 
Категории раздела
Мои статьи [8]

Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0

Форма входа

Поиск

 

Copyright MyCorp © 2020