ГлавнаяРегистрацияВход www.багумян.рф Четверг, 01.10.2020, 10:11
  Каталог статей Приветствую Вас Гость | RSS

 
 
Главная » Статьи » Мои статьи

ЛІНГВІСТИЧНА МОДЕЛЬ ЯК ІНСТРУМЕНТ ТЕКСТОВОГО АНАЛІЗУ
ЛІНГВІСТИЧНА МОДЕЛЬ
ЯК ІНСТРУМЕНТ ТЕКСТОВОГО АНАЛІЗУ


БАГУМЯН О.В.


  The article introduces some basic concepts and issues of modern text analysis in terms of  linguistic models that generate a set of morphological, syntactic, lexical or semantic units derived in a text. Naturally, before any real text modeling is to be done, a text needs to be segmented at least into linguistic units of different levels. The analysis is a process of finding the hierarchical organization of incoming text constituents that more closely relates to its expected  structure and is applicable to other text processing problems.  
  У статті розглядається методика текстового аналізу через поетапне моделювання його одиниць на морфологічному, синтаксичному, лексичному та семантичному рівнях, що проводиться з метою встановлення текстової структури для практичного використання набутих даних.

  На відміну від лінгвістичних досліджень XIX і початку XX ст. сучасна наука не обмежується спостереженнями за мовними об'єктами й міркуваннями з приводу цих спостережень з подальшим висуненням гіпотез без їхньої перевірки. Ці процедури є лише початковим етапом пізнання істини. Наступний, креативний, етап дослідження передбачає побудову відповідних лінгвістичних моделей як інструмента опису та вивчення гносеологічних і онтологічних характеристик оригіналу. Перевірка ефективності створеної моделі є підсумком проведеного мовного аналізу [Пиотровский 2006: 131–140].
  Одним з таких мовних об'єктів є текст, що вивчається з метою відбору з нього необхідної інформації для подальшого її використання. На сучасному етапі розвитку лінгвістики набуває дедалі більшої актуальності думка про системну цілісність тексту [Воробьова 1993: 14]. Його розглядають як ієрархічне утворення [Перебейнос 1962: 163–165], що інтегрує взаємодіючі підсистеми [Тураева 1986: 15–18]. Цілісність тексту досягається через взаємозв’язки форми змісту і форми вираження [Мороховская 1989: 101–108] та  екстралінгвістичність його характеристик [Бабенко 2004: 52–74]: різнорівневі текстові одиниці поєднуються декількома лексичним, граматичним, логічним, стилістичним і т.ін. видами зв'язку [Гальперин 1981: 18].
  Актуальність цієї статті визначається зверненням до питання про теоретичні основи лінгвістичного аналізу тексту шляхом його поетапного моделювання на морфологічному, синтаксичному, лексико-семантичному рівнях, що уможливлює вивчення тексту як системної цілісності. Метою дослідження є узагальнення структурних та функціональних властивостей лінгвістичних моделей, що використовуються для вивчення різноманітних аспектів тексту.            
  Якщо ми хочемо зрозуміти текст, встановити його авторство, визначити описані в ньому культурні традиції, відібрати приховану в тексті інформацію, перекласти або анотувати його, перед нами постає необхідність проведення текстового аналізу. Під "текстовим аналізом”  розуміють "певний комплекс прикладних процедур переходу від фрагмента тексту до його структури” [Уилкс 1983: 208] на поверховому й глибинному рівнях.  
Вибір форм і методів лінгвістичного аналізу зумовлюється доцільністю дослідження: аналізується те, що становить інтерес, випускаючи неважливе [Шенк 1983: 447].
  Незважаючи на таку вибірковість у підході до аналізу, існують обов'язковий етап переданалізу тексту і власне його аналіз, або допоміжний і базовий його етапи. Під час переданалізу відбувається попередня сегментація тексту й виокремлення в ньому одиниць кожного текстового рівня: морфологічного – морфем, синтаксичного – синтагм (словосполучень і пропозицій), лексико-семантичного – слів з денотативними і конотативними значеннями. Власне аналіз тексту може становити дистрибуцію, зіставлення, узагальнення, класифікацію відібраних одиниць, відповідні висновки [Уилкс 1983: 362– 364], моделювання одержаних результатів та їх перевірку.
  Зважаючи на системність тексту, його аналіз може проводиться поетапно (морфологічний→ 
лексичний→синтаксичний→стилістичний→когнітивний), паралельно (наприклад, одночасне вивчення семантичних і стилістичних характеристик) або рекурсивно (дослідивши морфологічні ознаки, перейти до семантичних, а потім знову повернутися до дослідження морфологічних ознак для уточнення синтаксичних зв'язків між словами).
  Основними способами вивчення тексту є аналіз за аналогією (зіставлення зі словами, структурами, шаблонами), через асоціацію (встановлення концептів за ключовими словами, фреймовий аналіз), на підставі причинно-наслідкових зв'язків (глибинні відмінки), за спроможністю до певної трансформації (трансформаційне породження словосполучень і речень).
  Мета проведення аналізу визначає рівень достатності дослідження: повний аналіз, тобто багаторівневе дослідження тексту (наприклад, при автоматичному анотуванні, перекладі і т.ін.), або частковий  аналіз, при якому вивчається, як правило, лише одна характеристика текстової одиниці (наприклад, корекція орфографічних помилок, визначення синонімів, встановлення лише морфологічних або синтаксичних ознак).
  У процесі текстового аналізу відбувається гіпотетична наукова побудова деякої моделі, абстрактної конструкції дослідницьких дій, спостережень і висновків. У лінгвістиці на поняття "модель" не накладається особливих обмежень стосовно властивостей, які має об'єкт, що вивчається за допомогою цієї моделі [Пиотровский 2006: 132]. Логічна структура кожної моделі така, що дозволяє здійснювати формальні операції над усією сукупністю об'єктів. Щодо операцій, що є допустимими для даної моделі, всі об'єкти поділяються на три типи: а) вихідні об'єкти, які задані ззовні й до яких можуть застосовуватися операції (у нашому випадку – тексти); б) проміжні об'єкти, до яких застосовуються операції і які самі виникають у результаті застосування операцій (текстові різнорівневі одиниці); в) кінцеві об'єкти, які є наслідком операцій (парадигми ознак, тематичні групи, концепти та ін.) [Ревзин 1962: 12].
  З погляду епістемології моделювання тексту метод його вивчення націлено на пізнавальну настанову. Такий текстовий аналіз орієнтовано на узагальнення й класифікацію окремих встановлених у тексті фактів з метою виявлення загального закону, якому вони підпорядковуються. Ця настанова виявляється в таких правилах вибору та побудови моделі, а також аналізу результатів її роботи:
1. Модель – це спрощений аналог об'єкта, що вивчається, особливий засіб відображення об'єктивної дійсності.
2. Модель не може бути складнішою за оригінал, проте не може бути і примітивною.
3. Побудова моделі ґрунтується на принципі економії і логічної коректності.
4. Універсальність моделі полягає в можливості її використання під час аналізу схожих об'єктів.
5. Експланаторність моделі дозволяє пояснювати й передбачати нерозкриті властивості об'єктів.
6. Модель повинна містити в собі евристичні можливості, тобто давати такі знання, які самі стають джерелом виявлення нових фактів, побудови нових теорій [Пиотровский 2006: 133].
  Враховуючи той факт, що модель повинна відображати й відтворювати істотні особливості об'єкта, І.І.Ревзін пропонує розрізняти два основні типи лінгвістичних моделей: аналітичні (або аналізуючі) й синтетичні (або синтезуючі) [Ревзин 1962: 12]. Як відомо, до основних властивостей тексту належать його зв'язність і цілісність [Валгина 2004: 43-52]. Виходячи з цього, аналітичні моделі можуть бути застосовні на етапі текстової сегментації (дослідження категорії дискретності тексту).    Синтетичні моделі використовуються під час базового аналізу тексту (вивчення категорій завершеності, інформативності, єдності зовнішньої і внутрішньої форм, логічності й т.ін.) або аналізу одержаних даних  через вторинну текстопобудову: анотування, реферування або переклад тексту.
  Різновидом синтетичних моделей виступають парадигматичні моделі, які відображають способи поєднання окремих елементів у класи (наприклад, окремих морфів у морфеми) і синтагматичні моделі, в яких досліджуються відношення між елементами (наприклад, між окремими словами в складі словосполучень і речень).
Серед аналітичних моделей виокремлюються розпізнавальні моделі, цінність яких полягає в здатності відновлювати одиниці синтезу (наприклад, лексичні одиниці, які структурують відповідний концепт).
  Аналіз тексту – це не тільки дослідження мовних чи "омовлених” об'єктів (текстова інформація) у їх статичному стані, коли застосовуються розглянуті моделі, а й спостереження за процесами їх зміни з використанням моделей породження [Ревзин 1962: 15–16] або трансформації [Шаумян,  Соболева, 1963].
  Розгорнутість і послідовність тексту спричиняють розширення лінгвістичної моделі. Розширення моделі (метод розгортання) може спостерігатися, наприклад, при детальнішому дослідженні етимології метафори чи метонімії (під час лексико-семантичного аналізу), омонімії (при лексичному аналізі), у разі введення екстралінгвістичних фактів (наприклад, автобіографічних даних у ході лінгвостилістичного аналізу) тощо. До звуження моделі веде однорідність або синонімія одиниць: їх піддають згортанню з метою оптимізації структури тексту для подальшої його обробки (методика І.Севбо) [Севбо 1969].  
  Виходячи з факту єдності формальної, змістовної і комунікативної сторін тексту [Бабенко 2004: 255], на кожному етапі текстового аналізу повинна застосовуватися найприйнятніша лінгвістична модель (моделі), а саме така, при роботі з якою виводилися б результати, необхідні для проведення подальших етапів дослідження тексту.
  Невід’ємною частиною текстового аналізу є перевірка спроможності моделі використовуватися для подальшого аналізу тексту на підставі вже одержаних за її допомогою результатів або для здійснення вторинної текстопобудови.
Метою морфологічного аналізу є отримання граматичної інформації про лексичні одиниці тексту. Для цього проводиться розбиття слова на морфи, які зіставляють з морфами-шаблонами, після чого кожній лексичній одиниці приписують конкретну морфологічну категорію з визначеного набору її параметрів. Необхідність такого аналізу диктується потребами розробки різних методик, в яких кожному слову тексту надається «ярлик»,  що відповідає частині мови, до якої це слово належить [Беляева 2001: 104].
  Основною одиницею синтаксичного аналізу виступає синтагма (переважно двочленне поєднання словоформ або сегментів) з інформацією про її граматичну будову.   Синтаксичний аналіз є двохетапним: на першому етапі (внутрішньосегментний аналіз) встановлюються синтаксичні зв'язки словоформ усередині одного сегмента; на другому етапі (міжсегментний аналіз) з’ясовуються синтаксичні зв'язки між сегментами. Синтаксична структура словосполучення / речення зображується у вигляді дерева залежностей із пронумерованими стрілками, кожна з яких позначає відношення безпосереднього підпорядкування слів [Апресян 1966: 238–239]. Оскільки синтаксис проектується, виходячи з лексикону [Залевская 2005: 117], синтаксична організація речення може проходити не тільки на формально-граматичному, а й на семантичному або концептуальному рівнях [Филлмор 1983: 94]. У результаті проведеного дослідження синтагмі приписуються певні відношення в термінах синтаксичних і семантичних категорій і створюється база синтаксичних даних. Результати такого модельного синтаксичного аналізу послужили основою для розвитку нових методик, наприклад, передбачувального синтаксичного аналізу й методики пошуку опорних точок, методу фільтрів [Апресян 1966: 242–246], які дозволили вдосконалити сучасні автоматичні пошукові системи.   
  Під час лексико-семантичного аналізу встановлюються значення слова (денотатив і конотатив). Проте наявність великого масиву елементарних значень сама по собі ще не забезпечує семантичної зв'язності – необхідно враховувати парадигми граматичних  і синтаксичних категорій слів. Основною моделлю текстового аналізу, що використовується на семантичному рівні, є семантичне дерево (дерева), яке включає елементарні значення – вершини моделі й стрілки їх залежності. У сучасних розробках для подання семантичних даних використовують також структурні відмінкові схеми, за допомогою яких встановлюються й передаються відповідності між поверховими та глибинними відмінками – свого роду семантичними інваріантами [Моучек 2001: 44–45]. Саме семантичні моделі дозволили досліджувати конверсні відношення між словами (до цього розглядалися лише правосторонні та лівосторонні зв'язки). Семантичне моделювання стало поштовхом до розвитку методу текстового портретування, суть якого полягає в послідовному представленні «картинок», які в сукупності складають типову ситуацію, що позначається певним виразом [Апресян 1966: 252–264]. Наприкінці XX століття метод портретування був розвинений до фреймового представлення концептів і ролевої іконографії.
  Загальна модель стилістичного аналізу тексту складається з двох взаємопов'язаних модулів (або блоків [Стилистика 1991: 203]) – екстралінгвістичного й лінгвістичного. Екстралінгвістичний модуль включає емпіричний аналіз даних про автора та культурно-історичні особливості часу написання твору, що мають безпосереднє або опосередковане значення для дослідження тексту [Курс функциональной стилистики 2005: 4–6]. У лінгвістичному модулі відбувається визначення способів комбінування лексичних і синтаксичних одиниць (з урахуванням їх морфологічних особливостей) для створення стилістичних ефектів у творах того або іншого автора [Слама-Казаку 1983: 28]. Три основні стратегії проведення стилістичного аналізу – отримання даних про власне лінгвістичний аспект тексту, визначення прийомів текстового кодування авторських ідей і сприйняття текстової інформації потенційним читачем [Стилистика 1991: 21] – породжуються потребами практичного застосування одержаних результатів. Лінгвістичні класифікації стилів (жанрів) і мовних образів стають обов’язковими інформаційними базами даних для алгоритмізації автоматичного текстового аналізу й моделювання текстів, для розробки методик навчання мови й психологічного тестування, для подальшого розгляду когнітивного аспекту текстосприйняття і т.ін.
  Концептуальний аналіз художнього тексту передбачає визначення екстралінгвістичних характеристик тексту, важливих для формування його концептуального простору, проведення лексико-семантичного аналізу для виявлення набору ключових слів та їх концептуальних парадигм, проведення логіко-синтаксичного аналізу для встановлення зв'язків між концептами та їх складниками, моделювання структури концептосфери [Бабенко 2004: 111]. Концептуальний фрейм як базова модель когнітивного аналізу може не враховувати синтаксичних зв'язків, а представляти лексико-граматичне забезпечення (сценарні фрейми Мінського, Шенка, Абельсона) даного тексту для найменування й опису об'єктів і відношень між ними [Филлмор 1983: 110].  
  При системному (лінгвостилістичному або когнітивному) аналізі тексту на завершальному його етапі своєрідними фільтрами ефективності використання моделі виступають текстові категорії. Текстові категорії відіграють роль тих необхідних критеріїв правильності одержаних результатів, які перевіряються або під час імітації зворотного аналізу тексту – процесу вторинної текстопобудови, або шляхом вивчення адекватності реакції адресата. Принцип перевірки похідних текстів використовується в комп'ютерних програмах для автоматичної обробки текстів з метою їх анотування, реферування та перекладу.   Адекватність реакції адресата на повідомлення є кульмінаційним моментом у теорії стратегічної текстопобудови первинних текстів, що має прикладне значення у різноманітних сферах людської діяльності.                    
  Таким чином, завдання лінгвіста полягає не в тому, щоб описати досліджуване мовне явище та переконливо обґрунтувати вибір понять, що використовуються при цьому, а в тому, щоб змоделювати їхню структуру для пояснення процесів побудови й розуміння текстів людиною.

ЛІТЕРАТУРА

Апресян Ю.Д. (1966). Идеи и методы современной структурной лингвистики. – М.: Просвещение.
Бабенко Л.Г. (2004). Филологический анализ текста. Основы теории, принципы и аспекты анализа. – М.: Академический Проект; Екатеринбург: Деловая книга.
Беляева Л.Н. (2001). Лингвистические автоматы в современных информационных технологиях. – СПб.: Изд-во РГПУ им. А.И.Герцена.
Валгина Н.С. (2004). Теория текста. – М.: Логос.
Воробьева О.П. (1993). Текстовые категории и фактор адресата: Монография. – К.: Вища шк.
Гальперин И.Р. (1981). Текст как объект лингвистического исследования. – М.: Наука.
Залевская А.А. (2005). Психолингвистические исследования. Слово. Текст: Избранные труды. – М.: Гнозис.
Курс функциональной стилистики: Анализ текстов английского языка межкультурного общения /(2005). Сост. Г.И.Филимонова. – СПб.: Инфо-да.
Мороховская Э.Я. (1989). Взаимодействие грамматических категорий в тексте // Текст и его категориальные признаки: Сб. науч. тр./ КГПИИЯ. – К.
Моучек Р. (2001). Методы разработки семантических представлений в диалоговых системах // Материалы XXX научно-практической конференции преподавателей и аспирантов филологического фак-та СпбГУ. – СПб.
Папина А.Ф. (2002). Текст: его единицы и глобальные категории. – М.: Едиториал УРСС.
Перебейнос В.И. (1962). К вопросу об использовании структурных методов в лексикологии // Проблемы структурной лингвистики / Отв. ред. С.К. Шаумян. – М.: Изд-во АН СССР.  
Пиотровский Р.Г. (2006). Доказательно-экспериментальные черты новой лингвистической парадигмы // Материалы III Международной научной конференции «Прикладная лингвистика в науке и образовании»/ СпбРГПУ им. Герцена. – СПб.
Ревзин И.И. (1962). Модели языка. – М.: Изд-во Академии Наук СССР.
Севбо И.П. (1969). Структура связного текста и автоматизация реферирования. – М.: Наука.
Слама-Казаку Т. (1983). Место прикладной лингвистики в системе наук: отношени ПЛ к «лингвистике» // Новое в зарубежной лингвистике: Сб. – Вып.XII. Прикладная лингвистика / Сост. В.А.Звегинцева. – М.: Радуга. – С.23–72.
Стилистика английского языка (1991). / А.Н.Мороховский, О.П.Воробьева, Н.И.Лихошерст, З.В.Тимошенко. – К.: Выща школа.
Тураева З.Я. (1986). Лингвистика текста. – М.: Просвещение.
Уилкс Й. (1983). Анализ предложений английского языка // Новое в зарубежной лингвистике: Сб. – Вып.XII. Прикладная лингвистика / Сост. В.А.Звегинцева. – М.: Радуга.– С.318 – 372.
Филлмор Ч. (1983). Основные проблемы лексической семантики // Новое в зарубежной лингвистике: Сб. – Вып.XII. Прикладная лингвистика / Сост. В.А.Звегинцева. – М.: Радуга., – С.74 – 122.
Шаумян С.К.,Соболева П.А.(1963). Аппликативная порождающая модель и исчисление трансформаций в русском языке. – М.
Шенк Р., Лебовиц М., Бирнбаум Л. (1983). Интегральная понимающая система // Новое в зарубежной лингвистике: Сб. – Вып.XII. Прикладная лингвистика / Сост. В.А.Звегинцева. – М.: Радуга. – С.401 – 449.

  

Категория: Мои статьи | Добавил: Helen (08.01.2010)
Просмотров: 1977 | Рейтинг: 5.0/6
 
 
Категории раздела
Мои статьи [8]

Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0

Форма входа

Поиск

 

Copyright MyCorp © 2020