На правах рукописи
КОЗЬМИН АРТЕМ ВИКТОРОВИЧ
Структурно-семантический указатель фольклорных сюжетов Компьютерная модель установления связей между текстом и единицами его описания
Специальность 10.01.09 – "Фольклористика"
Автореферат
диссертации на соискание ученой степени
кандидата филологических наук
Москва 2003
Работа выполнена в Институте высших гуманитарных исследований
Российского государственного гуманитарного университета
Научный руководитель:
доктор филологических наук, профессор С.Ю. Неклюдов
Официальные оппоненты:
доктор филологических наук В.Л. Кляус
кандидат филологических наук Г.А. Левинтон
Ведущая организация:
Институт антропологии и этнографии РАН (Кунсткамера)
Защита состоится "30" декабря 2003 г. в ___ часов на заседании диссертационного совета Д. 212.198.04 в Российском государственном гуманитарном университете по адресу: 125267, Москва, Миусская пл., 6
С диссертацией можно ознакомиться в библиотеке Российского государственного гуманитарного университета.
Автореферат разослан " " ____________ 2003 г.
Ученый секретарь
диссертационного совета,
доктор филологических наук,
профессор Д.М. Магомедова
Постановка проблемы
В отличие от текста литературного фольклорный текст не воспроизводится в неизменном виде, каждое исполнение создает новый вариант. Фольклористика как наука имеет дело с огромными и постоянно расширяющимися массивами записей; при этом отдельная запись не может сколько-нибудь полно репрезентировать фольклорный текст, реализацией которого она является, необходимо сопоставление записей. Существуют сборники, описывающие этнические традиции, собрания, составленные по жанровым признакам (например, метризованные тексты, эпос, сказки, несказочная проза и т. д.), наконец, коллекции, систематизированные по исполнителям. Однако часто этого оказывается недостаточно. Во многих случаях требуется опора на содержание текстов, а не на его "внешние" критерии. Впервые эта задача была поставлена при создании сюжетно-мотивных указателей фольклорных текстов. Как правило, эти указатели ориентированы на описание определенных жанровых групп, самой многочисленной из которых являются сказки (в широком и не очень точно определенном смысле). Попытки упорядочения сказочного материала были и в XIX в., однако, систематическая деятельность по написанию указателей началась лишь с выходом указателя А. Аарне (1910 г.), в дальнейшем усовершенствованного С. Томпсоном.
Основной единицей описания в указателях данного типа является сюжет. Предполагается, что это некоторая целостная сущность, автономно существующая в фольклорной традиции. Выделение сюжетов как единиц указателя базируется на обнаружении текстов, схожих по содержанию, содержание же рассматривается прежде всего как описание некоторых событий, со своим началом и логическим завершением в рамках данного текста. Соответственно, указатель по системе Аарне – это определенным образом структурированный список сюжетов со ссылками на публикации сказок, имеющими соответствующий сюжет. Кроме того, существует шеститомный указатель мотивов С. Томпсона. Мотивы при этом понимаются как некоторые мельчайшие семантические элементы традиции самой разной природы. Основной критерий их выделение – повтор такого "семантического пятна" в разных текстах и традициях. Еще один интенсивно разрабатываемый исследователями вид указателей – указатели сюжетов несказочной прозы.
Любой указатель включает три компонента: структурированный набор единиц описания, ссылки на тексты и, опосредованно, сам фонд описанных в указателе фольклорных записей. Фактически указатель представляет собой "уменьшенную копию", модель всей фольклорной традиции, разумеется, в одном из ее аспектов. Эта структура общеизвестна, но до сих пор не описана в теоретическом плане. Для каждого компонента данной структуры существуют свой круг теоретических и практических проблем:
Указатели. Какую информацию можно получить о фольклорной традиции, используя этот инструмент? Каков статус единиц описания в указателях, являются ли они только исследовательскими конструктами? Как устранить недостатки, связанные с непоследовательной классификацией сюжетно-мотивных единиц, не перерабатывая существующие указатели? Как облегчить работу с ними – прежде всего в том, что касается поиска сюжетов по определенным критериям?
Ссылки. Как можно установить, что данный текст является реализацией того или иного сюжета или в нем присутствует тот или иной мотив? Можно ли сформулировать правила, позволяющие соотносить тексты с теми или иными сюжетно-мотивными единицами?
Тексты. Какие внутренние структуры можно обнаружить в фольклорных текстах, пользуясь указателями как исследовательским инструментом?
Цели и задачи исследования
Указатели, работа над которыми идет на протяжении десятилетий, незаменимый инструмент для исследователей со всего мира, подвергались и подвергаются заслуженной критике. Эта критика касается прежде всего эмпиризма при выделении единиц описания, таких как сюжеты и мотивы, и произвольной классификации этих единиц. Неоднократно предпринимались попытки выдвижения теорий, которые позволили бы создать сюжетно-мотивные указатели, лишенные всех этих недостатков. К сожалению, пока не создано систем, основанных на этих теориях и сравнимых по охвату материала со "старыми" указателями, такими как указатель Аарне-Томпсона (далее AaTh). Как показала многолетняя практика, сложности, которые возникают при выделении и классификации единиц описания, проистекают не из слабости или отсутствия теории, а из объективной сложности устройства самой фольклорной традиции. Другой круг проблем касается описания текстов в соответствии с указателями. При публикации новых текстов принято указывать, к каким сюжетам по AaTh они относятся, однако основания для такой обработки фольклорных записей не получили до сих пор теоретической экспликации. Исходя из этого, целью работы является создание теоретических инструментов, которые позволили бы преодолевать недостатки существующих указателей, оставляя их, однако, в том виде, в котором они существуют в настоящий момент, поскольку отказаться от их использования – значит потерять результаты многолетней работы исследователей. Другая задача тесно связана с первой – предложить теоретически обоснованные правила описания фольклорных текстов при помощи сюжетно-мотивных единиц. Наконец, все эти теоретические инструменты направлены на получение новых результатов, относящихся к функционированию фольклорной традиции.
Актуальность темы исследования
В настоящее время создано множество указателей для самых разных традиций. Работа над новыми указателями ведется разными исследовательскими группами во многих научных центрах. Следует ожидать, что с привлечением все большего и большего фольклорного материала значимость этого инструментария возрастет. Указатели являются повседневным инструментом в работе любого фольклориста. В то же время, существующие указатели отмечены многими недостатками и с трудом "увязываются" в единую систему, теоретически продуктивную и практически удобную; требуется создание концептуального каркаса, который позволил бы объединить в такую систему существующие указатели. Другим недостатком является отсутствие критериев, по которым связываются единицы описания в указателе и конкретные фольклорные тексты. Этот круг проблем разработан недостаточно, что может препятствовать практической деятельности фольклористов, прежде всего издательской. Поскольку всякий указатель является прежде всего рабочим инструментом, новые теоретические положения должны быть, безусловно, воплощены в конкретном научном продукте, имеющем практическое применение.
Новизна исследования
В работе теоретически обоснована и практически реализована система, позволяющая интегрировать в себя существующие указатели. Разработаны инструменты для получения разнообразных сведений о фольклорной традиции с использованием этой системы; предложены эксплицитные алгоритмы установления ссылок от указателей к фольклорным текстам. Насколько известно, все это сделано впервые в научной практике, как отечественной, так и мировой. Также впервые исследованы многие особенности строения сказок и распределения фольклорных сюжетов.
Научно-практическая значимость исследования
Практическим результатом исследования являются: электронная версия "Сравнительного указателя сюжетов. Восточнославянская сказка" (далее СУС), снабженная дополнительными, по сравнению с печатной, возможностями; электронные версии указателей демонологической прозы; система навигации по данным указателям. Также в электронном виде представлены тексты сказок, обработанные с использованием разнородных единиц описания, в том числе пропповских функций. Все эти электронные продукты размещены в свободном доступе в сети Интернет. Таким образом, для широкого круга исследователей стал доступен целый комплекс справочных материалов по сказкам и демонологической прозе.
Наглядность и удобство работы с этими продуктами позволяют использовать их как для исследовательских целей, так и в процессе преподавания фольклористики, а также других филологических дисциплин, связанных с анализом текста.
Многообразие информации, которая предоставляется читателям фольклорных текстов, как они представлены в системе, показывает плодотворность использования подходов, предложенных в работе, в эдиционной практике с использованием компьютерных инструментов.
Система принципиально расширяема и постоянно пополняется новыми материалами, это позволяет надеяться, что в ее рамках будут объединены все существующие на данный момент русскоязычные сюжетно-мотивные указатели.
Методологические основы исследования
Поставленные в исследовании задачи потребовали привлечения не только филологических методов, но также формально-семантического и компьютерного инструментария. Таким образом, оно опирается на результаты современных структурно-семиотических исследований, восходящих к В.Я. Проппу, прежде всего на работы Е.М. Мелетинского, С.Ю. Неклюдова, Е.С. Новик, Б.Н. Путилова, А. Дандеса, К. Бремона.
Привлекались также методы лингвистики текста и анализа дискурса (работы Е.В. Падучевой, С.И. Гиндина, Т.А. ван Дейка и др.).
Компьютерный инструментарий использует методологию структурной разметки текстов, в наиболее общем виде разрабатываемую World Wide Web Consortium (Т. Беннерс-Ли и др.).
Материал
В работе были обработаны все волшебные сказки из сборника А.Н. Афанасьева, Сравнительный указатель сюжетов восточнославянской сказки, указатель сюжетов сказок Аарне-Томпсона, все доступные на данный момент на русском языке указатели демонологической прозы, и некоторые другие материалы.
Апробация работы
Отдельные положения диссертации были представлены в виде докладов, обсуждавшихся на следующих научных конференциях и форумах: "Проблемы создания структурно-семантического указателя фольклорных сюжетов: электронные версии" (ИВГИ РГГУ, март 2001 г.), "Девятые Лотмановские чтения: Семиотика и типология устных традиций" (ИВГИ РГГУ, декабрь 2001 г.), Конференция по компьютерной лингвистике ДИАЛОГ-2002 (Москва, июнь 2002 г.), семинар "Формовка детского писателя: среда, рычаги и стимулы" (СПбГУКИ, декабрь 2002 г.), Летняя школа по типологии фольклора (В. Новгород, май 2003 г.), а также на постоянно действующем семинаре ИВГИ РГГУ "Фольклор и постфольклор: структура, типология, семиотика", и на заседании сектора этнолингвистики и фольклора Института славяноведения РАН (Москва, ноябрь 2003 г.).
Исследование послужило основой для ряда учебных заданий, которые использовались при преподавании курса общей фольклористики на историко-филологическом факультете Института филологии и истории РГГУ.
Программные продукты размещены в открытом доступе в сети Интернет (http://www.ruthenia.ru/folklore/indexes.htm).
По материалам диссертации опубликовано шесть статей (см. список на с. 26).
Структура работы
Диссертация состоит из введения, трех глав и заключения.
Содержание работы
Во Введении рассматривается история вопроса, описываются существующие на данный момент указатели, излагаются разные подходы к их построению, ставятся цели и задачи исследования. Указатели рассматриваются как инструменты, описывающие содержание больших массивов фольклорных текстов. Как показывает рассмотрение структуры существующих указателей сказочной и несказочной прозы, чему посвящена значительная часть Введения, четко выделяются три круга проблем. Это прежде всего проблемы, связанные с классификацией единиц описания в указателе, со структурой указателя как такового. Данные вопросы весьма подробно разработаны в литературе, причем наибольшую критику вызывают как раз указатели по системе AaTh, охватывающие огромный материал. Методы описания сюжетов, предложенные В.Я. Проппом, хотя и гораздо менее эмпирические, чем те, которые использованы в указателях системы AaTh, направлены на решение других задач. Существует немало попыток применения пропповской методологии в указателях. Однако построенные на таких принципах системы пока не приблизились к "старым" указателям по охвату материала. Таким образом, необходимы инструменты, не заменяющие существующие системы, а включающие их в себя, преодолевающие их недостатки.
Другой круг проблем связан с установлением соответствий между единицами описания, такими как мотивы и пропповские функции, с одной стороны, и фольклорными текстами, с другой. Эти проблемы могут быть кратко проиллюстрированы при помощи следующих вопросов: "Откуда мы знаем, что в этой сказке есть мотив "бой со змеем"? В каком месте текста этот мотив отражен? Можно ли это строго обосновать?" Такие вопросы постоянно встают перед любым исследователем, имеющим дело с конкретными текстами. Как правило, подобные проблемы решаются при помощи некоторых интуитивных критериев. Однако если сформулировать эти критерии явным образом, то работа исследователей станет более согласованной. Это согласование необходимо, поскольку объем текстов очень велик, а работа по их описанию при помощи таких единиц, как мотивы, ведется разными исследователями, имеющими разные методологические установки.
Наконец, единицы описания, "наложенные" на текст, обнаруживают и его внутренние структуры. При этом набор единиц (например, список пропповских функций) задан заранее, а не выделяется в процессе анализа. Данные единицы должны быть соотнесены с определенными сегментами текста. Насколько произвольно такое сегментирование, соответствует ли оно реальной структуре текста или является результатом исследовательского произвола? Какие особенности строения сказки оно позволяет обнаружить? Это третий круг проблем, решаемых в ходе исследования.
Первая глава "Установление соответствий между единицами описания в указателе и фольклорными текстами" посвящена наименее разработанному кругу проблем – связям между единицами описания и текстами.
В указателях типа AaTh основной единицей описания является сюжет, который в идеале должен соответствовать целой сказке. В реальности сюжет не является далее неразложимой сущностью, в нем могут быть выявлены отдельные "ходы" или же мотивы указателя С. Томпсона.
Таким образом, для определения сюжета, к которому относится текст, необходимо выделить в тексте единицы, в сущности, более мелкие, чем он сам. Эти единицы, такие, как функции В.Я. Проппа и мотивы указателя C. Томпсона, теснее всего связаны с конкретными записями. Только после анализа текста при помощи таких единиц следует переходить к определению сюжета. Благодаря подобному сегментированию связи "сюжет – тексты" становятся более определенными – каждый сюжетный элемент соотносится с определенным фрагментом текста. Примеры, когда текст разбивается на фрагменты в соответствии с разбиением сюжета на функции, есть и в книге В.Я. Проппа и, например, в одной из работ Э. Кенгас-Маранда. Однако не существует работ, в которых описывались бы критерии выделения таких фрагментов.
Для такого сегментирования нужно указать свойства сюжетно-мотивных единиц, которые позволяют устанавливать связи между ними и текстом. В основу классификации, на которую опирается сегментирование текста, могут быть положены различия в структуре сюжетно-мотивных единиц. Сначала рассматриваются мотивы. Первую группу составляют мотивы с четко выраженной актантной структурой; они всегда включают несколько персонажей – участников одного действия, например, "низкая героиня вступает в брак с принцем (королем)".
В другую группу входят мотивы, приписывающие персонажу некоторый признак; их можно назвать мотивами-признаками: "жестокая мачеха", "существо с тремя глазами" и т. п. Семантически это признаки, которые мыслятся как статические, персонаж обладает ими в течении длительного времени, предикаты же первой группы описывают события, они являются динамическими.
Третью группу можно назвать мотивами-актантами. В сущности, речь идет о персонаже, природа которого подразумевает наличие определенного набора качеств и определенного круга действий. Скажем, мотив "змей" имплицитно содержит следующие компоненты: змей может иметь много голов, изрыгать пламя, летать, похищать людей и т. д.
Что касается других единиц описания – функций В.Я. Проппа, то их структура более прозрачна. Основой определения функции является действие. Хотя персонажи в разных сказках меняются, эти действующие лица могут быть отнесены лишь к 7 типам (герой, вредитель, даритель и т. д.), в зависимости от того, в каких действиях – функциях они принимают участие. Таким образом, чтобы описать функцию, нужно указать действие и его участников. По своей внутренней структуре функции В.Я. Проппа совпадают с мотивами, включающими нескольких участников. Важно, что функция определяется не только семантикой действия, но и тем, какое место это действие занимает в развертывании сюжета. В частности, "схватка с враждебным дарителем" отличается от "боя с вредителем" фактически только положением в цепочке функций: встреча с дарителем должна предшествовать борьбе с основным антагонистом. Между тем с точки зрения описания мотивов, речь скорее должна идти об одной единице описания.
С точки зрения сегментации текста, первое, на что стоит обратить внимание, это актантная структура мотивов и функций: они указывают на взаимодействие главного героя с другими персонажами-актантами. Исходя из этого, можно считать признаком для начала фрагмента, соответствующего одной из таких функций (или мотивов), появление нового персонажа-выполнителя.
Для единиц описания, прежде всего для мотивов, которые фактически свернуты до обозначения актантов ("змей", "великан", "чудовище") четкое выделение вряд ли возможно, такие единицы как бы "размазаны" по всему тексту.
Мотивы-признаки могут также реализоваться как наименования персонажей: мотив "герой, не подающий надежд" в сказке [Афанасьев № 131] реализуется в виде многократно использованного имени "Фролка-сидень", которое никак не поясняется. Выделение разного рода "свернутых" единиц основано на знании о "развернутых" случаях. "Сидень" обращает на себя внимание, поскольку известны герои, "биография" которых начинается с того, что они физически немощны, как, например, Илья Муромец, который сидел на печи "тридцать лет и три года".
Текстовая реализация предикатов, входящих в единицы описания, – случай более сложный, чем текстовая реализация актантов. Можно выделить несколько типов отношений между текстами и предикатами, используемыми в наименованиях единиц описания. Типы эти различаются степенью близости между языком текста и языком описания.
Метаязык, на котором формулируются названия вариантов функций, может быть лексически очень сходен с языком сказки: так, функции "бой на открытом поле" в тексте будут соответствовать такие слова, как "биться", "сражаться". Для нахождения фрагментов, реализующих предикаты единиц описания, можно использовать слова, близкие по значению к этим предикатам, без их глубокого семантического анализа.
Второй тип соответствий можно назвать денотативным. Описанная в тексте ситуация является одной из возможных реализаций функции, но слова, которые описывают такую ситуацию, ни в каком смысле не синонимичны названию функции. Например, "решение трудной задачи" может получить следующую реализацию: помощник охлаждает баню [Афанасьев № 138].
Третий тип соответствий между предикатами единиц описания и текстом требует обращения к актантам, которые могут связываться с этими предикатами. Если взять, например, функцию "свадьба" (то есть двухместный предикат "... вступает в брак с ..."), то ей в текстах сказок будут соответствовать, в частности, слова "царевна", "царица", "королевна", обозначающие "потенциальную невесту". Фактически при помощи слов-сигналов, соответствующих предикатам единиц описания, в тексте можно находить не варианты функций, а мотивы. Более того, если похожие наборы слов встречаются во фрагментах, соответствующих разным вариантам функций, это означает, что фрагменты текста, реализующие данные функции, в то же самое время содержат одинаковые мотивы: функции "схватка с враждебным дарителем" и "бой с вредителем" соответствуют мотиву "бой с чудовищем".
Поскольку одинаковые семантические единицы встречаются в разных текстах и сюжетах, следовало бы ожидать, что соответствующие текстовые фрагменты также могут иметь признаки относительной автономности, замкнутости в рамках текста, аналогично абзацам письменной литературной речи. Действительно, такие случаи обнаруживаются. В главе приводятся примеры, когда границы могут быть проведены с опорой на изменение видо-временных форм глагола или в соответствии с началом прямой речи.
Следует заметить, что строение устного текста, вероятно, принципиально изменяется при его переводе в письменную форму, и признаки, позволяющие членить его на "абзацы" также должны существенно изменяться. Однако можно предположить, что подобному разбиению поддается и устный текст.
В главе выделены следующие типы отношений между единицами описания (мотивами и функциями) и текстом:
- одна единица соответствует одному текстовому фрагменту;
- одна единица соответствует нескольким текстовым фрагментам;
- несколько единиц соответствует одному и тому же фрагменту.
В текстах имеют место все подобные случаи, однако, у них разная функциональная нагрузка.
Тип отношения "одна единица – один фрагмент" соответствует сюжетообразующей функции таких единиц. Текст складывается как цепочка сюжетных элементов. В этом случае пропповская функция и мотив фактически совпадают.
При рассмотрении отношения "одна единица – много фрагментов" выделяется несколько подтипов. Первый подтип представляет собой повтор одинаковой единицы в разных сюжетных звеньях. Например, герой может многократно отправляться на борьбу с разными антагонистами в разных ходах сказки. Такая "экземплификация" соответствует специфике мотива – его способности реализовываться в разных контекстах, его относительной независимости от развертывания повествования. Наличие повторов на семантическом уровне указывает на инвариантное, независимое от сюжета, содержание. Это инвариантное содержание соотносится с моделью мира данного жанра.
Второй подтип отношения "одна единица – много фрагментов" включает в себя случаи "прерывистой" реализации одной единицы; в отличие от мотивов, для функций этот случай не очень характерен. Например, мотив "добрый и злой" реализуется в виде противопоставленных действий разных персонажей. Такая "дистантная" реализация единицы, как и повтор, указывает на существование некоторой семантической конфигурации, относительно независимой от линейного порядка текста.
Третий тип, "несколько единиц – один фрагмент", еще более сложен. Если обратиться к функциям, то "склеивание" нескольких функций исследовал сам В.Я. Пропп, говоря о "двойном морфологическом значении одной функции", рассматривая их с точки зрения развертывания сюжета.
Другие отношения могут связывать различные мотивы, что определяется, в частности, структурой указателя С. Томпсона. Мотивы в нем описываются иерархически, так что один мотив может конкретизировать другой.
Относительно простым является случай, когда в одном фрагменте реализуются два мотива, логически подчиненные друг другу, наппример: "вознагражденная вежливость" и "богатство как награда". Логическое подчинение не мешает тому, что обоим мотивам можно поставить в соответствие один и тот же фрагмент. Однако в случаях типа "низкий герой" и "низкий герой получает в жены царевну", возможно, следует говорить о том, что логическое подчинение сопровождается "вложением" фрагментов, например, в [Афанасьев № 139].
Еще более сложный случай:
Вот Ивашко посадил на ремни девицу из медного царства и затряс за ремень; братья потащили и вытащили девицу, а ремни опять опустили [Афанасьев № 128].
По AaTh этот фрагмент может быть сопоставлен следующим мотивам: "царевна, освобожденная из Нижнего мира"; "яма, ведущая в Нижний мир"; "яма, отверстие, источник или пещера, служащие входом"; "веревка, ведущая в Нижний мир". Ясно, что на уровне текста границы между этими единицами из указателя провести невозможно, несмотря на то, что отдельные слова могут быть тесно связаны только с одним из мотивов этого набора. Отношения между перечисленными мотивами сложны и скорее соответствуют глубинной семантике, только частично реализующейся в рамках цитируемой сказки (отношения между мирами; веревка, связанная, в частности, с комплексом "шаманской" мифологии, и т. д.).
Как соотносятся мотивы и функции между собой? Многие из функций, точнее, их вариантов, могут быть прямо сопоставлены с мотивами. Например, вариант функции "спасение героя" – "бросание гребешка и пр." фактически совпадает с мотивом "бегство, во время которого преследуемый бросает позади себя предметы, магическим образом превращающиеся в препятствие для преследователя". Соответственно, для этих функции и мотива соположенные им фрагменты совпадают [Афанасьев № 93].
Набор мотивов столь велик, что фактически для любого варианта функции можно подобрать соответствующий мотив. Однако для фрагментов это не совсем верно. Мотив в общем случае "мельче" функции (с точки зрения сегментирования текста).
Наконец, один и тот же мотив может фигурировать в разных частях сюжета, так что это приводит к "расслаиванию" одного мотива на разные функции. Мотив "птичий язык" в сказке [Афанасьев № 247] встречается в пределах мотивировки "пророчества, предвещания" и функции "решение задачи". Присутствие этого мотива указывает на специфику соответствующих функций – на их "информационную" природу.
Предложенные приемы установления соответствий между текстом и единицами его описания в значительной степени базируются на критериях разного порядка. Подобная "эклектичность" отражает специфику самих единиц описания. Набор таких единиц не полностью отражает структуру текста, их выделение основывается на изучении традиции в целом. Текстуализация сюжетно-мотивных единиц осуществляется при помощи самых различных средств – от отдельных лексем до развернутых эпизодов. Поэтому критерии выделения корреспондирующих фрагментов должны учитывать множество возможных случаев и работать на всех уровнях текста, от нарративного (семантика ситуаций) до языкового (частицы и грамматические показатели).
Вторая глава "Структура текста и единицы описания" посвящена тем структурам, которые обнаруживаются в текстах при применении инструментария указателей.
Исследование фольклорных текстов неотделимо от исследования повторов на разных уровнях. Прозаический текст, в отличие от метрического, предоставляет немного возможностей для формального выделения повторяющихся единиц, поэтому особенно важным становится семантическое членение текста. Аппарат пропповских функций дает богатые возможности для такой семантической сегментации.
Наиболее естественным представляется обращение к сказкам, состоящим более чем из одного хода, в которых по определению должны содержаться повторения функций. Другим случаем повторов функций будут повторы в пределах одного хода, например, утроения. Поэтому материалом для данного исследования послужили многоходовые сказки, описанные В.Я. Проппом в приложениях к "Морфологии сказки".
Прежде всего, текст сказок был разбит на фрагменты, соответствующие функциям, которые были указаны В.Я. Проппом в схематических записях этих сказок. После разбиения текста сказок на фрагменты, соответствующие повторяющимся вариантам функций в пределах одного текста, сами фрагменты сравнивались по числу входящих в них слов. Обнаружилось, что первый фрагмент в последовательности имеет длину в среднем 29 слов, второй – 20, третий – 19. Встречаются фрагменты, которые превышают по длине предшествующие, но не более чем на 10 слов, то есть на 1-2 предложения; таких случаев примерно десятая часть. Общая качественная тенденция очевидна: длина фрагментов в цепочке повторов убывает, хотя встречается и случаи, которые не подчиняются этой закономерности.
Случаи, когда последующий фрагмент длиннее предыдущего, объяснимы, если рассмотреть семантическую нагрузку повторов. В принципе, в повторе наибольший "вес" следует приписать последнему элементу, который является решающим в развитии сюжета – последний бой, последняя задача и т.п. Для спонтанной устной речи характерна закономерность, которую можно сформулировать следующим образом: "самое важное излагается дольше всего". Если учесть устный характер фольклорного текста, то случаи удлинения последующих фрагментов, вероятно, объясняются именно этой "риторической" особенностью спонтанной речи.
Обратная закономерность проявляется в подавляющем большинстве исследованных случаев: последующий фрагмент в повторе короче предыдущего. Повтор, особенно в фольклорном тексте, предполагает стереотипность не только содержания, но и выражения, а это может приводить к тому, что рассказчику достаточно один раз подробно изложить некий эпизод, чтобы в дальнейшем лишь напоминать ключевые детали, когда это требуется в случае повтора функции. Этим механизмом следует объяснить основную тенденцию к сокращению повторяющихся эпизодов.
Таким образом, вряд ли следует говорить о некоем жестком законе, характерном для жанра сказки. Скорее речь идет о двух различных механизмах, действие которых определяется как спецификой спонтанной устной речи, так и поэтикой фольклора с его стереотипностью. При этом второй механизм ("напоминание") гораздо сильнее, но им не определяются все случаи.
Как показано в первой главе, для сегментирования фольклорного текста в соответствии с такими единицами описания, как мотив и функция, необходимо выделение имен персонажей в тексте: имена действующих лиц маркируют фрагменты, соответствующие данным единицам описания.
В связи с этим возникает следующая проблема: какую семантическую нагрузку несет упоминание тех или иных персонажей в тексте?
В.Я. Пропп выделил семь инвариантных типов персонажей волшебной сказки: герой, вредитель, даритель, помощник, царевна, ложный герой, отправитель. Насколько значимо присутствие каждого из этих персонажей в тексте сказки?
Присутствие персонажа в тексте следует отличать от его значимости для сюжета сказки. Например, даритель – весьма значимая для сюжета фигура, поскольку без него герой не может добиться своих целей. Но в разных текстах эпизоды с дарителем могут излагаться очень кратко или, наоборот, развернуто. "Присутствие" можно понимать просто как число предложений, описывающих действие персонажа или упоминающих его. Разумеется, членение на предложения для устного в своей основе текста достаточно условно, однако в данном случае "формальное" предложение используется лишь как мера длины для текста.
Как показали подсчеты, чаще всего в тексте сказок упоминаются герой и вредитель, что неудивительно. Менее ожидаемо то, что третью позицию по частоте упоминаний занимает царевна, причем ее "отрыв" от остальных персонажей довольно значителен. Казалось бы, царевна скорее пассивна. Утверждение о пассивности царевны в сюжете сказки можно подтвердить более строго. Активность того или иного персонажа в сюжете можно увидеть, подсчитав число функций, в которых он фигурирует. Царевна по этим подсчетам оказывается на пятом месте, после героя, вредителя, дарителя и помощника.
Можно сказать, что царевна упоминается чаще, чем требуется для развертывания сюжета. С одной стороны, такое распределение отражает некоторую глубинную семантическую структуру сказки: два "игрока" (герой и вредитель) и объект их соперничества. С другой стороны, столь частое упоминание царевны может являться еще одним свидетельством связи сказки и свадьбы.
Отношения между персонажами волшебной сказки достаточно многообразны. Например, помощник может рассматриваться как "внешняя проекция" качеств героя, царевна – просто как ценность, которую он приобретает. Мерой связи между героями могут быть упоминания персонажей в пределах одного предложения. Подсчеты четко подтверждают наблюдение о "героецентричности" сказки: другие персонажи довольно редко оказываются в одном и том же предложении без упоминания героя. Заметна особая роль царевны как для вредителя, так и для героя: для обоих персонажей царевна находится на втором месте по близости. Показательно в этой связи, что и помощник (которого можно рассматривать как ипостась самого героя) связан сильнее с царевной, а не с вредителем.
Сегментирование текста с использованием различных единиц описания – весьма сложная задача. Однако даже после того, как такое сегментирование произведено, остается проблема наглядного представления результатов работы. Если рассматривать сегментированные фольклорные тексты в качестве необходимого компонента указателей, то сегментирование должно быть представлено таким образом, чтобы исследователи могли легко с ним работать. Как представляется, решение этой проблемы требует применения компьютерных технологий. При этом реализация теоретических принципов и исследовательских приемов в виде компьютерной программы свидетельствует о том, что эти научные положения сформулированы ясно и эксплицитно. В свою очередь, такая эксплицитность облегчает проверку теории.
Сформулируем основные требования к продукту, представляющему сегментированные фольклорные тексты, прежде всего сказки. Текст сказки может быть описан как:
- последовательность функций В.Я. Проппа;
- последовательность фрагментов, реализующих эти функции;
- последовательность мотивов указателя С. Томпсона;
- последовательность фрагментов, реализующих эти мотивы.
Таким образом, требуется наглядно представить, во-первых, сказку просто как единое целое, в соответствии с ее "бумажным" изданием, и, во-вторых, наглядно показать членение ее текста в соответствии с различными единицами описания. При этом нужно четко различать задачу разметки (т.е. сегментации) текста сказки в соответствии с определенными критериями и задачу наглядного представления этой разметки.
Проблему наглядного представления сегментации решает программа MEDIATOR 1.0, разработанная автором. Данный продукт состоит из двух больших блоков. Первый блок представляет собой стандарт для разметки сказочных текстов, реализованный в виде XML-приложения – язык FolkML. Второй блок – программная оболочка для представления пользователям сказочных текстов, размеченных в этом формате.
Разметка текстов велась в соответствии со следующими принципами. Текст сказки размечается целиком, так что корневым тегом является тег сюжета по указателю AaTh. Далее текст разбивается на фрагменты, соответствующие функциям В.Я. Проппа. Наконец, в тексте выделяются фрагменты, соответствующие мотивам, которые могут присутствовать в сказках данного типа. Существенно отметить, что сказка разбивается на функции "без остатка", однако о мотивах этого утверждать нельзя: в конкретной сказке, в соответствии с указателем AaTh, выделяются только мотивы, присутствующие в достаточно большом количестве вариантов сказок, принадлежащих к этому типу.
В зависимости от своих потребностей, пользователь программы может видеть для конкретного текста:
· последовательность функций В.Я. Проппа, представленных в данной сказке, которая дает возможность увидеть сюжетный уровень текста;
· текст, разбитый на фрагменты, соответствующие различным функциям;
· последовательность мотивов, которые встречаются в данном сюжете, по указателю AaTh;
· членение текста на фрагменты по мотивам;
· членение по мотивам и функциям одновременно.
В системе доступен поиск фрагментов, соответствующих различным функциям и мотивам. Ознакомившись с найденными фрагментами, можно составить представление о различных способах текстуализации одной и той же семантической единицы в разных фольклорных текстах.
Описанная выше система представляет в эксплицитном виде результаты исследовательской работы – разбора текстов. Большинство операций при таком разборе требуют обращения к смыслу текста, а задача автоматического понимания текста не решена, несмотря на многолетние усилия. Однако некоторые приемы все же могут быть реализованы в компьютерных продуктах. В частности, один из критериев выделения фрагментов, соответствующих сюжетно-мотивным единицам, может быть реализован в виде компьютерной программы.
Алгоритм работы основан на том, что первое появление персонажа, обладающего собственным именем, маркирует начало некоторой мотивной единицы.
На вход программы поступает набор текстовых файлов, содержащих тексты сказок. На первом шаге для каждого файла строится список слов, начинающихся с заглавной буквы не после точки. Естественно, имена могут встречаться и в начале предложений после точки. Работа программы строится на том, что имя вряд ли будет встречаться ТОЛЬКО в начале предложений. Если оно встретиться в любом другом месте, то оно будет включено в список. Затем в тексте ищутся и отмечаются первые вхождения слов из этого списка. Как показывает анализ результатов работы программы, многие сюжетные блоки выделяются вполне корректно.
Таким образом, сюжетно-мотивные единицы, казалось бы, скорее предназначенные для анализа фольклорной традиции в целом, позволяют обнаружить в конкретных фольклорных текстах весьма нетривиальные структуры, связанные как с глубинной семантикой, так и с их "поверхностным" строением.
Третья глава "Инструменты работы с указателем" посвящена описанию компьютерной системы, предназначенной для работы с СУС и указателями несказочной прозы, а также научным результатам, полученным с ее помощью.
Основная трудность работы с указателями заключается в поиске нужных сюжетов. Как показывает опыт, в некоторых случаях для этого требуется просмотреть весь указатель. Разумеется, это зависит от того, по каким критериям осуществляется поиск. Приведем несколько таких поисковых задач:
– найти описание сюжета, номер которого известен. Например, найти сюжет AaTh 307, учитывая, что у него есть несколько разновидностей;
— найти все сюжеты, встречающиеся в одном регионе, например, в Архангельской области;
— найти все сюжеты, в которых присутствует определенный персонаж, например, Баба Яга;
— найти все сюжеты, которые включают определенный мотив, например, сюжеты с исчезновениями.
Первая задача может быть решена с использованием печатной версии указателя довольно легко. Что касается второй, то, например, СУС располагает росписью сюжетов по регионам, а в AaTh такая роспись отсутствует.
Что касается остальных задач, то тут требуется сплошной просмотр указателя. Если учесть, что Баба Яга – персонаж не актуальной, а сказочной мифологии, то можно ограничиться сюжетами волшебных сказок (номера с 300 по 750 с подтипами). Для мотива исчезновения круг сюжетов вообще невозможно ограничить.
Как представляется, для решения всего этого круга задач наиболее перспективным представляется использование компьютерных средств, поскольку они позволяют, с одной стороны, сохранить тексты существующих указателей в неизменном виде и, с другой стороны, "надстроить" над ними новые дополнительные структуры. Эти структуры, как будет показано ниже, не только облегчают работу с указателями, но и позволяют ставить и решать новые научные проблемы.
Электронная версия СУС предназначена прежде всего для того, чтобы исследователи могли бы работать с этим изданием через Интернет, не имея в своем распоряжении печатного варианта. При этом электронная версия указателя дает дополнительные по сравнению с печатным текстом возможности.
Электронная версия позволяет, во-первых, просматривать описание каждого сюжета. Для этой цели сделано оглавление сюжетов. Кликнув любой пункт оглавления, можно перейти к описанию данного сюжета.
Таким образом, при помощи оглавления можно гораздо быстрее, чем в печатном тексте, просматривать описания сюжетов. Описание целиком совпадает с печатным вариантом. Однако от некоторых элементов описания возможен быстрый переход по гипертекстовой ссылке. Это, прежде всего, переход по перекрестным ссылкам. Кликнув любую из этих ссылок, можно быстро перейти к соответствующей единице указателя. Другие возможные переходы от описания сюжета – это переход от краткого наименования публикации сказочного текста, например, "Афанасьев", к полному библиографическому описанию публикации.
Сюжеты в разделе "Сказки о животных" СУС также снабжены ссылками на соответствующие описания сюжетов AaTh. Кликнув ссылку, можно перейти к описанию этого же сюжета в AaTh. AaTh не только имеет ссылки на издания сказок различных традиций, но и список мотивов по указателю С. Томпсона. Таким образом, воспользовавшись этой функцией электронной версии СУС, можно посмотреть, какое распространение имеет данный сюжет в мировом фольклоре.
Отсутствующие у печатной версии указателя возможности включают прежде всего полнотекстовый поиск. Он позволяет найти, например, все описания сюжетов, в которых присутствует слово "черт". Ясно, что в случае печатной версии это потребовало бы трудоемкого просмотра всего текста. Полнотекстовый поиск позволяет, таким образом, работать не просто с набором сюжетных типов, а с их "фрагментами", например, с мотивами, именами действующих лиц, названиями мест и т.п.
Однако и полнотекстовый поиск не может решить многих задач. Дело в том, что язык, на котором описываются типы, достаточно специфичен. В частности, в нем обнаруживается не всегда мотивированная синонимия (например, пара "царевна" – "принцесса" в описании сюжета 304).
Для того, чтобы облегчить поиск и обнаружить такие случаи, в электронную версию СУС включен полный перечень лексем, использованных при описании сюжетов. Для каждой лексемы указан список сюжетов, в описании которых она встречается. Кликнув по номеру типа, можно перейти к полному описанию. Выше приводилась задача найти все сюжеты, связанные с исчезновением. В списке этому семантическому элементу отвечают слова "исчезать" и "исчезнуть".
Просмотр этого списка позволяет обнаружить разного рода синонимию, получить представление о языке описания в целом. Видно, что фактически один и тот же семантический элемент может реализовываться разными лексемами: "исцеление", "исцелить", "исцелять" и "исцеляться". Та же семантика присутствует в словах "лечить", "излечивать" и "излечить". При простом полнотекстовом поиске довольно трудно предсказать, что мотив врачевания/исцеления может описываться всеми этими словами. В дальнейшем этот перечень может быть использован для унификации описаний сюжетов.
Возможна и более тонкая автоматическая обработка этого перечня, например, классификация лексем по их грамматическим показателям. Например, неодушевленные существительные могут относиться либо к волшебным предметам, либо к местам действия и т.д.
Полный список лексем – тезаурус, получен автоматически, при помощи программы, которая была написана на диалекте языка Clipper и использует возможности СУБД Starling. Результатом работы программы является база данных, включающая все слова в начальной форме и с указанием части речи, встречающиеся в тексте.
Классификация лексем способна дать хорошее представление о собственно сюжетном фонде. Другая задача – облегчить работу с указателем, описав его лексику. Например, слово "хозяин" может обозначать как человека, которому помогает демон, так и облик, в котором демон является. Таким образом, затрудняется, например, поиск сюжетов, в которых демонические персонажи принимают разный облик. В главе предлагается такая классификация для лексем, использованных в "Указателе сюжетов-мотивов быличек" К. Шумова и Е. Преженцевой. Структуризация в значительной степени основывается на работе И.А. Разумовой и М.Л. Лурье, посвященной структуре быличек. Как показано в ней, сюжеты быличек могут быть описаны как последовательности, состоящие из действий демона и действий человека. Соответственно, для указателя выделяется лексические группы, описывающие действия демона, действия человека, облик демона, характеристики человека и некоторые другие. Разумеется, существующие указатели не придерживаются такой схемы в полной мере, но она достаточна для удобной классификации.
Такая классификация лексики позволяет быстро ориентироваться в указателе, при ее помощи можно определить степень подробности описания сюжетов, увидеть список персонажей, их основные действия и признаки.
Одной из проблем, к решению которой позволяет подойти электронная версия указателя, является проблема популярности разных сюжетов.
Материалом послужил сюжетный фонд русской волшебной сказки, как он отражен в СУС. Для каждого сюжета (номера 300-749, всего 230 сюжетов) подсчитывалось число записей сказок на данный сюжет. Учитывался только русский материал.
В результате обнаруживается следующая картина. Сюжетный фонд русской сказки состоит из относительно небольшого набора очень распространенных сюжетов, в то время как большая часть сюжетов малопопулярна. Всего в СУС упоминается 3432 записи волшебных сказок. Первые 10 наиболее популярных сюжетов охватывают 800, первые 20 – 1298 записей и т.д. Первые 30 (из 230) наиболее популярных сюжетов покрывают 1736 записей, то есть больше половины всех записей всех сюжетов. В свою очередь 137 сюжетов, каждый из которых встречается в 10 и меньшем числе записей (т.е. в 9, 8 и т.д. записях, что, в общем, не свидетельствует об их исключительной редкости), встречаются лишь в 426 записях.
Таким образом, в сюжетном фонде можно выделить небольшое, но "сильное" ядро и "слабую" периферию. Подобная структура сюжетного фонда точно отражает хорошо известные свойства жанра волшебной сказки. Этот жанр характеризуется традиционностью, отсутствием инноваций и мало продуктивен. Статистика популярности сюжетов указывает на то, что традиция "произвела отбор" сюжетов, вызывающих интерес, но хорошо известных аудитории.
Одним из факторов, связанных с популярностью сюжетов, могло бы быть наличие лубочных изданий соответствующих сказок. Однако популярность лубочных сюжетов сильно отличается от популярности устных. Из 20 наиболее популярных сюжетов только 7 широко представлены в лубочных сказках.
Итак, наблюдается своего рода дополнительное распределение между популярностью сюжетов лубочных и устных сказок. Возможны следующие объяснения этих фактов. Во-первых, лубочное издание сказки могло "подменять" устное исполнение чтением. Сказка в этом случае не рассказывалась, а читалась. Во-вторых, собиратели могли просто не записать соответствующие сказки, считая их вторичными по отношению к лубочным. Вообще говоря, эти два объяснения не противоречат друг другу.
Среди семантических признаков сюжетов, потенциально могущих повлиять на их популярность, следует отметить пол главного героя. Если взять уже упоминавшиеся 30 наиболее популярных сюжетов, покрывающих собой половину всех записей, то в этом списке только два с героиней женского пола. Остальные 27 сюжетов с героиней попадают в список менее популярных сюжетов. Таким образом, русская волшебная сказка – явно "мужской" жанр. Это может быть вызвано как общей ориентацией традиционной культуры на "мужское", так и составом сказочников.
Решение проблемы, которую можно сформулировать как "Почему один сюжет популярнее другого" требует средств описания, применимых к любому сюжету. Аппарат функций В.Я. Проппа оказывается слишком сильным, каждый сюжет излагается слишком многими способами с точки зрения последовательности функций. Между тем, требуется объяснить популярность именно сюжета, а не конкретного варианта, который описывается цепочкой функций. Вероятно ответ может быть найден после разработки семантических классификаций сюжетов, опирающихся на их синтагматику, однако описывающих сюжеты не так "дробно", как система В.Я. Проппа.
В Заключении излагаются основные выводы работы:
1. Всякий указатель, опирающийся на тексты фольклорной традиции (или традиций) моделирует эту традицию. Сюжетно-мотивные единицы, представленные в указателе, соотносятся с семантическими комплексами, которыми оперирует сама традиция, а классификация этих единиц соответствует связям, существующим между этими комплексами. Моделирование традиции в указателе происходит на разных структурных уровнях.
2. Репертуар сюжетных единиц описания соответствует бытующим в традиции целостным текстам (разумеется, фольклорный текст – образование, существующее лишь в конкретных вариантах и актах исполнения),. Исследование сюжетов, таким образом, позволяет обнаружить различные особенности "циркуляции" текстов в традиции.
3. Лексика, которая используется в указателе для описания сюжетов, соотносится с мотивным фондом традиции. Мотив понимается как некоторое "смысловое пятно", встречающееся в разных текстах. Рассмотрение лексики позволяет исследовать глубинно-семантические структуры жанров и жанровых групп.
4. Ссылки, ведущие от сюжетно-мотивных единиц в указателях к изданиям, выявляют структурные особенности текстов. Соответствия между конкретными единицами описания и фрагментами фольклорных текстов выявляют технику рассказывания, варьирование, нарративные структуры и т. д.
Таким образом, фольклорные указатели представляет собой не простой набор вспомогательных инструментов, а целостную систему, обладающую богатейшими исследовательскими возможностями, в которой следует выделять отдельные компоненты, относительно самостоятельные, однако раскрывающие все свои функции только в связи с целым. Эти положения о системности указателей являются не просто теоретическими конструктами, они позволили создать работающий электронный инструментарий.
Основные положения диссертации отражены в публикациях:
- Построение сказки: длина повторяющихся фрагментов // Живая старина. – М.: ГРЦРФ, 2002. № 1. – С. 27-29.
- Дом: опыт тезаурусного описания: Рец. // Живая старина. – М.: ГРЦРФ, 2002. № 1. – С. 49 (0, 2).
- Текст–функция–мотив: программа "МЕДИАТОР" // Компьютерная лингвистика и интеллектуальные технологии: Тр. Междунар. семинара Диалог’2001 (Протвино, 6–11 июня 2001 г.): В 2 т. Т. 2: Прикладные проблемы / Под ред. А.С. Нариньяни. – М.: Наука, 2001. – С. 276–282 (0,7 а. л., совместно с А.В. Рафаевой, А.С. Архиповой).
- Folklore and Cultural Anthropology on the Internet // The Journal of the Slavic and East European Folklore Association. University of Virginia.Vol. 6. № 1. Spring 2001. – P. 36-47 (with A.S. Arxipova).
- Дандес А. От этических к эмическим единицам в структурном изучении сказок: Комментарии // А. Дандес. Фольклор: семиотика и/или психоанализ. – М.: Издательская фирма "Восточная литература", 2003. – С. 28-29 (0,2 а. л.).
Материал размещен на сайте при поддержке гранта №1015-1063 Фонда Форда.
|