А.В. Козьмин, А.С. Архипова, А.В. РафаеваТекст – функция - мотив: программа "Медиатор"Статья опубликована в сборнике "Компьютерная лингвистика и интеллектуальные технологии". (Труды Международного семинара Диалог'2002. М., 2002. С. 276-282) Ключевые слова: Мотив, функция, разметка, XML, сказка, формальный метод в фолькористике В настоящей статье описывается работа по установлению соответствий между единицами описания фольклорного повествования (мотивами, функциями Проппа) и фрагментами текстов русских сказок. Данная задача решается в рамках проекта по созданию компьютерной версии структурно-семантического указателя фольклорных сюжетов (грант РФФИ № 01–06–800191, руководитель С.Ю. Неклюдов). Единицами описания сюжета сказки служат: - типы сказочных сюжетов по указателю Аарне-Томпсона (АТ) и указателю сюжетов восточнославянской сказки (СУС); - функции Проппа; - мотивы по классификации С. Томпсона. На первом этапе работы разбираются сказки, проанализированные В.Я. Проппом в "Морфологии сказки". Tale type, function, XML-format, folktale, formal method in folklore studies Folktales, functions and motifs in program tool MEDIATOR / Koz’min Art’om Viktorovich (Insttitute for the Advanced Studies in the Humanities Russian State University for the Humanities Moscow Miusskaya Square 16 Ошибка! Закладка не определена., Arkhipova Alexandra Sergeevna Viktorovich (Insttitute for the Advanced Studies in the Humanities Russian State University for the Humanities Moscow Miusskaya Square 16 Ошибка! Закладка не определена., Rafaeva Anna Valerievna Viktorovich (Insttitute for the Advanced Studies in the Humanities Russian State University for the Humanities Moscow Miusskaya Square 16 Ошибка! Закладка не определена. The structure of folktales can be described with the help of motifs or Propp's functions. The program tool MEDIATOR 1.0 is developed to connect the description and the text of Russian fairy tales. As a programming area of the project the XML language is chosen. The results of the work are placed in Internet. 1. Введение Исследователь, анализирующий фольклорное повествование, рано или поздно встает перед проблемой использования какого-либо указателя фольклорных сюжетов и мотивов. За прошедший век накоплен огромный опыт в составлении таких указателей, (см. обзоры фольклорных указателей в работах Х. Ясон [Jason 2000], Т. Китаниной [Китанина 2001]), основным из которых является сводный указатель Аарне-Томпсона (далее АТ). Сюжетно-мотивные классификации в этих указателях построены древовидно, при этом верхний уровень составляют единицы, соответствующие целым группам текстов, иногда принадлежащих разным фольклорным традициям (например, "сказки о животных" в указателе Аарне-Томпсона). Ясно, однако, что выделение любых единиц такого рода требует тщательного анализа конкретных текстов; результатом чего и являются ссылки на тексты в указателях. Указатели фольклорных прозаических текстов описывают большое количество материала и тем самым адекватно репрезентируют данную традицию, но из-за своей эмпиричности и отсутствия принципов формализованного описания сказочных типов они подвергались резкой критике. В 1928 г. с критикой такого принципа эмпирического классифицирования выступил В.Я. Пропп, предложив альтернативу в виде описания сказок по функциям ([Пропп 1969, с. 9 – 14]). С тех пор сюжетно-мотивный и функционально-морфологический анализ противопоставляются [Apo 1992; Georges 1997; Holbek 1964; Jason 2000]. 2. Постановка проблемы Любой исследователь, анализируя фольклорный текст с помощью выделяемых эмпирически мотивов или с помощью функций, сталкивается с проблемой алгоритмизации/автоматизации выделения мотивов и функций. Упоминая тот или иной мотив или функцию, мы достаточно легко приводим в пример тексты, в которых этот мотив или функция присутствуют (например, сказки, содержащие мотив "Бой со змеем" или функцию "Свадьба"). Однако обратный процесс - выделение в самом тексте конкретного фрагмента, соответствующего определенному мотиву или функции, а также определение в данном тексте границ этого фрагмента – достаточно сложен. Например, сколько слов/предложений соответствует мотиву "змееборство" в сказке "Фролка-сидня" (№131); или как реализуется вариант функции "кровавый след указывает путь" в сказке "Иван-сучонко и Белый Полянин" (№139) 1 Указанная проблема имеет еще один аспект. Само появление некоторой единицы в указателе (например, мотива) отражает существование в традиции семантического элемента, который по-разному манифестируется в различных текстах. Наличие точных критериев, позволяющих четко выделять фрагменты, соответствующие таким семантическим элементам, может способствовать исследованию варьирования фольклорного текста. 3. Программная реализация Эта проблема решается в рамках разработки программного продукта MEDIATOR 1.0. Данный продукт состоит из двух больших блоков. Первый блок представляет собой стандарт для разметки сказочных текстов, реализованный в виде XML-приложения – язык FolkML. Второй блок – программная оболочка для представления пользователям сказочных текстов, размеченных в этом формате. В программе используются результаты работы системы СКАЗКА [Рафаева 1998], описывающие соответствие между сказочными типами и мотивами С. Томпсона. Стандартным средством разметки в настоящее время можно считать XML (eXtensible Markup Language). Существенными представляются следующие особенности XML: - возможность внесения в текст информации различных "сортов", - возможность расширения репертуара меток (тегов), размещаемых в тексте, в зависимости от хода исследования, - независимость хранения данных от их визуального представления, - возможность размещения размеченных документов как локально, так и в Интернете. При этом просмотр размеченных текстов требует только наличия у пользователя Microsoft Internet Explorer версии 5.0 и выше. Текущее множество XML-тегов включает в себя теги, отмечающие границы текстовых фрагментов, соответствующих функциям В.Я. Проппа, типам сказок по указателю Аарне-Томпсона, мотивам по указателю Томпсона. Конкретное имя функции, типа и мотива представляется в виде значения атрибутов соответствующих тегов. Разметка текстов велась в соответствии со следующими принципами. Текст сказки размечается целиком, так что корневым тегом является тег сказочного типа по указателю Аарне-Томпсона. Далее текст разбивается на фрагменты, соответствующие функциям Проппа. Наконец, в тексте выделяются фрагменты, соответствующие мотивам, которые могут присутствовать в сказках данного типа. Существенно отметить, что сказка разбивается на функции "без остатка", однако о мотивах этого утверждать нельзя: в конкретной сказке, в соответствии с указателем Аарне-Томпсона, выделяются только мотивы, присутствующие в достаточно большом количестве вариантов сказок, принадлежащих к этому типу. Пример начала текста сказки, размеченного в XML: <?xml version="1.0" encoding="Windows-1251"?><fabula><mainmotif number="671" name="The Three Languages"><function name="Начальная ситуация">В одном городе жил купец с купчихою, и дал им господь сына не по годам смышленого, по имени Василия.</function> <function name="Пророчества, предвещания">Раз как-то обедали они втроем; а над столом висел в клетке соловей и так жалобно пел, что купец не вытерпел и проговорил: "Если б сыскался такой человек, который отгадал бы мне вправду, что соловей распевает и какую судьбу предвещает, кажись - при жизни бы отдал ему половину имения, да и по смерти отказал много добра". <motif number="B215.1" name="Bird language">А мальчик- ему было лет шесть тогда - посмотрел отцу с матерью в глаза озойливо и сказал: "Я знаю, что соловей поет, да сказать боюсь". - "Говори без утайки!" - пристали к нему отец с матерью, и Вася со слезами вымолвил: "Соловей предвещает, что придет пора-время, будете вы мне служить: отец станет воду подавать, а мать полотенце - лицо, руки утирать".</motif></function>... Визуализация размеченных текстов производится при помощи языка XSL, поддержка которого реализована в XML-парсере браузера Microsoft Internet Explorer версии 5.0 и выше. Переключение между шаблонами визуализации осуществляется при помощи языка JScript. В зависимости от своих потребностей, пользователь может видеть для конкретного текста: - последовательность функций В.Я. Проппа, - членение текста на фрагменты по функциям, - последовательность фрагментов по указателю Аарне-Томпсона, - членение текста на фрагменты по мотивам, - членение по мотивам и функциям одновременно. Использование XML-разметки позволяет не только изменять визуальное представление текста, но и осуществлять поиск фрагментов, соответствующих различным единицам описания. В системе доступен поиск фрагментов, соответствующих различным функциям и мотивам. При этом пользователю предоставляется возможность видеть список всех функций и мотивов, выделенных в размеченных текстах. Поиск также реализован на языке JScript с использованием Document Object Model XML-парсера, предоставляемого Microsoft. В системе размечены все многоходовые сказки, описанные В.Я. Проппом в приложениях к "Морфологии сказки". В этих текстах были выделены фрагменты, соответствующие функциям В.Я. Проппа и мотивам, перечисленным в указателе Аарне-Томпсона для этих сказок. Результаты работы представляет собой не только комплекс размеченных фольклорных текстов, но и справочно-поисковую систему, размещенную в Интернете, которая предоставляет новые возможности для анализа материала. С тестовой версией системы можно ознакомиться в Интернете по адресу http://www.ruthenia.ru/folklore/xmlfabula/index.htm. 4. Теоретическое решение проблемы Еще раз повторим, что задача выделения в фольклорном тексте фрагментов, соответствующих определенной единице указателя, стоит перед всяким фольклористом, описывающим сказку, например, по системе С. Томпсона или по функциям В.Я. Проппа. Однако, насколько известно, это никогда не рассматривалось как теоретическая проблема. Между тем ее решение имеет и практический смысл, поскольку позволит более явным образом связывать фольклорные тексты и единицы для их описания. Представляется, что современные средства разметки электронных документов позволяют устанавливать связи между единицами указателя и конкретными текстовыми фрагментами (в отличие от традиционных ссылок на целы тексты, как делается в "бумажных" указателях). Такие ссылки позволяют не только переходить от единиц указателя к их текстовым реализациям, но и осуществлять интеллектуальный поиск в массивах сказочных текстов. Сравнение фрагментов, реализующих определенный мотив или функцию в разных текстах, позволяет исследовать варьирование текстуализации мотива/функции в традиции. В процессе обработки текстов был эмпирически установлен ряд критериев для выделения фрагментов, соответствующих единицам указателя. В результате обработки текстов были выделены следующие типы отношений между единицами описания (мотивами и функциями) и текстом: одна единица соответствует одному текстовому фрагменту, одна единица соответствует нескольким текстовым фрагментам несколько единиц соответствует одному и тому же фрагменту. 1. Тип отношения "одна единица - один фрагмент" соответствует сюжетообразующей функции таких единиц. Текст складывается как цепочка некоторых сюжетных элементов, что детально было исследовано В.Я Проппом и его продолжателями. В этом смысле функция в смысле В.Я. Проппа и мотив фактически совпадают. Мотив "S143: Abandonment in forest" ("оставление в лесу"). Старик молча уклал пожитки, велел дочери накинуть шубняк и пустился в дорогу. Долго ли ехал, скоро ли приехал — не ведаю: скоро сказка сказывается, не скоро дело делается. Наконец доехал до бору, своротил с дороги и пустился прямо снегом по насту; забравшись в глушь, остановился и велел дочери слезать, сам поставил под огромной сосной коробейку и сказал: "Сиди и жди жениха, да мотри — принимай ласковее". А после заворотил лошадь — и домой [Афанасьев №102] 2 . 2. Более сложный случай представляет собой отношение "одна единица - несколько фрагментов". Тут можно выделить несколько подтипов. Первый подтип представляет собой повтор одинаковой единицы в разных сюжетных звеньях. Например, мотив "Dragon" может получать многократную реализацию в разных "экземплярах" этого персонажа. Мотив "H1537.1: Bear demands that heroine play Blindman's Buff". Ночью вломился медведь. "Ну-ка, деушка, — говорит, — туши огни, давай в жмурку играть" <...> Пришла полночь — вломился медведь и говорит: "Эй, где ты, деушка? Давай-ка в жмурку поиграем" [Афанасьев №98]. Второй подтип отношения "одна единица - много фрагментов" включает в себя случаи "разрывной" реализации одной единицы. Для функций этот случай не очень характерен, в отличие от мотивов. Например, мотив "Kind and unkind" ("детский и недобрый") реализуется в виде противопоставленных действий разных персонажей: Она дала им <мышам> кашки. <...> А она не дала им <мышам> выговорить, то тоё скалкой, то другу (Афанасьев №102). 3. Наконец, третий тип отношений - совпадение в границах одного фрагмента разных единиц, характерен в случаях контаминации. Например, фактически невозможно провести границу в тексте между реализациями функций "Бой с вредителем" и "Победа над вредителем". Иногда в одном фрагменте реализуются два мотива, логически подчиненные друг другу, например, "Politeness rewarded" ("вежливость вознаграждена") и "Riches as reward" ("богатство как награда"). Логическое подчинение не мешает тому, что обоим мотивам можно поставить в соответствие один и тот же фрагмент. Однако в случаях типа "Низкий герой" и "Низкий герой получает в жены царевну" возможно, следует говорить о том, что логическое подчинение сопровождается "вложением" фрагментов. Например, низкое происхождение героя может отражаться в про его имени ("Иван-сучонко"), а брак описываться более развернуто. Критерии выделения фрагментов, соответствующих некоторой единице, представляют сложную проблему. То, что текст состоит из некоторого набора единиц, ясно по определению. Далеко не очевидно, что в любом случае речь идет об их линейном расположении, допускающем простую сегментацию текста на соответствующие фрагменты. На такую непрерывную сегментацию ориентированы в большей степени функции В.Я Проппа, нежели мотивы указателя С. Томпсона. Однако и для мотивов можно предложить некоторые правила выделения фрагментов. Первое, на что стоит обратить внимание, - это актантная структура единиц. Появление имени актанта некоторой единицы может маркировать границы фрагмента. Многие из функций указывают на взаимодействие главного героя с другими персонажами-актантами, например, функции, связанные с дарителем и вредителем. Исходя из этого, можно предложить в качестве признака для начала фрагмента, соответствующего одной из таких функций, появление нового персонажа. Структура единиц указателя во многих случаях может рассматриваться как включающая в себя предикат. Однако текстовая реализация обобщенных предикатов, входящих в единицы описания, - случай более сложный, чем текстовая реализация актантов этих предикатов. Имена персонажей гораздо более устойчивы, чем предикаты - отношения между этими персонажами. Вероятно, это вызвано тем, что имена гораздо менее мотивированы, чем наименования действий и отношений. В силу неясности смысла имен они допускают меньшую свободу перефразирования и синонимических замен. Можно вспомнить, например, роль имени "Иван" для русской сказки или устойчивые имена чудовищ. Действия же этих персонажей, именно из-за их ясного смысла могут быть изложены очень разными способами. В силу этого, можно выделить несколько разных типов отношений между предикатами, которые присутствуют в наименованиях единиц описания, и текстами. Типы эти различаются, если так можно выразиться, степенью близости между языком текста и языком описания. Проиллюстрируем вначале это на примере функций. Рассмотрим вариант функции "Борьба с вредителем" - "Бой на открытом поле". Этому варианту в тексте сказки могут соответствовать такие слова как "биться", "сражаться". Варианту той же функции "Взвешивание" могут соответствовать слова "весы", "перевесить" и т. п. В отношении многих единиц, прежде всего мотивов, можно предполагать их относительную автономность для традиции: они могут использоваться в разных текстах и сюжетах. В связи с этим следовало бы ожидать, что соответствующие текстовые фрагменты также могут нести признаки относительной автономности, замкнутости в рамках текста, аналогично абзацам письменной литературной речи. Действительно, такие случаи обнаруживаются. Разберем следующий пример (Афанасьев №123, начало сказки): "1. Жил-был король, у него был сын-подросток. 2. Королевич был всем хорош - и лицом и нравом, да отец-то его не больно: все его корысть мучила, как бы лишний барыш взять да побольше оброку сорвать. 3. Увидел он раз старика с соболями, с куницами, с бобрами, с лисицами. 4. "Стой, старик! 5. Откудова ты?" - 6. "Родом из такой-то деревни, батюшка, а ныне, служу у мужика-лешего". - 7. "А как вы зверей ловите?" - 8. "Да леший-мужик наставит лесы, зверь глуп - и попадет". - 9. "Ну, слушай, старик! 10. Я тебя вином напою и денег дам; укажи мне, где лесы ставите?" 11. Старик соблазнился и указал. 12. Король тотчас же велел лешего-мужика поймать и в железный столб заковать, а в его заповедных лесах свои лесы поделал. 13. Вот сидит мужик-леший в железном столбе да в окошечко поглядывает, а тот столб в саду стоял. 14. Вышел королевич с бабками, с мамками, с верными служанками погулять по саду; идет мимо столба, а мужик-леший кричит ему: 15. "Королевское дитя! Выпусти меня; я тебе сам пригожусь". - 16. "Да как же я тебя выпущу?" - 17. "А пойди к своей матери и скажи ей: матушка моя любезная, поищи у меня вшей в головке. 18. Да головку-то положь к ней на колени; она станет у тебя в голове искать, а ты улучи минуту, вытащи ключ у ней из кармана, да меня и выпусти". 19. Королевич так и сделал; вытащил ключ из кармана у матери, прибежал в сад, сделал себе стрелку, положил на тугой лук и пустил ее далеко-далеко, а сам кричит, чтоб мамки и няньки ловили стрелу. 20. Мамки и няньки разбежалися, в это время королевич отпер железный столб и высвободил мужика-лешего." Согласно указателю АТ, в этом тексте присутствуют, в частности, мотивы "F 567. Wild man lives alone in wood like beast" ("Дикий человек живет в лесу как дикий зверь") и "G 671. Wild man released from captivity aids hero" ("Дикий человек, освобожденный из плена, помогает герою"). В свою очередь, приведенный выше отрывок может быть описан следующим образом. Предложения 1 - 2: описание длящейся ситуации, используются глаголы несовершенного вида. Предложения 3 - 12: описание события, глаголы совершенного вида, маркер начала - "(увидел он) раз". Предложения 13 - 20: описание события, начинающееся in medias res, глаголы несовершенного вида ("Вот сидит мужик-леший в железном столбе да в окошечко поглядывает, а тот столб в саду стоял"), сменяющиеся сов. видом ("Вышел королевич с бабками, с мамками, с верными служанками погулять по саду; идет мимо столба, а мужик-леший кричит ему..."), маркер начала - "Вот (сидит)". Достаточно естественно сопоставить мотиву "F 567. Wild man lives alone in wood like beast" второй фрагмент, а мотиву "G 671. Wild man released from captivity aids hero" - третий. Помощь, которую оказывает леший герою, описывается в тексте сказки далее. Очевидно, что список критериев, кратко описанных выше, неполон и требует дальнейшего развития. Существенно, что XML-разметка фольклорных текстов, реализованная в системе, в силу своей гибкости, расширяемости и доступности для многих исследователей через Интернет, позволяет продолжить такую работу. Ее возможным результатом является как собственно электронный сюжетно-мотивный указатель, так и обработанные в соответствии с этим указателем тексты. 5. Заключение Операции над сказочными текстами в системе MEDIATOR позволяют увидеть способы реализации мотивов и функций в самом тексте, а также как они соотносятся между собой. Но, кроме этого, программа позволяет отследить вариативность реализаций мотивов и функций (и сравнить их!) как внутри одного текста, так и между разными текстами – таким образом исследователь может изучить, как сама фольклорная традиция непрерывно комбинирует и трансформирует сюжетно-мотивные блоки, в результате порождая новые тексты. ЛитератураАфанасьев 1985 - Народные русские сказки А.Н. Афанасьева. В трех томах. М.: "Наука", 1985. Китанина 2001 – Китанина Т. Указатели сюжетов и мотивов. http://www.ruthenia.ru/folklore/kitanina1.htm Пропп 1969 - Пропп В.Я. Морфология сказки. 2-е изд. М.: Наука, 1969. Рафаева 1998 - Рафаева А.В. Полуавтоматический анализ волшебных сказок в компьютерной системе СКАЗКА // Труды международного семинара Диалог'98 по компьютерной лингвистике и ее приложениям. Т 2. Казань, 1998. С. 701 - 706. Рафаева 1999 - Рафаева А.В. Структура сказочных мотивов // Труды международного семинара Диалог'99 по компьютерной лингвистике и ее приложениям. Т.1. Таруса, 1999. С.241 - 246. СУС - Сравнительный указатель сюжетов. Восточнославянская сказка. Л., 1979. Apo 1992 - Apo S. Analyzing the contents of narratives: Methodical and technical observations // Folklore processed: in honor of L. Honko on his 60th birthday 6th March, Helsinki, 1992/ AT - Thompson S. The Types of the Folktale: A Classification and Bibliography. Anti Aarne's Verzeichnis der Mдrchentypen. Helsinki, 1973. FFC No. 184.Georges 1997 - Georges R. The centrality in folkloristics of motif and tale type // Journal of folklore research, 1997, Vol. 34. Holbek 1964 - Holbek B. On the classification of Folktales // IV international congress for Folk Narrative Research in Athens, 1964. Jason 2000 - Jason H. Motif, type and genre: A manual for compilation of indixes & a bibliography of indices and indexing. Helsinki, 2000. FF Communications No. 273. ThMot - Motif-index of folk-literature. 6 vols. Copenhagen - Bloomington, 1955 – 1958. ПримечанияТексты и номера сказок везде в этой статье приводятся по изданию: Народные русские сказки А.Н. Афанасьева. Т. I-III. М., 1985 Материалом для данного исследования послужили многоходовые сказки, описанные В.Я. Проппом в приложениях к "Морфологии сказки".
Материал размещен на сайте при поддержке гранта №1015-1063 Фонда Форда.
|