​Источниковедение on-line: Современные методы работы с цифровой формой рукописного документа

В последнее время все большее внимание привлекает словосочетание digital humanities – направление исследований, возникшее на стыке гуманитарных наук и современных информационных технологий. После почти пятидесяти лет «параллельного развития» в гуманитарную сферу, вслед за стремительно ворвавшейся новой техникой, приходят новые методы работы с источником. Проделав путь от простейшего «компьютер и гуманитарные науки» через «информатику в гуманитарных науках» к «гуманитарной информатике»1, digital humanities ставят вопрос о доступности, цитировании и способах публикации научного документа2. Оставляя за рамками вопрос о визуальном сохранении культурного наследия3, активно развивающегося в рамках digital history4, применительно к филологии информатизация гуманитарных наук может быть озвучена как «текст и digital humanities»: передовые технологии публикации (в т.ч. виртуальная реконструкция рукописных источников), анализа текста и интеграции информационных ресурсов.  

Digital humanities превращают текст из рукописного раритета в объект электронной публикации. Становясь частью электронного архива, источник приобретает новое качество – мобильность. Независимо от научной квалификации исследователя и состояния оригинала рукописи, любой пользователь Интернета получает прямой доступ к его электронной копии: может его изучать, цитировать в своих работах и распространять ссылки на источник. Ученый перестает быть антикваром, первооткрывателем. Все выложенные в Интернет рукописи в равной степени доступны всем. Профессионализм исследователя проявляется не в знакомстве с кругом источников, закрытым для остальных, а исключительно в методах и качестве работы с ним. На первый план выходит не наличие публикации, а уровень подготовки текста и научного комментария,

С этой точки зрения наиболее перспективно сотрудничество ученых и архивистов для создания объединенного электронного архива рукописей, в котором исследователь сможет получить доступ к вариантам текста, находящимся в различных архивохранилищах. Не совершая длительных командировок, ученый сможет сопоставить на одном экране черновые и беловые автографы произведений Вячеслава Иванова, Анны Ахматовой, Марины Цветаевой, Бориса Пастернака, Федора Сологуба, Иннокентия Анненского и Андрея Белого5, находящиеся в Москве, Петербурге, Риме, а в перспективе – Русском архиве Лидсского университета. Сам процесс создания электронного архива русской литературы – это серьезная научно-исследовательская работа. Процесс отбора материалов невозможен без работы текстологов. Источником текста может быть не только рукопись (хотя диапазон этих материалов огромен: от чернового или белового автографа до гранок с авторской правкой или рукописной книги), но в той или иной степени дневниковая запись, маргиналии (знаменитая бунинская правка на полях собрания сочинений), газетная статья, фрагмент письма. 

Как и реальный архив, электронное собрание позволяет увидеть источник в его бытовании – набросок рассказа вместе с письмом, в которое он был вложен, правку в газетной публикации вместе с другими вырезками с замечаниями автора на полях, первые варианты стихотворений вместе с юношескими дневниковыми записями. Работая над электронным архивом, ученый создает историю текста, самое полное издание. Поднимается по ступенькам от нескольких строчек в записной книжке или подчеркнутой цветным карандашом фразы (возникновение замысла) к рабочим тетрадям, письмам, дневникам, рисункам. Затем – черновые автографы, еще очень далекие от завершенного варианта (другое название, другие персонажи), опять письма и дневники, и наконец, появление первого беловика (одного из многих), а дальше, в зависимости от судьбы произведения, гранки или рукописная книга.

При всех достоинствах аутентичного издания, к числу которых, несомненно, относится точная фиксация всей полноты текста и последовательности записей  независимо от их тематики, аутентичное издание требует длительной подготовки (в зависимости от объема – от нескольких лет до десятилетий) и значительного финансирования. Для точного воспроизведения литературного памятника требуется высокое качество бумаги и полиграфии, недостижимое при таком объеме текста. Кроме того, даже при самом бережном издании памятника не исключены ошибки текстологов и комментаторов.

Использование современных электронных технологий позволяет избежать этих затруднений,  перенеся публикацию источника on-line. Серверные блоки, предназначенные для создания электронных библиотек, могут разместить практически неограниченное количество документов. Облачные технологии делают возможным одновременную работу ученых и архивистов при загрузке и аннотировании источников. Применение digital humanities в филологии может решить и еще одну задачу – сопоставить на экране беловой автограф и его публикацию, текст в авторском варианте и тот же текст после расшифровки, приведения к современной орфографии и пунктуации, комментирования и т.п. При синхронном просмотре можно попытаться достичь искомой гармонии между «авторским» и «публикаторским» текстами – небесным совершенством авторской воли и приземленным, но необходимым вмешательством текстолога.

Другим способом работы digital humanities с электронной копией источника становится интеллектуальный анализ данных. В этом случае для высокотехнологичной обработки цифрового изображения создаются специальные программные модули, которые либо работают со структурными элементами текста, либо автоматизируют выполнение рутинных, но необходимых элементов текстологической работы, таких как постраничное соотнесение рукописного источника и распознанного текста, поиск фраз/ словосочетаний/ слов в рукописном тексте и т.п.

Существующие на сегодняшний день программы рассчитаны только на демонстрацию цифровой формы рукописного документа или на работу с его текстовой формой без возможности их автоматического соотнесения. Значительный прорыв в этом направлении достигнут с помощью программного модуля «Текстолог6, способного выполнять точное соотнесение цифровых форм документов  с их текстовыми формами (txt, doc, rtf).

Программный модуль «Текстолог» предоставляет в распоряжение ученых абсолютно идентичный оригиналу электронный аналог рукописного текста – основного объекта любого текстологического исследования – в его первозданном виде, с сохранением всех графических и орфографических особенностей, абсолютно свободный от редакторских искажений и анахронизмов (например, приведение аутентичных текстов к современным языковым нормам). На практике программный модуль позволяет исследователям синхронно работать с электронной копией рукописи и соответствующим ей распознанным текстом, проводить контекстный поиск необходимых слов и фраз не только в распознанных, но и в рукописных текстах, формировать тематические корпусы, включающие черновики, беловые автографы, машинопись с правкой автора. Сопоставляя с помощью модуля цифровые копии вариантов одного и того же произведения, исследователи могут поэтапно восстанавливать процесс возникновения текста, анализировать психологию творчества, а также выявлять разночтения и ошибки в передаче текста и осуществлять редактирование при подготовке научных собраний сочинений.

Следующий уровень «электронной филологии» позволяет работать со структурными элементами текста, определяя высокоуровневые (семантические) элементы через низкоуровневые (графические, позиционные и метрические элементы: количество и длина строки, взаиморасположение строк на странице и т.п.), характерные для растровых изображений.  Таким образом создается система автоматизированного анализа электронной версии источника7, предоставляющая информацию о составе и полноте документа, датировке, количестве, стиле и жанре записей и их расположении на странице. Более того, локализация структурных элементов позволит уточнить практику цитирования рукописного источника, при которой единицей цитирования и визуализации станет не страница, а сегмент текста абзац или строка. Историк получит возможность изучить фактографию, статистик – обработать новые данные, текстолог – сопоставить варианты произведений и поэтапно восстановить историю текста, лингвист – изучить поэтический словарь и процесс формирования языка, литературовед – познакомиться с записями, относящиеся к биографии писателя.

Применение электронных технологий в филологических исследованиях – сравнительно новая разработка, развивающаяся в России в течение последних пяти лет. Их успех будет определяться тем, насколько они будут востребованы – войдут, как Интернет, редактор MicrosoftWord или Adobe Acrobat, в практику обычной рутинной работы филолога. Именно «рабочий стол» ученого станет показателем того, какие направления digital humanities будут развиваться, а что останется просто «пробой пера», моделью, увлекательным поискам научной мысли.


Л.В. Хачатурян, А.А. Ларин

Примечания:

1. McCarty W. Humanities Computing. Palgrave: New York, 2005.  P. 288.

2. Е.Ю. Журавлева использует термин «электронная филология». См.: Журавлева Е.Ю. Современные модели развития гуманитарных наук в цифровой среде //Вопросы философии. 2012. № 7. С. 97-98.

3. Arthur P. Virtual Strangers: e-Research and the Humanities // ACH: International Journal of Culture and History in Australia, 2009, Vol. 27. N. 1. P. 47–59; Arthur P. Exhibiting history: the digital future // Journal of the National Museum of Australia. 2008. Vol. 3. N. 1.

4. Наиболее близкий перевод – историческая информатика. См.: Бородкин А.И. Digital history: Применение цифровых медиа в сохранении культурного наследия? //Информационный бюллетень Методологические проблемы исторической информатики. 2012. Т. 1. №1. С. 14-21; Он же. Историческая информатика сегодня: вызовы «цифровой эпохи» // Там же. 2014. № 42. Специальный выпуск. Материалы XIV конференции АИК. С. 3-6.

5. Электронные архивы: http://www.ivanov-rgali.ru; http://www.akhmatova-rgali.ru; http://literature-archive.ru/ru

6. Программный модуль разработан при поддержке РГНФ. Проект № 13-04-12014в.

Наверх
 

Все права на размещенные здесь материалы принадлежат предоставившим их архивохранилищам или ученым.
Если вы хотите опубликовать эти материалы в своей книге или сделать перепост, пожалуйста, согласуйте это с редакцией сайта
или обратитесь непосредственно в предоставившую их организацию.