Опыт создания базы данных «Советские немцы — трудармейцы Тагиллага»
Одним из динамично развивающихся направлений социальной истории являются просопографические исследования, заключающиеся в изучении определенных социальных групп на основе индивидуальных биографических данных их представителей.
В 2000 г. под руководством д-ра ист. наук В. М. Кириллова в Проблемной научно-исследовательской лаборатории «Историческая информатика» Нижнетагильского государственного педагогического института (НТГПИ) на основе учетных карточек трудармейцев была создана электронная база данных «Советские немцы — трудармейцы Тагиллага».
Карточки, заполненные в период существования трудармейских формирований из граждан СССР немецкой национальности (1942–1946), содержат данные по двум разделам в первом сосредоточены персональные биографические сведения и социодемографические характеристики трудармейца (ФИО, возраст, место рождения и жительства до мобилизации и т.д.); во втором — информация о его мобилизации и пребывании в рабочей колонне на объекте НКВД (Тагиллаге или Богословлаге).
Необходимо отметить, что карточки персонального учета трудармейцев начали заводиться в соответствии с указаниями временной инструкции ГУЛАГа на формулярах учетных карточек заключенных только с 19.05.1942 г., т. е. через три месяца после прибытия в Тагиллаг первого эшелона с мобилизованными немцами. Вследствие этого в части учетных карточек трудармейцев, уже выбывших из лагеря к этому времени (в результате побега или смерти), содержатся только их фамилии, имена и отчества, а также год рождения или возраст. Остальные поля карточки, очевидно, заполнялись со слов мобилизованного и не подтверждались соответствующими документами. Данный вывод подтверждается обнаруженными нами многочисленными разночтениями в географических названиях, фамилиях и даже в написании райвоенкоматов, проводивших мобилизацию.
В картотеках исправительно-трудовых лагерей количество карточек персонального учета превышает общее количество трудармейцев, прошедших через рабочие колонны того или иного лагеря. При возвращении в рабочую колонну трудармейца, ранее выбывшего оттуда в результате осуждения, на него зачастую заполнялась новая карточка персонального учета, в которой номер личного дела, а иногда и фамилия отличались от зафиксированных в первоначальной карточке.
Особенности источника — стабильность по составу документов, преемственность в содержании и форме, высокая степень структурированности позволили поместить всю информацию учетной карточки в рамки стандартной реляционной базы данных (БД). Из большого количества систем управления базами данных (СУБД) нами был выбран пакет Access97 (сегодня используются его новые модификации), являющийся высокопроизводительной 32-разрядной системой управления реляционными БД. Пакет Access97 предназначен как для разработки локальных БД, так и для создания распределенных БД (архитектура клиент — сервер), работающих под управлением операционных систем WINDOWS 95–2000, WINDOWS NT (сегодня более современных ОС).
Структура базы данных представлена в БД состоит из двух таблиц и 37 полей, содержащих основные персональные характеристики (ФИО, возраст, пол), а также информацию о месте рождения, роде занятий, уровне образования, социальном происхождении и социальном положении, сведения о перемещениях трудармейца и видах выполняемых им работ. Для уточнения и автоматической корректировки вводимой информации БД должна быть связана с внешними справочными базами данных (созданы справочники имен и географических названий).
Принципы формирования описываемой БД предусматривают точное воспроизведение содержания источника. При этом кодирование качественных признаков, дает возможность проводить агрегирование и корректировку вводимой информации, а также поиск и анализ данных.
Этапы работы с БД.
1. Ввод информации в БД осуществляется с помощью специальной графической формы. При этом проводилась корректировка написания имен, с использованием внешней БД «Имена», и географических названий (внешняя БД «Регион»).
2. Обработка и анализ результатов. Математическое обеспечение базы данных и процедуры, внедренные в тело БД, поддерживают разные возможности, облегчающие обработку и повторный анализ данных (к настоящему времени реализованные частично). Например, группировка и выборка данных, отвечающих заданным условиям (расчленение генеральной совокупности по одному или нескольким признакам).
Модуль, написанный на языке программирования Visual Basic с использованием языка SQL (язык управления реляционными базами данных), позволяет создавать разнообразные запросы и получать соответствующие выборки по 22 признакам и их комбинациям с последующим графическим представлением результатов выборки. Форма, позволяющая создавать запросы, представлена в
Например, автоматическая выборка позволила выделить записи, относящиеся к трудмобилизованным советским немцам. При этом оказалось, что из 7232 чел., числящихся в картотеке трудармейцев Тагиллага, большая часть являлась именно советскими немцами, но кроме них в картотеке и БД представлены интернированные немцы из Германии, репатриированные советские граждане, а также трудармейцы других национальностей. Следующий простейший алгоритм выборки позволил «отслоить» все остальные категории, кроме советских немцев:
Национальность
|
= немец
|
В БД предусмотрена возможность графического отображения информации (в том числе результатов выборки) о поле, возрасте, социальном происхождении, партийности, национальности, образовании, профессии, дате мобилизации, объекте работы, причине и дате убытия трудармейцев.
Необходимо отметить, что наибольшие сложности возникли с отображением сведений о профессиональной деятельности трудармейцев до их мобилизации, оказавшихся далеко неоднозначными. В нашем случае за основу была взята классификация профессий по словарю переписи 1939 г., подвергнутая дополнительной группировке.
Возможно использование БД в составе более обширного банка данных по истории репрессий.
Дальнейшая перспектива использования БД «Советские немцы–трудармейцы Тагиллага» состоит во включении данной базы данных в состав более крупных банков данных (в первую очередь в рамках «Единого электронного банка данных жертв политических репрессий в СССР»), что потребует определенной доработки БД.
Кроме учетной карточки с достаточно ограниченным набором данных, в различных государственных и ведомственных архивах существует большое количество массовых источников (личных дел, учетных карточек, анкет), содержащих более обширные сведения о различных аспектах жизни персоналии в тот или иной временной период: составе семьи, трудовой и общественно-политической деятельности, судимости и т. д. (см. Приложение 6). Для перевода сведений этих источников в машиночитаемый вид необходимо создание более обширной БД, к построению которой существует, как минимум, два подхода.
Логичным и более простым с точки зрения технического воплощения является применение подхода «от человека» («персонально-ориентированный подход»), так как структура БД в данном случае будет строиться вокруг проблем, ключевых мест в жизнедеятельности определенного человека — «семья», «осуждение», «образование» и т. д.
В то же время необходимо отметить, что существует ряд аргументов в пользу использования в БД и элементов подхода «от источника» («источнико-ориентированный подход»).
В реальной практике ввод информации в БД будет происходить таким образом, что каждая категория пользователей будет иметь дело только с одним определенным типом источника, иллюстрирующим какой-либо один период в жизнедеятельности персоны и содержащим ограниченный набор признаков. Это делает ненужным (для этой категории пользователей) наличие в БД большого количества «проблемно-ориентированных форм». И, наоборот, для таких пользователей оптимальным был бы ввод данных только в одну «источнико-ориентированную» форму, внешне повторяющую структуру источника;
Недостаточная квалификация пользователей, непосредственно осуществляющих ввод данных, при работе с комплексом источников (содержащих массу разночтений) и многочисленном наборе «проблемно-ориентированных» форм ввода может привести к неверному разнесению информации источника по полям БД:
Данные различных источников могут разниться, при этом оба расхождения должны быть зафиксированы с указанием источника;
Часть данных носит динамический характер, т. е. со временем может изменяться (семейное положение, количество и состав родственников, партийность, образование и т.д.), поэтому в различных по времени составления источниках может быть зафиксировано различное значение одного признака. При этом путь фиксации в поле одного, «верного» (например, последнего по времени) значения и отбрасывания остальных некорректен.
С учетом вышеизложенного мы предлагаем следующий подход к построению БД. Придерживаясь «проблемно-ориентированной» структуры БД на уровне хранения данных придать ей «источнико-ориентированный» интерфейс: набор форм, повторяющих структуру наиболее распространенных источников (наряду с наличием обычных «проблемно-ориентированных» форм, не связанных с источником, — «Приговор», «Члены семьи», «Трудовая деятельность» и т.д.). Преимуществом предложенной схемы является возможность «эмулировать» один или несколько источников практически без потери содержащейся в них информации, в том числе и с учетом разночтений.
Таким образом, описываемая БД «Советские немцы-трудармейцы Тагиллага» может быть использована для характеристики социального портрета значительной по составу этносоциальной группы.
Авторами также определены подходы, реализация которых позволит включить описанную БД в состав более обширных банков данных для изучения «жизненных путей» советских немцев.
К настоящему моменту в рамках работы сотрудников лаборатории «Историческая информатика» шаблон формы ввода «Трудармейцы Тагиллага» применен при создании баз данных по персоналиям трудмобилизованных Тагилллага, Богословлага, ИТЛ Бакалстрой-Челябметаллургстрой, Востураллага, Севураллага, Ивдельлага. В развитие баз данных по отдельным ИТЛ Урала созданы два интегральных банка данных: «Электронная книга памяти российских немцев» (размещен на портале RusDeutsch Международного союза немецкой культуры) и «Трудармейцы в ИТЛ Урала» (на сайте Баварского культурного центра российских немцев).