МЕТОДИКА КООРДИНАТНОГО ИНДЕКСИРОВАНИЯ

Скипор Инна Леоновна,
к.п.н., доцент кафедры ТАОИ КемГАКИ

1.Общие положения
1.1. Назначение

Назначение методики заключается в системном представлении технологии координатного индексирования; снижении субъективности действий человека при выделении основного смыслового содержания документа или запроса, а также при формировании поисковых образов документов или запросов; в повышении качества индексирования; снижении временных и интеллектуальных затрат на его осуществление.

1.2. Область применения

Данная методика может быть использована в библиотеках различных типов, информационных службах и учреждениях в ходе выполнения ими процесса координатного индексирования, результаты которого используются при подготовке широкого спектра информационных продуктов и услуг, подготавливаемых как в традиционном, так и в автоматизированном режимах.

1.3. Объект

В качестве объекта индексирования выступают первичные и вторичные документы, а также запросы пользователей.

1.4. Описание цели, задач

Целью методики координатного индексирования является алгоритмизация действий человека при анализе содержания и формы документа, а также переводе результатов анализа с естественного языка на дескрипторный информационно-поисковый язык.
Достижение поставленной цели требует решения следующих задач:
_____- анализ документа или запроса как объекта индексирования;
_____- выбор понятий, характеризующих содержание документа или запроса, а также терминов индексирования для обозначения этих понятий;
_____- формирование поисковых образов документов (ПОД) или поисковых образов запросов (ПОЗ) из терминов индексирования.

1.5. Требования к конечному продукту

Качество подготовленного на основе данной методики поискового образа документа (поискового образа запроса) должно удовлетворять требованиям ГОСТ 7.52-85 Коммуникативный формат для обмена библиографическими данными на магнитной ленте. Поисковый образ документа и ГОСТ 7.66-92 Индексирование документов. Общие требования к координатному индексированию.

1.6. Организация-разработчик

Методика разработана на кафедре технологии автоматизированной обработки информации Кемеровской государственной академии культуры и искусств.

1.7. Источники, использованные при разработке

1. ГОСТ 7.74-96 Информационно-поисковые языки. Термины и определения. - Минск, 1997. - 21 с.
2. ГОСТ 7.52-85 Коммуникативный формат для обмена библиографическими данными на магнитной ленте. Поисковый образ документа. - М., 1985.- 12 с.
3. ГОСТ 7.66-92 Индексирование документов. Общие требования к координатному индексированию. - М., 1992. - 14 с.
4. Воройский Ф.С. Индексирование документов в АБИС// Библиотека. - 1996. - № 9. - С. 42-44.
5. Гендина Н.И. Лингвистическое обеспечение автоматизированных библиотечных систем. -Алма-Ата: Гылым, 1991. - 222с.
6. Типовая технологическая инструкция по индексированию документов в узлах КСПБМ - № 5 ОКиО// Создание корпоративной сети публичных библиотек Москвы (КСПБМ): Рабочий проект. Т.1. Порядок формирования, хранения и использования машиночитаемых ресурсов общего пользования КСПБМ/ Отв. исполнитель проекта Ф.С. Воройский. - М., 2001. - С.53-56.

2.Технология работы
2.1. Исходный продукт

В качестве исходного продукта при координатном индексировании выступают документы и запросы пользователей.

2.2. Методы преобразования информации при координатном индексировании

В качестве основного при координатном индексировании выступает формализованный подход. Сущность используемого метода заключается в том, что при выполнении координатного индексирования документа или запроса заранее заданы некоторые формальные правила, которые регламентирует деятельность человека.

Формальные правила сводятся к следующему:
_____1) Определяются элементы структуры издания, которые подлежат анализу с целью извлечения информации для _____отражения основного смыслового содержания документа (запроса);
_____2) Приводится перечень характеристик (аспектов содержания), которые признаются важными для отражения в ПОД _____(ПОЗ);
_____3) Задаются правила осуществления тождественной и нетождественной замены при выборе терминов _____индексирования.

Наряду с формализованными методами используются методы логического анализа, метод унификации и стандартизации лексических единиц при формировании ПОД и ПОЗ.

2.3. Перечень выполняемых технологических операций

Технология координатного индексирования предполагает выполнение следующих операций:
_____1. Анализ и определение содержания и формы документа как объекта индексирования;
_____2. Выбор понятий, характеризующих содержание документов;
_____3. Выбор терминов индексирования для обозначения понятий;
_____4. Формирование поисковых образов документов (поисковых образов запросов) из терминов индексирования.

2.4. Ожидаемый результат технологического процесса

Результатом использования методики является составление поискового образа документа и поискового образа запроса. При этом под поисковым образом понимается совокупность лексических единиц ИПЯ, выражающая содержание документа, информационного запроса и предназначенная для реализации информационного поиска.

ПОД (ПОЗ) из ключевых слов или дескрипторов имеет линейную структуру - простой перечень лексических единиц (ЛЕ) без соблюдения алфавитного порядка.

2.5. Последовательность выполнения отдельных технологических операций

2.5.1. Анализ и определение содержания и формы документа как объекта индексирования.
_____2.5.1.1. Выделить ключевые слова, характеризующие основное смысловое содержание документа. При выполнении данной процедуры анализу подлежат:
- справочный аппарат издания (титульный лист, предисловие/ введение, послесловие, содержание/ оглавление, аннотация, реферат и др.);
- первые фразы глав и параграфов;
- иллюстрации, схемы, таблицы и подписи к ним;
- слова и группы слов, выделенные в тексте специальными полиграфическими средствами.
_____2.5.1.2. Выделить ключевые слова, характеризующие форму документа: тип, вид, язык, территориальный, географический аспекты. Данная операция осуществляется на основе анализа элементов справочного аппарата (титульный лист, предисловие/ введение, аннотация, реферат).
_____2.5.1.3. Правила формулирования ключевых слов см. "Методику создания дескрипторного словаря".

2.5.2. Выбор понятий, характеризующих содержание документов.
_____2.5.2.1. В первую очередь отбору подлежат предметы и аспекты рассмотрения, выделенные из названия документа, наименований частей, разделов, глав и т.п.
_____2.5.2.2. Отобрать из выявленных на 1 этапе (п. 2.5.1.) понятий те, которые соответствуют тематике запросов пользователей системы.
_____2.5.2.3. Количество терминов индексирования, подлежащих отражению в ПОД, зависит от вида документа (научный, учебный, нормативный, художественный и т.д.), его объема (книга, брошюра, статья и т.п.), а также от количества сведений, содержащихся в документе. Ограничение числа терминов должно быть основано на содержательном отборе наиболее важных понятий. Например, в качестве важнейших характеристик, подлежащих отражению в ПОД (ПОЗ), могут выступать:
__________- предмет рассмотрения (например, тракторы, документы первичные, системы информационные);
__________- содержательный аспект рассмотрения (ремонт, комплектование);
__________- территориальный аспект (Кузбасс, г. Москва, Красноярский край);
__________- хронологический аспект (1954Г, 20-е ГГ, 20-50-е ГГ);
__________- вид издания (учебники, пособия учебные, монографии, стандарты);
__________- язык издания.
В каждой конкретной ИПС данный список характеристик должен быть уточнен и добавлен теми характеристиками, которые признаются важными для отражения в ПОД в соответствии со спецификой решаемых задач информационно-библиотечного учреждения.

2.5.3. Выбор терминов индексирования для обозначения понятий.
_____2.5.3.1. Определить дескрипторный словарь, соответствующий тематике индексируемого документа (запроса).
_____2.5.3.2. Найти в дескрипторном словаре дескрипторы, соответствующие отобранным на 2 этапе (п. 2.5.2) ключевым словам.
__________2.5.3.2.1. Если ключевое слово полностью совпадает с дескриптором, имеет место тождественная замена. Например, в ходе анализа содержания документа было выделено ключевое слово "тезаурусы информационно-поисковые"; в дескрипторном словаре найден "тезаурусы информационно-поисковые". Следует произвести операцию избыточного индексирования (см. табл. 1). Для выполнения данной операции следует обратиться к терминологическим ГОСТ, словарям, справочникам по заданной предметной области.
_______________2.5.3.2.1.1. При индексировании документов осуществить операцию восходящего избыточного индексирования, т.е. включение в ПОД вышестоящих по отношению к данному дескрипторов (см. табл. 1).
_______________2.5.3.2.1.2. При индексировании запросов осуществить операцию нисходящего избыточного индексирования, т.е. включение в ПОЗ нижестоящих по отношению к данному дескрипторов (см. табл. 1).

Таблица. Проведение операции избыточного индексирования

__________2.5.3.2.2. Если ключевое слово совпадает с имеющимся в дескрипторном словаре аскриптором, сопровождаемым пометой см., замена является тождественной. Например, в ходе анализа содержания документа было выделено ключевое слово "карполин"; в дескрипторном словаре найдена аскрипторная статья:
_____Карполин
_____см. Севин
Включить в ПОД (ПОЗ) дескриптор, к которому отсылает помета см., т.е. дескриптор "Севин". Произвести операцию избыточного индексирования (см. п. 2.5.3.2.1.1, 2.5.3.2.1.2).
__________2.5.3.2.3. Если ключевое слово отсутствует в дескрипторном словаре, следует проверить возможности вариантов:
_______________2.5.3.2.3.1. Ключевое слово представлено словосочетанием. Осуществить поиск как в прямом, так и в инвертированном виде с использованием в качестве поискового каждого элемента словосочетания. Например, в ходе анализа содержания документа было выделено ключевое слово "травы однолетние злаковые"; возможные варианты поиска - "травы злаковые однолетние", "однолетние злаковые травы", "злаковые однолетние травы". Если словосочетание найдено, замена считается тождественной. Произвести избыточное индексирование (см. п. 2.5.3.2.1.1, 2.5.3.2.1.2).
_______________2.5.3.2.3.2. Ключевое слово отсутствует в дескрипторном словаре как в прямом, так и в инвертированном виде. Провести поиск каждого слова, входящего в состав словосочетания. Осуществить перевод ключевых слов в дескрипторы. Если все ключевые слова найдены, замена считается тождественной. Например, в ходе анализа содержания документа было выделено ключевое слово "посев трав"; в дескрипторном словаре найдены аскриптор "посев", отсылающий к дескриптору "высев", и дескриптор "травы". Произвести избыточное индексирование (см. п. 2.5.3.2.1.1, 2.5.3.2.1.2).
_______________2.5.3.2.3.3. Ключевые слова представлены сложными словами, отсутствующими в дескрипторном словаре. Разбить слово на составные части и перевести каждый из терминоэлементов отдельно. Допускается замена однокоренных существительных на прилагательные и наоборот. Например, в ходе анализа содержания документа было выделено ключевое слово "системы информационно-библиотечные"; в дескрипторном словаре найдены дескрипторы "системы информационные", "системы библиотечные".
_______________2.5.3.2.3.4. Если перечисленные в п. 2.5.3.2.1. - 2.5.3.2.3. рекомендации не срабатывают, осуществить нетождественную замену. Для этого перевести ключевые слова набором подходящих по смыслу дескрипторов либо вышестоящим по отношению к данному понятием. Операция избыточного индексирования не производится.
_____2.5.3.3. Если понятие не отражено в дескрипторном словаре, проверить его точность и приемлемость использования в данной предметной области с помощью справочных изданий (справочников, словарей, энциклопедий), классификационных таблиц, терминологических стандартов и др. источников, признанных авторитетными в данной области.
_____2.5.3.4. Если понятие, не представленное в дескрипторном словаре, необходимо включить в ПОД, выразить его, используя следующие способы:
__________2.5.3.4.1. Привести к принятой для данной ИПС форме (род, число, падеж и т.д.) и включить в ПОД в качестве нового специфического термина. При этом следует отметить его знаком (*) после последней буквы.
__________2.5.3.4.2. Отразить более общим понятием, имеющимся в дескрипторном словаре.
_____2.5.3.5. Рассмотреть возможность включения понятия в дескрипторный словарь.

2.5.4. Формирование поисковых образов документов (поисковых образов запросов) из терминов индексирования.
_____2.5.4.1. Объединить выбранные термины индексирования в ПОД (ПОЗ), используя правила ввода данных, принятые в рамках конкретной автоматизированной информационно-библиотечной системы.
_____2.5.4.2. Записать ПОД на носителе информации в соответствии с требованиями конкретной АИБС.

<Назад>____________<Вперед>____________<Содержание>____________<На главную>