МЕТОДИКА
КООРДИНАТНОГО ИНДЕКСИРОВАНИЯ
Скипор
Инна Леоновна,
к.п.н., доцент кафедры ТАОИ КемГАКИ
1.Общие
положения
1.1. Назначение
Назначение
методики заключается в системном представлении технологии координатного
индексирования; снижении субъективности действий человека при выделении
основного смыслового содержания документа или запроса, а также при
формировании поисковых образов документов или запросов; в повышении
качества индексирования; снижении временных и интеллектуальных затрат
на его осуществление.
1.2.
Область применения
Данная
методика может быть использована в библиотеках различных типов, информационных
службах и учреждениях в ходе выполнения ими процесса координатного
индексирования, результаты которого используются при подготовке широкого
спектра информационных продуктов и услуг, подготавливаемых как в традиционном,
так и в автоматизированном режимах.
1.3.
Объект
В
качестве объекта индексирования выступают первичные и вторичные документы,
а также запросы пользователей.
1.4.
Описание цели, задач
Целью
методики координатного индексирования является алгоритмизация действий
человека при анализе содержания и формы документа, а также переводе
результатов анализа с естественного языка на дескрипторный информационно-поисковый
язык.
Достижение поставленной цели требует решения следующих задач:
_____- анализ документа или запроса как
объекта индексирования;
_____- выбор понятий, характеризующих
содержание документа или запроса, а также терминов индексирования
для обозначения этих понятий;
_____- формирование поисковых образов
документов (ПОД) или поисковых образов запросов (ПОЗ) из терминов
индексирования.
1.5.
Требования к конечному продукту
Качество
подготовленного на основе данной методики поискового образа документа
(поискового образа запроса) должно удовлетворять требованиям ГОСТ
7.52-85 Коммуникативный формат для обмена библиографическими данными
на магнитной ленте. Поисковый образ документа и ГОСТ 7.66-92 Индексирование
документов. Общие требования к координатному индексированию.
1.6.
Организация-разработчик
Методика
разработана на кафедре технологии автоматизированной обработки информации
Кемеровской государственной академии культуры и искусств.
1.7.
Источники, использованные при разработке
1.
ГОСТ 7.74-96 Информационно-поисковые языки. Термины и определения.
- Минск, 1997. - 21 с.
2. ГОСТ 7.52-85 Коммуникативный формат для обмена библиографическими
данными на магнитной ленте. Поисковый образ документа. - М., 1985.-
12 с.
3. ГОСТ 7.66-92 Индексирование документов. Общие требования к координатному
индексированию. - М., 1992. - 14 с.
4. Воройский Ф.С. Индексирование документов в АБИС// Библиотека. -
1996. - № 9. - С. 42-44.
5. Гендина Н.И. Лингвистическое обеспечение автоматизированных библиотечных
систем. -Алма-Ата: Гылым, 1991. - 222с.
6. Типовая технологическая инструкция по индексированию документов
в узлах КСПБМ - № 5 ОКиО// Создание корпоративной сети публичных библиотек
Москвы (КСПБМ): Рабочий проект. Т.1. Порядок формирования, хранения
и использования машиночитаемых ресурсов общего пользования КСПБМ/
Отв. исполнитель проекта Ф.С. Воройский. - М., 2001. - С.53-56.
2.Технология
работы
2.1. Исходный продукт
В
качестве исходного продукта при координатном индексировании выступают
документы и запросы пользователей.
2.2.
Методы преобразования информации при координатном индексировании
В
качестве основного при координатном индексировании выступает формализованный
подход. Сущность используемого метода заключается в том, что при выполнении
координатного индексирования документа или запроса заранее заданы
некоторые формальные правила, которые регламентирует деятельность
человека.
Формальные
правила сводятся к следующему:
_____1) Определяются элементы структуры
издания, которые подлежат анализу с целью извлечения информации для
_____отражения основного смыслового содержания
документа (запроса);
_____2) Приводится перечень характеристик
(аспектов содержания), которые признаются важными для отражения в
ПОД _____(ПОЗ);
_____3) Задаются правила осуществления
тождественной и нетождественной замены при выборе терминов _____индексирования.
Наряду
с формализованными методами используются методы логического анализа,
метод унификации и стандартизации лексических единиц при формировании
ПОД и ПОЗ.
2.3.
Перечень выполняемых технологических операций
Технология
координатного индексирования предполагает выполнение следующих операций:
_____1. Анализ и определение содержания
и формы документа как объекта индексирования;
_____2. Выбор понятий, характеризующих
содержание документов;
_____3. Выбор терминов индексирования
для обозначения понятий;
_____4. Формирование поисковых образов
документов (поисковых образов запросов) из терминов индексирования.
2.4.
Ожидаемый результат технологического процесса
Результатом
использования методики является составление поискового образа документа
и поискового образа запроса. При этом под поисковым образом понимается
совокупность лексических единиц ИПЯ, выражающая содержание документа,
информационного запроса и предназначенная для реализации информационного
поиска.
ПОД
(ПОЗ) из ключевых слов или дескрипторов имеет линейную структуру -
простой перечень лексических единиц (ЛЕ) без соблюдения алфавитного
порядка.
2.5.
Последовательность выполнения отдельных технологических операций
2.5.1.
Анализ и определение содержания и формы документа как объекта индексирования.
_____2.5.1.1. Выделить ключевые слова,
характеризующие основное смысловое содержание документа. При выполнении
данной процедуры анализу подлежат:
- справочный аппарат издания (титульный лист, предисловие/ введение,
послесловие, содержание/ оглавление, аннотация, реферат и др.);
- первые фразы глав и параграфов;
- иллюстрации, схемы, таблицы и подписи к ним;
- слова и группы слов, выделенные в тексте специальными полиграфическими
средствами.
_____2.5.1.2. Выделить ключевые слова,
характеризующие форму документа: тип, вид, язык, территориальный,
географический аспекты. Данная операция осуществляется на основе анализа
элементов справочного аппарата (титульный лист, предисловие/ введение,
аннотация, реферат).
_____2.5.1.3. Правила формулирования
ключевых слов см. "Методику создания дескрипторного словаря".
2.5.2.
Выбор понятий, характеризующих содержание документов.
_____2.5.2.1. В первую очередь отбору
подлежат предметы и аспекты рассмотрения, выделенные из названия документа,
наименований частей, разделов, глав и т.п.
_____2.5.2.2. Отобрать из выявленных
на 1 этапе (п. 2.5.1.) понятий те, которые соответствуют тематике
запросов пользователей системы.
_____2.5.2.3. Количество терминов индексирования,
подлежащих отражению в ПОД, зависит от вида документа (научный, учебный,
нормативный, художественный и т.д.), его объема (книга, брошюра, статья
и т.п.), а также от количества сведений, содержащихся в документе.
Ограничение числа терминов должно быть основано на содержательном
отборе наиболее важных понятий. Например, в качестве важнейших характеристик,
подлежащих отражению в ПОД (ПОЗ), могут выступать:
__________-
предмет рассмотрения (например, тракторы, документы первичные, системы
информационные);
__________-
содержательный аспект рассмотрения (ремонт, комплектование);
__________-
территориальный аспект (Кузбасс, г. Москва, Красноярский край);
__________-
хронологический аспект (1954Г, 20-е ГГ, 20-50-е ГГ);
__________-
вид издания (учебники, пособия учебные, монографии, стандарты);
__________-
язык издания.
В каждой конкретной ИПС данный список характеристик должен быть уточнен
и добавлен теми характеристиками, которые признаются важными для отражения
в ПОД в соответствии со спецификой решаемых задач информационно-библиотечного
учреждения.
2.5.3.
Выбор терминов индексирования для обозначения понятий.
_____2.5.3.1. Определить дескрипторный
словарь, соответствующий тематике индексируемого документа (запроса).
_____2.5.3.2. Найти в дескрипторном словаре
дескрипторы, соответствующие отобранным на 2 этапе (п. 2.5.2) ключевым
словам.
__________2.5.3.2.1.
Если ключевое слово полностью совпадает с дескриптором, имеет место
тождественная замена. Например, в ходе анализа содержания документа
было выделено ключевое слово "тезаурусы информационно-поисковые";
в дескрипторном словаре найден "тезаурусы информационно-поисковые".
Следует произвести операцию избыточного индексирования (см. табл.
1). Для выполнения данной операции следует обратиться к терминологическим
ГОСТ, словарям, справочникам по заданной предметной области.
_______________2.5.3.2.1.1.
При индексировании документов осуществить операцию восходящего избыточного
индексирования, т.е. включение в ПОД вышестоящих по отношению к данному
дескрипторов (см. табл. 1).
_______________2.5.3.2.1.2.
При индексировании запросов осуществить операцию нисходящего избыточного
индексирования, т.е. включение в ПОЗ нижестоящих по отношению к данному
дескрипторов (см. табл. 1).
Таблица.
Проведение операции избыточного индексирования
__________2.5.3.2.2.
Если ключевое слово совпадает с имеющимся в дескрипторном словаре
аскриптором, сопровождаемым пометой см., замена является тождественной.
Например, в ходе анализа содержания документа было выделено ключевое
слово "карполин"; в дескрипторном словаре найдена аскрипторная
статья:
_____Карполин
_____см. Севин
Включить в ПОД (ПОЗ) дескриптор, к которому отсылает помета см., т.е.
дескриптор "Севин". Произвести операцию избыточного индексирования
(см. п. 2.5.3.2.1.1, 2.5.3.2.1.2).
__________2.5.3.2.3.
Если ключевое слово отсутствует в дескрипторном словаре, следует проверить
возможности вариантов:
_______________2.5.3.2.3.1.
Ключевое слово представлено словосочетанием. Осуществить поиск как
в прямом, так и в инвертированном виде с использованием в качестве
поискового каждого элемента словосочетания. Например, в ходе анализа
содержания документа было выделено ключевое слово "травы однолетние
злаковые"; возможные варианты поиска - "травы злаковые однолетние",
"однолетние злаковые травы", "злаковые однолетние травы".
Если словосочетание найдено, замена считается тождественной. Произвести
избыточное индексирование (см. п. 2.5.3.2.1.1, 2.5.3.2.1.2).
_______________2.5.3.2.3.2.
Ключевое слово отсутствует в дескрипторном словаре как в прямом, так
и в инвертированном виде. Провести поиск каждого слова, входящего
в состав словосочетания. Осуществить перевод ключевых слов в дескрипторы.
Если все ключевые слова найдены, замена считается тождественной. Например,
в ходе анализа содержания документа было выделено ключевое слово "посев
трав"; в дескрипторном словаре найдены аскриптор "посев",
отсылающий к дескриптору "высев", и дескриптор "травы".
Произвести избыточное индексирование (см. п. 2.5.3.2.1.1, 2.5.3.2.1.2).
_______________2.5.3.2.3.3.
Ключевые слова представлены сложными словами, отсутствующими в дескрипторном
словаре. Разбить слово на составные части и перевести каждый из терминоэлементов
отдельно. Допускается замена однокоренных существительных на прилагательные
и наоборот. Например, в ходе анализа содержания документа было выделено
ключевое слово "системы информационно-библиотечные"; в дескрипторном
словаре найдены дескрипторы "системы информационные", "системы
библиотечные".
_______________2.5.3.2.3.4.
Если перечисленные в п. 2.5.3.2.1. - 2.5.3.2.3. рекомендации не срабатывают,
осуществить нетождественную замену. Для этого перевести ключевые слова
набором подходящих по смыслу дескрипторов либо вышестоящим по отношению
к данному понятием. Операция избыточного индексирования не производится.
_____2.5.3.3. Если понятие не отражено
в дескрипторном словаре, проверить его точность и приемлемость использования
в данной предметной области с помощью справочных изданий (справочников,
словарей, энциклопедий), классификационных таблиц, терминологических
стандартов и др. источников, признанных авторитетными в данной области.
_____2.5.3.4. Если понятие, не представленное
в дескрипторном словаре, необходимо включить в ПОД, выразить его,
используя следующие способы:
__________2.5.3.4.1.
Привести к принятой для данной ИПС форме (род, число, падеж и т.д.)
и включить в ПОД в качестве нового специфического термина. При этом
следует отметить его знаком (*) после последней буквы.
__________2.5.3.4.2.
Отразить более общим понятием, имеющимся в дескрипторном словаре.
_____2.5.3.5. Рассмотреть возможность
включения понятия в дескрипторный словарь.
2.5.4.
Формирование поисковых образов документов (поисковых образов запросов)
из терминов индексирования.
_____2.5.4.1. Объединить выбранные термины
индексирования в ПОД (ПОЗ), используя правила ввода данных, принятые
в рамках конкретной автоматизированной информационно-библиотечной
системы.
_____2.5.4.2. Записать ПОД на носителе
информации в соответствии с требованиями конкретной АИБС.
<Назад>____________<Вперед>____________<Содержание>____________<На
главную>