Проблемы
координатного индексирования и библиографического поиска
по электронным базам данных в условиях ЦБС
(из опыта работы)
Сычева
Нина Дмитриевна,
заведующая информационно-библиографическим
отделом ЦГБ им. Н. В. Гоголя г. Новокузнецка
В
своей практической деятельности библиограф в библиотеке любого уровня,
прежде всего, занят аналитической обработкой документов. В конце 1993г.
в практику работы библиографов ЦБС г. Новокузнецка добавился еще один
вид предмашинной обработки - раскрытие содержания документа путем
выявления и перечисления ключевых слов, т.е. координатное индексирование.
(автор термина - американский библиотекарь Мортимер Таубе, предложивший
его еще в 50-е гг.).
В
1994 году библиографический отдел на базе двух компьютеров приступил
к процессу автоматизации библиографических процессов на основе программы
А.И. Вислого "Библиотека" (версия EC3). Из входящего документального
потока, подлежащего аналитической росписи, предстояло определить приоритеты
для электронной росписи, чтобы обеспечить оперативное разыскание в
ответ на самые актуальные запросы. Таким направлением были выбраны
экономика и право. Ведение единственной в ту пору библиографической
базы данных находилось в руках одного библиографа, который сам отслеживал,
вводил, присваивал поисковые признаки, распечатывал карточки для СКС,
редактировал. Вводились статьи, законодательные и подзаконные акты.
Практически все библиографические составляющие были поисковыми:
_______- Автор
_______- Коллективный автор
_______- Заглавие
_______- Продолжение заглавия
_______- Источник
_______- Предметные рубрики
_______- Ключевые слова
_______- Индекс ББК
Но
статья - не книга, ориентироваться на поиск по автору и по заглавию
не приходится, да и тематические запросы, исходя лишь из индекса ББК,
не удовлетворишь. Следовательно, в электронной библиографической БД
основными поисковыми признаками становятся ключевые слова, которые
программа Вислого позволяет присваивать в любом количестве. То есть
вводили документ, который в ответ на тематический запрос можно будет
отыскать, опираясь практически на одни ключевые слова. Поле "Предметная
рубрика" использовалось формально, рубрик было всего две: "Закон"
и "Статьи".
Поиск
выглядел следующим образом:
_______Запрос: Зарубежный опыт
функционирования рынка ценных бумаг
В
строку поиска вводится ключевое слово "рынок ценных бумаг"
(выходит несколько десятков названий). На этом можно поиск окончить,
просмотрев все записи. Но можно вести поиск и далее, с уточнением
запроса (F3): после нажатия клавиши F3 вводится в поисковую строку
еще одно ключевое слово, которое, уточняет запрос - "Зарубежный
опыт". В результате нового отбора выходит уже те несколько записей,
которые максимально будут соответствовать запросу. Впоследствии в
поле "Предметная рубрика" стало вводиться обозначение текущего
года (1995, 1996…), это позволило сузить поиск в хронологическом отношении:
например, выявить все статьи по данной теме за последний год.
Формализованные
предметные рубрики ("Закон" и "Статьи") позволяли
в процессе поиска отделить ненужные читателю законодательные акты
по его запросу и оставить только статьи.
Чем
руководствовались при присвоении ключевых слов? Словарей не было как
у библиографов, так и у каталогизаторов. Создавать словарь было необходимо,
но при катастрофической загруженности единственного библиографа, обрабатывающего
текущий поток экономико-правовой периодики, это представлялось весьма
проблематичным.
В
процессе ввода информации библиограф старался действовать максимально
корректно, используя основные общепринятые правила присвоения ключевых
слов: множественное число вместо единственного, неприменение инверсирования,
если прилагательное при существительном несет модифицирующую нагрузку
(акционерные общества, фондовый рынок). Широко использовались инверсии,
исходя из соображения "так может сформулировать читатель":
"экономические кризисы" и здесь же "кризисы экономические".
Постоянно привлекались ассоциативные КС. Например, если в статье речь
идет о женской безработице, то ключевыми словами будут: Безработица.
Занятость. Рынок труда. Женская безработица. Женская занятость. Женщины
(в случае проведения поиска на уточнение - можно сначала выявить статьи
на "Занятость", затем уточнить на "Женщины").
Для
законодательных и подзаконных актов было принято обязательно вводить
как ключевые слова номера документов и даты их принятия: 113-ФЗ; 14.07.99.
Работая
без словаря, при вводе ключевых слов библиографу, приходилось опираться
на собственную память, на внутренний словарь программы, а также на
подключенный впоследствии словарь, созданный А. И. Вислым как приложение
к программе "Библиотека". Года через два с момента ведения
базы была предпринята попытка создания Словаря на основе внутреннего
словаря. Предварительно весь его словарный состав был отредактирован,
устранены ошибки и описки и результат выведен на печать. В ходе работы
была создана система ссылок (см. также) и отсылок (см.). Получился
словарный ряд, который так и остался распечатанным на отдельных листах.
Практически
сразу с начала создания Базы данных "СКС. Экономика и право"
была скоординирована работа по разграничению ввода источников с Сектором
информации, который взял на себя такую емкую и вместе с тем мобильную
часть экономической тематики, как Налоги, а впоследствии - еще и Бухгалтерский
учет. С самого начала работниками Сектора был создан Словарь,
куда они включили не только профильные термины по налогам и бухучету,
но и все экономические термины, которыми им приходится оперировать
в ходе как ввода в БД, так и разыскания.
Свой
словарь они предварили предисловием "В помощь пользователю БД
"Статьи". В нем сформулированы основные правила поиска,
где оговорены правила присвоения ключевых слов: множественное и единственное
число, формирование словосочетаний, синонимия и омонимия, сокращения,
обозначения числительных, использование кавычек, объяснена система
ссылок и отсылок
Словарь
был небольшим по объему (120 страниц формата брошюры), существовал
в единственном экземпляре и использовался при вводе в базу данных,
а также для разыскания в условиях отдела. Это был первый опыт настоящего
словаря пусть даже не отраслевого, а скорее тематического, созданного
по всем правилам.
В
1995 году появилась настоятельная необходимость создать автоматизированную
базу данных по политологии. Обвальный читательский спрос поставил
библиографов перед проблемой самой детальной аналитической росписи
по политологии, учитывая, что профильных учебников и пособий в этот
период было очень мало.
В
рамках существующей БД "СКС" решено было вести и тему Политология.
Эту работу скоординировали с сотрудником Сектора каталогов. Записи
по политологии внутри БД были отграничены с помощью предметной рубрики
"Политология", а впоследствии она стала самостоятельной
базой данных, насчитывающей несколько сотен записей. Для формирования
словарного состава и корректной формулировки был привлечен энциклопедический
словарь "Политология", а также учебные пособия, и создан
небольшой словарный ряд для вводящего данные. Впоследствии данная
база стала составной частью БД "Социально-гуманитарный комплекс".
В
конце 1997г. сотрудниками библиографического отдела была создана еще
одна автоматизированная БД "Педагогика" в связи с
большим объемом аналитической росписи и возросшим спросом на инновационные
темы по педагогике и народному образованию. Отсутствие словаря обусловило
введение большого количества ключевых слов на один документ, с широким
использованием синонимии, ассоциативных и смежных понятий. С одной
стороны это говорит о глубоком библиографическом анализе многих документов,
что, собственно, и характерно для этой базы данных. Например, статья
М. В. Каминской "Проблема освоения педагогической деятельности
в системе Эльконина -Давыдова" (ж. "Вопросы психологии",
№5 за 2001г). Для раскрытия содержания введено 14 ключевых слов:
_______1. Педагогическая деятельность
_______2. Деятельность педагогическая
_______3. Педагогическая психология
_______4. Система Давыдова -Эльконина
_______5. Система Эльконина -Давыдова
_______6. Эльконин Д. Б.
_______7. Давыдов В.В.
_______8. Освоение педагогической деятельности
_______9. Стереотипы профессиональной
деятельности
_______10. Психологическая помощь учителю
_______11. Психолого-педагогическая помощь
_______12. Помощь
_______13. Учителя
_______14. Развивающее обучение
С
другой стороны, мы видим здесь инверсии, а также вспомогательные слова
(не педагогические термины), употребление которых облегчит уточняющий
поиск: учителя +помощь или психологическая помощь + учителя.
Как в любой профильной базе данных здесь сложилась своя система присвоения
ключевых слов на основе устойчивых словосочетаний: например, "методика
преподавания", "учебно-воспитательная работа", "учебные
заведения", "учебные планы" и др. Принято решение,
что не подлежат инверсированию словосочетания со словом "педагогика"::
"педагогика сотрудничества", "педагогика живого
слова", "педагогика стиля", "педагогика развития"
и др. Но словосочетания со словом "образование"
инверсированию подвержены очень часто: "образование экологическое"-
"экологическое образование", "образование непрерывное"-
"непрерывное образование", "школы авторские"-
"авторские школы". Но: в словосочетаниях, характеризующих,
например, школу как новаторское явление в образовании, инверсия не
допускается: "школа-лаборатория", "школа-лицей",
"школа-парк".
Словарь
для ввода и поиска по базе данных "Педагогика" создан
на основе внутреннего словаря, т.е. просто распечатан словарный ряд
без ссылочно-отсылочного аппарата, предисловия с инструкцией по поиску
и других элементов словаря, составленного по всем правилам. В процессе
работы в словарный ряд внесено множество дополнений, поэтому предстоит
глобальная работа по переизданию.
Вскоре
работа по ведению базы данных "Педагогика" была скоординирована
с библиотекой городского Института повышения квалификации учителей:
у них и у нас оказались абсолютно одинаковые программы и состав аналитической
росписи. Сотрудничество длится уже третий год. При вводе библиограф
библиотеки ИПК пользуется нашим Словарем, также внося и свои поправки
и дополнения, и его новая версия уже должна стать результатом совместной
работы над ним.
В
конце 1998 года в структуре Центральной городской библиотеки им. Гоголя
появился новый отдел - экономико-правовой (ЭПО), в условиях которого
сразу же потребовалось оперативное разыскание законодательной и всей
профильной информации. Из библиографического отдела автоматизированную
базу данных "СКС. Экономика. Право" передали в ведение библиографам
ЭПО. Они продолжили ее вести, имея в качестве рабочего инструмента
автоматизированный словарь Вислого (приложение к программе "Библиотека")
и широко пользуясь доступом во внутренний словарь самой базы данных,
тем самым, придерживаясь унификации. Например,
_______правильно: право на недвижимость,
право на наследство, право на имущество, право на жизнь
_______неправильно: права на недвижимость
и т.д.
_______правильно: добровольное
медицинское страхование
_______неправильно: страхование
добровольное медицинское
Тем
не менее, поиск бывает затруднен: в 121 библиографическую запись ввели
ключевое слово "финансовый кризис", в 115 записей - "финансовые
кризисы. Есть и другие подобные примеры. В процессе поиска библиографы
уже сами знают о существующих разночтениях, поэтому могут задать ключевое
слово в разных вариациях и все равно прийти к какому-то результату.
Но все это в пределах одного подразделения. Если же такой неотредактированный
каталог будет включен в сеть, то работники других подразделений, при
обращении к нему не только будут испытывать трудности в поиске, но
и получать искаженную (неполную) информацию. Задав, например, ключевое
слово "экономический кризис" и получив в результате сведения
о 27 статьях, скорее всего, не будут искать на "экономические
кризисы", где в результате поиска получили бы сведения о 112
статьях по теме. Еще большие проблемы возникнут при создании автоматизированных
рабочих мест для читателей при отсутствии словарей для пользователей.
Конечно, памятки типа "В помощь пользователю базы данных"
позволяют следовать определенным правилам при поиске необходимой информации,
но при условии обязательной унификации употребления ключевых слов
при вводе.
После
передачи базы данных "СКС. Экономика. Право" в ведение ЭПО
проблемы выбора тематики новой автоматизированной базы данных перед
библиографическим отделом не существовало: начался повальный читательский
спрос на литературу социально-гуманитарной направленности: философию,
социологию, культурологию, политологию. Новую базу данных так и назвали
- "Социально-гуманитарный комплекс" (создана в октябре
1999г. За два года работы объем увеличился до 3700 записей).
Одновременно
с созданием СГК был задуман и начал создаваться внутри базы автоматизированный
словарь с перспективой издания в печатном виде. За основу был принят
предметный указатель к библиографическому указателю ИНИОН "Новая
литература по социальным и гуманитарным наукам. Философия и социология".
Основной словарный состав Словаря практически сформирован и используется
пока при вводе, печатного варианта еще нет. Дело в том, что в условиях
библиографического отдела эту базу данных ведут два библиографа с
двух рабочих мест, периодически "сливая" записи при отсутствии
сети. Но словари, созданные каждым, существенно отличаются по словарному
составу, т.к. один библиограф расписывает философию, историю, другой
- социологию, политологию. Следовательно, чтобы создать единый словарь,
эти два словаря нужно объединить, дополнить и отредактировать ссылочно-отсылочный
аппарат, написать развернутую памятку вводящему и пользователю. Проблема
эта важна еще и тем, что "Социально-гуманитарный комплекс"
ведется корпоративно: кроме двух библиографов библиографического отдела
в росписи участвуют сотрудники двух филиалов. При вводе им приходится
руководствоваться внутренним словарем, но в ближайшем будущем и они
получат печатные варианты Словаря. Периодически участники корпоративного
ввода собираются вместе, чтобы обменяться мнениями, поделиться достижениями
и сомнениями, прийти к единому методическому решению по тому или иному
моменту.
Поиск
в базе данных "Социально-гуманитарный комплекс" ведется
в основном по ключевым словам в ответ на тематические запросы.
_______Например, статья Т. Самсоновой
"Политическая социализация российских школьников" (ж.
"Вестник Моск. ун-та. Сер.18.Социология и политология",
№3 за 2001г). Речь идет об отношении российских школьников к политике,
власти, политическим деятелям. Для раскрытия содержания введено 11
ключевых слов:
_______1. Дети
_______2. Социализация
_______3. Школьники
_______4. Политическая социализация
_______5. Политические образы
_______6. Власть
_______7. Отношение к власти
_______8. Отношение к политике
_______9. Представления
_______10. Ребенок
_______11. Политика
Варианты
поиска:
_______Дети +Политика (набрать "Дети",
уточнить (F3) "Политика")
_______Школьники +Политика
_______Дети +Отношение к власти
_______Дети +Социализация
_______Школьники +Социализация
_______Школьники +Власть
_______ _______и
др.
Большая
часть ключевых слов присваивается в результате анализа самого текста.
Обязательны в ключевых словах фамилии создателей теорий и учений (Макиавелли
теория), инверсирование, конечно, применяется, но в меньшей степени,
чем в более старых базах данных. Слова, употребляющиеся в виде аббревиатуры,
приводятся и в расшифрованном виде: ООН и Организация Объединенных
Наций.
Несомненно,
положительной тенденцией в подходе к ведению этой базы является стремление
к унификации, следованию правилам ввода в Электронный каталог библиотеки.
_______- Ввод имен собственных: Петр
I; Сад Д.А.Ф. де
_______- Ввод числительных: 20в.; 1917г.;
8 марта. Кстати, употребление дефиса между датами не влияет на процесс
поиска: 1941-1945
_______- Использование кавычек: Институт
"Открытое общество".
Так
как же унифицировать, сделать нормализованным тот океан ключевых слов,
в котором вынужден "плавать" наш пользователь? Эта проблема
сейчас является основной для всех наших библиографических баз данных
и Электронного каталога. Пути ее решения мы видим в следующем:
_______1. На основе координирующего органа
- методического совета по справочно-библиографическому аппарату, который
работает в ЦБС несколько лет, создать рабочую группу по авторитетному
контролю индексирования баз данных.
_______2.
Продолжить создание унифицирующих документов, рассчитанных кроме ЭК
и на все базы данных. Пока такие документы разработаны только для
ЭК.
_______3.
Продолжить создание электронного тезауруса Предметных рубрик и Ключевых
слов, начатого отделом каталогизации. Закрепить его как авторитетный
словарь для всех баз данных, сделав его программно-доступным для всех
занимающихся индексированием, а также пользователей.
_______4.
Регулярно дополнять Словарь, консультируясь по вопросам новых, проблемных
ключевых слов с группой авторитетного контроля.
_______5.
Разработать документы по нормализации индексирования в базах данных,
являющиеся обязательными для всех подразделений, занимающихся библиографированием.
<Назад>____________<Вперед>____________<Содержание>____________<На
главную>
_______