|
Тематический
поиск в ЭК: современное состояние и перспективы развития
Тютчева
Наталья Ивановна,
библиотекарь сектора лингвистического обеспечения Единого центра каталогизации
Кемеровская областная библиотека им. В.Д.Федорова
e-mail: lingv@kemrsl.ru
На
сегодняшний день отечественные электронные каталоги достигли той стадии
развития, когда на смену тенденции наращивания их ресурсной базы приходит
интерес к обеспечению эффективности поисковых процедур в заметно выросших
и усложнившихся поисковых массивах.
Помимо задачи обеспечения физического доступа к информации, все большую
актуальность приобретают проблемы интеллектуального доступа - возможности
обнаружить, оценить, отобрать необходимые документы в совокупности
ресурсов. Здесь ведущую роль играют лингвистические средства поиска.
Чаще всего используются индексы иерархических классификаций в режиме
предкоординации и язык предметных рубрик - в режиме посткоординации.
(иерархические классификации, язык предметных рубрик, язык ключевых
слов, слова из заглавий, дескрипторный информационно-поисковый язык)
- все ИПЯ.
А. В. Бобко, Л. А. Жарикова, Г. А. Скарук в своей статье "О лингвистических
средствах тематического поиска в ЭК ГПНТБ СО РАН" пишут, что наибольшую
эффективность при тематическом поиске обеспечивает сочетание нескольких
ИПЯ [1].
Стремление максимально использовать опыт ведения систематического
каталога в сочетании с предметным указателем способствовали тому,
что ББК стала одним из ИПЯ ЭК ГПНТБ СО РАН.
Кроме того, каждому документу, вводимому в ЭК, присваиваются: индексы
рубрикатора ГАСНТИ, рубрики АПУ к систематическому каталогу, ключевые
слова. Такое комплексное использование нескольких ИПЯ (кроме перечисленных
языков тематического поиска имеются возможности поиска по отдельным
элементам языка библиографического описания) позволяет вести достаточно
углубленный поиск, расширяя или сужая его поле. В частности, можно
начать с индекса ББК, уточняя поисковое предписание для дальнейшего
поиска с помощью языка предметных рубрик в рамках соответствующего
раздела классификации.
Тем не менее, в ЭК семантические возможности вышеперечисленных языков
используются не в полной мере. Коснемся семантических возможностей
ББК, неиспользуемых при поиске.
Индекс ББК вводится без идентификации его элементов и используется,
упрощенно говоря, как цифровой код, следовательно, не работает полиерархическая
фасетизированная структура классификации.
Кроме того, нет полной машиночитаемой версии таблиц ББК, что позволило
бы, при необходимости, показать пользователю соответствующие фрагменты
таблиц и выбрать дополнительные разделы.
Язык ББК с предметным входом. Этот вариант предусматривает ввод в
память ЭВМ в полном объеме таблиц ББК со словарными формулировками
рубрик, системой ссылок и отсылок и "предметным входом" - аналогом
традиционного АПУ к систематическому каталогу.
Пользователь формулирует свой запрос на естественном языке, с помощью
предметного входа обращается к соответствующему разделу ББК, выбирает
интересующий его индекс и только затем получает доступ к конкретному
массиву библиографических записей (такая система разрабатывается в
РГБ). Отметим, что и ББК, и "предметный вход" будут функционировать
в качестве самостоятельных блоков в ЭК.
Благодаря иерархической организации словаря ББК располагает самым
широким набором подсказок пользователю и индексатору. Иерархия классификационных
кодов представляет собой механизм, с помощью которого можно свободно
переходить от более широкой темы к более узкой, и наоборот. Это особенно
важно в ситуации, когда пользователь затрудняется четко сформулировать
свой запрос.
Но эта жесткая структура ограничивает гибкость и выразительность языка
ББК. Поэтому нередки случаи, когда, чтобы не изменять структуру таблиц,
новые темы и понятия условно вписываются в уже существующие классы.
В результате, если пользователь хочет сформулировать запрос, используя
путь последовательного доступа по иерархической "лестнице", целый
ряд понятий окажется для него практически скрытым из-за отсутствия
в системе классификации логически выводящих на них ветвей. В этом
случае на помощь приходит язык предметных рубрик.
Трудности при введении ББК возникают и в связи с элементами фатесизации
в ББК. Эти элементы - планы расположения и типовые деления - в традиционном
АПУ представлены справочными карточками, которые не отсылают к конкретным
индексам, а лишь задают ритм поиска. В этом случае необходимо поэлементное
разбиение сложных индексов, причем каждый элемент будет присутствовать
в словаре в качестве самостоятельной лексической единицы.
Представляется целесообразным рассмотрением вопроса о дополнении классификационного
ИПЯ языком, который обладает более высоким уровнем специфичности лексических
единиц, лексика которого формируется с использованием слов естественного
языка. Этим условиям удовлетворяют и язык предметных рубрик, и дескрипторный
ИПЯ.
Для тематического поиска в большинстве ЭК РГБ используются таблицы
ББК. Сложилась ситуация, пишет О. А. Лавренова [2], когда библиотеки
РФ требуют машиночитаемые таблицы ББК, чтобы в своих ЭК обеспечить
принятые в библиотеках принципы тематического поиска с новыми возможностями.
Выбор ББК в качестве ИПЯ был обусловлен следующими факторами:
- ББК используется
в традиционных каталогах большинства библиотек страны;
- ББК при определенном
редактировании легко преобразуется в ИПЯ с иерархическими и ассоциативными
связями и грамматикой;
- таблицы ББК
постоянно развиваются отечественными авторами, в то время как распространение
УДК требуют выполнения международных условий и затрат.
Создание в РГБ машиночитаемых таблиц ББК с предметным входом (доступом)
резко подняло реноме классификации в глазах библиотек, которые заинтересованы
в приобретении файлов ББК на дискетах для загрузки в свои ЭК. Никому
не хочется повторять эту тяжелую работу.
Деления ББК в машиночитаемых таблицах представляются в форме нормативных
записей (Authority Records). Обеспечивается поиск по наименованиям
делений, индексам, предметному входу (Subject access), учет иерархических
и ассоциативных отношений между делениями, вывод ссылок и методических
указаний (Information Notes). Приблизительно одна четверть таблиц
уже сформирована на машинных носителях, причем одновременно создаются
машиночитаемые таблицы ББК для областных библиотек. Ряд библиотек
уже приобрели файлы из таблиц из полных и областных таблиц.
Кроме ББК, в виде Autority files - файлов нормативных записей, должны
быть представлены на машинных носителях записи об индивидуальных и
коллективных авторах. Для проведения этих работ в РГБ создается Служба
ведения нормтивных записей, ведется подготовка русской версии формата
USMARC/Authorities.
Гальцева Т. Е., сотрудник Челябинского государственного технического
университете в своей статье "Электронный каталог в библиотеке вуза"
[3] пишет: "ЭК - это не только база данных, но и справочный аппарат
библиотеки, вобравший в себя функции алфавитного, предметного и систематического
каталогов. Качество предметного каталога обеспечивают схема и методика
предметизации, АПУ и систематизатор. При определении ключевых слов
используются УДК, ББК, Рубрикатор ГАСНТИ, АПУ к систематическому каталогу.Возле
мониторов в обязательном порядке должны быть представлены классификационные
таблицы для пользователей, информация о СПА, инструкции в ЭК. Предпочтителен
метод предварительного формирования словарей основных понятий на основе
классификационных таблиц. При отсутствии нормативных стандартов появляется
угроза составления в каждой библиотеке своего словаря, что создаст
большие неудобства для пользователей ЭК".
Очень эмоционально о значении систематического каталога говорит Эдуард
Рубенович Сукиасян в своей известной статье "Пришло ли время "закрывать"
систематический каталог?" [4].
Он пишет: "В начале 1990-х гг., когда мы мечтали об ЭК в наших библиотеках,
признавалась обязательность базы знаний как составной части программного
обеспечения любого ЭК. Под базой знаний понималась система классификации.
Считалось естественным, что в состав библиографической записи обязательно
должен входить классификационный индекс, по которому может проводиться
поиск. Оставалось найти подходящие инструменты, с помощью которых
можно выйти на нужный читателю индекс. Единственным инструментом поиска,
причем худшим, по мнению автора, оказался язык ключевых слов….
Сегодня ЭК не является альтернативой карточному систематическому каталогу,
его не заменяет, его функции не выполняет. И далее…: "Систематический
поиск возможен. Логический (иерархический) механизм поиска осуществляется
путем развертывания таблиц классификации. Читателю предлагается не
"маска" (форма, бланк), а "меню" - перечень основных делений таблиц
классификации. Движением мыши можно выделить любую строку и открыть
следующий ряд делений. Причем каждая операция последовательно углубляет
поиск. При необходимости можно вернуться назад. Таблицы на экране
содержат ссылочно-справочный аппарат. Когда вы захотите получить библиографическую
информацию, надо будет проделать двойную операцию: выделить индекс
и дать машине команду "каталог". На экране появится фрагмент "систематического
каталога", в котором записи объединены не по пресловутым ключевым
словам, а по содержанию. Получить аналогичный фрагмент можно и другим
способом: выделить в составе любой записи имеющейся в ней индекс.
По индексу можно найти другие книги других авторов, объединенных по
содержанию. Если хотите посмотреть книги более общего характера (на
ступеньку выше) - выделяйте индекс, но на этот раз воспользуйтесь
командой "Система классификации". На экране будет фрагмент таблиц:
вы можете подняться на ступеньку выше или спуститься ниже. Для реализации
подобного поискового механизма придется особым образом ввести в машину
таблицы классификации с их методическим оснащением и ссылочно-справочным
аппаратом. В базу знаний придется ввести также вспомогательные таблицы
(типовые деления в ББК). Для поиска выгодно использовать не ключевые
слова, а предметные рубрики АПУ, язык которого определяется лексикой
и грамматикой классификационной системы. Предметная рубрика формулируется
как бы "под индекс", в ней всегда выражен не только предмет, но и
аспект его рассмотрения. Компьютерный поиск по предметным рубрикам
элементарно прост. Надо только выводить на экран фрагмент указателя,
а не вести поиск по одному слову. Не зная автора и точного заглавия,
читатель никогда не найдет большую часть нужных книг в ЭК без систематического
поиска".
О. А. Лавренова в своей статье "Электронные каталоги: тенденции и
практика Российской государственной библиотеки" [5] пишет: "в мировой
практике наметились следующие тенденции развития ЭК: расширение разнообразия
видов поиска, использование неограниченного количества индексных файлов
(индексирование по любым полям записей, реиндексирование записей в
ранее сформированных базах данных при создании новых индексных файлов),
формирование файлов нормативных записей и т. д.
Лингвистическое обеспечение ЭК РГБ включает формат для баз данных
- РГБ МАРК, формат для нормативных записей USMARC/Authorities, индексы
ББК, ИПЯ на основе таблиц ББК с предметным входом, дополнительные
ключевые слова для расширения возможностей поиска. Разнообразие тематического
поиска обеспечивается возможностями поиска по любым элементам записей
и их сочетаниям с учетом смысловых отношений между поисковыми признаками.
Программное обеспечение ЭК РГБ позволяет: ведение поиска с верхнего
или любого уровня до любого другого уровня иерархии вниз; выход на
любой уровень иерархии и на уровни в разных тематических разделах
одновременно по "предметному входу"; развертывание наименования делений
на экране (с индексами или без них); переход от деления ББК к списку
БЗ без привлечения индекса для поиска".
В исторической перспективе Систематический каталог в совокупности
с классификацией можно представить как некоторую систему представления
знаний на структурном уровне [6].
Информатики уже давно поняли, что переработка знаний связана не только
и не столько с совершенствованием компьютеров, сколько с организацией
самих этих знаний.
Развитие автоматизации в библиотечном деле позволил под другим углом
зрения посмотреть на традиционные библиотечные процессы поиска, систематизации.
Появились исследования, которые давали основания утверждать, что универсальные
библиотечные классификации (ББК, УДК, классификация двоеточием) обнаруживают
сходство принципов построения (полиерархия, система вспомогательных
таблиц, наличие АПУ) с подходами, разрабатываемыми в области представления
знаний в автоматизированных системах.
Классификационные системы, считает Л.А.Жарикова, имеют свои несомненные
преимущества перед другими информационными языками в использовании
их для машинного поиска в том случае, если они достаточно детально
разработаны, имеют развитую структуру и обозначения, позволяющие идентифицировать
каждый элемент индекса.
О возможностях тематического поиска в ЭК ГПНТБ СО РАН пишут Л. А.
Жарикова, Г. А. Скарук, А. В. Бобко, Г. И. Сергеева [7].
"В процессе выбора лингвистических средств тематического поиска принимались
во внимание и опыт создания ЭК других крупных универсальных библиотек,
и сложившиеся традиции каталогизации, и ряд новых задач и требований,
возникающих в связи с внедрением в библиотечную практику автоматизированных
технологий. В результате специалисты ГПНТБ СО РАН пришли к выводу
о целесообразности использования в ЭК информационно-поисковых языков
разных типов (классификационных и предметных), обеспечивающих наиболее
широкие поисковые возможности. В создаваемом комплексе одни поисковые
средства могут быть более ""остеприимными"" другие более жестко структурированными,
но в то же время более обозримыми и контролируемыми, одни будут более
простыми в использовании, другие --более сложными и способными обеспечить
решение более тонких поисковых задач.
В поиске по теме применяются индексы ББК, ГРНТИ, ключевые слова, слова
из заглавий документов и предметные рубрики.
Одним из основных аргументов в пользу включения ББК в состав лингвистического
обеспечения послужила в свое время необходимость обеспечения лингвистической
совместимости электронного и традиционного каталогов. Методика индексирования
и поиска по ББК отрабатавалась в течение многих лет, в Центре научной
обработки документов (ЦНОД) существует отлаженный механизм актуализации
таблиц ББК, контроля качества систематизации.
Основой для создания языка предметных рубрик (ЯПР) стал список рубрик
алфавитно-предметного указателя (АПУ). При этом рубрики АПУ согласованны
цифровыми индексами, что облегчает "предметный вход" в структурированный
словарь ББК.
Поиск в ЭК производится по отдельным словам и формулировкам предметных
рубрик.
Но жесткая связь языка предметных рубрик (ЯПР) с ББК имеет и оборотную
сторону. Отражая структуру и логику построения классификационных таблиц,
список рубрик АПУ не всегда удовлетворяет требованиям, предъявляемым
к ЯПР как самостоятельному поисковому языку.
Кроме индексов ББК, ЯПР, ГПНТБ в качестве ИПЯ использует ключевые
слова, Рубрикатор ГАСНТИ.
Программные средства ЭК предоставляют широкие возможности для варьирования
поисковых стратегий. В зависимости от задач поиска можно применять
один или несколько ИПЯ, используя для построения поискового предписания
(ПП) логические связки булевой алгебры и правостороннее усечение терминов.
Чаще всего в реальном поиске задаются содержательные и формальные
признаки, например, запрашиваются издания по той или иной теме за
определенные годы выпуска или период конкретного поступления в библиотеку,
книги конкретного автора, конкретные виды изданий. Но в сложных случаях
может быть удобно использование в поисковом предписании различных
видов тематического поиска. Самый распространенный вариант - сочетание
классификационных индексов с предметными индексами и/или словами из
заглавий документов.
В ГПНТБ СО РАН был проведен в эксперимент по моделированию реальных
поисковых ситуаций в ЭК, которые позволили оценить поисковые возможности
используемых в библиотеке ИПЯ.
Интересные результаты были получены при поиске с усечением по индексам
ББК. В таких случаях в выдачу оказываются включенными документы, содержащие
в соответствующем поисковом поле все нижестоящие по отношению к приведенному
поисковому предписанию индексы. Так же, как и в словарных ИПЯ, усечение
приводит к изменению (расширению) границ поиска, - это происходит
благодаря логике классификации. В отличие от языка предметных рубрик
(ЯПР), ББК позволяет создавать и просматривать обширные тематические
массивы библиографических описаний по несколько иному - отраслевому
принципу. При этом, изменяя длину индекса в ту или иную сторону, мы
либо сужаем, уточняем, либо расширяем тематические рамки обзора.
С помощью ББК можно в кратком поисковом предписании объединить большое
число понятий по широкой отраслевой теме. Например, если читателя
интересуют книги о болезнях органов дыхания, нет необходимости перечислять
их все. Достаточно привести в поисковом предписании индекс ББК Р412.
Подобными возможностями в таком объеме не располагает ни один из поисковых
языков ЭК.
Но в ряде случаев методика индексирования предполагает ограничения,
к которым можно отнести принцип обобщающего индекса документа о трех
и более предметах, недопустимость вторичного отражения произведения
из обобщающей рубрики в подчиненную и наоборот. Возможности ЭК по
многоаспектному отражению содержания документов не должны ограничиваться
условными методическими приемами. При обработке некоторых видов документов
(сборников, продолжающихся изданий, многоаспектных монографий кажется
целесообразным использование приемов аналитической систематизации.
Это тем более уместно, если учесть, что в современном ЭК поиск по
классификационным индексам далек от совершенства - затруднен доступ
в классификационное дерево, отсутствуют полномасштабные нормативные
словари информационно-поисковых языков. Сказывается на результатах
поиска и невозможность идентификации отдельных элементов сложных индексов
ББК.
Возможности классификационных языков будут проявляться наиболее полно
в случаях, когда пользователь недостаточно четко осознает свои информационные
потребности. Тогда таблицы ББК помогут ему сориентироваться в системе
понятий интересующей его отрасли, уточнить запрос в соответствующем
контексте, соотнести его с другими отраслями знаний внутри классификационного
дерева. Однако наш эк такими возможностями пока не обладает.
Маршак Б. И, Зайцева Е. М., Фуралев О. А., Сбойчаков К. О. [8] - сотрудники
ГНТБ считают, что создание классификационной базы УДК позволит использовать
ее для индексирования документов и запросов в автоматизированном режиме,
так и как справочное руководство по классификационной системе с высокосервисными
функциями…. База данных предоставляет читателю удобный и гибкий поисковый
аппарат, позволяющий свободно ориентироваться в классификационной
системе, осуществлять в ней поиск по индексам с последующим входом
в документную базу данных….
Систематизатор же обеспечивается эффективными средствами поиска по
классификационным таблицам и средствами интерактивного индексирования.
Предметом тематического поиска является тема документа, его составной
части, фрагмента (включая персональный, географический и другие аспекты),
выраженная в классификационных индексах, предметных рубриках, ключевых
словах и библиографической записи [9].
Ю. Селиванова, Т. Масхулия в своей статье "Электронный каталог: формирование
и поиск. Тенденции современной каталогизации" [10] пишут, что "современный
ЭК состоит из трех частей - части, включающей библиографические сведения;
части, включающей авторитетные сведения и части, включающей сведения
об экземпляре (циркуляции документа)". В настоящее время в мире существуют
несколько семейств форматов, включающих систему форматов для различных
данных - библиографических, классификационных, авторитетных, сведений
о циркуляции. К ним относятся семейства Marc 21 (US), UNI, RUS, включающие:
формат для представления библиографических данных, формат для представления
авторитетных данных, формат для представления классификационных данных,
формат для представления данных о циркуляции.
В 2000 г. в РГБ состоялся семинар, посвященный современному состоянию,
перспективам развития ББК [11].
Э.Р. Сукиасян так сказал о возможностях использования ББК в качестве
ИПЯ. "Классификационный подход обладает наибольшей эффективностью
при поиске тогда, когда читатель, и даже квалифицированный библиограф
затрудняются сформулировать поисковое предписание. Второе. ББК намного
эффективнее в условиях автоматизированного поиска по отдельным элементам
индекса и их сочетаниям….
Заключая дискуссию, Э. Р. Сукиасян сказал: "Россия - единственная
страна, где ставится вопрос о предпочтении одного вида поиска другому.
Во всех других странах вместо "или" говорят "и", так как различные
способы поиска не являются альтернативными, а дополняют друг друга.
Гипертрофированное внимание к предметизации и поиску по ключевым словам
обусловлено кризисом в ББК к началу 1990-х гг., а также тем, что все
зарубежные библиотечные автоматизированные системы являются в первую
очередь предметными. Этому есть объяснение - фонды в подавляющем большинстве
библиотек открыты и организованы в систематическом порядке…
Мы считаем, что во всех случаях, если читатель разыскивает не конкретное
произведение, когда автор, название, другие формальные признаки ему
известны, а литературу по теме, он должен пользоваться не "предметным
входом", а базой знаний - классификационными таблицами. Поиск организуется
путем просмотра на экране перечня делений. Выбранное деление открывает
следующий (нижестоящий) ряд. Затем процесс повторяется. "Голая" структура
может и должна быть дополнена методическими указаниями, вопросами,
диалогом….Очень эффективной окажется выдача на экране найденного по
запросу массива записей в систематическом порядке - в виде фрагмента
систематического каталога. Конечно, и здесь должны быть реализованы
все удобства карточного каталога, располагающего разделителями с перечнем
делений следующей ступени и системой ссылок".
Г. А. Скарук, мл. науч. сотрудник ГПНТБ СО РАН в своей статье "Тематический
поиск в электронном каталоге: проблемы лингвистического обеспечения"
[12] пишет, что различные библиотеки России в зависимости от своего
типа, задач, которые они надеются решить с помощью ЭК, выбирают комплекс
лингвистических средств, в котором какой-либо из языков считается
наиболее эффективным, а другие играют вспомогательную роль. Например,
в Автоматизированной информационной системе по общественным наукам
(АИСОН) основным средством поиска является дескрипторный ИПЯ, но при
этом библиотека ИНИОН разрабатывает собственный нормативный файл предметных
рубрик. В РГБ в составе АБИС готовится "база знаний" на основе ББК
с "предметным входом". Но одновременно специалисты РГБ в качестве
одного из основных ИПЯ рассматривают и язык предметных рубрик.
Отстаивая преимущества того или иного поискового языка, авторы находят
в каждом случае веские аргументы. Каждый ИПЯ обладает рядом устойчивых
характеристик, которые в одних вариантах поиска могут проявиться как
несомненные достоинства, а в других - негативно сказаться на результатах.
Для решения различных поисковых задач наиболее эффективными могут
оказаться разные поисковые средства.
Н. И. Гендина считает, что многообразие задач, обусловленных с одной
стороны мощностью и разнообразием поступающим в библиотеку потока
документов, а с другой - широким диапазоном и сложностью информационных
потребностей пользователей, ростом их требований к качеству предоставляемой
информации требует применения комплекса различных по своим функционально-структурным
особенностям ИПЯ. В ЭК, где,в отличие от традиционных, возможен многоаспектный
поиск информации по сочетанию признаков, эта идея может быть реализована
в полной мере.
Понятно увлечение специалистов языком предметных рубрик, достоинством
которого является близость к естественному языку. Для многих библиотек
стала эталоном система предметных рубрик библиотеки Конгресса США.
По результатам исследований, в ЭК нового поколения на базе традиционных
предметных языков? вводятся элементы иерархического структурирования
(иерархическогие деревья, логические цепочки), все шире используютсяв
автоматизированном поиске классификационные ИПЯ.
Вопрос об обеспечении оптимального взаимодействия классификационных
и предметных языков в составе единого комплекса остается открытым.
К ЭК в полной мере применимы общие принципы проектирования автоматизированных
информационно-поисковых систем (АИПС), согласно которым построение
комплекса лингвистических средств должно производиться на основе перечня
функциональных задач в соответствии со спецификой ЭК и характеристиками
его пользователей.
Для оптимизации лингвистического обеспечения ЭК формируется перечень
задач тематического поиска; определяются категории пользователей ЭК
(сюда входят как задачи внешних пользователей - читателей, так в задачи,
решаемые библиотечными специалистами в ходе информационно-библиографического
и справочного обслуживания).
Затем в соответствии задачами определяется перечень создаваемых в
результате поиска в ЭК информационных продуктов и услуг, для которых
необходимо установить некоторые параметры качества: полнота и точность
результатов, комфортность и оперативность. При этом для разных типов
поисковых задач необходимы будут различные уровни полноты и точности
выдачи.
На следующем этапе исследования для каждого типа задач собирается
информация об используемых для ее решения лингвистических средствах.
С этой целью ИПЯ оцениваются с точки зрения их способности обеспечить
установленные ранее параметры качества - определяется уровень полноты
и точности, которым обеспечивается поиск на том или ином ИПЯ. На основании
проведенного анализа делаются выводы о целесообразности включения
того или иного ИПЯ в состав комплекса лингвистических средств ЭК.
Нужно учитывать еще одну особенность при выборе ИПЯ - его лингвистическую
совместимость с существующими карточными и автоматизированными каталогами.
На заключительном этапе могут быть произведены:
- замена совокупности
ИПЯ одним языком, равнозначным по функциональной эффективности этой
совокупности;
- исключение
ИПЯ, если при этом эффективность поиска остается в заданных пределах;
- дополнение
комплекса языками, применение которых способствует повышению параметров
качества;
- совершенствование
уже используемых ИПЯ.
Необходимо позаботиться и о разработке правил обеспечения качества,
т. е. об инструктивных и методических материалах по обеспечению поиска
и индексирования документов. Для этого на основании обобщения результатов
исследования возможна выработка для различных типов запросов эффективных
стратегий поиска в ЭК. Используя эти данные, можно уже в начальной
стадии поиска определить уровень сложности запроса и определение круга
источников удовлетворения потребностей).
В 1996 г. на базе ЭК в ГПНТБ СО РАН было проведено пилотажное тестирование
лингвистических средств. В ходе эксперимента было случайным образом
отобрано 12 тестовых запросов, для каждого из которых были составлены
самостоятельные поисковые предписания на каждом из 5 применяемых в
ЭК ГПНТБ информационно-поисковых языков тематического поиска (ББК,
ГРНТИ, языка предметных рубрик, слов из заглавий документов, ключевых
слов).
По результатам серии поисков определялась точность, полнота выдачи
информации, а также причины потерь информации и информационный шум
по каждому ИПЯ. Полнота определялась как отношение доли участия в
выдаче того или иного ИПЯ по отношению к суммарной выдаче по данному
запросу на всех 5 языках.
Оказалось, что лидирующую позицию по количественным параметрам в эксперименте
занял язык ББК (средняя полнота выдачи составила 69%, точность - 65%).
В результате поиска на этом языке оказалось успешно реализованным
(полнота и точность выдачи более 50%) наибольшее количество запросов
(7 из 12).
Язык предметных рубрик уступил ББК по критерию полноты лишь незначительно
(66%), а по точности превзошел - 84%. На третьем месте оказался поиск
по словам из заглавий документа. Наиболее высокую точность показал
(91%) поиск по ключевым словам, но полнота выдачи оказалась низкой
- 25%. Самые низкие показатели точности поиска оказались у ГРНТИ.
Это связано с тем, что трехуровневый рубрикатор не предназначен для
узкотематического поиска.
Г. В. Ядрова из научной библиотеки Таврического национального университета
им. В. И. Вернадского из г. Симферополя (Украина) в своей статье,
которая является ответом-размышлением на статью Э. Р. Сукиасяна
"Пришло ли время закрывать систематический каталог" затрагивает ….
Роль наших методических и обучающих центров, которые сделали бы сравнительный
анализ применяемых в библиотеках различных программ?
"В работе с ЭК наоборот: в большинстве случаев запрос сформулирован
очень узко. Чтобы убедить читателя просмотреть дополнительные источники
информации, приходится использовать встроенные в программу системы
классификации (они не всегда нас удовлетворяют, и здесь очень много
проблем).
Ядрова пишет: "Очень часто именно запросы читателей ставят задачу
организации нового вида поиска…".
Она же: "Библиотекари знают, какой труд перевести печатные АПУ или
вспомогательные таблицы ссылок и отсылок в другую форму…".
Она же: "Отсутствие электронных таблиц классификации, АПУ превращается
сегодня в вопрос, который не позволяет дальше совершенствовать поиск".4
Библиотекари сами пытаются решить эту проблему с учетом специфика
каждой библиотеки. Но так хочется получить централизованно если не
готовые электронные АПУ, то хотя бы схемы и рекомендации по их созданию.
Иначе скоро будем задавать себе вопросы типа - а зачем мы тратили
столько времени и сил на создание некачественных электронных АПУ?
Сегодня ЭК не является альтернативой карточному систематическому каталогу,
его не заменяет, его функции не выполняет.
Но, считает Ядрова: "альтернативы применению компьютерных технологий
нет. Хотим мы или нет, но нам придется использовать этот инструмент
для создания нового типа каталога, поиск в котором будет удовлетворять
самым строгим требованиям систематизации документов".
Ядрова: "активно использовать этот вид поиска (с помощью таблиц ББК)
мы пока не можем. Причина - отсутствие таблиц соответствия систем
классификации. Вид поиска "Другая классификация" представляет собой
набор цифр, которые никак систематически не структурированы и даже
словесно не расшифрованы. Естественно, что искать по такой цифровой
казуистике никто не будем". "Поиск по индексу АПУ частично реализован
в комплексном поиске, где можно из 2-3 видов поиска (ключевых слов,
предметной рубрики, персоналии) составить точный запрос, но все же
это только прообраз электронного АПУ".
Э. Р. Сукисян пишет: "Надо ли специально говорить о том, как выгодно
использовать для поиска не ключевые слова, а предметные рубрики АПУ.
Язык указателя определяется лексикой и грамматикой классификационной
системы. Предметная рубрика формулируется как бы под индекс, в ней
всегда выражен не только предмет, но и аспект его рассмотрения. Крупное
гнездо указателя дает огромную информацию о том, в каких аспектах
отражен тот или иной предмет…. Поиск по предметным рубрикам АПУ прост.
Читатель знакомится с рубрикой, всеми ее подрубриками. Выделив индекс,
читатель нажимает команду либо "каталог", либо "система классификации".
В первом случае он сразу получает библиографическую информацию, во
втором - "копается" в базе знаний, уточняет индекс… АПУ может быть
перестроен и превращен в тезаурус. Классификационные индексы жестко
свяжут его в единую поисковую систему с таблицами ББК".
Ядрова говорит, что АПУ вообще не выведен как вид поиска для читателя
во многих в настоящий момент используемых автоматизированных библиотечных
программах. Он существует в электронном виде, но создан как самостоятельные
БД и предназначен в основном для служебного пользования"
О корпоративности в каталогизации
Корпоративная каталогизация предполагает, что где-то есть гипотетический
центр специалистов, которые обрабатывают поток документов и выполняют
весь комплекс связанных с этим методических задач. А библиотеки -
члены данной сети покупают или каким-либо другим способом используют
готовый продукт в той или иной степени.
Централизация вкупе с компьютеризацией усиливает тенденцию к монополизации,
нормированию и формализации процессов систематизации.
В этом есть и преимущества, но очевидны и недостатки: принятие упрощенных
обобщающих классификационных решений в процессе аналитико-синтетической
обработки документов для электронных каталогов.
Г. В. Ядрова в ответ на статью Э. Р. Сукиасяна "Пришло ли время закрывать
систематический каталог?" пишет, что "Все же нужно создать систематические
каталоги нового типа, с еще более широкими возможностями поиска. Постепенная
и качественная замена (а не подмена и бесконечный дубляж) позволит
избавить библиотекарей от двойных нагрузок и тем самым поможет им
поверить в то, что компьютер не наказание, а всего лишь инструмент,
облегчающий труд специалиста.
Список литературы:
1. Бобко А.
В., Жарикова Л. А.,Скарук Г. А. О лингвистических средствах тематического
поиска в ЭК СО РАН //Региональные библиотечные системы. - Новосибирск,
2. Лавренова
О. А. Создание ЭК РГБ: стратегия, лингвистика, проблемы//библиотеки
и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества.
Крым-94. - М.; 1994. - С. 118.
3. Гальцева
Т. Е. Электронный каталог в библиотеке вуза//НТБ. - 1996. - № 8. -
С. 6 - 12.
4. Сукиасян
Э. Р. Пришло ли время "закрывать" систематический каталог?//НТБ. -
2002. - № 12. - С. 18 - 30.
5. Лавренова
О. А. Электронные каталоги: тенденции и практика Российской государственной
библиотеки//НТБ. - 2000. - № 2. - С. 29 - 35.
6. Жарикова
Л. А. Тематический поиск: от карточного каталога к электронному -
меняет ли среда суть проблемы//Формирование современной информационно-библиотечной
среды. - Новосибирск, 2004. - С. 92.
7. Жарикова
Л.А., Скарук Г. А., Бобко А. В., Сергеева Г. И. Возможности тематического
поиска в электронном каталоге ГПНТБ СО РАН//НТИ. - 2000. - № 8. -
С. 30 - 38.
8. Маршак Б.
И., Зайцева Е. М., Фуралев О. А., Сбойчаков К. О. Универсальный интерфейс
представления классификационных баз данных на примере базы данных
УДК//НТБ. - 2000. - № 3. - С. 57 - 60.
9. Левин Г.
Л. Библиографический поиск: теоретический аспект//Библиотековедение.
- 2000. - № 4. - С. 49.
10. Селиванова
Ю., Масхулия Т. Электронный каталог: формирование и поиск. Тенденции
современной каталогизации//Библиотечное дело. - 2004. - № 8. - С.
20 - 21.
11. Библиотечно-библиографическая
классификация: современное состояние, перспективы развития//Библиотековедение.
- 2001. - № 3. - С. 31 - 35.
12. Скарук Г.
А. Тематический поиск а электронном каталоге: проблемы лингвистического
обеспечения//Библиотековедение. - 2001. - № 3. - С. 48 - 55.
<Назад>____________<Вперед>____________<Содержание>____________<На
главную>
|
|