Лингвистическое обеспечение электронных каталогов библиотечно-информационных систем и сетей: состав и особенности использования при проведении тематического поиска

Скипор Инна Леоновна
Сбитнева Елена Андреевна,
Кемеровский государственный университет культуры и искусств
e-mail: nir@art.kemerovonet.ru

Активное внедрение информационно-коммуникационных технологий в деятельность библиотек, интеграция разрозненных информационных ресурсов в рамках библиотечно-информационных сетей (прежде всего, корпоративных библиотечно-информационных сетей) позволили существенно расширить номенклатуру предоставляемых информационных продуктов и услуг, создать более комфортные условия доступа к библиотечным ресурсам, обеспечить на принципиально новом уровне взаимодействие библиотеки и пользователя.

Как известно, одним из важнейших инструментов реализации цели повышения полноты и оперативности библиотечно-информационного обслуживания всех категорий пользователей за счет предоставления им объединенных информационных ресурсов и средств поиска в них с использованием современных информационных и телекоммуникационных технологий являются web-сайты.

В связи с этим для решения задач определения состава предлагаемых современными библиотеками информационных продуктов и услуг были проанализированы сайты библиотечно-информационных систем и сетей (на примере региональных корпоративных библиотечно-информационных сетей), а также отдельных библиотек (на примере областных научных библиотек Сибирского региона). В обобщенном виде данные, полученные в ходе исследования, можно представить следующим образом:

         1. Информационные продукты:
         Электронные каталоги;
         Электронные библиотеки;
         Базы данных;
         Полнотекстовые документы:
         Документы, отражающие сведения по истории, культуре и т.п.;
         Документы, отражающие деятельность библиотечно-информационной системы, сети, либо отдельной библиотеки (в т.ч. организационно-правовые, нормативные, справочные и т.п. документы).

         2. Информационные услуги:
         Удаленный доступ к информационным ресурсам;
         Удаленный поиск в локальных, распределенных и сводных информационных ресурсах;
         Электронная доставка документов;
         Телеконференции и списки рассылки новостей в электронной форме;
         Справочно-консультационные услуги.

Приведенные выше данные в наибольшей степени отражают перечень информационных продуктов и услуг, создание и предоставление которых возможно только в условиях использования информационно-коммуникационных технологий. Состав информационных продуктов и услуг конкретных библиотечно-информационных систем, сетей, либо отдельных библиотек различен, что обусловлено их особенностями: принадлежностью к определенному типу и виду, категориями обслуживаемых пользователей и т.п. Однако важнейшим информационным продуктом любой библиотечно-информационной системы, сети или отдельной библиотеки является, прежде всего, электронный каталог (ЭК), а важнейшей услугой, предоставляемой на его основе- информационный поиск, главным образом, тематический поиск.

Как известно, библиотечный каталог является традиционным информационным продуктом библиотеки, а проведение тематического поиска - традиционной информационной услугой. Однако их подготовка в условиях использования информационно-коммуникационных технологий не только изменила физическую форму представления, но и существенно расширила их возможности.

Чтобы всесторонне оценить электронный каталог, необходимо охарактеризовать различные его составляющие: семантические, программные, технические, эргономические и т.п. Современные программные и технические средства позволяют создать комфортную среду для пользователя при работе с электронным каталогом, обеспечить широкий спектр сервисных возможностей: быстро установить наличие конкретного издания в фонде библиотеки и его месторасположение, обеспечить поиск необходимых данных на рабочем месте либо дома, сформировать заказ на конкретное издание и т.п. Однако, как нам кажется, все-таки важнейшей характеристикой при оценке поисковых возможностей электронных каталогов является его семантическая составляющая и, прежде всего, лингвистическое обеспечение электронного каталога.

Особая важность данного вопроса обусловлена тем, что работа с электронным каталогом у современного пользователя возможна как в библиотеке, так и в режиме удаленного поиска, главным образом, через Интернет, что определяет особенности взаимодействия конечных пользователей с сетевыми информационными ресурсами. Суть их заключается в отсутствии возможности непосредственных контактов пользователей сетевых информационных ресурсов с работником библиотеки, призванным оказывать им необходимую помощь при выборе оптимального пути в "информационном лабиринте". Это изначально накладывает особые требования к средствам поиска в электронных каталогах, доступных через Интернет.

Следует отметить, что проблемы определения состава лингвистического обеспечения электронных каталогов, организации тематического поиска в электронных каталогах, совершенствования механизма организации Интернет-версий сводных каталогов библиотечных систем и развитие их поисковых возможностей неоднократно рассматривались на страницах профессиональной печати. В частности, данные проблемы поднимались в работах Н.Е. Каленова (1), О.А. Лавреновой (2), Г.А. Скарук (3), О.А. Фуралева и Е.М. Ручимской (5) и др.

С целью определения состава лингвистического обеспечения электронных каталогов библиотечно-информационных систем и сетей проведено исследование, в рамках которого были проанализированы поисковые образы документов (ПОД), а также элементы интерфейса электронных каталогов региональных корпоративных библиотечно-информационных сетей (РКБИС), поскольку именно РКБИС в настоящее время являются наиболее распространенными и перспективными формами объединения библиотечных и информационных учреждений.

Анализ полученных данных позволил определить состав лингвистического обеспечения электронных каталогов библиотечно-информационных систем и сетей, который может быть представлен следующим образом:

         1. Информационно-поисковые языки:
                  1.1. Классификационные языки (ББК, УДК, ГРНТИ);
                  1.2. Вербальные языки (язык предметных рубрик, язык ключевых слов, дескрипторный ИПЯ);
                  1.3. Объектно-признаковый язык, в т.ч. язык библиографического описания.

         2. Элементы информационно-поисковых языков:
                  2.1. Международные стандартные номера (ISBN, ISSN);
                  2.2. Коды названий (языков, стран, физических единиц и т.п.).

         3. Языки взаимодействия с системой:
                  3.1. Семантические языки разметки текста (HTML и т.п.);
                  3.2. Языки диалога (элементы интерфейса и т.п.).

         4. Форматы представления данных в машиночитаемой форме (коммуникативные форматы RUSMARC, USMARC, UNIMARC и др.).
         5. Нормативно-справочная база:
                  5.1. Нормативные документы (стандарты);
                  5.2. Инструктивно-методические документы (инструкции, методические рекомендации, правила);
                  5.3. Файлы авторитетных записей (предметных рубрик, авторов и т.п.);
                  5.4. Справочные документы.

Результаты, полученные в ходе проведенных исследований показали, что состав поискового образа документа в структуре электронного каталога существенно расширился за счет включения совокупности классификационных (УДК, ББК, ГРНТИ) и вербальных информационно-поисковых языков (языка ключевых слов, языка предметных рубрик). Расширение состава используемых ИПЯ обусловлено стремлением разработчиков увеличить поисковые возможности электронных каталогов, а также необходимостью достижения совместимости лингвистического обеспечения библиотечно-информационных систем, главным образом, в условиях корпоративного взаимодействия библиотек.

Тем не менее, следует отметить, что при разработке лингвистического обеспечения электронных каталогов в большей мере были заимствованы положения концепции построения традиционных (карточных) каталогов. Поскольку в библиотечно-информационные сети объединяются библиотеки различных типов, у которых уже сформированы свои правила и традиции семантической обработки документов, накоплены значительные информационные массивы, обработанные в соответствии с этими правилами, разработчики электронных каталогов выбирают путь параллельного использования нескольких ИПЯ. Такой путь, как нам кажется, не может рассматриваться как оптимальный, поскольку идет экстенсивное наращивание поисковых возможностей электронных каталогов.

Для того, чтобы установить возможности использования конкретных лингвистических средств при проведении тематического поиска, был проведен анализ состава поисковых атрибутов электронных каталогов. Далее он был сопоставлен с составом элементов поискового образа документа. Полученные результаты представлены в таблице 1.

Таблица 1
Использование лингвистического обеспечения электронных каталогов при проведении поиска

Наименование РКБИС

ББК

УДК

ГРНТИ

ДКД

ЯКС

ЯПР

ДИПЯ

Элементы ЯБО

ISSN

ISBN

Язык HTML

Региональная корпоративная библиотечная система г. Новосибирска

+

+

 

 

+

 

 

+

+

+

 

Открытая электронная библиотека г. Томска

+

+

 

 

+

+

 

+

+

+

 

Ярославская корпоративная библиотечная сеть

+

+

 

 

 

+

 

+

+

+

+

Корпоративная сеть Московских библиотек

+

+

+

 

 

+

 

+

 

+

 

RUSLANet: Библиотечная сеть учреждений науки и образования Северо-Западного региона России

+

+

 

 

 

+

 +

+

+

+

+

Корпоративная библиотечная система республики Карелия

+

+

 

 

+

+

 

+

 

 

+

Consensus omnium: корпоративная сеть библиотек Урала

 

+

 

 

+

+

 

+

+

+

 

Корпоративная библиотечная сеть г. Казани

+

+

+

+

+

+

 

+

+

+

+

Нижегородская корпоративная библиотечная система

+

 

 

 

 

+

 

+

+

+

 

Омская корпоративная библиотечная система

+

+

 

 

+

+

 

+

+

+

 

КОРБИС: Тверь и партнеры

+

+

 

 

 

+

 

+

 

+

+

Открытая библиотечная система Челябинского региона

+

+

 

 

+

+

 

+

 

+

 

МАРС

+

+

 

+

 

+

+

+

+

 

+


+ лингвистические средства, использующиеся при построении ПОД
+ лингвистические средства, использующиеся при поиске

Анализ данных, представленных в таблице 1, позволяет сформулировать следующие выводы:
         1) Состав лингвистических средств, использующихся при построении ПОД, шире, чем состав лингвистических средств, обеспечивающих поиск в ЭК.
         2) При проведении поиска во всех электронных каталогах используются элементы библиографического описания.
         3) Индексы иерархических классификаций (УДК, ББК, ГРНТИ, ДКД) используются при построении ПОД, как правило, параллельно. При этом индексы УДК и ББК используются при построении ПОД почти во всех анализируемых ЭК.Однако следует отметить, что ПОД в пределах даже одного электронного каталога не всегда содержит одинаковый набор классификационных индексов. Кроме того, в электронных каталогах каждый ИПЯ может быть представлен как отдельный поисковый атрибут (например, "УДК", "ББК"), так и как сводный атрибут поиска (например, "Индексы ББК, ГРНТИ", "Классификации").
         4) В качестве вербальных языков преимущественно используется язык предметных рубрик. Вербальные языки (язык ключевых слов, дескрипторный ИПЯ, язык предметных рубрик) также могут применяться при поиске параллельно. Так, в качестве поисковых атрибутов параллельно используются "Ключевые слова" и "Предметные рубрики" в Открытой библиотечной системе Челябинского региона, Корпоративной сети библиотек Урала, Ярославской корпоративной библиотечной сети, Корпоративной библиотечной системы республики Карелия. При этом они представляются либо как отдельные поисковые атрибуты ("Ключевые слова", "Предметные рубрики"), либо как сводный атрибут ("Тематика").
         5) В большинстве электронных каталогов атрибутом поиска выступают международные стандартные номера (в т.ч. ISSN и ISBN).
         6) В ПОД используется также язык HTML.

Таким образом, полученные в ходе исследования результаты свидетельствуют о том, что используемый состав лингвистического обеспечения электронных каталогов позволяет обеспечить поиск по различным признакам:
         - по формальным признакам (реализуется на базе языка библиографического описания, международных стандартных номеров);
         - именам объектов поиска (реализуется на базе элементов объектно-признакового языка);
         - тематическим признакам (реализуется на базе классификационных и вербальных языков);
         - совокупности различных признаков (реализуется на базе совокупности ИПЯ).

Как известно, наибольшую часть запросов, выполняемых на базе электронных каталогов, составляют тематические запросы. Реализация тематического поиска в электронных каталогах возможна на базе классификационных и вербальных ИПЯ. В профессиональной среде утвердилось мнение, что классификационные ИПЯ обеспечивают широкотематический поиск, а использование вербальных ИПЯ направлено на решение задач узкотематического поиска. Однако экспериментальных данных, полученных в ходе исследований поисковых возможностей электронных каталогов, которые бы подтверждали или опровергали эти утверждения, в профессиональной печати не отражено.

При этом следует отметить, что проводились исследования (4), в рамках которых определялись возможности использования различных видов ИПЯ для решения различных задач различными категориями пользователей.

Так, например, Г.А. Скарук были исследованы поисковые стратегии различных категорий пользователей ГПНТБ СО РАН: научных работников, специалистов с высшим и средним специальным образованием, студентов вузов. При этом учитывались цели поиска: подготовка доклада, сообщения; работа над диссертацией; разработка научной темы, проблемы; планирование новых исследований; написание статьи; преподавательская деятельность; решение конкретной производственной задачи; конъюнктурное исследование рынка; принятие организационно-управленческих решений; информационная деятельность; подготовка курсовой работы; написание диплома; профессиональное и общее самообразование, повышение квалификации; решение социально-бытовых проблем.

Результаты, полученные исследователем, свидетельствовали о том, что наиболее высокие ранги у всех категорий опрошенных получил критерий точного соответствия цели поиска. Однако требуемые показатели полноты и точности поиска у различных категорий пользователей были различны (в наибольшей степени точность поиска востребована у студентов, в наименьшей - у научных сотрудников).

В целом отраженные в работе (4) данные свидетельствуют о востребованности пользователями каталогов и классификационных, и вербальных ИПЯ при проведении ими тематического поиска. Однако полученные в ходе этих исследований результаты также не могут дать однозначного ответа на вопрос: использование какого ИПЯ (классификационного или вербального) эффективнее при проведении тематического поиска.

Обеспечение возможности поиска в электронных каталогах на основе использования ИПЯ, базирующихся на естественном языке (в частности, языка ключевых слов, дескрипторных ИПЯ, языка предметных рубрик) спровоцировало ситуацию, когда предпочтение при проведении тематического поиска пользователем отдается именно вербальным языкам. Это закономерно, поскольку пользователю близок и наиболее понятен данный тип ИПЯ. В связи с этим особо актуальной является проблема полноты и точности отражения содержания документа средствами именно данного типа ИПЯ.

Особого внимания заслуживает состав аспектов содержания, отражаемых в ПОД с помощью ключевых слов. Анализ нормативных, инструктивно-методических, научных, учебных изданий, отражающих вопросы координатного индексирования, свидетельствует о том, что качественные характеристики (т.е. состав отражаемых аспектов содержания) либо вообще не рассматриваются, либо ограничиваются фразами типа "список ключевых слов должен, в первую очередь, отражать те части документа, которые представляют наибольший читательский спрос", "следует стремиться к полноте отражения в ПОД всех наиболее важных понятий, рассматриваемых в документе" и т.п.

Анализ поисковых образов документов реальных электронных каталогов библиотек показывает, что в качестве объектов отражения, как правило, выступают объекты (предметы) исследования, сторона (точка зрения), с которой исследуется предмет или его свойства, область применения объекта, законы, уравнения, функции, географическая локализация объектов, временной период. При этом такой аспект, как вид издания отражается не во всех ПОД и зачастую дублирует сведения из библиографического описания.

Чтобы оценить возможности удовлетворения информационных запросов пользователей на базе электронных каталогов с использованием вербальных ИПЯ, нами была предпринята попытка проанализировать реальные запросы пользователей библиотек. Был проведен структурно-семантический анализ запросов пользователей. При этом особое внимание уделялось анализу состава аспектов рассмотрения, отраженных в структуре запросов. Далее выявленный в структуре запросов пользователей состав аспектов рассмотрения был соотнесен с составом аспектов, отражаемых в поисковых образах документов электронных каталогов.

Попытка соотнести состав характеристик, рекомендуемых нормативными, инструктивно-методическими, научными, учебными изданиями для отражения в ПОД, отраженных в ПОД электронных каталогов, а также присутствующих в структуре запросов пользователей, представлена в таблице 2.

Таблица 2
Соотношение характеристик, отражаемых в поисковом образе документа и запросах пользователей

Наименование характеристики

Рекомендуются для отражения

 в ПОД

Отражены в ПОД ЭК

Присутствуют в структуре запросов пользователей

Объекты (предметы, тема) исследования, изобретения (вещества, явления, процессы и т.п.)

+

+

+

Состояния, характеристики, свойства, параметры объекта

+

 

+

Составные части, узлы, детали объекта

+

 

 

Сторона (точка зрения), с которой исследуется предмет или его свойства (производство, автоматизация, эксплуатация и т.п.)

+

+

+

Законы, уравнения, функции (Больцмана уравнение, функция распределения и т.п.)

+

+

+

Вид исследования (теоретические расчеты, лабораторные исследования и т.п.)

+

 

+

Цель исследования, разработки

+

 

 

Методы (методика) исследования

+

 

+

Средства исследования, технологическая оснастка

+

 

+

Результаты исследования

+

 

 

Область применения объекта

+

+

+

Назначение объекта

+

 

 

Условия, характеризующие процесс исследования:

 

 

 

- Географическая локализация объектов

+

+

+

- Временной период

+

+

+

-Физические, химические, биологические и др. условия

+

 

 

Общенаучные термины и прочие слова (обзоры, конференции, персоналия и т.п.)

+

 

+

Вид издания

 

+

+

Номенклатурные знаки

 

 

+

Исторический аспект

 

 

+

Классификационные признаки (принадлежность к роду, классу и т.п.; виды чего-либо)

 

 

+

Возрастной признак (либо читательское назначение)

 

 

+


Анализ данных, представленных в таблице 2, позволил составить обобщенный перечень, включающий 21 характеристику (объекты и аспекты рассмотрения), который отражает:
         1) характеристики, рекомендуемые для отражения в ПОД нормативными, научными, учебными, инструктивно-методическими изданиями (76 % от общего количества выделенных характеристик);
         2) характеристики, отражаемые в реальных электронных каталогах библиотечно- информационных систем и сетей (33 % от общего количества выделенных характеристик);
         3) характеристики, выделенные в структуре тематических запросов пользователей (76 % от общего количества выделенных характеристик).

К числу характеристик, встречающихся во всех трех вышеперечисленных группах, относятся: объекты (предметы, тема) исследования, изобретения (вещества, явления, процессы и т.п.); сторона (точка зрения), с которой исследуется предмет или его свойства (производство, автоматизация, эксплуатация и т.п.); законы, уравнения, функции (Больцмана уравнение, функция распределения и т.п.); область применения объекта; географическая локализация объектов; временной период.

При этом следует отметить, что в электронных каталогах отражается лишь 44 % характеристик из числа рекомендуемых нормативными, научными, учебными, инструктивно-методическими изданиями и 44 % характеристик, выделенных в структуре запросов пользователей. Таким образом, как нам кажется, в электронном каталоге изначально заложено ограничение возможностей обеспечения точности поиска при его реализации на базе вербальных ИПЯ.

Безусловно, приведенные данные можно считать лишь предварительными, поскольку проведенное исследование носило характер пилотажного. В связи с этим актуальным является организация и проведение общесистемных исследований в сфере лингвистического обеспечения электронных каталогов с целью установления зависимостей в использовании конкретных ИПЯ для реализации различных видов поиска, определения критериев выбора ИПЯ при формировании поискового образа документа в условиях функционирования электронного каталога конкретной библиотечно-информационной системы, сети или отдельной библиотеки.

В целом решение проблем лингвистического обеспечения электронных каталогов, как нам кажется, связано с реализацией следующих основных направлений:
         1. Разработка концептуальных положений в сфере создания и использования лингвистического обеспечения электронных каталогов.
         2. Взаимоувязка требований к индексированию на базе различных ИПЯ при создании электронных каталогов в условиях интеграции библиотечных и информационных учреждений.
         3. Проведение экспериментальных исследований в сфере лингвистического обеспечения электронных каталогов.
         4. Модернизация имеющейся и создание новой нормативно-справочной базы лингвистического обеспечения электронных каталогов.
         5. Создание инструментария пользователя электронных каталогов (инструкций, руководств), отражающих принятые правила индексирования с использованием конкретных лингвистических средств.

         Список литературы:
         1. Каленов, Н.Е. Электронные каталоги библиотек сточки зрения пользователя [Текст]/ Н.Е. Каленов// Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: Тр. Междунар. конф. "Крым-2002". - М., 2002. - Т.2. - С.553-555.
         2. Лавренова, О.А. Лингвистическое обеспечение электронных каталогов: разработка средств тематического поиска [Текст]/ О.А. Лавренова// Мир б-к сегодня. - 1997. - Вып. 15. - С. 60-70.
         3. Скарук, Г.А. Лингвистическое обеспечение тематического поиска в электронном каталоге: основные тенденции развития по результатам анализа документопотока [Текст]/ Г.А. Скарук // Формирование современной информационно-библиотечной среды: сб.науч. тр./ ГПНТБ СО РАН. - Новосибирск, 2004. - С.96-105.
         4. Скарук, Г.А. Помощь пользователю электронного каталога: ожидания читателей и возможности поисковой системы [Текст]/ Г.А. Скарук // Место и роль библиотеки в инфраструктуре образовательного пространства: Сибирь и Дальний Восток: сб.науч. тр./ ГПНТБ СО РАН. - Новосибирск, 2003. - С.84-96.
         5. Фуралев, О.А. Соотношение традиционного каталога с электронным каталогом и перспективы использования языка предметных рубрик в электронном каталоге [Текст]/ О.А. Фуралев, Е.М. Ручимская // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: Материалы 3 Междунар. конф. "Крым-96". - Т.2. - С. 187-189.

 

<Назад>____________<Вперед>____________<Содержание>____________<На главную>