Основные тенденции развития электронных библиотечных каталогов

Основные тенденции развития электронных библиотечных каталогов

Скарук Г. А.,
старший научный сотрудник
Отдела управления фондами
ГПНТБ СО РАН, кандидат педагогических наук
e-mail: skaruk@spsl.nsc.ru

Сегодня, в эпоху глобальных изменений системы распространения и потребления информации, электронные каталоги (ЭК) оказались на острие проблем информационного поиска в библиотеках. ЭК постоянно сравниваются с поисковыми системами Интернета, как правило, не в пользу каталогов. По сравнению с началом 21 века первенство в облегчении поиска и создании системы помощи пользователям перешло к поисковым машинам Интернета и веб-сервисам. Такая ситуация считается одной из причин отказа читателей от обращения к ЭК. Поэтому основная тенденция развития, воплотившаяся в "электронных каталогах нового поколения" связана с "подстройкой" поиска в ЭК под привычные пользователям Интернета механизмы и стратегии. Но в этой области каталогам, безусловно, трудно конкурировать с Интернет-сервисами, в которые вкладываются огромные средства и где поиск ведется по полным текстам документов. Поэтому параллельно развивается и другая тенденция – поиск каталогами собственной ниши в обновленной системе поиска, предложение "своих" инструментов совершенствования поиска.

Обозначим основные направления поиска в рамках названных тенденций.

Технологии "a la Google" в каталогах

Наиболее очевидная тенденция, в которой электронные каталоги следуют поисковым машинам Интернета – упрощение поисковых процедур. Оно все чаще обеспечивается за счет передачи части функций пользователя поисковой системе^[1]. Многие процедуры по формулированию и корректировке поисковых предписаний для ЭК (ранее выполняемые самим пользователем) осуществляется программными средствами по заранее заданным алгоритмам. Заметим, что такого рода замещение функций может иметь как положительные, так и отрицательные последствия. Важно, чтобы при этом за пользователем сохранялась свобода выбора путей поиска информации.

Поисковые машины Интернета обеспечивают простой и быстрый поиск информации для пользователей любого уровня подготовки. Эти технологии становятся все более совершенными, возрастает качество поиска, увеличивается число средств помощи пользователям. Читатели "поколения Net" привыкли к простым методам поиска и ждут того же и от электронных каталогов.

Воплощение поиска "a la Google"в электронных каталогах – простое поисковое окно с вводом запросов на естественном языке и последующей их машинной обработкой различными способами. Простое поисковое окно охотно применяется пользователями, но, справедливости ради, нужно сказать, что этим методом поиск в современных каталогах не ограничивается. Как правило, в ЭК нового поколения обеспечивается быстрый переход к расширенному поиску, читателям предоставляются возможности уточнения результатов простого поиска с помощью механизмов фасетной навигации.

Еще одна функция обновленных ЭК, позаимствованная из Интернета – ранжирование выданных документов по релевантности. Один из разработчиков принципов работы каталогов нового поколения М. Бридиинг считает, что среди критериев релевантности должна быть частота книговыдачи, отражающая популярность и полезность документов^[2];

Следующий инструмент "a la Google" - механизм проверки правильности написания слов. В случае ошибки в поисковом предписании должно появляться всплывающее окно с вариантами правильного написания слов.

Возвращение почти забытого направления деятельности библиотеки – рекомендации литературы - воплотилось в каталогах нового поколения в виде рекомендательных сервисов. Такой прием, как рекомендации дополнительных источников для изучения (например, в форме: "Читатели, которые заказывают эту книгу, заказывают также и следующие книги") копирует подход, существующий в системах коммерческих продаж.

Обсуждаются и более сложные формы организации рекомендательных систем. Предлагается создавать программы, которые пытаются предсказать, какие объекты (например, документы) будут интересны пользователю, имея определенную информацию о его профиле. Рекомендательные системы сравнивают однотипные данные, характеризующие разных людей, и вычисляют список рекомендаций для конкретного пользователя.

Еще один вариант в рамках рассматриваемого подхода - предложения к запросу (query suggestion)^[7,8]. Основываются рекомендательные системы на формировании и предложении пользователям во всплывающем окне концептуально связанных с приведенным пользователем в поисковом предписании словами вариантов запросов. Подходящий контекст можно выбрать щелчком мыши.

Доступ к информационным ресурсам

Широко обсуждается вопрос о возможности ЭК служить единой точкой входа для доступа ко всей имеющейся в распоряжении библиотеки информации, включая локальные электронные коллекции и удаленные полнотекстовые базы данных с лицензионным доступом. Существуют два основных метода обеспечения такого объединенного доступа^[9].

В первом случае для обеспечения доступа к ЭК и локальным ресурсам библиотеки строится единый поисковый индекс. В единый массив объединяются описания ресурсов (как печатных, так и электронных) из всех доступных в библиотеке информационных источников, которые затем нормализуются на основе специально разработанной единой схемы метаданных.

Во втором варианте для обеспечения поиска в нескольких удаленных применяется технология Federated Search. Системы Federated Search преобразуют запросы по правилам соответствующих поисковых систем и рассылают их к нескольким удаленным БД. Полученные результаты объединяются и представляются в единой форме. По возможности устраняется дублирование. Этот подход позволяет решить проблему доступа к научному контенту на уровне журнальных статей.

Эго – одна из главных тенденций развития не только электронных каталогов, но и многих других поисковых систем. Э.Р. Сукиасян считает, что будущее – именно за ней. "Не только карточные каталоги, но и создаваемые с таким трудом ЭК, станут "памятниками истории". Им на смену придут совершенно иные поисковые системы. С огромным диапазоном возможностей. Это, конечно, случится не скоро, и мы, библиотекари, к такому повороту событий не готовы"^[5].

А пока такой подход заставляет библиотеки несли большие расходы по обеспечению лицензионного доступа к электронным журналам, базам данных и другим цифровым ресурсам, в то время как пользователи не осознают ценность предоставляемых ресурсов, не отличают их от ресурсов, просто найденных в Интернете.

Навигация и поиск

Основные способы поисковой навигации в современных ЭК, помогающие пользователям составить и скорректировать поисковое предписание, снизить информационный перегрузки – предварительный просмотр словарей поисковых языков перед началом поиска и фасетная навигация после получения результатов.

Первое направление представляется как решение задачи визуализации содержания библиотечных фондов, наглядного и полного представления их читателям. В этом контексте новое развитие получает тезис о необходимости применения контролируемых ИПЯ. Системное представление языка предметных рубрик и классификационных ИПЯ в авторитетных файлах – своеобразная "карта знаний", которая позволяет пользователям сориентироваться в интересующей их области знаний или практики, точнее составить и скорректировать поисковое предписание. Из последних тенденций – представление списков предметных рубрик в виде графовых древовидных систем, где линиями изображены связи предметных областей и подобластей^[6].

Новое направление, по мнению специалистов, принципиально отличающееся от традиционного поиска, в котором пользователь путем проб и ошибок пытается подобрать термины, которые по его предположению могут встретиться в документах, – фасетная навигация^[2]. Она позволяет пользователям выбирать лексические единицы (поисковые признаки) из заранее заданных наборов поисковых терминов, сгруппированных в фасеты. Фасеты рассматриваются как значимые характеристики документов (формальные и содержательные категории).

Фасетный подход применяется как инструмент фильтрации (корректировки) результатов поиска, особенно проведенного с использованием упрощенных стратегий (например, по ключевым словам через единое поисковое окно). В таких случаях пользователь может корректировать запрос, используя разнообразные фасеты (дата создания, язык текста, режим доступа, вид ресурса, принадлежность к определенной коллекции, место хранения и т.п.).

Недостаток описываемого подхода в том, что все фасетные категории создаются заранее и могут не отражать наиболее актуальных, новых тем и тенденций.

Персонализация поиска

Персонализацию (ориентацию на каждого конкретного пользователя) поиска можно назвать общемировым трендом.

Персонализация выражается в изучении требований и предпочтений пользователей, создании гибких систем диагностики пользователей, кластеризации - предварительном выделении пользовательских групп с похожим информационным поведением, разработке моделей пользовательского поведения.

На этой основе пользователю предлагаются различные инструменты поиска информации, выстраиваются поисковые стратегии, формируются схемы выдачи, ранжирования и представления информации в интересующих пользователя аспектах.

Проблемы в этой области связанны с тем, что оптимизация поиска для конкретных пользовательских групп может не оправдать ожидания отдельного пользователя, привести к информационному шуму и отвержению данной поисковой системы. Поэтому "тотальная" автоматизация не всегда рассматривается как однозначное преимущество. Пользователю должна быть дана возможность самостоятельной настройки системы, выбора поисковых инструментов, при желании – отказа от автоматизированных процедур в пользу самостоятельного поиска.

Обучение и консультирование пользователей

Проведенные в разных странах на базе различных ЭК исследования показали, что пользователи испытывают серьезные проблемы при поиске, не знают его правил и принципов. Поэтому сегодня отмечается новый всплеск внимания к обучению пользователей каталогов, составлению персонализированных руководств разного уровня для пользователей различных категорий. идет активный поиск способов мотивации пользователей к обучению и проведению тщательных качественных поисков^[9].

В обучающих программах наблюдается смещение акцентов от технических к интеллектуальным моментам обучения, стремлению задействовать в процессе поиска механизмы критического и творческого мышления. Пользователи хотят, чтобы их обучали не только техническим навыкам, но и умению четко определять тему поиска, выбирать термины при составлении поисковых предписаний, корректировать запрос. Однако следует признать, что подходы к обучению пользователей в целом остаются достаточно традиционными.

Несмотря на постоянно совершенствующиеся за рубежом автоматизированные системы помощи пользователям OPAC, данные исследований показывают, что пользователи по-прежнему нуждаются в консультациях библиографов^[10,11]. Но, поскольку значительная часть поисков в ЭК проводится в дистанционном режиме, библиотеки осваивают дистанционные формы консультирования. Сейчас основной упор делается на непосредственное общение библиографов и читателей "лицом к лицу", мгновенные ответы на вопросы. Для этого используются библиотечные чаты и общение в режиме телеконференций. Можно сказать, что мы на новом уровне возвращаемся к традициям консультирования у каталогов, которые в условиях автоматизации, казалось, стали не столь уж необходимы.

Веб 2.0 и электронные каталоги

Термин Веб 2.0 как правило характеризует проекты и сервисы, активно развиваемые и улучшаемые самими пользователями. С технологиями Веб 2.0 в библиотеках обычно связывают такие идеи и понятия, как привлечение пользователей к созданию информации, тегирование и фолкосономия, взаимодействие с социальными сетями, доверие и поддержка "коллективного разума".

Фолксономия - это практика совместной категоризации информации (текстов, ссылок, фото, видео клипов и т. п.) посредством произвольно выбираемых меток, называемых тегами. В электронном каталоге фолксономия рссматривается как метод коллективного пользовательского индексирования документов^[11]. Пользователям предлагается присваивать ресурсам метаданные в виде произвольных ключевых слов. Формируются коллективные наборы ключевых слов (тегов) для каждого конкретного ресурса.

Высказывания практиков по поводу полезности фолксономии для поиска в ЭК противоречивы.. В общем преобладает мнение, что термины пользователей не могут заменить контролируемые языки, но помогают расширить область поиска, отразить в точку зрения национальных и социальных меньшинств.

"Облака тегов" в электронных каталогах представлены как списки ключевых слов, отражающих тему или близких по смыслу к теме данного документа, в формате гиперссылок на множество ресурсов, в которых приведенные слова являются точками доступа.

Еще один подход в рамках этого блока - обогащение лексики контролируемых поисковых языков терминами, позаимствованными из социальных сетей.

По мнению зарубежных исследователей, электронные каталоги нового поколения. должны содержать обложки книг, аннотации, оглавления. Кроме того пользователям предоставляется возможность добавлять информацию в библиографические записи. Эта информация может включать описания, обзоры, резюме, критические замечания, комментарии, рейтинги, а также тэги и самостоятельно присвоенные рубрики;

Semantic Web и электронные каталоги

Идея Semantic Web была предложена в 1998 г. Т. Бернесом-Ли. Semantic Web – интернет-среда, в которой данные размещаются таким образом, что их смысл становится доступным для компьютерной обработки. В концепции Semantic Web основной упор делается на работе с метаданными, однозначно характеризующими содержание представляемых в Веб ресурсов, в отличие от текстового анализа документов^[12]. Итак, основная цель технологии связанных данных – установление связей между объектами любого вида (не только текстами) таким образом, чтобы это было понятно и машине, и человеку. Проект Semantic Web в настоящее время находится в стадии активной разработки, старается интегрировать в себе все имеющиеся на сегодняшний день подходы с целью создать действительно универсальное средство семантического поиска. В библиотеке концепция реализуется путем публикации информации в системе связанных данных.

Связанные данные (Linked Data) – термин, применяемый для определения методов публикации, обмена и установления связей между структурированными данными в Semantic Web с использованием модели RDF (Resource Description Framework – Среда описания ресурсов) и URI (универсальных индентификаторов ресурсов) или URIref (URI-ссылок)^[13]. RDF – графовая модель, в которой данные описываются в виде отдельных суждений, представленных тройками (или триплетами) "Субъект – Предикат – Объект". Субъект определяет предмет описания, предикат – специфический аспект описываемого предмета (RDF-свойство), а объект представляет значение этого аспекта^[14].

Преимущества описанной технологии – повышение "видимости" библиотечных данных в Интернете, расширение возможностей хранения и описания информации.

В библиотечной среде технологии Linked Data используются для публикации наборов данных (структурированных коллекций метаданных о библиографических ресуросах), чаще всего именно библиотечных каталогов, и словарей значений – словари контролируемых ИПЯ (тезаурусов, классификационных схем, списков предметных рубрик).

По технологии связанных данных создаются международные авторитетные файлы. Наиболее известный из них – Virtual International Authority File – VIAF (Виртуальный международный авторитетный файл http://viaf.org/).

Это – система, предназначенная для удобного доступа к основным мировым авторитетным файлам и позволяющая представлять имена лиц в предпочтительном для пользователей языковом оформлении (язык, алфавит, орфография, варианты написания). VIAF сопоставляет и связывает авторитетные записи (АЗ) из авторитетных файлов национальных библиотек в единую "суперзапись" или "облако записей" для каждого уникального личного имени, обеспечивает сосуществование национальных и региональных вариантов АЗ.

Как видим, каталоги нового поколения прете5рпеваютт существенные изменения по сравнению с предыдущими поколениями OPAC в направлении удобства и результативности поиска. Но, к сожалению, проявляются эти тендении преимущественно в зарубежных каталогах.

Литература:

1. Dorner D. G., Curtis A. A comparative review of common user interface products // Libr. Hi Tech. – 2004. – Vol. 22, № 2. – P182–197.

2. Дедик П. Е. Новые возможности доступа к ресурсам зарубежных библиотек: каталоги нового поколения // Науч. и техн. библиотеки. ? 2013. ? № 2. ? С. 65?84.

3. Kato M. P., Sakai T., Tanaka K. When do people use query suggestion? A query suggestion log analysis // Inf. Retriev. – 2013. – Vol. 16, № 6. – P725–746.

4. Дедик П. Е. Новые возможности доступа к ресурсам зарубежных библиотек: системы Web Scale Discovery // Науч. и техн. библиотеки. – 2013. – N 3 . – С. 22?37.

5. Сукиасян Э. Р. Есть ли будущее у библиотечных каталогов? // Науч. и техн. библиотеки. – 2013. – № 3. – С. 38–42.

6.Julien,C.-A., Catherine G., France B. Capitalizing on information organization and information visualization for a new-generation catalogue [Text] : научное издание / Charles-Antoine Julien, // Libr. Trends. – 2012. – Vol. 61, N 1. – P148–161.

7. Goyal P., Mehala N., Bansal A. A robust approach for finding conceptually related queries using feature selection and tripartite graph structure // J. Inf. Sci. ? 2013. ? Vol. 39, N 5. ? P575?592.

8. Kato M. P., Sakai T., Tanaka K. When do people use query suggestion? A query suggestion log analysis // Inf. Retriev. – 2013. – Vol. 16, № 6. – P. 725–746.

9. Savolainen R. Approaching the motivators for information seeking: The viewpoint of attribution theories // Libr. and Inf. Sci. Res. – 2013. – Vol. 35, N 1. – P63–68.

10. Guiding design: Exposing librarian and student mental models of research guides / C. Sinkinson [et al.] // Portal: Libr. and Acad. ? 2012. ? Vol. 12, N 1. ? P63?84

11.Richards А. An investigation into the viability of LibraryThing for promotional and user engagement purposes in libraries [Text] : научное издание / Anna Richards, Barbara Sen // Libr. Hi Tech. - 2013. - Vol. 31, N 3. - P493-519 :

12. Воробьев А. А., Селиванова Ю. Г. Место и роль библиотеки в Semantic Web : подходы и решения // Координация и стандартизация в области создания и использования национальных информационных ресурсов. – Санкт-Петербург, 2012. – С. 69–82.

13. Жлобинская О. Н. Semantic Web, связанные данные и библиотеки. – URL: http://www.rusmarc.ru/publish/SemWeb.pdf .

14. Willer M., Zabar C. UNIMARC и связанные данные – URL: http://www.nilc.ru/text/Other_publications/Other_publications17.pdf .