Приложение
Инструкция
по индексированию документов
(формированию ключевых слов в ЭК)
Введение
Качество
индексирования документов т.е. описание и содержание средствами ИП
(информационно-поискового языка), требует полноты отображения в поисковых
образах документа (ПОД) всех важных аспектов их содержания и точного
соответствия содержания документа значениям лексических единиц (ЛЕ).
Составление
и написание ключевых слов (КС) при вводе и индексировании библиографической
записи (БЗ) состоит из нескольких этапов:
1. этап - анализ заглавия, продолжения заглавия, аннотации,
реферата к книге или статье, оглавления, а в наиболее ответственных
случаях и выборочных участков текста (введения, выводов и т.п.)
2. этап- формирование ключевых слов (КС)
Формирование
ключевых слов
В
качестве КС используются отдельные слова и словосочетания, аббревиатуры,
фрагменты сложных слов, соединенных дефисом (социально - экономический),
числа и даты, вводимые по методике, изложенной ниже:
_______- одиночное существительное
вводится в форме именительного падежа и, как правило, в единственном
числе (ввод понятий во множественном числе оговорен в инструкции ниже)
_______- одиночное прилагательное
и причастие вводятся в единственном числе, именительном падеже,
в мужском роде (экономический, политический). Но в ЛЕ - словосочетаниях
прилагательное согласуется с существительным.
_______ _______Например:
одиночное прилагательное - ценный
_______ _______
_______ЛЕ - словосочетание - ценная бумага
_______- наречие заменяется на
соответствующее прилагательное (автоматически - автоматический)
_______- деепричастие преобразуется
в соответствующее существительное (поставляя - поставка)
_______- глагол вводится в виде
отглагольного существительного (преобразуют -преобразование)
_______- омонимы (слова, имеющие
одинаковое произношение и написание)
_______ _______Например:
карта игральная и географическая. В таких случаях следует кроме омонима
вводить дополнительное КС, уточняющее его смысл: Карта + Игральный,
Карта + Географический
_______- синонимы: Желательно
избегать применения синонимов и использовать для этого отсылку
см. Если при формировании КС предпочтение отдано одному из 2-х понятий-синонимов,
то к выбранному в качестве КС понятию ставится отсылка см. от синонима,
который в качестве КС решено не использовать.
_______ _______Например:
из 2-х синонимов Суицид и. Самоубийство предпочтение
отдано понятию Самоубийство. При введении первой записи, в
которой будет впервые сформулировано КС Самоубийство, следует
ввести также КС - отсылку от неиспользуемого при последующих вводах
синонима - Суицид см. Самоубийство. Данное КС - отсылка
будет помещено в списке КС один раз и при последующих вводах будет
отсылать оператора к выбранному синониму - КС Самоубийство,
за которым и следует собирать все последующие записи на данную тему.
При
этом на введенную отсылку необходимо составить рукописную карточку
для картотеки методических решений с последующим однократным введением
текста отсылки в списки ключевых слов остальных видов записей (т.е.,
текст отсылки таким образом будет отражен во всех четырех видах изданий
в КНИГАХ, ГАЗЕТАХ, ЖУРНАЛАХ и РЕЦЕНЗИЯХ) базы КС в Картотеке статей
(и аналогично в базах данных ГК и Краеведение ЭК), и при последующих
вводах будет информировать оператора о выбранном для ввода варианте,
что позволит избежать дублирования однотипных понятий-синонимов в
базах КС.
Следует
иметь в виду, что есть Синонимы, в применении которых есть
нюансы, определяющие выбор то одного, то второго из двух понятий-синонимов,
как наиболее соответствующего тематике индексируемого материала, В
этом случае следует применять тот синоним, который точнее определяет
содержание материала.
_______Например: понятие Учитель,
как правило, могло бы быть синонимом понятия Педагог, а понятие
Педагог имеет более широкий смысл. И при индексировании материалов
о педагогах вузов применять КС Учитель нецелесообразно.
Или: понятие Персонал могло бы применяться в материалах о кадрах
предприятия (тем более, что связка Персонал предприятия стала
часто применяющейся), но, например, в материалах о занятости кадров
определенных профессий (библиотечных, научных и т.д.) понятие Персонал
применяется гораздо реже, чем понятие Кадры.
В
таких случаях следует применять то понятие (одно из двух), которое
точнее определяет содержание индексируемого материала. При этом следует
принять методическое решение об однократном введении в базу Ключевых
Слов связывающих ссылок см. также от первого понятия ко второму
и от второго понятия к первому. Решение оформляется соответствующей
рукописной карточкой для картотеки методических решений. Введение
таких связывающих ссылок проводится однократно в каждую из соответствующих
баз КС. Такая связывающая ссылка будет информировать пользователей
о наличии соответствующих материалов, собираемых за другим КС - синонимом,
и позволит избежать дублирования одних и тех же БЗ в двух местах базы
КС.
Во
множественном числе вводятся следующие понятия:
_______- слова, не имеющие единственного
числа (сани, очки, ножницы, джинсы и т.п.)
_______- наименования биологических
видов, отрядов, классов, семейств и т.д. (кошачьи, косточковые).
Но наименования определенного животного или растения вводятся в единственном
числе (кошка, лев, слон, яблоня)
_______- наименования наций и народностей
(кельты, скифы, русские, татары)
_______- наименования групп людей,
объединенных по следующим признакам: религиозному, политическому,
географическому, сословному, по принадлежности к направлению искусства
(азиаты, христиане, шестидесятники, демократы, символисты)
Исключение
в формулировке таких наименований составляют исторически сложившиеся
названия: аристократия, дворянство, духовенство, казачество, крестьянство,
купечество.
Материалы
персонального характера о каком-либо деятеле, принадлежащем к вышеперечисленным
группам, следует индексировать КС, сформулированным в единственном
числе: политик, путешественник, купец, аристократ, демократ (для более
точного разделения материалов персонального характера и материалов
о соответствующих группах, нациях, народностях).
Исключение
составляют наименования профессий, которые вводятся в единственном
числе (адвокат, библиотекарь, экономист) и когда речь идет о профессии
в целом, и при индексировании материалов персонального характера о
представителях данной профессии. Если наименование профессии состоит
из нескольких слов, то КС вводится в виде ЛЕ - словосочетания с дополнительным
вводом отдельных понятий из словосочетания, имеющих поисковое значение,
в качестве самостоятельных КС.
_______Например: наименование профессии
- мойщик посуды. Следует вводить два КС - Мойщик посуды и Посуда
Следует
также различать отдельные понятия, меняющие смысловой оттенок при
смене множественного числа на единственное число:
_______отходы (утиль, мусор) - отход
(отступление, действие)
_______чтения (мероприятие)- чтение (процесс,
действие)
_______курсы (способ обучения) - курс
(валютный, мореходный)
_______выборы (избирательная кампания)
- выбор (методическое решение)
Ключевые
слова - словосочетания (лексические единицы - ЛЕ)
Употребление
ЛЕ - словосочетаний должно быть минимальным. Но решение о разделении
или сохранении ЛЕ - словосочетания должно приниматься, исходя из интересов
поиска информации для каждой ее части. И если в словосочетании второе
или какое-либо из последующих слов, входящих в словосочетание, имеет
самостоятельное поисковое значение, его необходимо дополнительно вводить
в качестве отдельного КС.
Не
разделяются на отдельные ключевые слова и формулируются как КС
- словосочетания следующие лексические единицы, состоящие из нескольких
слов:
_______- идиоматические выражения,
смысловое значение которых при разделении словосочетания на отдельные
КС, теряется.
______________Например:
круглый стол, красная строка, мозговой штурм, ласточкин хвост, прямая
линия, черная дыра;
_______-законы, правила, явления,
теории, формулы, оборудование, в названии которых есть имена их авторов,
открывателей, изобретателей.
______________Например:
бином Ньютона, теорема Ферма, эффект Доплера, теория Кейнса, теория
Хекшера - Олина, лампа Чижевского
Данные
ЛЕ вводятся без применения кавычек.
Фамилии
персон дополнительно вводятся в видеокадре Лицо. Доп. описание.
При
наличии сведений персонального характера следует в поле "смешанная
информация" вводить фразу о нем. Если в индексируемом
материале нет сведений персонального характера, то поле "смешанная
информация" не заполняется, а в поле "код ответственности"
вводится кодовое значение ассоциированное имя
_______- наименования светских, общественных
и религиозных праздников, терминов народных календарей и лечебников
______________Например:
День Победы, Татьянин день, День святого Валентина, пастушья сумка,
бычья желчь, День пожилых людей.
Данные
ЛЕ вводятся без применения кавычек. Вторые и (или) последующие слова
из словосочетаний, имеющие поисковое значение, дополнительно вводятся
в качестве самостоятельных КС:
______________Например: Татьянин день
+ День; Год ребенка + Ребенок; День налоговой полиции + Налоговый
+ Полиция
_______-названия кинофильмов, спектаклей,
телесериалов, газет, журналов, имена собственные, присвоенные неодушевленным
предметам (кораблям, подводным лодкам и т.д.) вводятся в базу
КС в следующем порядке:
Каждое название заключается в кавычки (в том числе и те названия,
которые состоят из одного слова). При этом дополнительно вводятся
как отдельные КС слова Кинофильм, Спектакль, Газета, Журнал, Телесеhиал,
Крейсер, Теплоход, которые в кавычки не заключаются.
______________Например
:Спектакль "Горе от ума" разделяется на два КС: Спектакль
и ЛЕ - словосочетание "Горе от ума"; Журнал "Мир
библиографии" разделяется на два КС: Журнал и ЛЕ - словосочетание
"Мир библиографии"; Кинофильм "Мама" разделяется
на два КС: Кинофильм и "Мама", Теплоход"Адмирал
Нахимов" разделяется на КС: "Адмирал Нахимов" и
Теплоход; Подводная лодка "Курск" разделяется на
три КС: Подводный + Лодка + "Курск".
_______- устойчивые словосочетания,
относящиеся к определенным событиям или фактам и ставшие нарицательными,
также вводятся как ЛЕ - словосочетания и заключаются в кавычки.
______________Например:
"Ленинградское дело", "Дело врачей" "Холодная
война". При этом, отдельные слова из словосочетания, имеющие
поисковое значение, повторяют как дополнительные КС. В данных примерах
это слова Дело, Врач, Война. Дополнительные КС в кавычки не заключаются.
_______-названия отдельных войн, битв,
вооруженных конфликтов.
Данные ЛЕ - словосочетания вводятся с указанием даты (или диапазона
дат), приводящейся непосредственно после формулировки через пробел
и с проставлением букв, соответствующих дате или датам с временным
диапазоном: В. или ВВ. в вековых датах и Г. или ГГ. в годовых датах.
______________Например: Куликовская
битва 1380 г.
_____________________Корейская война
1950-1953 гг.
Отдельные
слова из словосочетаний, имеющие поисковое значение, также повторяют
в качестве дополнительных КС. В данных примерах это слова Битва
и Война
_______- наименования наград (ордена,
медали, звания, премии).
______________Например:
Герой Советского Союза, Герой России, Орден Красного Знамени, Премия
Нобеля, Орден Александра Невского и т.п.
Имена
собственные, входящие в данные ЛЕ - словосочетания следует дополнительно
вводить в видеокадре Лицо. Доп. описание. При наличии сведений
персонального характера о лицах, именами которых названы награды,
следует в поле "смешанная информация" вводить фразу о
нем. Если в индексируемом материале таких сведений нет, в таком
случае поле "смешанная информация" не заполняется, а в поле
"код ответственности" вводится кодовое значение ассоциированное
имя.
Если
в данных ЛЕ - словосочетаниях есть слова, имеющие поисковое значение,
их следует дополнительно вводить в качестве отдельных КС.
______________Например: КС - словосочетание
Медаль за оборону Одессы следует дополнить двумя КС: Оборона
и Одесса-история.
_______- наименования оборудования,
машин, материалов и т.п., пишущиеся через дефис, также вводятся
как ЛЕ - словосочетания с дополнительным вводом второго слова в качестве
отдельного КС:
______________Например: Смеситель-запарник
и Запарник
_______- наименования марок и моделей
машин и других транспортных средств, оборудования, материалов вводятся
в следующем порядке:
Аббревиатуры
марок и моделей вводятся как отдельные КС и в кавычки не заключаются.
______________Например: Автомобиль
+ ВАЗ, Самолет + Ту-154
Собственные
названия также вводятся как отдельные КС, но при этом заключаются
в кавычки. Например: Автомобиль + "Москвич", Самолет
+ "Боинг".
_______- программы, конкурсы, проекты,
имеющие собственное название, вводятся в базу КС без присвоенных
им названий (КС являются Программа, Проект, Конкурс). А собственное
название мероприятия вводится в видеокадр "Заглавие. Доп.
описание".
______________Например:
из словосочетаний Программа "500 дней", Конкурс "Окно
в Россию" в базу КС водятся два понятия: Программа и Конкурс,
а их названия вводятся в видеокадре "Заглавие. Доп. описание"
в поле "Заглавие" (так как тексты или изложения
их содержания являются печатным документом). Название в кавычки не
заключается. При этом в поле "Сведения, дополняющие заглавие"
следует повторить соответствующее слово Программа, Конкурс, Проект.
_______- числа и даты
ЛЕ
- словосочетания, начинающиеся с цифр, формируются в следующем порядке:
цифры, начинающие словосочетание, вводятся арабские. Затем через пробел
вводится словесная формулировка ЛЕ.
______________Например: 1 класс, 1-4
класс, 10 класс. Если цифры в словосочетании сформулированы в
виде диапазона (1-4 класс), в таком случае КС - словосочетание следует
дополнять КС, "раскрывающими" цифры, находящихся внутри
диапазона первого КС:
______________Например: КС 1-4 класс
дополняется КС 2 класс, 3 класс, 4 класс
_______- числа и даты в базе КС краеведческого
каталога
В базу КС краеведческого каталога дополнительно вводятся и отдельные
числа, относящиеся к датам конкретных событий, годам жизни
персон и т.д.
______________Например: 1 сентября,
1812 г. , 1899 - 1952 гг. , 1716 г. , 12 апреля 1961 г.
На
словесную формулировку, сопровождающую число в КС - словосочетании
следует дополнительно вводить отдельное КС.
______________Например: КС 1 сентября
следует дополнить еще одним КС Сентябрь. КС - словосочетания,
имеющие диапазон дат конкретных событий, следует дополнять КС на вторую
дату диапазона.
______________Например: КС на годы жизни
персоны 1899 - 1952 гг. должно быть дополнено вторым КС на
вторую дату диапазона 1952 г.
КС
- словосочетание на дату, состоящую из числа, месяца и года конкретного
события, дополняется КС на словесную формулировку месяца и КС на дату
года события.
______________Например: КС - словосочетание
12 апреля 1961 г. + КС Апрель + КС 1961 г.
_______- аббревиатуры - общепринятые,
устоявшиеся или ГОСТированные сокращения вводятся как отдельные КС
и одновременно формируются КС из отдельных частей полного значения
аббревиатуры:
______________ВВП
+ валовой + внутренний + продукт
______________ВНП
+ валовой + национальный + продукт
______________СПИД
+ синдром + приобретенный + иммунодефицит
______________СИЗ
+ средство + индивидуальный + защита
Но
наименования стран (США, СССР, СНГ и т.д.) вводятся в базу КС без
дополнительного раскрытия аббревиатуры.
_______- географические названия
вводятся в базу КС в следующем порядке:
______________наименования материков,
континентов и отдельных местностей вводятся с применением инверсий:
Америка Южная, Америка Латинская, Европа Восточная, Европа Центральная,
Сибирь Западная;
______________наименования отдельных
стран, состоящие из нескольких слов, вводятся без применения инверсий:
Киевская Русь, Древняя Русь, Древняя Греция, Древний Египет;
______________географические
названия собираются в базе КС в группы (географические блоки). Каждый
такой блок состоит из наименования страны (континента, материка, отдельной
местности) и вводимого через дефис наименования раздела таблиц ББК,
соответствующего первым двум делениям таблиц, (в разделах 60, 87,
76 и 79 - трем делениям таблиц) из присвоенного данной библиографической
записи индекса. Если БЗ имеет несколько индексов из разных разделов
ББК, географический блок, относящийся к каждой стране (континенту)
повторяется соответственно индексу каждого раздела.
_____________________Например: БЗ присвоено
три индекса: 65.9(2Рос) + 65.30(2Рос) + 67.402(2Рос). В базу КС будет
введено два словосочетания: Россия-экономика + Россия-право.
Или:
БЗ присвоено два индекса из раздела Экономика, но касающихся разных
стран: 65.261(7Сое) + 65.261(4Вел). В базу КС будет введено два словосочетания
(два блока): США - экономика, Великобритания - экономика.
В
географические блоки включаются также КС: развитые страны - тема,
развивающиеся страны - тема.
Если
в БЗ говорится об отдельной российской области (крае, республике,
округе), тогда формируются два КС: Россия - тема и область
(край, республика, округ) - тема.
Если
в БЗ говорится о конкретном российском городе (областном или краевом
центре), тогда тоже формируются два КС. Т.е., город-тема +
Россия-тема.
Если
российский город административно подчиняется области или краю, но
не является областным или краевым центром, то формируются три КС:
город-тема + область (край) -тема + Россия-тема.
Если
российский город расположен на территории автономного образования
(республики, края, округа), то независимо от того, является ли он
центром автономного образования или не является, в базе КС формируются
три КС: Россия - тема +республика (край, округ) -тема + город -
тема.
Порядок
заполнения поля КЛЮЧЕВЫЕ СЛОВА:
В
базах КС Картотеки статей, Директивных материалов и Краеведения
при вводе новых БЗ, в целях информирования, необходимо вводить
КС с датой внесения БЗ в электронный каталог (ЭК). КС состоит из цифр,
соответствующих месяцу и году ввода, разделенных знаком
</> (косая черта). Таким образом, в каждой БЗ, введенной
в январе 2001 года, должно быть КС1/01, в феврале 2001 года -КС 2/01
и т.п.
БЗ
на статьи, имеющие продолжение, датируются при введении БЗ с окончанием
статьи. При этом дата ввода должна соответствовать месяцу и году ввода
БЗ с окончанием статьи.
В
базе КС Генерального каталога (ГК) для формирования информационного
бюллетеня новых поступлений вместо КС на дату ввода БЗ в ЭК вводятся
КС, состоящие из аббревиатуры НП (новые поступления) и вводимого
после дефиса наименования раздела таблиц ББК, соответствующего
первым двум цифрам из присвоенного данной БЗ полочного индекса.
Таким
образом, в каждую БЗ ГК вводится КС НП - тема, которое после
составления очередного информационного бюллетеня новых поступлений
исключается редактором ЭК из базы КС с помощью программы Корректор.
В
процессе индексирования новых БЗ при формировании КС следует обязательно
использовать возможность поиска и автоматического переноса из сформированной
ранее базы КС тех ключевых слов, которые соответствуют тематике вводимых
БЗ, во избежание разночтений, ошибок и опечаток, возможных при ручном
наборе КС и для экономии времени, затраченного на ввод БЗ.
Составители:
О.Е. Лебедева, Е.Л. Милушкина, М.П. Захаренко, О.П. Моисеенко, Н.Б.
Герасенкова, А.С. Бочарова
2001
г.
март-апрель
Список
использованной литературы:
1.
Воройский, Ф.С. Индексирование документов в АБИС // Библиотека. -
1996. - №9. - С. 42 - 44
2. ГОСТ 7.59-90. Индексирование документов: Общие требования к систематизации
и предметизации.- Введ. 01.01.91.- (Система стандартов по информации,
библиотечному и издательскому делу)
3. ГОСТ 7.66-92 (ИСО 5963-85). Индексирование документов: Общие требования
к координатному индексированию. - Введ. 01.01.93. - (Система стандартов
по информации, библиотечному и издательскому делу)
4. Международная конференция "Библиотеки и ассоциации в меняющемся
мире: новые технологии и новые формы сотрудничества (Крым' 99)":
Материалы конф.: [В 2 т.]. - Судак, 1999
5. Международная конференция "Библиотеки и ассоциации в меняющемся
мире: новые технологии и новые формы сотрудничества (Крым' 98)":
Материалы конф.: [В 2 т.]. - Судак, 1998
6. Ханжин, А.Г. Разработка методики координатного индексирования документов.
Ч.2. // НТИ. Сер.2. Информационные процессы и системы.- 1995. №9.
- С. 14-19.
<Назад>____________<Вперед>____________<Содержание>____________<На
главную>