Новости
09.05.2023
с Днём Победы!
07.03.2023
Поздравляем с Международным женским днем!
23.02.2023
Поздравляем с Днем защитника Отечества!
Оплата онлайн
При оплате онлайн будет
удержана комиссия 3,5-5,5%








Способ оплаты:

С банковской карты (3,5%)
Сбербанк онлайн (3,5%)
Со счета в Яндекс.Деньгах (5,5%)
Наличными через терминал (3,5%)

РАЗРАБОТКА ТЕРМИНОЛОГИЧЕСКОГО СЛОВАРЯ ПО ФИЗИКЕ В СИСТЕМЕ СОПОСТАВЛЕНИЯ ИНФОРМАЦИОННЫХ КЛАССИФИКАЦИЙ

Авторы:
Город:
Москва
ВУЗ:
Дата:
11 марта 2016г.

В ВИНИТИ РАН разрабатывается система таблиц соответствия ведущих классификаторов, которые используются как средство доступа к массивам в различных информационных фондах [1]. Таблицы соответствия задуманы как инструмент анализа содержания информационных ресурсов, их оценки и управления ими. Эти же таблицы позволяют организовать тематическую навигацию в пространстве разнородных информационных систем, содержащих научные данные. Техническое задание на работу предусматривает сопоставление с Государственным рубрикатором научно-технической информации (ГРНТИ) двенадцати классификационных систем: Универсальной десятичной классификации (УДК), Библиотечно-библиографической классификации (ББК), Международной патентной классификации (МПК), рубрикатора Организации экономического содействия и развития (ОЭСР), рубрикатора библиографической системы Web of Science (WoS), классификатора библиографической системы Scopus, номенклатуры ВАК, рубрикаторами фондов поддержки науки – Российский гуманитарный научный фонд (РГНФ), Российский научный фонд (РНФ), Российский фонд фундаментальных исследований (РФФИ), рубрикатора Федерального агентства научных организаций (ФАНО).

Предполагается, что анализ данных в информационных системах будут проводить администраторы, которые не всегда являются специалистами в анализируемой области знания. В таком случае администратору следует не только указать на соответствие или несоответствие рубрик, но также следует в определённой мере раскрыть научное содержание сопоставляемых рубрик. Эту задачу решает разработка системы терминологических словарей, которые специализированы по тематикам 63 разделов ГРНТИ, охватывающих все области, включая технические знания, общественные, гуманитарные, точные и естественные науки, в том числе крупный раздел ГРНТИ 29 ФИЗИКА. Согласно концепции работы каждый словарь (в частности – словарь по физике) должен в первую очередь раскрывать смысл терминов, используемых в наименованиях рубрик, входящих в состав соответствующего раздела ГРНТИ а также в наименования рубрик других классификаций, сопоставленных этому разделу.

Структура ГРНТИ не представляет большой сложности. Это – 63 рассматриваемых раздела плюс несколько обобщающих разделов. Разделы делятся на подразделы, которые в свою очередь делятся на рубрики нижнего (третьего) уровня. Так, раздел физики имеет на втором уровне деления подразделы, указанные в Табл.1.

Всего в ГРНТИ имеется около 8000 рубрик. Однако, учитывая, что в некоторых сопоставляемых классификациях (УДК, ББК, МПК) насчитывается более 100 000 рубрик, а каждая рубрика содержит один или более терминов, подлежащих разъяснению, разработка отдельных словарей по каждой паре сопоставляемых рубрик была бы практически невозможной, хотя такая постановка задачи была бы оптимальной для последующей административной работы с информационными системами. Именно поэтому был выбран указанный выше компромисс – разрабатывать словари по разделам ГРНТИ в целом.


Таблица 1  

Рубрики второго уровня раздела ГРНТИ 29 Физика



Код и наименование рубрики

Число выявленных ключевых слов

29.01 Общие вопросы физики

18

29.03 Общие проблемы физического эксперимента

20

29.05 Физика элементарных частиц. Теория полей. Физика высоких энергий

40

29.15 Ядерная физика

35

29.17 Физика газов и жидкостей. Термодинамика и статистическая физика

35

29.19 Физика твёрдого тела

88

29.27 Физика плазмы

57

29.31 Оптика

36

29.33 Лазерная физика

46

29.35 Радиофизика. Физические основы электроники

44

29.37 Акустика

47

Несмотря на то, что задача словарей состоит в поддержке смыслового соответствия классификационных систем друг с другом, любое применение информационных классификаций в сфере науки требует сопоставления с содержанием научных работ. Следовательно, словари должны содержать термины не только из классификаций, но также их текущих научных публикаций. Для словаря по физике источником текущей научной лексики служит опыт тематического индексирования научных работ в базах данных ВИНИТИ РАН и Библиотеки по естественным наукам РАН. В базах данных тематика каждой научной публикации описана указанием нескольких терминов из содержания работы, называемых ключевыми словами. Из базы данных ВИНИТИ был выделен 231 термин с определениями соответствующих понятий. Их распределение по подразделам показано на таблице 1. Слияние этого материала со словарём, полученным в результате анализа наименований рубрик, производилось в сопоставлении с материалами индексирования в БЕН РАН. При этом велось редактирование формулировок и уточнение библиографических ссылок на энциклопедические источники. Элементы статьи были размечены служебными символами для обеспечения автоматического анализа элементов данных при вводе в компьютерную систему. Технология составления словарей описана в докладе [2].

Словарная статья итогового словаря имеет следующий вид: ЗАГЛАВНЫЙ ТЕРМИН *

Определение (толкование) термина @ Ссылка на источник \

Код ГРНТИ _

Примеры статей из словаря: АКУСТИЧЕСКИЙ ШУМ *

Шум акустический – беспорядочные звуковые колебания разной физической природы, характеризующиеся случайным изменением амплитуды,  частоты и др.  В быту — звуки,  мешающие восприятию  речи,  музыки, отдыху, работе. Шум оказывает вредное воздействие на организм человека. @

dic.academic.ruАкустический шум \

29.37.33 _

ЗВУКОИЗОЛИРУЮЩИЕ КОНСТРУКЦИИ *

Звукоизолирующие конструкции - конструкции, укрывающие некоторую область пространства от звука. @ Красильников В.А. Введение в акустику. – М.: 1992

39.37.35

Работа над словарём продолжается. Первая очередь словаря, содержащая только термины, выделенные из наименований рубрик, содержит 192 термина.

Предполагается, что разработанные в настоящем проекте словари и таблицы соответствия классификационных систем будут составлять единую базу данных, позволяющую осуществлять тематическую навигацию по пространству разнородных информационных систем и отыскивать информацию независимо от того, каким информационным языком она описана в сетевых источниках и независимо от языка поступившего запроса, будь то ключевые слова, информационно-поисковые тезаурусы или библиографические классификации. Общая структура такой базы данных представлена в докладе [3].

Работа проводится в соответствии с контрактом и заданием Минобрнауки РФ (уникальный идентификатор проекта 2014-14-573-0024-001).

 

Список литературы

1.     Арский Ю.М., Никольская И. Ю., Гоннова С. М. Формирование системы тематической классификации с целью развития информационного обмена в научно-технической сфере // Международная конференция Крым-2015 «Библиотеки и информационные ресурсы в современном мире науки, культуры образования и бизнеса», г. Судак, Крым, 7-13 июня 2015 г.

2.     Белоозеров В.Н. Технология разработки словарей по лексике класс-ификационных систем // XIX научно- практический семинар «Инфор-мационное обеспечение науки: новые технологии» (Таруса, 24-28 августа 2015 г.).

3.     Белоозеров В.Н., Шабурова Н.Н. Тезаурус тематических рубрик по физике полупроводников как модель объединённой    классификационно-словарной    системы    //    XIX    научно-практический    семинар «Информационное обеспечение науки: новые технологии» (Таруса, 24-28 августа 2015 г.).