Academic Journal

ТЕМАТИЧНЕ МОДЕЛЮВАННЯ НАУКОВЦІВ НА ОСНОВІ ЇХ ІНТЕРЕСІВ У GOOGLE SCHOLAR.

Bibliographic Details
Title: ТЕМАТИЧНЕ МОДЕЛЮВАННЯ НАУКОВЦІВ НА ОСНОВІ ЇХ ІНТЕРЕСІВ У GOOGLE SCHOLAR. (Ukrainian)
Authors: ШТОВБА, С. Д., ПЕТРИЧКО, М. В.
Source: System Research & Information Technologies / Sistemnì Doslìdžennâ ta Ìnformacìjnì Tehnologìï; 2021, Issue 2, p113-129, 17p
Subject Terms: INFORMATION resources, ALGORITHMS, CLASSIFICATION, SCHOLARS, NOISE
Alternate Title: TOPIC MODELING OF RESEARCHERS BASED ON THEIR INTERESTS FROM GOOGLE SCHOLAR. (English)
ТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ УЧЕНЫХ НА ОСНОВЕ ИХ ИНТЕРЕСОВ В GOOGLE SCHOLAR. (Russian)
Reviews & Products: GOOGLE Scholar (Web resource)
Abstract (English): The article proposes an algorithm for topic modeling of researchers based on their interests from Google Scholar profiles. The algorithm uses the set of fields of research from research classification system ANZSRC. An information resource for topic modeling is a corpus of categorized publications from Dimensions. Interests from researchers’ profiles are used as search queries to Dimensions that outputs distributions of documents over categories. To reduce information noise these distributions are taken through a few stages of processing. The article also compares the results of topic modeling based on interests from Google Scholar profiles and based on a categorized list of publications from Dimensions. The comparison is done using modified Czekanowski metric that takes into account the similarity between categories. The results of comparing the topic modeling outputs based on different information sources show a good match. [ABSTRACT FROM AUTHOR]
Abstract (Russian): Предложен алгоритм тематического моделирования ученых по научным специальностям на основе их интересов в профилях в Google Scholar. Алгоритм использует перечень научных специальностей из системы класси-фикации наук ANZSRC. Информационным ресурсом для тематического моде-лирования является база категоризированных научных публикаций из системы Dimensions. Интересы из профилей ученых используются как поисковые за-просы для Dimensions, сервисы которой выдают распределения релевантных документов по специальностям. Для уменьшения информационного шума эти распределения проходят несколько этапов обработки. Сравниваются результа-ты тематического моделирования на основе профильных интересов в Google Scholar и категоризированного списка авторских публикаций в Dimensions по метрике Чекановского с учетом схожести специальностей. Для тестовых уче-ных выявлена высокая согласованность результатов тематического моделиро-вания при различной исходной информации. [ABSTRACT FROM AUTHOR]
Copyright of System Research & Information Technologies / Sistemnì Doslìdžennâ ta Ìnformacìjnì Tehnologìï is the property of Institute for the Applied System Analysis at the NTUU KPI and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
ISSN: 16816048
DOI: 10.20535/SRIT.2308-8893.2021.2.09
Database: Complementary Index