АННОТАЦИИ К СТАТЬЯМ (ЖУРНАЛ ``МЕДИЦИНА И ВЫСОКИЕ ТЕХНОЛОГИИ`` №1, 2022)
Пятницкий А.М., Гукасов В.М.

Поиск статистически значимых кластеров в сетях и медико биологические приложения

Резюме: Новый метод статистически мотивированного поиска кластеров, ранее использованный авторами для анализа точечных и частотных данных в эпидемиологии, а также для решения задачи кластеризации выборок, применен к поиску сильно связанных между собой объектов (вершин) некоторой сети (графа). Подобная задача часто встречается в медико-биологических приложениях, однако существующие в литературе алгоритмы ее решения не имеют статистического обоснования, и вопрос о значимости полученных кластеров остается открытым. В том случае, когда кластеры не составляют всю исследуемую сеть неизбежно возникновение ложноположительных результатов. В статье предлагается метод выявления значимых кластеров. Он сравнивается с девятью метода- ми, существующими в литературе. Показано, что только данный метод позволяет выявить значимые кластеры, успешно выделяя их из фона, состоящего из объектов случайно связанных между собой.

Ключевые слова: значимые кластеры в сетях, статистически мотивированная кластеризация графов, поиск со- обществ, основанная на вероятности мера близости, множественные сравнения, минимальное остовное дерево.

A.M. Pyatnitskiy, V.M. Gukasov

Search for statistically significant clusters in networks and biomedical applications

Summary: A new, statistically based method of clustering previously used by authors for analysis of frequency and point data in epidemiology and for searching clusters in samples is applied to discovering clusters in graphs or networks. Graph clustering or community detection is often used in biomedical applications. Nevertheless methods existing in literature have no sufficient statistical background and the question of significance for revealed clusters usually is not considered. In the case when clusters do not form the whole network false positive results are inevitable. We propose method for discover- ing statistically significant clusters. It is compared with nine methods existing in literature. It is shown that only proposed method can discover significant clusters successfully discriminating them from phone consisting from randomly connected network objects.

Keywords: significant clusters in networks, statistically motivated graph clustering and communities detection, probability based similarity measure, multiple comparisons, minimal spanning tree

DOI: 10.34219/2306-3645-2022-12-1-53-62

ИНФОРМАЦИЯ ОБ АВТОРАХ
Пятницкий Алексей Михайлович – кандидат физико-математических наук, доцент кафедры высшей математики МБФ РНИМУ, e-mail: alpyat@bk.ru

Pyatnitskiy A.M. – Associate Professor at the Department of Higher Mathematics, PRNRMU, Ph.D., e-mail: alpyat@bk.ru

Гукасов Вадим Михайлович – доктор биологических наук, главный научный сотрудник Государственного центра экспертизы в сфере науки и инноваций, ФГБНУ НИИ Республиканский исследовательский научно-консультационный центр экспертизы (ФГБНУ НИИ РИНКЦЭ) Министерства науки и высшего образования России, e-mail: v_m_gukasov@mail.ru

Gukasov V.M. – Doctor of Biological Sciences, Chief Re- searcher of the National Centre of expertise in the field of science and innovation, Research Institute Republican Re- search Scientific-Consulting Center Expertise (FRCEC), Ministry of Science and Higher Education of Russia, e-mail: v_m_gukasov@mail.ru