В статье рассматриваются основные классы операций порядкового взвешенного агрегирования, которые получили широкое распространение из-за наличия ряда числовых характеристик, обеспечивающих целенаправленный подход к организации процедуры агрегирования информации в системах мониторинга, информационно-аналитических системах, в экспертных системах и системах поддержки принятия решений, в нечетких системах и других, в которых осуществляется обработка информации в рамках оценочных моделей. Особенностью данного типа операторов является то, что векторная оценка объекта перед агрегированием упорядочивается по невозрастанию или по неубыванию, что позволяет непосредственно учитывать значения компонент, а не важность источников информации, как это делается при использовании взвешенных средних. Моделирование операций агрегирования данного класса сводится к разработке подходов для определения весовых коэффициентов. Назначая определенным образом веса, можно спроектировать процедуру агрегирования с определенными свойствами, в частности, стратегией, компенсационными свойствами, уровнем равномерности учета компонентов векторной оценки. В статье рассматриваются различные семейства операций, реализующих технологию порядкового взвешенного агрегирования, их обобщения и модификации, а также важные случаи. Показана связь данных операторов с интегралами Сугено и Шоке, а также приведены обобщенные представления на основе нечетких мер. Представленный обзор зарубежных публикаций открывает возможности для широкого использования операций агрегирования из данного класса при разработке процедур обработки информации в различных прикладных системах, позволяя обеспечить большую гибкость, многоальтернативность, обоснованность и интерпретируемость.
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии
2022. — Выпуск 1
Содержание:
Развиваются научно-методологические основы системных подходов в решение задач динамики технических объектов. Предлагается технология построение структурных математических моделей виброзащитных систем различного конструктивно-технического назначения; излагается ряд инновационных технических предложений. Теоретическим фундаментом предлагаемого материалы служат методы структурного математического моделирования, в рамках которых механическая колебательная система рассматривается как эквивалентная в динамического отношении структурная схема система автоматического управления. Используются методы системного анализа и теории автоматического управления. Показано, что механическая колебательная система в её структурной интерпретации состоит из объекта, динамическое состояние которого оценивается, и реализации в колебательном контуре отрицательных обратных связей, создаваемых с помощью типовых элементарных звеньев (упругие звенья и демпфирующие устройства). Показано, что число типовых звеньев известной природы, может быть расширено за счёт введения в систему инерционных связей. Исследованы возможности реализации таких подходов на основе введения в структуру механической колебательной системы дополнительных связей, которые представляют собой простейшие механизмы различного вида (винтовые несамотормозящиеся, рычажные, зубчатые передачи и др.). Предложена и разработала технология оценки и изменения динамических состояний механических колебательных систем путем введения в структуру механизмов с различными конструктивно-техническими характеристиками Показано, что системы вибрационной защиты могут получать развитие за счёт концепции формирования и наращивания структуры дополнительных связей, в рамках которых известные элементарные типовые элементы могут рассматриваться и как частные случаи более общих представлений о возможностях обратной связи.
Ключевые слова
Интенсивное развитие роевой робототехники актуализирует вопросы обеспечения ее информационной безопасности. Известные подходы к обнаружению угроз информационной безопасности процесса коллективного принятия решений в роевых робототехнических системах используют физические параметры, которые сильно зависят от среды функционирования и аппаратной реализации системы. Поэтому трудно определить универсальные признаки аномального поведения робота, обеспечивающие точный порог отклонения и низкий процент ложных срабатываний. Целью работы является повышение эффективности достижения консенсуса в роевых робототехнических системах в условиях наличия неисправных или вредоносных роботов. Решение задачи обнаружения вредоносных роботов базируется на применении методов машинного обучения. В качестве классификатора вредоносных роботов использована искусственная нейронная сеть, обученная на наборе данных, сгенерированных с помощью разработанного ранее аналитического метода. Новизна представленного решения заключается в выборе параметров с варьируемыми значениями для проведения симуляций с целью формирования набора данных для обучения классификатора вредоносных роботов. Предложенный подход обеспечивает универсальность выявления вредоносных роботов независимо от их численности или стратегии поведения. Проведено имитационное моделирование роевой робототехнической системы, состоящей из 100 роботов. При наличии 20 % роботов с некорректным поведением, количество ложных срабатываний снижено на 41,07 % относительно метода-прототипа. Представленный метод реализован в виде программного обеспечения на языке программирования C++, которое может быть использовано при моделировании систем управления роевыми робототехническими системами.
Ключевые слова
Актуальность представленной работы обусловлена широким внедрением шифрования данных, включая и текстовые сообщения, в многочисленные сферы как гражданского, так и военного применения. Представлен обзор традиционных методов шифрования текстовой информации и методов, разрабатываемых на основе перспективных направлений (клеточные автоматы, нейронные сети, хаотические отображения). Работа посвящена разработке алгоритма шифрования текста с использованием информационных матриц и систем c детерминированным хаосом. В соответствии с предложенным алгоритмом шифрования исходный текст трансформируется в двумерный массив данных - информационную матрицу. Элементами этой матрицы являются символы текста. Позиция элемента информационной матрицы однозначно связана с позицией символа исходного текста, а значение элемента определяется двоичным кодом символом алфавита открытого текста. Для шифрования информационной матрицы используется трехмерная хаотическая система. Существенная зависимость хаотического отображения от начальных условий и наличие у него свойства транзитивности позволяют обеспечить одновременное перемешивание и рассеивание элементов информационной матрицы. На примере трехмерной хаотической системы Рёсслера исследованы критерии стойкости предложенного алгоритма шифрования к статическому криптоанализу (коэффициенты корреляции между элементами зашифрованной информационной матрицей, энтропия, распределение вероятностей значений элементов) и дифференциальному криптоанализу (процент измененных элементов и среднее изменение интенсивности). Проведенные вычислительные эксперименты показали достаточно хорошие (близкие к теоретически достижимым значениям) критерии стойкости и полное соответствие между дешифрованным текстом и исходным текстом. Вычислительные эксперименты выполнены с использованием разработанных программ на языке Python и Java.
Ключевые слова
Статья посвящена исследованию схемы движения общественного транспорта в городской среде с целью корректировки и оптимизации топологии транспортной сети. Для достижения данной цели используется междисциплинарный подход. Применение междисциплинарного подхода к анализу маршрутов движения городского общественного транспорта позволяет оптимизировать их работу и тем самым улучшать качество жизни населения. В статье представлена методика выявления дублируемости маршрутов общественного транспорта в системе городской сети, основанная на применении математического аппарата теории графов и линейной алгебры. Для оценки степени дублируемости маршрутов составлена матрица маршрутов, определены вектор-маршруты, рассчитаны коэффициенты дублируемости на основе проекции одного вектора маршрута на другой. Задача анализа данных схемы движения городского общественного транспорта с целью выявления дублируемых маршрутов решена для системы города Ижевск Удмуртской Республики, включающей 55 маршрутов движения городского транспорта. На основе значения коэффициентов дублируемости и варианта дублирования маршрутов предложены конкретные методы решения задачи планирования топологии транспортной сети. Так, для преодоления проблемы дублируемости маршрутов в системе общественного транспорта города Ижевск предлагается провести синхронизацию расписания более чем у 28 маршрутов, а 6 маршрутов движения общественного транспорта исключить в результате их частичного слияния в 3 маршрута. Описанная методика выявления дублируемых маршрутов может быть применена для систем общественного транспорта в различных городах Российской Федерации.
Ключевые слова
Кластеризация является одной из базовых задач машинного обучения, наряду с распознаванием образов, классификацией и прогнозированием. Особенно существенна роль кластеризации в анализе больших данных, работа с которыми может быть эффективной только с использованием компьютерных технологий. При этом, задача автоматического разбиения на кластеры с учетом погрешностей исходных данных не получила однозначного решения и требует поиска более адекватных подходов, включающих автоматическое определение числа кластеров. В работе предложен новый метод кластеризации данных, основанный на модификации гравитационного алгоритма, использующего аналогию с формированием звездных кластеров за счет притяжения масс в соответствии с законом всемирного тяготения. При применении такого подхода к кластеризации данных реальные физические массы заменяются точками в многомерном пространстве данных, а движение этих точек с учетом их притяжения приводит к формированию кластеров. Недостатком такого способа является проявление эффектов инерции, которые могут затруднять процесс завершения кластеризации и приводить к выбросу ускоренных частиц из кластера на стадии его формирования. Для исключения таких нежелательных событий в работе используется модель динамики вязкого движения частиц, представляющих данные, и естественное ограничение размеров кластеров за счет отталкивания частиц. Силы отталкивания частиц взяты в виде обменного взаимодействия Паули для фермионов при гауссовом распределении плотностей погрешностей. Записаны основные уравнения, описывающие работу представленной модификации гравитационного алгоритма. На численном примере продемонстрированы особенности и преимущества вязкого гравитационного алгоритма в сравнении с методом k-средних и основанном на плотностях методом DBSCAN, включая автоматическую остановку процедуры при завершении процесса кластеризации. Полученные результаты позволяют проводить слепую кластеризацию больших данных и допускают обобщение на решение задач многомерной оптимизации.
Ключевые слова
Разработан метод выделения границы объекта интереса на переменном фоне, ориентированный на автоматический анализ выражения лица человека. Из полутонового фотографического изображения извлекаются контуры бровей глаз и губ. На первом этапе проводится классификация пикселей по трём уровням яркости. Полагается, что пиксели одного из них, соответствуют коже, другого - волосам, третий же уровень составляют остальные пиксели. Для определения яркостей этих уровней применяется разработанный автором ранее алгоритм, суть которого состоит в следующем. Изображение делится на прямоугольные фрагменты. Для каждого из них проверяется гипотеза о том, что яркости его пикселей являются выборкой из распределения, которым описывается случайный шум, присутствующий на изображении (формулы были получены для нормального распределения шума). В предположении, что все пиксели любого фрагмента, для которого подтвердилась гипотеза, входят только в одну из указанных групп, яркости уровней определяются путём арифметического усреднения гипотетических математических ожиданий яркостей пикселей, принадлежащих каждой группе. Далее в процессе построчной обработки определяются границы областей, имеющих постоянную яркость. Метод был опробован на фотографиях из открытой базы, созданной в университете штата Джорджия (США). Результаты показали, что извлечённые контуры визуально хорошо соответствуют границам объектов интереса, и есть основания полагать, что они могут быть использованы для решения задачи автоматического определения эмоционального состояния человека по его портретной фотографии. Кроме того, была продемонстрирована устойчивость алгоритма по отношению к случайному шуму, величина стандартного отклонения которого не превышает 25 % от средней величины полезного сигнала.
Ключевые слова
В статье предлагается подход к металлографическому исследованию образов стали, основанный на использовании обучаемого нейросетевого классификатора W-Net. Разработан программный подход к обработке данных (микрофотографий срезов металлов), включающий в себя предобработку изображений, нахождение сегментов (зёрен) металла, вычисление их границ, площадей и балла зерна с последующим построением гистограммы распределения площадей зёрен металла на микрофотографии. Проведён анализ эффективности предлагаемого подхода путем сравнения полученных гистограмм распределений с эталонными через вычисление их статистических характеристик. Полученные результаты демонстрируют высокую корреляцию между рассчитанными и эталонными данными.
Ключевые слова
В статье обсуждаются особенности разработки современных методов обучения с подкреплением в задачах медицинской направленности. Методы обучения с подкреплением являются популярным инструментом машинного обучения, применяемым в задачах поиска оптимальных стратегий лечения пациентов, персонализированной медицины, а также интерактивных систем наблюдения за пациентами. При этом важной задачей является выбор оптимального алгоритма обучения с подкреплением из множества существующих на данный момент методов, обладающих своей спецификой применения, преимуществами и недостатками. Данная статья посвящена анализу алгоритмического аппарата наиболее популярных методов обучения с подкреплением и содержит примеры результатов работы рассматриваемых методов в контексте задачи поиска оптимальных схем лечения для кардиологических пациентов.
Ключевые слова
Выбор стратегии распределения параметров между языками в моделях многоязычного машинного перевода определяет то, насколько оптимально используется пространство параметров. Следовательно, выбранная стратегия напрямую влияет на конечное качество перевода. Данная работа исследует новый подход к организации параметров в многоязычном машинном переводе на основе лингвистических деревьев, которые показывают степень родства между различными языками. Основная идея заключается в том, чтобы использовать эти экспертные языковые иерархии в качестве основы для архитектуры модели: чем ближе два языка, тем больше у них должно быть общих параметров. Мы испытываем эту идею для архитектуры Трансформер и показываем, что, несмотря на успех в предыдущих работах, существуют проблемы, присущие обучению таких иерархических моделей. Мы демонстрируем, что при специально подобранной стратегии обучения иерархическая архитектура может превзойти как простые двуязычные модели, так и многоязычные модели перевода с общим пространством параметров.
Ключевые слова
The article discusses the importance of automation for managing the intelligent processes and evaluating the effectiveness of processes. Often this process requires the creative approach of an analyst who has to read a lot of media information relating to the crowdsourcing project activity. This may be messages from users, persons concerned, experts' comments and other information generated by society as a response to the project activity. For many reasons, this is a non-optimal process, firstly, an analyst must review the entire array of information to estimate the project activity, and it is difficult to parallel this task. Since the social situation is subject to variation just for several hours and the human factor keeps away from such efficiency, then the evaluation relevance and up-to-dateness are compromised. It is necessary to automate the evaluation process of the crowdsourcing activity and this is the essence of our approach. We have developed the hierarchic thesaurus for highlighting the information from users' and persons' concerned messages, in the press reports and blog comments. Findings show that crowdfunding projects are hybrid in nature and include the elements of crowdsourcing, crowdsensing, crowd-funding, crowdworking, and crowdsourced recruitment. We explored the possibility of automating the efficiency evaluation of various crowdsourcing working processes and proposed design solutions for the development of such systems. The preliminary results indicate that leading issues include the lack of financial guarantees and the likelihood of information leakage to competitors. Hence, the first priority is to manage the exchange of money and information. By following this strategy, the crowdsourcing platforms will reach a high level of responsibility among project initiators and participants and will reduce the likelihood of tax avoidance by individuals, who received a financial reward.