Статья посвящена проблеме построения вполне интерпретируемых линейных регрессионных моделей, оцениваемых с помощью метода наименьших квадратов. Линейная регрессия называется вполне интерпретируемой, если знаки её коэффициентов соответствуют физическому смыслу входящих в уравнение факторов, а эффект мультиколлинеарности незначителен. При этом желательно, чтобы модель обладала высоким качеством аппроксимации, а все её коэффициенты были значимы. В статье впервые сформулирована задача частично-булевого линейного программирования для выбора в линейной регрессии оптимального числа информативных регрессоров, знаки коэффициентов при которых согласуются со знаками соответствующих коэффициентов их корреляции с зависимой переменной, а абсолютные вклады переменных в общую детерминацию не меньше заданного числа. Эффективность решения этой задачи обусловлена наличием ограничений на согласованность знаков коэффициентов модели, а ограничения на абсолютные вклады переменных позволяют контролировать эффект мультиколлинеарности. Разработан метод последовательного повышения абсолютных вкладов переменных в общую детерминацию, гарантирующий построение вполне интерпретируемой линейной регрессии. Для решения сформулированных задач разработана программа ВИнтер-1. Сначала с помощью неё на обычном персональном компьютере решалась довольно сложная вычислительная задача, решение которой методом полного перебора требует оценки примерно 16,5 квадриллионов моделей. Программа Винтер-1 справилась с этой задачей примерно за 293 секунды, что подтверждает её эффективность. Помимо этого с помощью ВИнтер-1 была построена вполне интерпретируемая модель грузоперевозок железнодорожного транспорта в Иркутской области.
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии
2022. — Выпуск 2
Содержание:
Распространённость беспилотных систем мультироторного типа и их использования в самых различных областях с каждым годом становится всё выше. Однако, почти все подобные системы имеют существенное ограничение - полетное время и, соответственно, эффективное время работы большинства мультироторных платформ (МРП) составляет 15-20 минут. Очевидное решение с использованием аккумуляторов большей емкости или более энергоэффективных аккумуляторов решают данную для ограниченного круга задач. В связи с этим актуален вопрос использования привязных МРП для достижения более высоких значений полетного времени благодаря обеспечению питания по тросу-кабелю для использования в качестве быстро-разворачиваемых наблюдательных пунктов или антенных установок. Специфическим требованиям к данным системам является возможность работать в условиях, когда возможно возмущающее влияние ветра и его порывов на систему стабилизации аппарата. Данные возмущающие воздействия необходимо учитывать при разработке систем управления привязных МРП. В работе дан анализ способов компенсации горизонтального сноса привязной мультироторной летающей платформы, при наличии горизонтально направленного ветрового возмущении. Для минимизации указанного возмущения на движение платформы могут быть использованы различные подходы, что требует разработки соответствующих алгоритмов управления. В рамках решения задачи поиска наиболее эффективного способа управления установлены два наиболее удобных в конструктивном отношении способа компенсации горизонтального сноса: за счет увеличения силы тяги моторов и за счет осуществления разворота МРП. Представлены результаты сопоставительного анализа энергетических затрат на реализацию обоих способов.
Ключевые слова
При нелинейном характере зависимости случайных величин использование коэффициента корреляции может приводить к неверным выводам. Более универсальной характеристикой зависимости является взаимная информация, не требующая предположения о линейности связи случайных величин. Ее можно интерпретировать как среднее количество информации относительно случайной величины, содержащейся в распределении некоторой другой случайной величины. В статье описан метод непараметрической оценки величины взаимной информации по эмпирическим данным, заключающийся в минимизации регуляризованного квадратичного функционала в гильбертовом пространстве с воспроизводящим ядром. Используется замена скалярного произведения в обычном гильбертовом пространстве на значение неотрицательно определённой функции двух переменных. Аналитическим решением является линейная комбинация значений воспроизводящего ядра с коэффициентами, вычисляемыми как решение регуляризованной системы линейных уравнений. Приведены результаты оценки связи между вариабельностью сердечного ритма и успешностью работы оператора системы управления через взаимную информацию и через коэффициент корреляции по данным реального эксперимента. На примере выяснения зависимости успешности выполнения задания оператором системы управления от вариабельности сердечного ритма на малых интервалах времени показана эффективность использования предложенной оценки взаимной информации.
Ключевые слова
Широкое распространение распределённых информационных систем для управления технологическими процессами и сложными техническими объектами привело к созданию особого класса протоколов связи, чьей характерной чертой является высокая энергоэффективность и низкая пропускная способность. Это, в свою очередь, приводит к жёстким ограничениям на размер передаваемого кадра информации, и снижает размер полей служебной и идентификационной информации, по которой компоненты распредёлённой системы определяют источник, сформировавший передаваемое управляющее или информационное сообщение. Для повышения достоверности идентификации созданы методы, основанные на определении источника для групп сообщений. Их недостатком является высокая вычислительная сложность, определяемая числом возможных вариантов формирования таких групп из всего множества сообщений, обрабатываемых приёмником. В статье рассматривается метод ограничения множества обрабатываемых блоков для повышения достоверности идентификации и снижения вычислительной сложности реализуемых при этом алгоритмов в условиях ограниченного несколькими битами размера поля идентификационной информации. Описаны математические модели формирования и обработки множеств сообщений приёмниками. На основе полученных результатов показано, что использование неизменности характеристик потока сообщений от источника позволяет в разы повысить достоверность методов, основанных на определении источника для групп сообщений. Определены условия применения метода ограничения множества обрабатываемых слов, при которых наблюдается наибольшее снижение вероятности ошибки идентификации. Практическим результатом проведённых исследований является снижение размеров полей идентификационной информации в пакетах данных, передаваемых между устройствами распределённых информационных систем по каналам связи с ограниченной пропускной способностью, и снижение числа переспросов, вызванных ошибками. Всё это обеспечивает снижение информационной избыточности передаваемых данных и повышение скорости их обработки оконечным оборудованием.
Ключевые слова
В данной работе решена задача оценки параметров системы обыкновенных дифференциальных уравнений первого порядка по неточным наблюдениям на коротком временном интервале. Речь идет о системах дифференциальных уравнений, разрешенных относительно производной (о нормальных системах), у которых число параметров совпадает с числом уравнений, с заданными начальными условиями. По аналогии с линейным регрессионным анализом на рассматриваемом отрезке времени выбирается достаточно большое число наблюдений и оцениваются значения функций, стоящие в правых частях нормальной системы уравнений, и значения их производных в начальный момент времени. По аналогии с методом моментов по оценкам значений функций и ее производных определяются неизвестные параметры исходной системы дифференциальных уравнений. В работе исследуется свойства полученных оценок и при определенных условиях, накладываемых на шаг разбиения временного отрезка, доказывается их асимптотическая несмещенность и состоятельность при увеличении числа наблюдений. Для двух частных случаев были проведены вычислительные эксперименты и их результаты продемонстрированы в работе. Предложенный в работе алгоритм оценивания параметров системы обыкновенных дифференциальных уравнений по неточным детерминированным наблюдениям, в отличие от классических оптимизационных алгоритмов, позволяет оценить скорость сходимости полученных оценок к оцениваемым параметрам. А рассмотрение малого интервала временного наблюдения дает возможность построить процедуру планирования эксперимента. Наряду с системами обыкновенных дифференциальных уравнений предлагаемый алгоритм может быть применен и к системам уравнений в частных производных, что планируется реализовать авторами в дальнейшем.
Ключевые слова
Необходимость оценки эффективности создаваемых систем безопасности значимых объектов критической информационной инфраструктуры, определяет потребность в разработке простых и адекватных математических моделей реализации компьютерных атак. Использование методов математического моделирования ходе проектирования системы безопасности значимого объекта позволяет без значительных затрат и без какого-либо влияния на технологический процесс обосновать требования к системе в целом или к отдельным ее частям. Целью работы является разработка модели процесса проведения многоэтапной компьютерной атаки, эксплуатирующей уязвимость Zerologon, основанной на представлении ее марковским случайным процессом с дискретными состояниями и непрерывным временем. Используемые методы: методы теории марковских процессов, теории вероятностей, вычислительной математики, а также теории графов. Новизна работы заключается в применение методов вычислительной математики для функционального анализа результатов решения системы уравнений Колмогорова, что позволяет известными методами анализа непрерывных функций решать задачу оптимизации компенсирующих мер защиты, входящих в систему безопасности. Разработана математическая модель, позволяющая определить требуемые вероятностно-временные характеристики средств защиты в проектируемых системах безопасности. При оценке эффективности мер защиты введен показатель эффективности системы безопасности значимого объекта критической информационной инфраструктуры как отношение вероятности срабатывания системы безопасности к вероятности успешного завершения атаки нарушителем. Оценена зависимость времени защиты относительно соотношений временных параметров применяемых компенсирующих мер защиты и действий нарушителя. Результаты исследования можно использовать при проектировании систем безопасности значимых объектов критической информационной инфраструктуры с учетом задаваемых параметров системы безопасности и нарушителя.
Ключевые слова
В работе рассматривается задача построения рабочих графиков для ресурсов, задействованных в реализации проекта. Решение данной задачи необходимо для организации рабочего процесса на уровне конкретных исполнителей. Предлагаемый подход исходит из наличия построенного общего расписания проекта и основывается на минимизации индивидуальных рисков, определяемых характеристиками распределения работ. При этом подход стремится избежать необходимость в дополнительных оценках сверх тех, что традиционно получают на более ранних этапах планирования. Это делает его легко внедряемым на практике. В статье рассматривается две возможные формулировки задачи: с однородными полностью взаимозаменяемыми ресурсами и с наличием нечетких оценок сложности выполняемых исполнителями работ. Приводится принцип переформулирования исходной задачи за счет представления ограничений на пересекающиеся работы в виде графа. Это позволяет получить все возможные конкретные варианты рабочих графиков как независимые множества вершин графа ограничений. В качестве метода решения предлагается алгоритм, основанный на методе ветвей и границ. Приводится описание его основных компонентов, включая оценку нижней границы, проверку ограничений и некоторые приемы, позволяющие повысить эффективность. Наконец, демонстрируется применение предлагаемых методов и алгоритмов на конкретных исходных данных.
Ключевые слова
Рассматривается задача повышения качества изображений при воздействии различных видов шумов и искажений. Проводится сравнительный анализ стандартных алгоритмов и нейросетевых алгоритмов улучшения качества изображений, основанных на использовании глубоких нейронных сетей. Последние позиционируются как универсальное средство решения задачи улучшения качества изображений. Исследуется влияние гиперпараметров глубоких нейронных сетей на качество восстанавливаемых изображений. В первой части рассматривается теоретическая часть проблемы восстановления изображения, как решение сложной неустойчивой оптимизационной задачи. Исследуются различные техники аугментации, основанные на применении методов принудительного зашумления изображений и искусственной генерации дефектов, а также на применении нового подхода к аугментации данных путем частичной стилизации изображений. Помимо этого, используются различные метрики оценки качества восстановленных изображений, определяются их недостатки и границы применимости. Во второй части проводится сравнение известных классических алгоритмов с предложенными нейросетевыми, исследуется зависимость качества восстановления изображений от уровня шума. В ходе экспериментов по оценке эффективности предложенных подходов для улучшения изображений рассматриваются аддитивные и импульсные типы шумов, встречающиеся на изображениях медицинских снимков, а также на изображениях, полученных при помощи оптической когерентной томографии. Исследуется возможность работы алгоритмов в режиме реального времени. Определяется способ сравнения качества изображений через задачу сегментации с помощью сети Unet. Было показано, что нейронные сети не уступают классическим алгоритмам при улучшении качества изображений, а в некоторых случаях даже превосходят их.
Ключевые слова
В статье представлен разработанный алгоритм генерации реалистичных трехмерных облаков в реальном времени. Приведен подробный анализ существующих решений по генерации облаков. Исходя из анализа, для дальнейшей работы была выбрана базовая технология Nubis. В статье описывается теоретический материал, необходимый для реализации алгоритма. Разработанный алгоритм подробно описывается, и для каждого его этапа демонстрируются результаты работы на основе реализованного программного обеспечения. Важной частью статьи является подробное описание вычислительного эксперимента по настройке параметров алгоритма. На основе анализа полученных результатов делаются выводы о работе алгоритма в реальном времени и предлагаются необходимые настройки параметров для качественной работы алгоритма.
Ключевые слова
Работа посвящена разработке математического и программного обеспечения в интересах обнаружения элементов новизны на аэрокосмических снимках городской, пригородной, лесистой местности и акваторий. Для достижения поставленной цели в ходе работы были исследованы традиционные и современные методы обнаружения изменений, а также популярные архитектуры сегментационных нейронных сетей, алгоритмы постобработки и сопоставления изображений. Основной идеей предлагаемого метода и реализуемых на его основе алгоритмов является применение постклассификационного подхода. Он базируется на оценке разности пары бинарных масок, получаемых в результате сегментации анализируемых разновременных изображений с использованием сег-ментационных нейронных сетей и специализированных алгоритмов постобработки. При этом предлагается реализовать обнаружение элементов новизны в условиях различий геометрических параметров сравниваемых изображений, которые большинство предложенных ранее методов и алгоритмов не учитывают. Такой подход позволяет использовать результирующие бинарные маски для качественного сопоставления нового и ранее отснятого снимка, коррекции перспективы и, в конечном итоге оценки их разности. Кроме этого, в отличие от большинства предшествующих работ, предлагается обнаруживать не только изменённые объекты, но и определять их классы и такие связанные топографические объекты, как: здания, дороги, деревья и водные объекты. Это предоставляет возможность использования метода в приложениях фотограмметрии. Ввиду отсутствия объективных количественных данных для оценки точности обнаружения было осуществлено визуальное тестирование. В результате был сделан вывод о том, что предложенный подход весьма хорошо работает лишь для обнаружения крупных изменений, поскольку реализованный метод обнаружения имеет высокую чувствительность к малейшим изменениям.
Ключевые слова
Динамические и статические байесовские сети являются эффективным инструментом моделирования стохастических процессов. Области практического внедрения данных моделей существенно расширились за последнее время. Качество их применения при решении практических задач во многом определяется возможностями алгоритмов обучения структуры и вероятностных параметров моделей, позволяющих произвести настройку сети для решения рассматриваемого круга прикладных задач. В алгоритмах определения оптимальной структуры байесовских сетей и верификация алгоритмов настройки их параметров важную роль играют инструменты, основанные на принципах эквивалентности. На базе принципа эквивалентности формируются асимптотические оценки преобразований, получаемых в процессе добавления, изменения или удаления отдельных узлов графа байесовской сети и создается аппарат получения локального априорного распределение для каждого из параметров сети. В данной работе исследуются инструменты оценивания эквивалентности байесовских сетей на основе метрики Байеса - Дирихле, структурного расстояния Хэмминга и Кульбака - Лейблера. Данные инструменты можно применить и к динамическим байесовским сетям, для работы с которыми дополнительно нужно определить структуру модели перехода между временными срезами. В рамках исследования рассматриваются также вопросы эквивалентности априорных распределений вероятностей, формируемых в процессе обучения параметров. В заключительной части работы приведен вычислительный эксперимент, отражающий эффективность применения различных алгоритмов обучения с позиции сравнения их результатов с эквивалентными эталонными байесовскими сетями. Предложенные в работе инструментальные средства позволяют адаптировать статические и динамические байесовские модели для решения практических задач, оптимизируя процессы обучения данных моделей за счет использования принципа эквивалентности графических вероятностных моделей.
Ключевые слова
The paper explores the options for developing artificial intelligence technologies and tools aimed at enhancing the functionality of the system designed for monitoring and analyzing political Internet memes in the Russian-speaking segment of the Internet. Achieving this goal on the basis of deep machine learning methods and neural network technologies involves dealing with a number of correlated systemic interdisciplinary tasks (problems), which we discuss in the article. We introduce the architecture and functionality of the Memometrix software package, which can provide a partial solution to the problem of automatic image acquisition, tagging, filtering, grouping and exporting. The rationale for distinguishing different levels of macro- and micromodels, models of information interaction between intelligent agents, and control models, has been provided. Simulation modeling is helpful in adjusting the sets of algorithms to be then equipped by a search intelligent agent designed for monitoring and collecting Internet memes, and their analysis, as part of a multi-agent system for controlling the flow of Internet memes. Creating an intelligent system for monitoring Internet memes, its tuning and verification to real processes require the use of tagged databases. Building Internet meme databases involves accumulating and classifying Internet meme images, identifying their duplicates. It is required to use filtering, grouping and exporting the data relevant to Internet memes. Searching for memes involves making search queries and an option to perform a reverse image search, in that allowing to use the already existing databases for classifying meme images. We provide a detailed description of the package's relevant modules, as well as an example of an interface for filtering Internet memes based on using the templates agreed upon with sociologists. The software product was developed with the use of modular architecture and comprises several applications: a Web application (user interface), a server application (provides the operation of the package), and an application for automatically collecting Internet memes. The modularity of the package allows for making adjustments in the application (analysis of collected results, visualization of collected information, prediction of the further spread of Internet memes).