В статье рассматривается один из наиболее популярных в настоящее время подходов к построению различных типов интеллектуальных помощников и запрос-ответных систем на базе больших языковых моделей (LLM), основанный на in-context learning или retrieval augmented generation (RAG). Появившееся в последнее время множество публикаций на эту тему в первую очередь ориентировано на английский язык и использует такие ведущие по качеству модели, как GPT-4o и их развитие. В то же время оценки методов поиска контекста RAG для задач на русском языке практически отсутствуют, что делает актуальной задачу проведения исследований, направленных на адаптацию и оценку этих методов для русского языка. Цель исследования: изучить эффективность различных подходов retrieval augmented generation (RAG) для русскоязычных задач, учитывая, что большинство исследований в этой области ориентированы на английский язык и используют ведущие модели, такие как GPT-4. Материалы и методы. В статье рассматриваются три базовых подхода к построению RAG: naive RAG, HyDE и вероятностный подход, основанный на функции BM25. Особое внимание уделяется оценке качества этих методов по метрике mean average precision (mAP) для трех областей знаний. Комбинированные методы RAG, такие как SelfRAG, не использовались, чтобы получить отдельные оценки каждого подхода. Для экспериментов были отобраны корпуса текстов на русском языке для областей знаний - нефтегазовой промышленности и юриспруденции. Результаты. Проведенное исследование позволило получить оценки качества для каждого из рассмотренных методов. Результаты хорошо согласуются с данными других исследований, но уступают известным RAG на английском языке. Заключение. Полученные результаты могут быть использованы как базовые оценки (baseline) и в качестве основы для принятия решений по выбору оптимальных архитектур RAG для русскоязычных задач. Дальнейшие исследования будут направлены на интеграцию комбинированных методов и адаптацию моделей для повышения качества генерации на русском языке.

Вестник Южно-Уральского государственного университета. Серия: Компьютерные технологии, управление, радиоэлектроника
2025. — Выпуск 2
Содержание:
Недостаточная пропускная способность улично-дорожной сети является проблемой большинства городов. Частично эта проблема может быть решена оптимизацией работы светофора. Поскольку подбор настроек светофора в реальном времени может привести к ухудшению дорожной ситуации, целесообразно предварительно настроить модель и на ней отработать различные режимы работы светофора, подобрать оптимальные. Цель исследования: моделирование изменения среднего числа машин в очереди перед запрещающим сигналом светофора и среднего времени проезда перекрёстка. Для достижения поставленной цели сформулированы следующие задачи: создание модели дорожного участка с реальными потоками на входах; определение среднего числа машин в очереди при различных режимах работы светофора; создание эксперимента для нахождения среднего времени левого поворота с вводом и без ввода специализированной левоповоротной фазы светофора. Материалы и методы. Для решения поставленных задач опробована методика использования среды AnyLogic для анализа участка дорожного движения, показана возможность применения имитационного моделирования с целью выявления зависимости пропускной способности перекрёстка от режима работы светофора. Результаты. В процессе исследования создана модель существующего перекрёстка и рассмотрена зависимость числа автомобилей в очереди перед запрещающим сигналом светофора от длительности его полного цикла. Для проведения эксперимента существующий цикл работы светофора длительностью 84 с был изменен до 30 с, 1, 2, 3 и 5 мин. Для визуализации полученных зависимостей построен график, отражающий число автомобилей в пробке при различных режимах работы светофора. Созданная модель использована также для определения зависимости времени проезда перекрёстка при левом повороте от числа поворачивающих машин и числа машин во встречном направлении. Рассмотрены варианты проезда светофора с дополнительным левым сигналом светофора и без него. Результаты представлены таблицей и графически. Заключение. Исследование показало, что при небольшом встречном трафике введение специализированной левоповоротной фазы светофора увеличивает время проезда перекрёстка, но при увеличении встречного трафика ситуация меняется на противоположную.
Ключевые слова
Целью является разработка формализма (последовательности формальных действий) выписывания формул вычисления элементов матрицы инерционных коэффициентов (ЭМИК) древовидных систем тел с открытыми ветвями (ДСТОВ), тела которых образуют между собой шарниры, т. е. вращательные кинематические пары пятого класса. Методы исследования относятся к механике систем тел, системному анализу и робототехнике. Результаты исследования содержат новый формализм автоматического выписывания формул вычисления ЭМИК, т. е. коэффициентов при произведениях относительных угловых скоростей тел в выражении кинетической энергии ДСТОВ. Формулы ЭМИК содержат постоянные структурные, геометрические и инерционные параметры рассматриваемой ДСТОВ. Эти формулы представляются в виде квадратичных форм относительно направляющих косинусов между осями систем координат, жестко связанных с телами. Эффективность формализма демонстрируется на примерах ручного выписывания ЭМИК трехзвенного ангулярного манипуляционного робота (МР) в вертикальной плоскости, двуруких МР с пятью и семью степенями свободы на плоскости и в пространстве. Для МР в пространстве решена задача синтеза его параметров, для которых ЭМИК не зависят от углов поворота тел. Заключение. Предлагаемый формализм можно использовать для выписывания ЭМИК типовых ангулярных МР, а также шагающих аппаратов в одноопорной фазе ходьбы или полета, например, с целью вывода на их основе уравнений динамики в форме уравнения Лагранжа второго рода. Применение известных методов учета связей расширяет область использования ЭМИК на ДСТВ, т. е. на ДСТОВ со связями концевых тел, а также на ДСТВ с переменной структурой, что актуально для выписывания уравнений динамики шагающих аппаратов и машин в различных фазах ходьбы.
Ключевые слова
В работе предложен метод нейросетевой оптимизации областей существования скользящего режима в проекциях фазового пространства объекта управления с целью последующего синтеза систем управления со скользящими режимами. Расширение областей существования скользящего режима предоставляет большую свободу в выборе поверхностей скольжения, в том числе нелинейных, и позволяет рассчитывать на повышение качества управления. Цель исследования заключается в определении применимости современных методов машинного обучения, в частности нейронных сетей и генетических алгоритмов, в задачах оптимизации областей существования скользящего режима на примере нелинейной системы 4-го порядка. Материалы и методы. Для решения задачи применяются численные методы машинного обучения нейронных сетей и стохастического направленного поиска, в частности генетические алгоритмы. Также применяется метод анализа двумерных проекций фазового пространства многомерной системы. Результаты. Предложна структурная классификация проекций фазового пространства с нейросетевой оптимизацией областей существования скользящего режима для обеспечения автоматизированного синтеза алгоритмов управления. На примере импульсного преобразователя 4-го порядка рассмотрены особенности проекций фазовых пространств многомерных систем. Предложен способ формирования линий переключения для скользящего режима на основе проекций фазового пространства, позволяющий классифицировать проекции с точки зрения их пригодности к организации управления в скользящем режиме. Произведена максимизация областей существования скользящего режима с помощью стохастического генетического алгоритма и с использованием нейронной сети в виде многослойного перцептрона. Сеть реализована на базе библиотеки для построения и обучения нейронных сетей TensorFlow. Для обновления модели применен оптимизатор Adam. Показано, что оптимизация с помощью генетического алгоритма и нейронной сети позволяет значительно увеличить потенциал выбора алгоритмов управления за счет расширения областей существования скользящего режима в проекциях фазового пространства. Заключение. Результаты применения генетического алгоритма и многослойной нейронной сети демонстрируют, что предложенный метод расширяет область применения проекций фазового пространства в задачах синтеза управления многомерными нелинейными системами и открывает новые возможности для повышения эффективности управления в скользящих режимах.
Ключевые слова
Обрывы в короткозамкнутой обмотке ротора асинхронного электродвигателя являются одной из причин преждевременного выхода из строя промышленного оборудования. Обрыв стержня ротора приводит к перегреву электродвигателя, повышению его вибрации и снижению эффективности работы. Классические методы диагностики дефектов ротора, основанные на обнаружении частотных составляющих около гармоники питания двигателя в спектрах тока, часто оказываются недостаточно точными из-за влияния различных маскирующих факторов, таких как присутствие шумов в сигналах тока, особенности конструкции ротора и изменение рабочих условий. Цель исследования: применить метод матричных пучков к сигналам тока электродвигателя для получения значений амплитуд и частот высших гармоник дефекта ротора в районе 5-й и 7-й гармоник питания. Высшие гармоники дефекта ротора менее подвержены влиянию маскирующих эффектов и являются более надёжными индикаторами неисправности ротора по сравнению с составляющими в районе основной гармоники питания. Материалы и методы. Метод матричных пучков имеет высокое спектральное разрешение и вычислительную эффективность по сравнению с методами спектрального анализа на основе преобразования Фурье. Дополнительная обработка сигналов тока, включающая их фильтрацию и демодуляцию на основе суммирования квадратов токов, позволяет повысить точность и надёжность обнаружения высших гармоник дефекта ротора. Результаты. Обработка реальных сигналов электропривода с дефектами ротора показала, что при увеличении нагрузки двигателя и прогрессировании дефекта амплитуды гармоник дефекта ротора также увеличиваются. Таким образом, данные параметры могут служить диагностическими признаками неисправности. Метод матричных пучков позволяет с достаточной точностью определить значения частот и амплитуд гармоник дефекта ротора при малой частоте дискретизации 100 Гц при длине сигнала 200 отсчетов. Заключение. Метод матричных пучков является эффективным инструментом для мониторинга состояния асинхронных электродвигателей, так как позволяет отслеживать как изменение частот дефектных гармоник, так и рост их амплитуд при развитии повреждения. Таким образом, метод матричных пучков может быть применен на практике для раннего обнаружения неисправностей асинхронного двигателя и предотвращения аварийных ситуаций.
Ключевые слова
The reliability of actuators is determined by the criteria of limit states, which are assessed by different types of sensors. The reliability of sensors depends on their design properties, features of technological support of their quality in the manufacturing process. The angular position of the rotary links of actuators is determined by different types of sensors, including rotary angle sensors. A non-contact sensor is considered. The sensor operation is based on the Hall measurement principle, which ensures its structural simplicity, reliability and long service life. The accuracy characteristics of the sensor are determined by manufacturing errors of its individual parts. The purpose of the study is to develop a model of sensor error depending on manufacturing inaccuracies of the permanent magnet, which is part of its primary measuring transducer. Materials and Methods. The rotary angle sensor manufactured by Specialized Design Bureau “Induction” has been chosen as a prototype, during the production of which deviations in its technical characteristics caused by defects in the permanent magnets have been detected. The methods used in the paper include theoretical mechanics, calculation of electric and magnetic circuits, and numerical modelling. The calculations have been performed for a cylindrical permanent magnet with radial magnetization, wherein the magnetization vector is shifted in the radial direction. To perform the error calculations, the schemes of the arrangement of defective magnets relative to the magnetization vector of the external field created by additional magnets have been used. The coaxial arrangement of additional magnets is ensured by arranging them in coaxial cylindrical guides. Results. Analytical dependencies that relate the displacement of the magnet dipole relative to its geometric centre with the error in determining the rotary angle have been presented. The sensor errors have been shown in sketches of the primary measuring transducer in various positions of the magnet relative to the Hall elements in the primary transducer. Conclusion. The research results can be used in engineering facilities that allows for a quantitative assessment of the radial displacement of the magnetic dipole relative to the geometric centre of the magnet. The practical significance of the results lies in the rejection of permanent magnets at the stage of incoming inspection of the permissible displacement of the magnetic dipole relative to its geometric centre.
Ключевые слова
В настоящее время как никогда все большую актуальность обретает проблема обеспечения безопасности цифровых данных. Потребителями цифровых данных или же информации являются практически все люди в большинстве сфер жизнедеятельности. Безопасными данными в контексте исследования являются данные, происхождение которых достоверно, целостность не нарушена и авторские права соблюдаются. Методы защиты цифровых данных с каждым годом совершенствуются, стремясь предотвращать кражу информации и оберегать людей от недостоверных или заведомо ложных сведений. Однако при всем своем многообразии и технологической зрелости современные подходы к верификации подлинности, авторского права, целостности мультимедиа и инструменты на их основе не всегда могут защитить потребителей информации в полном объеме от современных киберугроз. При создании нового также не всегда устраняются концептуальные проблемы того, что было раньше. Новые подходы, инструменты и стандарты зачастую привносят новые уязвимости, которые используются злоумышленниками для атаки. Цель исследования: провести анализ современных методов и технологий верификации подлинности, авторского права и целостности мультимедийных данных, а также предложить комплексный подход, который может способствовать решению выявленных проблем. Материалы и методы. Используется ретроспективный метод для анализа исторического развития технологий защиты данных, криптографические подходы, а также современные решения на основе блокчейна и машинного обучения. Результаты. Анализ показал, что традиционные криптографические методы, несмотря на эффективность в обеспечении целостности данных, сталкиваются с ограничениями в распределенных системах из-за отсутствия единых стандартов и сложности масштабирования. Заключение. Несмотря на разнообразие существующих технологий подтверждения авторства, целостности, и аутентичности цифровых данных в общем и мультимедиа в частности, на сегодняшний день проблемы отсутствия стандартизации и фрагментированности решений остаются одними из ключевых вызовов в области обеспечения комплексной безопасности цифровых данных.
Ключевые слова
Данное исследование посвящено методическому подходу, который рассматривает школу как цельный объект, единовременно взаимодействующий со многими агентами, а также актуальному вопросу влияния материальной базы на управление образовательным процессом в российских школах. В статье предлагается несколько моделей взаимодействия между школами и поставщиками, апробированных с помощью интервью директоров школ и компаний-поставщиков. Цель исследования: рассмотреть школу как цельный объект и определить влияние материальной базы на образовательный процесс в российских школах. Материалы и методы. Для определения используемых фундаментальных механизмов управления была применена декомпозиция целей, которая показала значительное влияние механизма «затраты - эффект» на несколько ключевых показателей, связанных с целями оснащения школ. Кроме того, в работе проведен количественный анализ механизма, подразумевающий ранжирование направлений расходов в рамках механизма «затраты - эффект». Чтобы выделить основные категории оборудования, был проведен расчет корреляции между количеством студентов, набравших на экзаменах от 251 до 300 баллов по государственному экзамену, и стоимостью этого типа оборудования. Результаты. Анализ показал, что лабораторное и цифровое оборудование имеет наиболее значимые корреляции бюджета на закупку и образовательного результата школ. Закупки учебной литературы оказывают менее значительный эффект. Закупки оборудования для школ описываются тремя ключевыми механизмами: оптимизацией цепочек поставок, стимулированием и механизмом «затраты - эффект». Заключение. В данной статье рассматриваются вопросы определения показателей эффективности закупок школ, полученных на основе декомпозиции целей директоров средних школ, и описание механизмов управления закупками различных видов оборудования, влияющих на жизненно важные результаты. Получены данные о потенциальном влиянии закупок различных типов школьного оборудования на образовательный результат и описан механизм «затраты - эффект» применительно к школе.