Как Konergy связывает элементы схемы с текстовыми подписями
Когда нейросеть распознаёт электрическую схему, недостаточно просто найти на изображении условные графические обозначения аппаратов. Главная практическая задача начинается после этого: нужно понять, какой именно текст относится к каждому найденному элементу. Именно так система определяет не просто “символ на схеме”, а полноценный объект со смыслом: его обозначение, серию, номинал, ток, полюсность и другие признаки, которые затем можно использовать для подбора ETIM-класса, характеристик и конкретного оборудования.
На иллюстрации показана базовая концепция такого сопоставления. Сначала мы детектируем сам элемент на схеме. На изображении он выделен жёлтой рамкой. Затем отдельно детектируются текстовые блоки рядом с этим элементом. В примере это несколько текстов: “QF1”, “NS800N” и “630A”. Каждый из них распознаётся как самостоятельный объект со своими координатами.
Этап 1. Детектирование графического элемента
На первом этапе модель компьютерного зрения ищет на схеме графические элементы: автоматические выключатели, контакторы, рубильники, предохранители, трансформаторы, клеммы и другие типовые обозначения. Для каждого найденного объекта формируется рамка, которая ограничивает его геометрию на листе.
Это важно, потому что дальше именно от положения и размеров этого объекта строится логика поиска связанного текста. Система получает не просто факт наличия элемента, а его координаты, высоту, ширину, пропорции и ориентацию на чертеже.
Этап 2. Детектирование текстовых подписей
Отдельным этапом система находит текстовые области на схеме. Это могут быть позиционные обозначения, маркировки серий, номиналы тока, напряжения, типовые обозначения цепей и другие подписи. После детектирования включается OCR, который превращает изображение текста в машиночитаемые строки.
На этом этапе текст ещё не привязан к конкретному элементу. Мы просто знаем, что в определённой точке изображения есть блок текста, например “QF1”, в другой точке — “NS800N”, а чуть ниже — “630A”. Следующая задача — понять, какие из этих подписей действительно относятся к найденному аппарату.
Этап 3. Построение зоны видимости вокруг элемента
После детектирования элемента вокруг него формируется расширенная зона поиска — так называемая зона видимости текста. На иллюстрации она показана фиолетовой рамкой. Это не сам элемент, а область вокруг него, в которой с высокой вероятностью находятся его подписи.
Логика здесь простая: на большинстве электрических схем текст, относящийся к аппарату, располагается рядом с ним — сбоку, сверху, снизу или в непосредственной близости от символа. Поэтому системе не нужно анализировать весь лист целиком для каждого элемента. Она локализует поиск в ограниченной зоне, что уменьшает количество ошибок и ускоряет обработку.
Размер и форма такой зоны могут задаваться по правилам. Например, зона может быть шире самого элемента в несколько раз, вытягиваться сильнее влево или вправо в зависимости от типа схемы, либо учитывать тип обнаруженного символа. Для вертикального аппарата зона поиска может строиться иначе, чем для горизонтального. Это особенно важно для сложных однолинейных схем, где рядом расположено много подписей.
Этап 4. Поиск пересечений текста с зоной элемента
Далее система проверяет, какие текстовые блоки попадают в зону видимости элемента. На схеме это показано через пересечение текста с расширенной областью вокруг аппарата. Фиолетовый квадрат на иллюстрации показывает точку пересечения — именно она служит признаком, что найденный текст относится к данному элементу.
В приведённом примере текст “NS800N” и “630A” попадает в зону найденного аппарата, поэтому система относит эти подписи к элементу в жёлтой рамке. А значит, распознанный объект больше не является просто графическим символом. Он превращается в структурированную запись: аппарат с конкретным обозначением, серией и номиналом.
Почему нельзя просто брать ближайший текст
На первый взгляд кажется, что можно использовать простое правило: брать тот текст, который ближе всего к символу. Но на реальных схемах это работает плохо. Текст может быть расположен каскадом, в несколько строк, рядом могут проходить подписи соседних элементов, обозначения шин, фаз, цепей и служебные комментарии. Кроме того, сами схемы могут быть плотными, неидеально выровненными, с разным стилем оформления.
Поэтому более надёжный подход — это не одна точка расстояния, а анализ пространственной принадлежности текста зоне элемента. Мы не просто ищем ближайшую надпись, а определяем, находится ли текст в допустимой области около конкретного объекта. Это даёт более устойчивый результат на разных шаблонах схем.
Что происходит после связывания элемента и текста
После того как текст привязан к элементу, система может переходить к следующему уровню интерпретации. Она анализирует собранный набор признаков и пытается определить, к какому классу ETIM относится данный аппарат.
Например, если найден символ автоматического выключателя, а рядом с ним распознаны текстовые признаки “NS800N” и “630A”, система получает уже не абстрактный объект, а элемент с конкретными характеристиками. Дальше по этим данным можно:
- подобрать вероятный ETIM-класс;
- выделить атрибуты, такие как номинальный ток, серия, количество полюсов;
- сопоставить элемент с каталогом производителей;
- найти аналоги по характеристикам;
- сформировать основу для спецификации или подбора оборудования.
Зачем это нужно в Konergy
Для Konergy это один из ключевых промежуточных этапов между распознаванием изображения и получением инженерно полезного результата. Если система просто видит символы, но не умеет правильно связывать их с текстом, она не сможет качественно извлекать характеристики. А без характеристик невозможно корректно построить ETIM-структуру, подобрать оборудование, сравнить аналоги и сформировать спецификацию.
Иными словами, связка “элемент + подпись” — это мост между компьютерным зрением и инженерной логикой. Именно в этом месте изображение схемы начинает превращаться в структурированные данные, пригодные для дальнейшей автоматизации.
Какие сложности возникают на практике
На реальных проектах задача осложняется сразу несколькими факторами:
- текст может быть разбит на несколько строк;
- часть подписей может находиться не слева, а справа или сверху;
- на листе могут быть наложения линий, штриховки, рамки и помехи;
- OCR может ошибаться в отдельных символах;
- рядом с аппаратом могут находиться подписи соседних элементов;
- в разных стандартах оформления схем логика расположения текста отличается.
Поэтому в промышленной системе такой алгоритм обычно не ограничивается одним правилом. Он дополняется набором эвристик: оценкой расстояния, направлением расположения текста, размером блоков, приоритетом определённых типов подписей, проверкой типовых паттернов вроде позиционного обозначения и номинала.
К чему приводит такой подход
Правильное сопоставление элементов и текста даёт более точное распознавание схемы в целом. Система начинает понимать не только графику, но и смысл того, что изображено на чертеже. Это позволяет перейти от простой визуальной детекции к автоматическому извлечению инженерных сущностей: аппаратов, их параметров, позиций и атрибутов.
Именно на этом строится следующий уровень ценности: автоматический подбор ETIM-кодов, поиск аналогов, проверка комплектности, подготовка спецификации, сравнение брендов и дальнейшее построение цифровой инженерной цепочки.
Вывод
На схеме недостаточно найти только символ аппарата. Чтобы получить практический результат, нужно понять, какие подписи относятся именно к нему. Поэтому Konergy детектирует отдельно графические элементы, отдельно текстовые блоки, строит вокруг каждого элемента зону видимости и анализирует пересечения этой зоны с найденным текстом.
В показанном примере именно так текст “NS800N” и “630A” связывается с конкретным элементом. А дальше на основании этой связки система уже может подбирать ETIM-коды и переходить к более глубокой интерпретации схемы. Это один из фундаментальных механизмов, который превращает картинку электрической схемы в структурированные инженерные данные.
