Меню Рубрики

Система технического зрения для мобильного робота

Юдин Д.А.
Белгородский государственный технологический университет им. В.Г. Шухова (БГТУ им. В. Г. Шухова), инженер, г. Белгород, ул. Костюкова, д. 46, тел.: +7(920)200-73-95, Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Проценко В.В.
Белгородский государственный технологический университет им. В.Г. Шухова (БГТУ им. В. Г. Шухова), студент, г. Белгород, ул. Костюкова, д. 46, тел.: +7(4722)30-99-01, Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Постольский Г.Г.
Белгородский государственный технологический университет им. В.Г. Шухова (БГТУ им. В. Г. Шухова), аспирант, г. Белгород, ул. Костюкова, д. 46, тел.: +7(4722)30-99-01, Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Кижук А.С.
Д.т.н., Белгородский государственный технологический университет им. В.Г. Шухова (БГТУ им. В. Г. Шухова), профессор, г. Белгород, ул. Костюкова, д. 46, тел.: +7(4722)23-05-09, Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Магергут В.З.
Д.т.н., Белгородский государственный технологический университет им. В.Г. Шухова (БГТУ им. В. Г. Шухова), зам. директора института по научной работе, профессор, г. Белгород, ул. Костюкова, д. 46, тел.: +7(960)625-44-78, Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Аннотация
При разработке автономных мобильных роботов важной задачей является их автоматическое ориентирование, позиционирование и навигация относительно известной и особенно, неизвестной сцены наблюдения.
Разработана система технического зрения (СТЗ), которая на основе изображения от видеокамеры с поворотно-наклонным механизмом выделяет искусственные ориентиры и позволяет вычислить отклонение движения робота от заданного курса с учетом найденных ориентиров. В качестве искусственных ориентиров выступают линии, ограничивающие трассу робота, и метки в виде двухмерных штриховых кодов. При наличии модели пространства с искусственными ориентирами СТЗ позволяет установить позицию и ориентацию мобильного робота. СТЗ представляет собой программно-аппаратный комплекс, который включает в себя одну видеокамеруc поворотно-наклонным механизмоми бортовой компьютер, на котором реализовано программное обеспечение (ПО), позволяющее осуществлять поиск искусственных ориентиров в окружающем пространстве и выделять их на изображении. ПО обеспечивает также управление приводом колес робота с целью устранить вычисленное отклонение от курса, полученного на основе информации об искусственных ориентирах.
Для обнаружения искусственных ориентиров в виде двухмерных штриховых кодов применен алгоритм, основанный на анализе яркостных характеристик поперечных сечений изображения. Примененный алгоритм распознавания ориентира-линии основан на операции порогового преобразования изображения, морфологическом расширении и преобразовании Хафа.
Предлагаемая СТЗ испытана на мобильном роботе с дифференциальным приводомна кафедре «Техническая кибернетика» БГТУ им. В.Г. Шухова, в качестве целевых объектов выступали специальные визуальные метки.
Предлагаемая система технического зрения для автоматического ориентирования и позиционирования робота отличается экономичностью и может быть применена в составе систем управления складскими робокарами, роботами сферы обслуживания и обеспечения безопасности, мобильными роботами, работающими в агрессивных и опасных для здоровья человека средах.
Работа выполнена в рамках гранта РФФИ № 12-07-97526-р_центр_а «Информационно-вычислительные интеллектуальные системы управления роботизированных транспортных средств для решения логистических задач промышленных и агропромышленных производств», государственного задания Минобрнауки РФ № 01201256918.

Ключевые слова
Робот, зрение, перемещение, объект, методика, навигация.

Год 2014 Номер выпуска 1 Сквозной номер 2 Страницы 70-75

Мошкин Владимир Иванович
Петров Андрей Александрович
Титов Виталий Семенович
Якушенков Юрий Григорьевич

ТЕХНИЧЕСКОЕ ЗРЕНИЕ РОБОТОВ

ПРЕДИСЛОВИЕ
Решение актуальных задач автоматизации производства с учетом ускорения темпов научно-технического прогресса требует серьезной перестройки существующей структуры отечественного парка промышленных роботов. Наряду о преобладающими сегодня простейшими промышленными роботами, функционирующими по жестким (не меняющимся в процессе работы) программам, в широкую практику должны войти робототехнические системы качественно иного класса, обладающие адаптивными возможностями и элементами искусственного интеллекта. Адаптивные роботы, снабженные различными средствами очувствления — сенсорными системами и способные гибко перестраивать свои действия в соответствии с воспринимаемой информацией о рабочей среде, являются одним из важнейших компонентов гибких производственных систем (ГПС), без них немыслима роботизация непромышленной сферы, проведение многих работ в космосе, под водой и в других экстремальных средах.
При создании адаптивных роботов весьма существенная роль среди возможных средств очувствления отводится системам технического зрения (СТЗ), обеспечивающим восприятие видеоинформации об окружающей среде, автоматическую обработку и анализ изображений рабочих сцен в целях формирования команд управления роботом в процессе его работы. В настоящее время во всем мире расширяется серийный выпуск самых различных СТЗ, активно ведутся разработки новых методов и средств визуального очувствления роботов. В нашей стране этими проблемами занимается целый ряд научных центров и предприятий Москвы, Ленинграда, Киева, Томска, Рыбинска, Ростова-на-Дону и других городов.
Вопросы создания и применения СТЗ роботов интересуют многих специалистов, причастных к проектированию, внедрению и эксплуатации роботизированных технологических комплексов и ГПС. Хотя советскими издательствами за последнее время выпущено несколько оригинальных и переводных книг и сборников, в которых затрагиваются отдельные аспекты теории, построения и использования СТЗ роботов (см. например [9, 30, 34, 39, 40, 41, 43, 47, 49]), существенная часть информации по этой
проблеме остается недоступной широкому кругу читателей, поскольку сосредоточена в узкоспециализированных периодических изданиях (в большинстве своем — на иностранных языках), материалах зарубежных фирм и международных выставок, трудах множества конференций, таких, как Международные конференции по техническому зрению и управлению очувствленными роботами ROVISEC, тематические симпозиумы международных федераций по промышленным роботам, технологии промышленного производства, автоматическому управлению, обработке информации и др. Если учесть, что значительное число разработчиков и пользователей робототехнических систем ранее не были профессионально знакомы с проблемами технического зрения, становится очевидной потребность в систематизированном изложении современных принципов построения, основ проектирования, алгоритмического и программного обеспечения СТЗ роботов различного назначения, методов использования видеоинформации для управления роботами, а также необходимость в рассмотрении примеров эффективного практического применения роботов о техническим зрением, перспектив развития этого научно-технического направления.
Разработчики СТЗ роботов во многом опираются на опыт более традиционных применений технического зрения в устройствах промышленной автоматики и телемеханики, телевидении, дефектоскопии, при обработке фотоснимков, изображений биологических препаратов, текстов и т. п. В ряде случаев удается использовать те или иные из созданных ранее технических средств, методических решений, алгоритмов и программ или же приспособить их к задачам робототехники с небольшой модификацией. Однако часто специфика робототехнических приложений не позволяет непосредственно воспользоваться накопленным арсеналом методов и средств и требует развития оригинальных подходов к созданию СТЗ о учетом новых функциональных задач, конкретных возможностей реализации и условий работы в составе робототехнических систем.
В связи о этим при написании данной книги представлялось целесообразным рассмотреть проблему в обоих аспектах. С одной стороны, считая датчики внешней видеоинформации робота (видеосенсоры) частным случаем более широкого класса оптико-электронных приборов (ОЭП), авторы стремились сохранить преемственность общих методов, принятых при проектировании ОЭП, показать возможность распространения на случай СТЗ роботов целого ряда хорошо зарекомендовавших себя принципов расчета, выбора структурных и функциональных схем, элементной базы. Это позволило опустить подробное описание многих традиционных процедур, адресовав читателя к известной литературе по ОЭП.
С другой стороны, особое внимание уделено недостаточно освещенным в этой литературе вопросам, которые характерны именно для СТЗ роботов: обеспечению универсальности и повышенной
степени гибкости, высокого быстродействия, устойчивости к воздействиям окружающей среды, необходимости миниатюризации и ориентации на широкодоступную элементную базу, совместимости с существующими устройствами управления роботов и т. п. В то же время в книге сделана попытка обобщить методы выбора и расчета основных типовых блоков, необходимых для визуального очувствления робота вне зависимости от его конкретного назначения. На основе единого системного подхода рассмотрены требования к организации рабочей сцены робота с СТЗ, видеосенсорам, включающим оптическую систему, преобразователь оптической информации о наблюдаемой сцене в соответствующий электрический сигнал (видеосигнал), электронный тракт предварительной обработки этого сигнала, блокам ввода изображений в вычислительное устройство, их обработки, сегментации, описания и анализа, а также связи СТЗ о системой управления робота. При изложении путей реализации этих требований упор делается на необходимость рационального сочетания аппаратных и программных средств.
Научно-технический уровень разработок СТЗ роботов в мире повышается очень высокими темпами, их элементная база постоянно обновляется — этим объясняется сравнительно малый объем, отводимый в книге описанию используемых сегодня элементов и специальных технических решений в конкретных применениях. Авторам хотелось избежать описательности и перечисления характеристик и особенное: л многочисленных СТЗ, созданных в нашей стране и за рубежом, что свойственно некоторым книгам, вышедшим в последнее время.
Главная цель настоящей книги — дать одно из первых пособий разработчикам СТЗ роботов ближайшего будущего и помочь специалистам, которым предстоит применять их для решения разнообразных практических задач.

Книгу написали: В. И. Мошкин (пп. 3.1, 3.4, 4.3, 4.4, 5.1 — 5.3, 5.5, 6.4 — 6.8), А. А. Петров (предисловие, гл. 1, 2, 7), В. С. Титов (пп. 3.2, 4.1, 4.2, 5.4, 5.7, 5.8), Ю. Г. Якушенков (пп. 3.1, 3.3, 3.4, 5.6, 6.1 — 6.3).

ГЛАВА 1 СТРУКТУРА И ОСОБЕННОСТИ СИСТЕМ ТЕХНИЧЕСКОГО ЗРЕНИЯ РОБОТОВ
1.1. ОСНОВНЫЕ ФУНКЦИОНАЛЬНЫЕ ЗАДАЧИ СИСТЕМ ТЕХНИЧЕСКОГО ЗРЕНИЯ В РОБОТОТЕХНИКЕ
Роботы, снабженные СТЗ, достаточно широко и успешно применяются во многих отраслях промышленности на таких операциях, как контроль и отбраковка различных деталей и изделий по внешнему виду, загрузка обрабатывающих станков деталями с конвейеров или из бункеров, сортировка и ориентированная укладка в кассеты деталей и заготовок, в том числе неупорядоченно движущихся по конвейеру или поступающих в таре навалом, сборка и комплектация узлов, сварка, окраска, упаковка изделий, монтаж электронных схем и других СТЗ используют также для обеспечения условий техники безопасности на роботизированных рабочих местах, организации учета и складирования предметов производства, маршрутизации материалопотоков в гибких производственных системах, управления транспортными мобильными роботами.
Роль адаптивных роботов с техническим зрением и элементами искусственного интеллекта еще более возрастает при расширении процесса роботизации в таких областях, как горнодобывающая промышленность, строительство, сельское и лесное хозяйство, коммунальные службы, быт, где рабочая среда носит сложный, плохо структурированный характер. СТЗ необходимы роботам, предназначенным для исследования космического и подводного пространства, используемым для тушения пожаров и при других стихийных бедствиях. В подобных приложениях СТЗ должна обеспечивать не только данные для непосредственной выработки сигналов обратной связи при управлении движениями робота и передачу сведений об окружающей среде человеку-оператору, но и информацию для формирования роботом модели рабочей среды в целях автоматического планирования действий.
Функциональное назначение СТЗ робота в зависимости от области и конкретных условий его применения довольно многообразно. Наиболее типичными функциями, выполняемыми СТЗ в робототехнике, являются следующие: регистрация наличия объекта в поле зрения датчика внешней (по отношению к роботу) видеоинформации — видеосенсора; подсчет числа объектов, находящихся в поле зрения или прошедших перед видеосенсором;
считывание и расшифровка меток (цветовых или штриховых кодов, буквенно-цифровых символов, этикеток и других маркеров); обнаружение препятствий, мешающих движениям робота; измерения геометрических и физических параметров объектов; контроль изделий на наличие видимых дефектов, полноту комплектации, соответствие эталонам; классификация (распознавание) объектов; определение местоположения и ориентации объектов в рабочей зоне робота; поиск нужных объектов на рабочей сцене; измерение скорости движущихся объектов; слежение за перемещениями и изменениями скорости объектов; визуальное определение изменений во времени наблюдаемых физических и технологических процессов; обеспечение информации для задания и коррекции траекторий рабочего органа робота в адаптивном режиме; навигация и наведение мобильных роботов; визуальный контроль правильности выполнения операций роботом; калибровка геометрических параметров манипулятора, привязка его системы координат к системе координат рабочего пространства; обеспечение требований техники безопасности.
Функциональные задачи СТЗ, характерные для робототехнических приложений, можно условно разделить по уровню их относительной сложности. К элементарным задачам обычно относят: обнаружение наличия объекта; измерение расстояния до объекта, его линейных или угловых перемещений, скорости; измерение геометрических параметров объекта (линейных и угловых размеров, площади и т. п.); определение физических характеристик излучения от объекта (интенсивности, спектрального состава и пр.); подсчет числа объектов и др.
Более сложный круг задач выполняет, например, СТЗ, которая снабжает систему управления манипуляционного робота информацией, необходимой для захватывания неупорядоченных объектов. В число этих задач входят: обзор рабочей сцены (плоской или пространственной) для поиска представляющего интерес объекта — одиночного или одного из нескольких, лежащего изолированно от других или соприкасающегося (перекрывающегося) с ними; определение местоположения и ориентации этого объекта; его классификация (если имеется несколько различных классов объектов). При этом объекты могут различаться не только размерами и формой (силуэтом), но и текстурой, цветом и т. п., покоиться или находиться в движении. Этот пример иллюстрирует тот факт, что относительная сложность функциональных задач СТЗ характеризуется целым рядом признаков, среди которых можно выделить следующие.
Размерность рассматриваемой сцены. Пространственные задачи, требующие анализа трехмерных сцен, как правило, намного сложнее «плоских» задач, в которых достаточно обработки изображения одной двумерной проекции сцены на картинную плоскость. Промежуточное положение занимают квазиплоские задачи («размерности 2,5»), где рассматривается картинная плоскость с добавлением информации о «глубине» (дальности) видимых точек изображения.
Степень изолированности объектов. По этому признаку задачи СТЗ классифицируются так (в порядке возрастания сложности): задачи с одиночным объектом; задачи с несколькими изолированными (т. е. несоприкасающимися) объектами на изображении; задачи с соприкасающимися (но не перекрывающимися) изображениями объектов; задачи о перекрытием одних объектов рабочей сцены другими.
Однородность объектов. Этот признак характеризует сложность задач классификации, стоящих перед СТЗ. Если все объекты, которые могут быть предъявлены СТЗ, идентичны, эта проблема вообще не возникает. При наличии ряда неодинаковых объектов задача их классификации тем сложнее, чем более «похожи» друг на друга их изображения, т. е. чем больше классифицирующих признаков необходимо для однозначного описания отличий каждого объекта от всех остальных.
Стационарность рабочей сцены. Изображения покоящихся объектов обрабатывать и анализировать проще, чем изображения объектов, которые перемещаются относительно видеосенсоров (например, при движении деталей по конвейеру, зрительном очувствлении мобильного робота, работе СТЗ типа «глаз на руке»).
Число элементов изображения. Чем больше размеры поля зрения и чем выше требуемая разрешающая способность СТЗ, тем сложнее задача, поскольку приходится обрабатывать больше элементов получаемого изображения Число градаций яркости. Задачи, в которых достаточно анализировать силуэтные очертания объектов, т. е. работать с двухградационными (бинарными) изображениями, как правило, решаются проще задач, требующих анализа многоградационных Спектральный состав видеосигнала. Наделить робот способностью воспринимать цветные изображения, вообще говоря, сложнее, чем снабдить его монохроматическим зрением.
Кроме того, на сложность тех или иных задач СТЗ существенное влияние оказывают такие факторы, как качество освещения рабочей сцены, его стабильность, уровень оптических и электрических помех, контрастность объектов относительно фона, отражающие свойства их поверхности, и др.
Чем более сложные задачи с учетом всей совокупности описанных критериев способна решать СТЗ, тем выше уровень функциональной гибкости («интеллекта») робота может быть обеспечен с ее помощью.
Для выполнения своего функционального назначения СТЗ робота в общем случае должна обеспечивать: восприятие оптического сигнала и формирование изображения- предварительную обработку изображения в целях ослабления влияния шумов, улучшения контрастности, коррекции искажений, сжатия инфор-
мации ит. д.; сегментацию изображения сцены на составные части — выделение нужных объектов, их фрагментов или характерных особенностей; описание изображений — расчет их геометрических и иных характеристик, вычисление классифицирующих признаков, определение местоположения и ориентации; анализ изображения с распознаванием образов или классификацией объектов и интерпретацией сцен на основе модели проблемной среды; передачу полученных результатов в систему управления робота.
Создание СТЗ робота, отвечающей ее конкретному функциональному назначению, включает следующие этапы: 1) постановку задачи на содержательном уровне и составление технического задания на СТЗ; 2) выбор структурной и функциональной схем СТЗ; 3) математическую формулировку задач функциональных блоков СТЗ; 4) разработку алгоритмов решения функциональных задач; 5) выбор средств реализации алгоритмов и конкретизации технических характеристик аппаратных, аппаратно-программных и программных блоков СТЗ в соответствии с техническим заданием; 6) разработку аппаратного и программного обеспечения СТЗ.
Прежде чем перейти к рассмотрению этих вопросов, остановимся на особенностях работы роботов о техническим зрением.

Читайте также:  Методика определения остроты зрения по таблицам

Техническое зрение в управлении мобильными роботами

Автоматическое управление движением мобильного робота SRX основывается на использование систем компьютерного зрения. Особенности применения робота требуют высокоточного проезда по местности, которая не всегда может быть открыта для приема сигналов спутниковых навигационных систем. Поэтому, использование дифференциальных СНС, широко распространённых в системах параллельного вождения точного земледелия — невозможно. Лидары, применяемые в автомобилях без водителя, достаточно дороги. Многолучевые лазерные сканеры требуют большой электрической мощности, для своего питания и для питания высокопроизводительных вычислителей обрабатывающих потоки данных от них.

В тоже время, системы компьютерного зрения широко используются в промышленной робототехники. Инженерным сообществом наработан большой опыт создания надежных систем технического зрения для работы в условиях искусственного освещения. Используя существующие достижения, компания «СМП Роботикс» разработала ряд решений пригодных для использования на улице, в условиях нестабильного естественного освещения.

Применение систем компьютерного зрения позволило получить приемлемую стоимость системы управления движением, несмотря на использование шести встроенных компьютеров. По мере увеличения вычислительной мощности микропроцессоров количество встроенных вычислителей будет уменьшаться, стоимость системы управления заметно снизится, а максимальная скорость движения мобильного робота значительно возрастет.

Обнаружение и объезд препятствий

Для решения задач обнаружения и объезда препятствий используется пара камер образующих стереосистему. Сопоставляя идентичные элементы изображений от каждой из камер, алгоритм системы технического зрения синтезирует трехмерное изображение пространства перед камерами. Это позволяет построить карту глубины и рассчитать дальность до препятствий, попавших в поле зрение камер. Дальность, на которой от стереопары можно получить достоверные данные определяется стереобазой и, применительно к роботу SRX1, составляет 4 — 5 метров. Увеличивая стереобазу и разрешение видеокамер системы технического зрения, можно значительно повысить точность и глубину синтезируемой карты диспаратности.

По мере своего продвижения робот выстраивает трехмерную карту окружающего пространства. По ней, собственно, прокладывается путь и планируется движение робота вычислителем автопилота.

Корректировка пути проезда

Основное назначение робота SRX 1 — перемещение по подготовленным территориям, асфальтовым или иным дорожкам с твердым покрытием. Вследствие этого стоит задача – необходимо избегать съезда робота с твердого покрытия дорожки, например на газон, через который проложена дорожка. В ряде случаев, ширина дорожки лишь на 10-20 сантиметров превышает ширину колеи робота, поэтому требования, предъявляемые к точности системы управления движением, достаточно высоки.

Задача высокоточного перемещения по узкой дорожке с покрытием, решается системой технического зрения, источник данных для которой видеокамера, направленная вперед и вниз. Изображение с этой камеры отображает дорогу, находящуюся по курсу движения робота, ее границы и поверхность за пределами асфальта. Используя оригинальный алгоритм сравнения текстур подстилающих поверхностей, вычислитель дорожной камеры корректирует движение робота в тех случаях, когда имеется визуальное отличие в цвете или текстуре предпочтительного пути проезда от остальной поверхности.

Автономная навигация робота по изображению

Для осуществления успешных автоматических проездов требуется решить задачу навигации, определения текущего местоположения робота. Несмотря на наличие в роботе приемника спутниковой навигационной системы, точность определения координат, им обеспечиваемая, не позволяет осуществлять проезд по маршруту с приемлемой точностью. Кроме того, надежность поступления данных от СНС сильно зависит от условия приема, местоположения приемной антенны по отношению к строениям и деревьям.

В описываемом проекте навигация реализуется системой технического зрения по изображению с вперед смотрящей видеокамеры. Алгоритм обработки запоминает изображение при тестовом проезде, выполняемом в режиме ручного управления, а в дальнейшем, при автоматическом движении, сопоставляет сохранённые изображения и увиденные в момент перемещения, находя расхождения — корректирует путь движения, с целью максимального приближения текущей траектории движения к ране пройденной. Реализация этого решения позволяет получать точность определения текущего местоположения с ошибкой отклонением от истинного, менее одного метра.
Подробнее об автономной навигации мобильных роботов на основе компьютерного зрения …

Инерциальная навигация и БИНС в системе управления роботом

В те моменты движения робота, когда ориентиров на изображении навигационной системы, по каким либо причинам не достаточно, робот продолжает движение, обрабатывая данные полученные от встроенного БИНС (Блока Инерциальной Навигационной Системы). В нем используются относительно дешевые микромеханические (MEMS), гироскопы и инклинометры. Дрейф микромеханических приборов используемых в этом узле фильтруется, и это позволяет достаточно точно восстановить траекторию движения робота на участке пути в несколько десятков метров, до момента поступления достоверных данных от визуальной навигационной системы технического зрения.

Реализация алгоритмов машинного зрения

Алгоритмы обработки видеоданных, систем технического зрения и управления движением, реализованы в программном обеспечении бортовых вычислителей. В роботе модели SRX 1 используется шесть вычислителей на базе процессоров архитектуры Cortex A9. Бортовые вычислители связаны между собой высокоскоростной локальной сетью. Все они работают под управлением операционной системы Linux. Управление взаимодействием встроенных компьютеров и формирование команд контроллерам приводов, осуществляется мультикомпьютерным программным движком RedCore.
Подробнее о программном обеспечение системы управления движением мобильных роботов ….

Программное обеспечение системы управления движением мобильного робота

Программный движок RedCore разработан для управления движением мобильных роботов серии SRX. Встроенное ПО обрабатывает данные от систем компьютерного зрения, блока инерциальных датчиков, СНС, механического одометра и формирует управляющие команды для контроллеров механических приводов робота.

Интерфейс оператора реализован в виде программного приложения для планшетного компьютера под управлением ОС Андроид. Приложение обеспечивает отображение текущего местоположение робота, видео с его камер, состояние систем управления и заряда батарей, позволяет задавать маршрут движения.

Для решения нетиповых задач, связанных с эксплуатацией робота в особых условиях, разработано и поддерживается API, позволяющее программировать сложные маршруты движения и создавать новые программные модули для их безошибочного прохождения. Подробнее.

Мультиагентное программное обеспечение с элементами искусственного интеллекта

Главный экран программы «Robot Vision»

Для целей постановки задачи мобильному роботу и контроля хода её выполнения, разработан программный пакет «Robot Vision». ПО представляет собой приложение для планшетного компьютера под управлением ОС Андроид. Наряду с простыми и необходимыми задачами, связанными с выбором маршрута перемещения, отображением текущего положения мобильного робота и состоянием его систем, программное обеспечение позволяет решать задачи группового управления роботами на обширных территориях с целью оптимального решения задач, с неполной исходной информацией, используя эвристические алгоритмы. Фактически, — превращая группу мобильных роботов в сверхорганизм с элементами искусственного интеллекта.

Под каждую практическую инсталляцию, связанную с групповой эксплуатацией роботов, разрабатывается индивидуальный программный пакет, который обеспечивает постановку и распределение задач во многоагентной системе роботов. В зависимости от общей задачи, решаемой роботизированной системой, выбирается наиболее удачная стратегия и в течении всего времени эксплуатации она совершенствуется, как в автоматическом, так и ручном режиме. При этом эффективность применения группировки роботов с течением времени значительно повышается, вследствие накопления наиболее полных и как следствие, легко формализуемых знаниях об условиях успешного решения поставленных задач. Подробнее.

Читайте также:  Явление внутреннего трения в идеальном газе с точки зрения мкт

Беспроводная зарядка аккумуляторов колёсного робота

Беспроводная зарядка аккумуляторов колесного робота

В качестве источника энергии движения наземных беспилотных транспортных средств, поставляемых компанией, используются аккумуляторы различных систем. Для некоторых энергозатратных применений используется встроенный бензиновый генератор, однако,в подавляющем большинстве случаев зарядка аккумуляторных батарей электромобиля осуществляется от стационарного зарядного устройства. В этих условиях для достижения максимальной автономности устройства наиболее целесообразно использовать беспроводные способы передачи энергии на борт робота.

Разработана система беспроводной зарядки с использованием квазирезонансной передачи электрической энергии c выходной мощностью 0.7 кВт. Две антенны располагаются с зазором в несколько сантиметров друг над другом. Первая — на поверхности дороги или сервисной зоны, вторая — под днищем робота. Система автоматического управления движением робота обеспечивает наезд и совмещение антенн друг над другом, а для увеличения КПД передачи энергии используется механическое сближение антенн.

Система беспроводной зарядки аккумуляторных батарей электромобиля, которым являются все разрабатываемые компанией колесные шасси, спроектирована с учётом требований по электромагнитной совместимости и уровень её излучения не превышает норм ГОСТ Р 51317.6.4-99 на допустимую эмиссию помех.

Электронные силовые преобразователи, установленные на борту робота, обеспечивают выходное напряжение 12/24В для зарядки аккумуляторных батарей и их подогрева. Питание электронных преобразователей стационарной антенны осуществляется от сети 220В.

Особенность применения данного инженерного решения заключается в том, что позволяет подзаряжать аккумуляторные батареи в нескольких местах по пути движения, и тем самым увеличить пробег и избежать их полного истощения. Причём, во всех точках подзарядки оператор не требуется, всё производится автоматически.

Система технического зрения в задачах навигации мобильных объектов Текст научной статьи по специальности « Автоматика. Вычислительная техника»

Похожие темы научных работ по автоматике и вычислительной технике , автор научной работы — Миронов С.В., Юдин А.В.,

Текст научной работы на тему «Система технического зрения в задачах навигации мобильных объектов»

ниже Windows XP. Необходимо наличие компилятора gcc, библиотек GDSIILib и GraphViz.

Запуск программы может выполняться из командной строки Unix-shell или из командной строки эмулятора терминала Windows.

Для апробации разработанного ПО была выполнена трансформация топологии 8-битного дешифратора. На рисунке 3а приведена исходная топология 8-битного дешифратора (слой поликремния). Однако выход годных интегральных схем был очень низок из-за негативного влияния эффекта взаимной дифракции.

С использованием разработанной программы TPLConverter исходная топология модифицирована таким образом, чтобы ее можно было воспроизвести по технологии двойного фотошаблона. На рисунке 3б приведены результаты работы программы TPLConverter для слоя поликремния топологии 8-битного дешифратора.

В заключение отметим, что разработанное ПО TPLConverter может найти широкое применение при проектировании топологии субмикронных СБИС для технологии двойного фотошаблона. Получаемое на выходе описание топологии СБИС в формате GDSII пригодно для последующего воспроизводства СБИС по технологии двойного фотошаблона. Применение предложенных подходов позволяет автоматизировать решение задачи по преодолению фундаментального противоречия, связанного с эффектом оптической близости при производстве субмикронных СБИС.

Разработанное ПО не требует значительных вычислительных ресурсов и может использоваться в работе дизайн-центров и в учебном процессе.

Рис. 3. Пример работы программы TPLConverter (слой поликремния)

Программа TPLConverter найдет применение как в виде отдельного полнофункционального приложения, так и в составе интегрированных маршрутов проектирования СБИС.

Дальнейшее развитие системы идет по пути совершенствования используемых структур обработки топологической информации и направлено на расширение функциональных возможностей разработанного ПО.

1. URL: http://www.itrs.net (дата обращения: 10.11.2010).

2. Зинченко Л.А., Резникова Е.В., Аверьянихин А.Е. Алгоритмы трансформации топологии субмикронных СБИС // Вест. МГТУ им. Н.Э. Баумана. № 1. 2011.

3. Shervani N. Algorithms for VLSI physical design automation // Kluwer Academic Publishes, 1995. 538 p.

4. URL: http://www.mentor.com/ (дата обращения: 10.11.2010).

5. URL: http://www-01.ibm.com/sofftware/awdtools/rup/ (дата обращения: 10.11.2010).

СИСТЕМА ТЕХНИЧЕСКОГО ЗРЕНИЯ В ЗАДАЧАХ НАВИГАЦИИ МОБИЛЬНЫХ ОБЪЕКТОВ

С.В. Миронов; А.В. Юдин (МГТУ им. Н.Э. Баумана, skycluster@gmail.com)

Работа посвящена разработке системы технического зрения для нужд навигации мобильного робота. Приведены алгоритмы калибровки видеокамеры, фильтрации шумов и распознавания двухмерных объектов на плоскости. Рассмотрены методы оптимизации системы. Приведена общая архитектура ПО для реализации системы, а также описаны объект автоматизации и типичная задача для технического зрения.

Ключевые слова: техническое зрение, робот, навигация, автоматизация, программное обеспечение.

Обработка визуальных данных с целью дальнейшего принятия решений в области управления любым автономным робототехническим комплексом носит для системы технического зрения фундаментальный характер.

В условиях динамически меняющегося окружения предполагается, что современные автономные системы способны выполнять ряд трудоемких работ, сопряженных с риском для жизни человека,

таких как разминирование, ремонт трубопроводов, мониторинг в агрессивных средах, автоматизация технологических процессов на производстве. Становится актуальным использование робототехни-ческих систем для решения задач обеспечения безопасности и охраны, а также комплексного ухода за больными, людьми в возрасте, когда необходимо постоянное присутствие другого человека.

Робототехнические системы во многих случаях позволяют улучшить экономические показатели промышленного производства за счет качества и скорости автоматизированных операций, непрерывного мониторинга, существенно повышающего надежность и эффективность системы управления. В свою очередь, качество робототехнической системы зависит от точности перемещения исполнительных механизмов и степени адаптации к различным средам — задачам, которые составляют основу навигации.

Применение технического зрения в навигации подвижных звеньев механизмов позволяет разработать единый универсальный технический модуль для разных сред и пространств за счет подобия человеческому глазу. Около 70 % информации человек получает через зрительную систему, что говорит о ее значимости для взаимодействия с внешним миром. Прочие системы, такие как слух, осязание или обоняние, в дополнение к очевидной специализации органа, по сравнению со зрением являются короткодействующими.

В отличие от других методов изучения окружающего пространства зрение как комплекс мер по ориентации в нем и по различению объектов наиболее универсально и непосредственно влияет на интеллект. Таким образом, наличие органа зрения у машины, которая претендует на автономное поведение, обязательно.

Архитектура системы управления с использованием технического зрения

Рассмотрим техническое зрение на примере базовой архитектуры робототехнической системы, основанной на модульном принципе (рис. 1). Информация датчиков Д1 и Д2 систематизируется в центральном компьютере К1 (модуль построения карты), после чего анализируется модулем принятия решений, который вырабатывает команды для исполнительной подсистемы.

Примечание: Д1, Д2 — датчики, К1 — компьютер, МК1 -микроконтроллер.

Рис. 1. Общие принципы взаимодействия подсистем

Внешние датчики и исполнители, используемые в робототехническом комплексе (РК), не могут быть подсоединены к компьютеру напрямую

через стандартные низкоуровневые интерфейсы, такие как PCI или ISA. Для решения этой проблемы используются платы расширения, представляющие собой один или несколько вспомогательных контроллеров. Вспомогательные контроллеры в отличие от главного компьютера работают на более низких тактовых частотах, а связь с ним осуществляется по интерфейсу общего назначения (например, CAN, USB, I2C).

В данном случае система технического зрения РК — совокупность программных модулей, принимающих, передающих и обрабатывающих информацию, полученную с помощью видеокамер (рис. 2).

Рис. 2. Основные компоненты системы технического зрения

Физические устройства и кабели, которые участвуют в работе системы, естественным образом дополняют ее до единого комплекса, но не рассматриваются по причине сильной зависимости их конфигураций от конкретного проекта.

Подсистема анализа визуальных данных. Подсистема включает программные модули, осуществляющие предварительную обработку видеопотока. Все модули, входящие в нее, не обладают какими-либо интеллектуальными функциями, а выполняют лишь строго возложенные на них задачи преобразования входных данных к более сжатому виду для упрощения работы следующей подсистемы.

Модуль «Драйвер видеокамеры» позволяет выделять очередной кадр из поступающего видеопотока. Модуль представляет собой интерфейс к компоненту операционной системы. Например, для Linux таким компонентом может быть код, использующий библиотеки v4llv4l2; для Windows могут использоваться средства DirectX (DirectDraw).

Модуль «Распознаватель» выделяет и классифицирует изображения. Получая их в виде на-

бора точек, он структурирует и фильтрует изображения. Выходной информацией модуля являются данные о видимой форме и размерах изображенных объектов, их типе и ориентации в пространстве. Таким образом, работа модуля сводится к автоматическому преобразованию растровых данных в векторные. Если видеопоток поступает от нескольких связанных между собой видеокамер (например, в системах стереоскопического зрения обычно используются две связанные камеры), данный модуль определяет положение объекта в пространстве, выполняя функции «Преобразователя координат».

Модуль «Преобразователь координат» определяет координаты распознанных объектов относительно выбранной точки, жестко связанной с системой видеокамер. Обычно алгоритм учитывает геометрические параметры системы видеокамер, а также данные, полученные в ходе ее калибровки (фокусное расстояние, величину искажения).

Подсистема принятия решений. Данная подсистема анализирует специальным образом подготовленную информацию, поступающую от предыдущей подсистемы. В результате анализа данных решаются следующие задачи:

• построение и поддержание непротиворечивого представления об окружающем мире;

• разработка стратегии решения поставленных задач;

• управляющее воздействие на исполнительные механизмы.

Следует выделить две наиболее общие части этой подсистемы — модули «Построитель карты» и «Искусственный интеллект».

В задачу «Построителя карты» входит определение положения объектов в мировой системе координат с учетом положения РК в этой системе и положения различных объектов относительно РК. Главная сложность заключается в том, что вся информация содержит погрешности, которыми нельзя пренебрегать. Алгоритм построения карты должен вести постоянное накопление данных и анализ их согласованности. При обнаружении противоречия необходимо определить менее достоверные данные и исключить их из рассмотрения. На этом этапе большую роль играют вспомогательные датчики, которыми оснащен РК. Если координаты РК в мировой системе координат можно определить достаточно точно, алгоритм работы модуля может быть значительно упрощен.

Модуль «Искусственный интеллект» отвечает за планирование действий РК. Результаты планирования выражаются в виде команд различным исполнительным механизмам.

Взаимодействие системы технического зрения с исполнительными центрами. Поскольку решаемая задача навигации ставит жесткие ограничения на время обработки сигналов всех датчи-

ков, необходимо обеспечить предобработку их данных без передачи информации главному компьютеру. Для решения этой задачи применяется метод делегирования полномочий системы принятия решений, который заключается в том, что подсистемы принятия решений присутствуют в виде связанных между собой агентов как на компьютере, так и на контроллере (рис. 3). Этот подход позволяет оперативно реагировать на нештатные ситуации, фиксируемые датчиками контроллера (Д2). При этом в системе по-прежнему возможно наличие контроллеров, не имеющих собственного агента принятия решений (например МК1). Для решения проблемы синхронизации агентов им назначаются роли (клиент/сервер). Клиентская часть системы берет на себя функции реагирования на нештатные ситуации, в то время как серверная часть — долговременное планирование и анализ данных датчиков на непротиворечивость.

Примечание: Д1, Д2, Д3 — датчики, К1 — компьютер, МК1, МК2 — микроконтроллеры.

Рис. 3. Подход к построению взаимодействия исполнительной подсистемы и подсистемы принятия решений с делегированием полномочий

Используются следующие типы протоколов передачи данных.

1. Протокол программного взаимодействия с модулем построения карты, который стандартизирует интерфейсы системных вызовов, выполняемых из подпрограмм драйверов датчиков в подпрограмму построения карты. Язык описания интерфейсов — C (Метка 1).

2. Протокол взаимодействия вынесенных датчиков с агентом принятия решений (Метка 2).

3. Протокол синхронизации агентов принятия решения (Метка 3).

Таким образом, система представлена набором модулей верхнего и нижнего уровней. Модули нижнего уровня связаны шиной нижнего уровня. Центр нижнего уровня отвечает за координацию

Читайте также:  Зрение правый глаз хуже видит чем левый

работы устройств нижнего уровня, раздачу команд управления, сбор данных и их первичную обработку. Также на нижнем уровне системы обязательна реализация рефлекторных реакций, то есть таких ответных действий системы, которые требуют незамедлительного исполнения.

Центры нижнего и верхнего уровней соединяются при помощи шины верхнего уровня. Центр верхнего уровня оперирует глобальными задачами робототехнической системы на основании данных, полученных с нижнего уровня. Это могут быть траекторное планирование движения манипулятора или мобильного робота, взаимодействие и обмен информацией с человеком, глобальное позиционирование, распознавание образов. Используя сетевую терминологию, можно сказать, что шина нижнего уровня является подсетью шины верхнего уровня. Система самодиагностики обеспечивает командный центр (операторов) информацией о состоянии всех элементов системы и выполняет аварийную остановку работы при наличии внутренних неполадок.

Проводя аналогию с человеком, центр верхнего уровня можно сравнить с головным мозгом, а нижнего уровня — со спинным, шины — с нервной сетью, а систему модулей нижнего уровня — с разветвленной сетью очувствления и моторики.

Применение систем технического зрения

Объект для автоматизации представлен мобильным роботом на базе PC-совместимой системной платы, работающим под управлением модульного ПО в операционной среде Linux. Шасси выполнено из комбинации металла и пластика. Робот двигается за счет пары независимых ведущих колес с дифференциальным законом управления двигателями и обратной связью через датчи-ки-энкодеры.

Робот в автономном режиме решает задачи распознавания объектов на цветном изображении, высокоуровневой обработки датчиков, построения карты объектов с высокой точностью определения координат, интеллектуального принятия решений, прецизионного наведения на объекты полигона [1].

Известно, что существующие робототехниче-ские соревнования отвечают современным требованиям промышленности в части задач, решаемых в ходе соревнований. В данном случае ставится задача мобильного робота — отсортировать случайно расположенные на полигоне шары белого и черного цветов по лункам с красным или синим маркером.

Реализация системы технического зрения

Для решения рассмотренной задачи мобильного робота необходимо разработать систему тех-

нического зрения, для чего необходимы следующие действия:

• исследование изменения параметров освещения окружающей среды;

• исследование параметров регистрирующего устройства (видеокамеры), установленного на мобильной платформе;

• разработка алгоритмов автоматической калибровки параметров регистрирующего устройства (видеокамеры) по установленным ранее параметрам;

• тестирование алгоритмов калибровки на различных аппаратных устройствах (видеокамерах) в предполагаемых условиях окружающей среды;

• разработка модульной архитектуры программной части комплекса, а именно системы управления движением мобильного робота, системы технического зрения;

• реализация программных модулей, необходимых для задач технического зрения.

Визуальное зрение робота в условиях неизвестной или меняющейся окружающей среды служит удобным инструментом для навигации. Рассмотрим несколько вариантов реализации системы технического зрения.

Простая реализация. Основные задачи системы технического зрения — быстрая обработка видеопотока, полученного с видеокамеры, фильтрация шумов, обнаружение объектов и восстановление их пространственных координат. Система должна различать лунки, шары, а также объекты, цвет которых отличается от цвета фона (зеленого).

Низкое качество видеокамеры может повлечь некорректную передачу цветов, а несовпадение центра матрицы и оптической оси объектива вызвать оптические аберрации, которые необходимо устранить. Поскольку заявленные условия являются наиболее значимыми в отношении применяемых алгоритмов, исследуем именно их. Кроме того, плохое качество видеокамеры во многом компенсируется ее низкой стоимостью, что в некоторых проектах может играть решающую роль.

Одним из возможных кадров подобной системы может быть кадр с синей лункой и наложив-шимся на синий цвет бликом от одной из ламп освещения. В этом случае можно выделить на кадре 2 области. Область 1 содержит пиксели, которые нужно классифицировать как синие, и при этом область подвержена блику. Область 2 содержит зеленые пиксели, которые также находятся вблизи блика, на стыке с синими пикселями.

Вычислим среднее значение цвета по областям и стандартное отклонение (результаты приведены в таблице):

где 1 — индекс, пробегающий по каждой точке рассматриваемой области (построчная развертка); х1 -цвет 1-й точки в координатах красной, синей и зеленой составляющих; М — вектор среднего значения; 8 — вектор отклонения от среднего; п — количество точек в рассматриваемой области.

Статистика по областям разного цвета

1 (синяя лунка) ‘188,3325 195,814 к226,7814 \ ‘3,73064 3,0322 .5,6226у

2 (полигон) ‘195,6036^ 193,4523 ^193,0845, ‘4,7929^ 4,5150 , 4,8271^

Примечание: координаты векторов: красная, синяя и зеленая составляющие цвета. Все значения лежат в диапазоне от (0,0,0) — черный до (255,255,255) — белый.

Видно, что и синий, и зеленый цвета по значениям близки к полутоновому серому цвету (200,200,200). Области синего и зеленого цветов на данной видеокамере пересекаются, следовательно, надежное выделение монохромных областей без предварительной обработки невозможно.

Распределение цветов выражается в шуме в области серо-зеленого цвета. Обычным приемом устранения такого шума является свертка с усредняющим фильтром. Пример масок такого фильтра:

Однако размытие и усреднение цвета исследуемых объектов являются трудоемкими операциями для больших изображений (сложность алгоритма в общем случае для квадратных изображений — ш2хп2, где т — размер стороны изображения; п — размер стороны маски фильтра) и не смогут решить проблему фильтрации неточечных помех (например бликов).

Размещение и калибровка камеры. Камера крепится к роботу на высоте порядка 30 сантиметров над полигоном так, чтобы граница области видимости находилась на расстоянии не больше 1 метра. При таком расположении ближайшие к роботу объекты видны с минимальными искажениями (рис. 4).

Для калибровки камеры применяется табличный метод: для каждого пикселя изображения строится таблица соответствия «экранные коорди-наты-пространственные координаты». Для этого на изображении выделяются достоверные точки, для которых точно известны пространственные координаты. Для остальных точек отображение экранных координат в пространственные вычис-

ляется по координатам ближайших достоверных точек.

Для вычисления используется метод двухмерной интерполяции (рис. 5). Здесь для координат достоверных точек А, В, С известны пространственные координаты А\ В\ С\ Тогда пространственные координаты О’ точки О вычисляются из пропорций АМ/МС=А,М,/М,С и МО/О]= =МО7О]Ч\

Для выделения достоверных точек применяется лист бумаги со специально нанесенным рисунком. Программа калибровки включает в себя следующие действия:

1) выделение экранных координат достоверных точек;

2) для каждой известной точки определение порядкового номера и выделение пространственных координат достоверных точек по известному расстоянию между ними;

3) для каждой точки изображения поиск трех ближайших достоверных точек, расположенных так, чтобы данная точка лежала внутри образованного ими треугольника, и определение пространственных координат методом двухмерной интерполяции.

Определение порядкового номера точки осложняется искажениями, вносимыми камерой. Для решения этой задачи были опробованы два подхода.

Метод выделения вертикальных и горизонтальных линий. Благодаря рисунку калибровочного листа, выделение горизонтальных линий сводится к наложению фильтра, пропускающего только синие составляющие цвета. Аналогично для выделения вертикальных линий применяется фильтр, пропускающий только красные составляющие цвета пикселей. Имея информацию о ли-

ниях, можно легко подсчитать порядковый номер данной точки.

Метод поиска соседей. Алгоритм подсчета номера точки опирается только на экранные координаты центрального столбца точек. Учитывая, что центральный столбец точек минимально искажен, поиск соседей проводится влево и вправо от него. Этот метод оказался более устойчивым, так как меньше зависит от параметров цветопередачи видеокамеры.

Фильтрация шумов и распознавание. Обработка каждого кадра изображения включает следующие этапы:

— классификация цветов пикселей,

— применение шумоподавляющего фильтра,

— локализация объектов и определение их пространственных координат.

Классификация цвета пикселей. Среди множества алгоритмов классификации рассмотрим простейший. Цвет определяется по максимальной цветовой составляющей:

color = green, g > r, g > b,

black, r wp, g > wp, b > wp.

Такой подход позволяет с малыми вычислительными затратами (например, по сравнению с нейросетевыми алгоритмами [2]) получить изображение с шестью возможными состояниями каждого пикселя.

Фильтрация. На этом этапе выделяются монохромные области изображения, что позволяет ускорить работу алгоритма локализации в несколько раз за счет устранения единичных пикселей, содержащих шум.

Изображение разбивается на квадратные участки площадью s: 3×3, 5×5, 7×7 пикселей. Для каждого участка считается количество пикселей i-го цвета si.

Критерием зашумленности области является выражение max(s) — min(s) 0,008856,

‘ K + 0,055Y 1,055 J

Функция f(K) необходима для аппроксимации нелинейного поведения гаммы в пространстве sRGB. В приведенной формуле используется значение 7=2,2, что соответствует среднему значению для реалистичного отображения.

Во втором преобразовании компоненты выбранной белой точки определяются как Xn=0,950456, Yn=1,0, Zn=1,088754. Значения ин-тенсивностей в пространстве CIE L*a*b* рассчитываются по следующим формулам:

a* = 500 •[ g(X/Xn) — g(Y/Yn)],

b* = 200 •[ g(Y/Yn) — g(Z/Zn)].

Функция g(t) выбрана таким образом, чтобы избежать точки бесконечной сингулярности при t=0:

t3 для t > 0,008856,

7,787 • t + — для t £ 0,008856. 116

После подобного преобразования работа с заливкой сцены эталонными цветами может производиться намного точнее и быстрее, так как уровень помех и бликов значительно снижен по сравнению с sRGB-пространством, использованным ранее. Следовательно, такие этапы, как классификация цвета пикселя, фильтрация и локализация

объектов, значительно улучшаются и по качеству выносимых решений, и по скорости выполнения.

В заключение отметим, что описанный набор алгоритмов позволяет успешно справиться с задачей ориентации на игровом полигоне. Погрешность определения пространственных координат составляет менее 5 мм на расстоянии 0,5 м и обусловлена главным образом низким разрешением обрабатываемых кадров (для минимизации времени обработки выбрано разрешение 256×256 точек). Время полной обработки одного кадра составляет менее 10 мс на кадр.

В долгосрочной перспективе разработанный комплекс мер позволит вести работу по таким направлениям, как определение границ применимости различных существующих решений и методов искусственного интеллекта, совершенствование методов и алгоритмов распознавания изображений, создание комплексной системы автономного функционирования в динамической среде.

1. Миронов С.В., Трушкин Ф.А. Система анализа визуальных данных мобильного робототехнического комплекса // Мобильные роботы и мехатронные системы: матер. науч. шк.-конф. (Москва, 23-24 октября 2006). М.: Изд-во Моск. ун-та, 2006.

2. Бухалто А.Н. [и др.]. Нейрокомпьютеры в системах обработки изображений. Кн. 7; [под общ. ред. Ю.В. Гуляева и А.И. Галушкина]. М.: Радиотехника, 2003. 192 с.

3. CIE, Commission Internationale de l’Eclairage Proceedings. Cambridge University Press, 1931.

4. Буянов А.А., Власов А.И., Макеев С.С. Исследование нейросетевых алгоритмов, применяемых для распознавания образов // Молодые ученые — науке, технологиям и профобразованию для устойчивого развития: проблемы и новые решения: 2-я Междунар. конф. СНГ. М., 2000. Ч. 2, 3.

5. Власов А.И. Аппаратная реализация нейровычисли-тельных управляющих систем // Приборы и системы управления. 1999. № 2. С. 61-65.

ПОИСК ЭЛЕКТРОННЫХ ИЗОБРАЖЕНИЙ ПО СЕМАНТИЧЕСКИМ ПРИЗНАКАМ

С.Ю. Папулин (МГТУ им. Н.Э. Баумана, papulir@mail.ru)

Статья посвящена поиску изображений по семантическим признакам, основанному на преобразовании визуальных признаков изображения в вид, удобный для восприятия человеком. Рассмотрена общая концепция поиска изображений по текстовому описанию особенностей изображений, а также поиска текстовой информации по семантическим признакам изображения.

Ключевые слова: поиск изображений, поиск текстовой информации, семантический признак, семантический признак связи, семантический объект, образ, семантический преобразователь, признак изображения, аннотация изображения.

Известно, что визуальные данные являются наиболее информативным источником для познания окружающего мира, поскольку все, что попадает в поле зрения, обрабатывается параллельно. Так, для описания одного конкретного предмета

может потребоваться несколько предложений, имеющих последовательную форму построения, и потеря хотя бы одного из них или какого-либо значимого слова может исказить образ предмета. В то же время с помощью визуального представ-

Источники:
  • http://sheba.spb.ru/delo/tehzren-rob-1990.htm
  • http://www.smprobotics.ru/technologies/
  • http://cyberleninka.ru/article/n/sistema-tehnicheskogo-zreniya-v-zadachah-navigatsii-mobilnyh-obektov