І

н

с

т

и

т

у

т

п

р

о

б

л

е

м

ш

т

у

ч

н

о

г

о

і

н

т

е

л

е

к

т

у

Головне меню

Відділ розпізнавання зорових та мовних образів

Створений шляхом злиття відділу фундаментальних проблем розпізнавання мовних образів та відділу розпізнавання зорових образів у 2014 році.

Вiддiл розпізнавання зорових образів – один з найстаріших та найбільш потужних структурних підрозділів ІПШІ. Створений у жовтнi 1993 року.

Основне завдання відділу –  фундаментальні та прикладні дослідження у галузі розпізнавання мовленнєвих та зорових образів.  Розроблені  системи, які розпізнають окремо вимовлені слова напередзаданого словника як ціле. Такі системи потребують попереднього навчання - створення для кожного слова голосового еталона. На їх основі розроблено ряд прикладних програм, у тому числі голосове керування мобільним роботом, програма голосового набору математичних формул та багато інших.

Науковці відділу працюють з передовими опен сурсними пакетами програм та проводять роботи в напрямах:

- Створення фундаментальних засад розпізнавання зорових образів;

- Розробка методів та технологій ідентифікації об’єктів за умов змін;

- Створення систем технічного зору автономних мобільних роботів;

- Розробка інтелектуальних систем відео спостереження спеціального призначення;

- Системи розпізнавання злитого мовлення;

- Створення методів та алгоритмів розпізнавання мовлення;

- Розроблення систем голосового управління робототехнічними комплексами;

- Розробка дикторонезалежних систем розпізнавання;

- Створення теоретичних засад ідентифікації диктора в системах розпізнавання;

- Розроблення текстонезалежних систем верифікації диктора.

Наукомістка продукція вчених демонструється на регiональних i міжнародних наукових заходах, у тому числi й на найбiльшiй у Європi щорiчнiй виставцi CeBIT (Ганновер, ФРН).

 

Наукомістка ​продукція відділу:

 

Навчальна система розпізнавання мови на базі читання з губ

Розроблена програмна система навчання правильній артикуляції при промовлянні української мови на базі читання з губ. Ціллю використання системи є спрощення візуального сприйняття української мови людьми з порушеннями слуху. В рамках програмної системи розроблено та використано технології пошуку обличчя людини в кадрі, локалізації області губ на зображенні, розпізнавання конфігурації губ, трансляції послідовності результатів розпізнавання конфігурацій губ в слова української мови. Система імітує візуальне сприйняття мови людиною завдяки чому виконується контроль правильності промовляння користувачем окремих звуків та слів. Розроблена програмна система є унікальною науковою розробкою та не має аналогів в світі. Розроблені і використані технології відповідають світовому рівню. Отримані результати є розвитком технологій розпізнавання мови в напрямку автоматизації процесу читання з губ та можуть бути використані для оснащення існуючих систем акустичного розпізнавання мови додатковим каналом інформації, що дозволить підвищити їх працездатність в умовах шумів та сторонніх джерел звуків.

 

Експериментальна система виявлення та розпізнавання номерних знаків транспортних засобів

Розроблено експериментальний комплекс алгоритмів для автоматизації процесу спостереження за рухом автотранспортних засобів. В комплекс входять методи пошуку положення знаку на зображенні, методи нормалізації зображення знаку за кутом нахилу, методи зіставлення моделі положення символів на знаку з зображенням для визначення типу знаку та масштабу і положення символів на поточному зображенні, методи розпізнавання символів на знаку.

Реалізовано дві моделі номерних знаків: ББ ЦЦЦЦ ББ, ЦЦЦ-ЦЦ ББ, де Ц-цифра, Б-буква. Запропонована модель номерних знаків допускає просте розширення для розпізнавання знаків інших типів. Отримані результати відповідають світовому рівню досягнень у цій галузі, та можуть бути використані для автоматизації процесу спостереження та управління рухом автомобільного транспорту.

 

 

Розроблення методів розпізнавання злито вимовлених фраз в рамках концепції пофонемного розпізнавання мовлення з узагальненою транскрипцією

 

 

Автоматизоване робоче місце експерта-фоноскопіста

 

 

Інтелектуальна технологія відео ідентифікації руху