Rauf Aliev (rauf) wrote,
Rauf Aliev
rauf

распознавание образов...

Когда-то давно, в институте еще, у меня было необычное хобби -- я занимался просто так написанием проги распознавания образов. Особо не имея поначалу никакой теории под это, хотел что-то придумать самостоятельно. Это потом уже пришлось заглядывать в алгоритмы линиаризации, разбираться с нейросетями и т.д.
В результате получилось идиотская программа, в ответ на матрицу 32х32 с нарисованной абы как буквой А, говорила, что это буква А, а не что иное. При этом работала, как мне помнится, несколько секунд только на анализ этой буквы.
С тех пор, мне помнится, в голове остались
1) лучше всего распознается то, что сделано не природой, а человеком (с исп. им же созданных механизмов). То, что создано природой распознается плохо или не распознается вообще.
2) фото- или видеосъемка -- самый неудобный тип входящей информации для алгоритмов распознования. Теряется информация о глубине, цвет и яркость сильно зависят от внешних источников света.
3) для распознования образов идеально бы подходил аналоговый компьютер. Как он должен работать и по каким алгоритмам -- я не знаю, но то, что оперировать нужно не цифрой, а аналоговыми значениями, почему-то "перевешивает".

Попробую пояснить некоторые моменты.
1) что распознается в настоящее время удачнее всего? Машинописный текст, заполненные от руки квадратики по строго заданным правилам их заполнения, движение контрастных объектов и т.д. А вот попробуйте сделать систему, которая на дерево, говорила, что это -- дерево. Причем срабатывала бы на всех деревьях всех видов. А ведь дерево имеет ряд постоянных свойств. Попробуйте распознать почерк, голос, лицо. Все это распознается с очень большими погрешностями. Но стоит привести объект распознавания к стандарту, сузить диапазон различных вариантов до минимума, и задача становится уже намного проще.
2) цвет сильно мешается распознаванию. Приходится убирать информацию о цвете вообще, и основываться только на яркости. При этом яркость в ряде случаев сводится к одному и тому же значению. Вот например, желтый и белый -- цвета разные, а яркости у них очень близки. Как только оставляешь только яркостную составляющую, так сразу видишь, что распознать ЭТО уже сложно.

Кстати, а интересно, вообще реально написать систему, которая бы смогла распознать целофанновый мятый пакет? Даже пока и не представляю как...
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments