Blog
Компютърна графика – Курсова работа
BoW model in computer vision (BoW моделът в компютърната графика)
В контекста на обектното разпознаване, състоянието на най-съвременните изпълнения е получено чрез визуалния модел „торба-от-думи”, или по-просто казано „множество от думи”. Ще разгледаме BoW модела и неговите компоненти в контекста на класификацията на изображенията. В частност ще се фокусиране върху етапите на кодиране, обединяване и проучване на влиянието на основните параметри на BoW канала. Ще покажем, че подходящата комбинация от няколко ниски (честото на дискретизация, разнообразен мащаб) и средни (размер на кодовата книга и нормализиране) параметри, е от решаващо значение за получаване на добри представяния.
В компютърната графика, моделът „торба-с-думи” (BoW), както вече споменахме, се прилага при класификацията на изображенията, чрез третиране на характеристиките на изображенията като думи.
Класификацията на изображенията се отнася до способността да се предвижда семантична концепция на базата на визуалното съдържание на изображението. Тази тема е широко изследвана поради големия си брой приложения в различни области, като обработка на изображения, извличане на информация, компютърна графика и изкуствен интелект. Това е един от най-трудните проблеми в тези области. Така например, в контекста на компютърната графика, способността да се предскажат сложни семантични категории, като например сцени или обекти, от нивото на пиксела, все още е много трудна задача. Как правилно да представят изображения за успешно им категоризиране, т.е., попълване на семантична празнина, остава основен проблем за изследователите компютърната графика.
Ето защо, BoW моделът, който се доказа като една от водещите стратегии през последното десетилетия, продължава да бъде много конкурентно изпълнение. Достигнати са две основни открития, които могат да обяснят силата на BoW модела. Първият от тях е проектът на дискриминационни местни функции от ниско ниво, като например Scale-Invariant Feature Transform (SIFT) и Histograms of oriented Gradients (HoG). HoG е проявата на изображенията от средно ниво, вдъхновени от текстовото извличане. И наистина, кодирането на локалните характеристики и струпването на кодовете (обединяване) направи възможно извеждането на векторно изображение от всяко едно изображение. В последствие, това изображение може да се използва за упражняване на мощни модели на статистическо учене, например Support Vector Machine (SVM) или за моделиране на визуални карти чрез функция претегляне и селекция, с помощта на биологически вдъхновени методи.
(За пълния вариант на курсовата работа, моля свържете се с нас на посочените телефон и имейл за контакт)