comic-reader

Ovaj repozitorijum sadrzi kod i materijale za prepoznavanje lica i teksta u stripu Alan Ford

U direkotrijumu result nalaze se primeri dobrog rada programa

Da bi se kod za prepoznavanje teksta mogao pokrenuti potrebno je:

instalirati tensorflow, opencv, keras
koristiti vec istrenirani model ANN za prepoznavanje slova - my_model.h5 (ili istrenirati novi model uz pomoc ocr_net.py skripte)
pokrenuti skriptu read_text.py

Da bi se kod za detekciju i prepoznavanje lica mogao pokrenuti potrebno je:

instalirati tensorflow
preuzeti darkflow repozitorijum https://github.com/thtrieu/darkflow - koji sadrzi YOLO modele
preuzeti tiny-yolo-voc weights sa sajta https://pjreddie.com/darknet/yolo/ i smestiti ih u bin direktorijum
instalirati cython pomocu python3 setup.py build_ext --inplace
konfiguraciju tiny-yolo-voc-3c.cfg premestiti u cfg direktorijum sa ostalim konfiguracijama
moguce je koristiti tezine koje sam ja dobio(u direktorijumu ckpt) ili istrenirati svoje tezine 6i) trenjiranje tezina vrsi se pomocu komande python flow --model cfg/tiny-yolo-voc-3c.cfg --load bin/tiny-yolo-voc.weights --train --annotation annotations --dataset images uz zadavanje parametara epochs,save,gpu,batch... 6ii) u skripti recognize.py, zameniti vrednost 4000 u recniku options sa vrednoscu koja je najveca u ckpt direktorijumu (istrenirane tezine se automatski smestaju u ckpt)
pokrenuti recognize.py skriptu

Provide feedback