comic-reader

Ovaj repozitorijum sadrzi kod i materijale za prepoznavanje lica i teksta u stripu Alan Ford

U direkotrijumu result nalaze se primeri dobrog rada programa

Da bi se kod za prepoznavanje teksta mogao pokrenuti potrebno je:

instalirati tensorflow, opencv, keras
koristiti vec istrenirani model ANN za prepoznavanje slova - my_model.h5 (ili istrenirati novi model uz pomoc ocr_net.py skripte)
pokrenuti skriptu read_text.py

Da bi se kod za detekciju i prepoznavanje lica mogao pokrenuti potrebno je:

instalirati tensorflow
preuzeti darkflow repozitorijum https://github.com/thtrieu/darkflow - koji sadrzi YOLO modele
preuzeti tiny-yolo-voc weights sa sajta https://pjreddie.com/darknet/yolo/ i smestiti ih u bin direktorijum
instalirati cython pomocu python3 setup.py build_ext --inplace
konfiguraciju tiny-yolo-voc-3c.cfg premestiti u cfg direktorijum sa ostalim konfiguracijama
moguce je koristiti tezine koje sam ja dobio(u direktorijumu ckpt) ili istrenirati svoje tezine 6i) trenjiranje tezina vrsi se pomocu komande python flow --model cfg/tiny-yolo-voc-3c.cfg --load bin/tiny-yolo-voc.weights --train --annotation annotations --dataset images uz zadavanje parametara epochs,save,gpu,batch... 6ii) u skripti recognize.py, zameniti vrednost 4000 u recniku options sa vrednoscu koja je najveca u ckpt direktorijumu (istrenirane tezine se automatski smestaju u ckpt)
pokrenuti recognize.py skriptu

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
for_reading		for_reading
images		images
result		result
sample_alan		sample_alan
slova		slova
README.md		README.md
comic-reader-poster.pdf		comic-reader-poster.pdf
edit_xml.py		edit_xml.py
labels.txt		labels.txt
my_model.h5		my_model.h5
ocr_net.py		ocr_net.py
read_text.py		read_text.py
recognize.py		recognize.py
tiny-yolo-voc-3c.cfg		tiny-yolo-voc-3c.cfg

Provide feedback