TLSTM_NewsTickers/common.py at master · BurhanUlTayyab/TLSTM_NewsTickers · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import glob
import numpy
import cv2
import numpy as np
import cPickle as pickle
import time
import os
import codecs
from label_generate import DIGITS
__all__ = (
    'DIGITS'
)
OUTPUT_SHAPE = (48, 1142)

DIGITS = DIGITS.decode('utf-8')


LEARNING_RATE_DECAY_FACTOR = 1  # The learning rate decay factor
INITIAL_LEARNING_RATE = 1e-4
DECAY_STEPS = 5   #5000

# parameters for bdlstm ctc
BATCH_SIZE = 117  #50 #25 #200 #35
BATCHES = 100 #146 #292 #445 #308
#100000

print "BATCH SIZE = {0}, No. OF BATCHES = {1}".format(BATCH_SIZE, BATCHES)

TRAIN_SIZE = BATCH_SIZE * BATCHES

MOMENTUM = 0.9
REPORT_STEPS = 1000 #BATCHES * 4

# Hyper-parameters
num_epochs = 1000000
num_hidden = 256
num_layers = 1

num_classes = len(DIGITS)  + 1  # characters + ctc blank
print num_classes


data_set = {}
label_dictionary = {}

def get_labels(names):
    for x in names:
        f = codecs.open( x +'.txt', 'r','utf-8')
        label_dictionary[x] = f.readline().strip('\n')

        #label_dictionary[x]=label_dictionary[x][::-1]
        f.close()


def load_data_set(dirname):
    with open(dirname) as f:
        image_names = f.readlines()
    fname_list = [x.strip() for x in image_names]
    result = dict()
    labels_list = []
    #get list of paths without extension
    for x in fname_list:
        labels_list.append((os.path.splitext(x)[0]))

    #load ground truths to label array
    get_labels(labels_list)

    for fname in sorted(fname_list):
        #for fname in fname_list:
        im = cv2.imread(fname)[:, :, 0].astype(numpy.float32) / 255.
        #get corresponding label
        label_key = os.path.splitext(fname)[0]
        code = label_dictionary.get(label_key)
        result[label_key] = (im, code)

    data_set[dirname] = result


def read_data_for_lstm_ctc(dirname, start_index=None, end_index=None):
    start = time.time()
    fname_list = []

    if not data_set.has_key(dirname):
        load_data_set(dirname)

    with open(dirname) as f:
        image_names = f.readlines()
        image_names = [x.strip() for x in image_names]

    if start_index is None:
        fname_list = image_names


    else:
        for i in range(start_index, end_index):
            fname_list.append(image_names[i])

    start = time.time()
    dir_data_set = data_set.get(dirname)

    with open('train_widths.pickle', 'r') as handle:
        widths_dict = pickle.load(handle)
    for fname in sorted(fname_list):
        #for fname in fname_list:
        d = os.path.splitext(fname)[0]
        im, code = dir_data_set[d]
        width = widths_dict[str(os.path.basename(d))]


        yield width, numpy.asarray(d), im, numpy.asarray([DIGITS.find(x)  for x in list(code)])


def unzip(b):
    ws, ns, xs, ys = zip(*b)
    ws = numpy.array(ws)
    xs = numpy.array(xs)
    ys = numpy.array(ys)
    ns = numpy.array(ns)
    return ws, ns, xs, ys