forked from nmeisburger/LSH-Tables
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathJaccardBruteForce.py
154 lines (140 loc) · 29.9 KB
/
JaccardBruteForce.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
import statistics
def jaccard(seq0, seq1, ngram):
set0 = set()
set1 = set()
for i in range(len(seq0)-ngram):
set0.add(seq0[i:i+ngram])
for i in range(len(seq1)-ngram):
set1.add(seq1[i:i+ngram])
return len(set0.intersection(set1))/len(set0.union(set1))
query_lst = [
"TCAGGCTACAACATGGACGGCCCTTGAAAACATTATGCCAAATGGAAGAAGCTAGTCACAATACATCACATATTGTATGATTCCATTTATGGAAAATGTCCAAAACAGGCAAATCTATGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACAGTATTTAGATGCAAAAATTCTCAATAAAATATTAGCAAAGTGAACCCAACAGCATATCAAAGAATTATTCACCATAACCAAGTGGAATTTATTCCTGGAGTGCAAAGATTGG",
"TCAGAATATCAGAGTACTTTTGCCTTCTTTTTGAACAGAAATTATGGGAAACTGGATTCACAAGGAGAACATCATAACCTTCCAGAAGTTTCCCTGGCCCAGAGGGCAGTGCACCAGAGAAGAGTCTTGAACCCTCTTTGGGAACAGAGAAGAGAATCTTAAAGGTCAGGGTTAGCTCCACCCAGGACTCTAAGGATACAATCAGCCATGACAAGCCTCAGTAGAATCCAGACGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACAATCCAGG",
"TCAGCTTCATTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTGTTTGTTTTCTTTCGTACGTTAACGAACGAAACGTAACGTAGGTTAGTTAAGAGAAGAAAGACGACCGAGAGATAGTACGACTAGTAGTAAGTAGTAGGTTTAAGTTTTAAAAATTTTTAAAAAATTTTTAGTAGAGNGGTGGTTCGGTTTAGGTACGGTAACGGTAAGGTTAGTAACTTACCGTTACCCGTTCCGTACCTACCTTACCTTCCCTACCTAGAGTCGTCGGTCGTTGTCGTCGTCGTCTTACGAACGAACGAAGGAACGGGTCGGGGTCCGGGTTGGTGGTCGGTCCGTACCCGTACCCGTACCGTTACGTTAACCCGTACCCG",
"TCAGATGTCCACCTACATTCAGTACATTGATTTTTAGATGAGGATGCTATATATTTAGAAGGTTGTTTAAAATCCTCTACTTCACCATGATGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTCGGTTCCAACTTCACCTCCAGGTCTTTATATATGCTGCTTCCTTTGCAAGGACAGTCATTCTCCTCTATATGCTCCTGCATATATCCTGCTCATCCTTCAAATCTCTGCTTGAATTCCTCTCTGCTG",
"TCAGTTCCTGGATATGAATATAAGTTTATTTTATTCTAAAGTCTATGTGTTTATATTGCCCACAGGTTACATGTTCTACAAGGACGGGTACCAGTTCTTAATTTGTTCTCCACTGGCCTATGCTATGTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTTGTTTTGCTTTGTTTTGTTTGATTTGAAGACAAACTGTAATGTGGAATACATTACCCTAACTTGGGTGTTTTTCCTCCACACTCACCCACCAACCCTTGGAATGCCAAGGGAGGGCCTCCTCACTGCCCTC",
"TCAGCCCCACGTGCATTAGGTATTTTATTTGACCTAATGCTCTCCCTCCCCTTGACCCCTACCCACTGATGGGCCCCAGTGTGTGCTGTCCCCTCCCTGTGTCTATGTTTTCTCATTGTTCAACTCACACTTATGAGTGAGAACATGCGGTGTTTGGTTTTCTGTTCCTGTGCTAGTTTGCTGAGGATCATGGCTTCTAGCTTCATGCATGTCCCTGCAAGTTGGAACCGAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCCTAGGTTCC",
"TCAGTGACAATTACGACCAAGGCCACACTCCCAATGCTGTGGTAAATCCCAGTCAATGGCTTTTGGAACCTTTATTTCTGGTGTTCTCTTTATGTCTGATTAGAATGTTCTTGAGACATGTCTTTCACAGGCTTTGTACTGAGCTCAACTAGTCCTGTGTGGGATTTTTTGGCTAAAATTCCTCAGTACGGATTACCACTTAGCTTTTCTTTAGACGGCCTGCAAGCCTCTTTCCAAGCTCATATTTCTCAGTTGGTTGGAACCGAAAGGGTTTNAA",
"TCAGCTTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCATGTTTATATCCATATTTGTTCCTGGCCCTCAAGAGCTCACAAAGGAACAGGCAAGTGAACAGGCAAATACCGCACAGTATGGAAACTACTACTCTACAGAGACGTGCAAAATAAGAACCCTATATATAACTCAATTACAACATTTCTCAATTACACTGAATTCTGCCTGTTTGTTTGTATGTGAGCCTCACCAGTGAGATGATGCACGCTC",
"TCAGGAAAACGGCACTTTTTTTTGTTTTGTAGATGGAGTATTGCTCTGTCGCCCAGGCTGGAGTACAGCGGCATGATCTCAGCTCACCACAACCTCTGCCTCCCGGGTTCAAGCTATTCTGCCTCAGCCTCCCGAGTAGCTGGGACTACAGGCATGGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACAAGTTAACACATGTGCCACTGAGCGGGCTGGCAAGGC",
"TCAGAAACAATCTATTTCCAACTAAGAAACTATCAATTTCCAGTGTCCAATTAGGACATGTGAGGTGGCTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACATGCAACACATTTTTAGGTATTTTCTTTGAAAAATTTTTTCCCTTTTAAGTGTTAGTACTTGTTTATCATTAAAAATTCACGACAAAGCCATTCTAATTTAGGATTTTATTCTAGTATTTCATTACATAGGTCAATTTTCTGACAATAAGACCTCAATTTCTCAAATATACATTATAATGCAGCTAAAA"
]
#top 10 retrieved items using brite force for each of the above query strings
result_arr = [["TCAGCAGATGATGAGTTAGTGGGTGCAGTGCACCAGCATGTCACATGTATACATATGTAACTAACCTGCACATTGTGCACATGTACCCTAAAACTTAAAGTATAATAATTAAAAAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTGATGCAAAAATCCTCAATAAAATACTGGCAAACTGAATCCAGCAGCACATCAAAAAGCTTATCCACCATGATCAAGTGGGCTTCATCCCTGGGATG","TCAGCAGATGATGAGTTAGTGGGTGCAGTGCACCAGCATGTCACATGTATACATATGTAACTAACCTGCACATTGTGCACATGTACCCTAAAACTTAAAGTATAATAATTAAAAAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTGATGCAAAAATCCTCAATAAAATACTGGCAAACTGAATCCAGCAGCACATCAAAAAGCTTATCCACCATGATCAAGTGGGCTTCATCCCTGGGATG",
"TCAGACAATCACAATGTCTGGAAATGAAAGACACACTTAGAGAAATGCAAATTATACTGGAAAGTTTCAACAATATAATTAAACAAGTAGAAGAAAGAACTTATTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTGATGAACATTGATGCAAAAATTCTCAATAAAATACTGGAAAACTAAATCCAGCAGCACATCAAAAAGCTTATCCACCACAATCAAGTCAGCTTCATACCTGGGATGCAAGGCTTGTTCAACACA",
"TCAGTTTTCTTGAACCAAAGAATTGAATCGAATATTTGAAGTATCAGGCAACTAATTAACCTAAAATCTGTAGAAAGAAAGGTGCCCACAGGGTATGAGCACTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCCAATATCCTTGATGAACACTGATGCAAAAATCCTCAATAAAATACTAGCAAACTGAATCTAGCAGCACATCAAAAAGCTTATCCACCATGATCAAGTCAGCTTCATCCCTGGGATGCAAGGTTGG",
"TCAGTGAGCTAAACCATATTTTTGGAGCAATGACTTGACAATGCAGTATCATGATGGAACTATCACAGATGGACAGAATGAGTCTCTTGATTCCTACATTTATTTTTCTATTGATGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACATGTAAAAATACTCAACAAAATTCTAGCAAACTGAAGCTAACAACACATCAAAAAGATAATTCATCATGATCAAGTGGGCTTTATTCCAGGGGTGCTTGAA",
"TCAGATCGGATGGAAATGAATGGAATCATCATCGAATGGAAATGAAAGGAGTCATCATCTAATGGAATTGCATGGAATCATCATAATATGGAATCGAATGGAATCAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCATCGAATGGAATCGAATGGAATCATCAAATGGACTCGAATGGAATAATCATTGAACGGAATCGAATGGAATCATCATCGGATGGAAATGAATGGAA",
"TCAGTACCCACAAAGGGAAACCCATCAGACTAACAGCAGATCTCTCAGCAGAAACCCTGCAAGCCAGAGGAGAGTGAGGGCCAATATTCAACATTCTTAAAGAAAAGAATTTTCAACCCAGAATTTCGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACGAATATTGATGCAAACATCTTCAACAAAATACTAACACATCAAATTCAGCAATACATAAGGAAGATCATTCATCATGACCAAGTGGGATTTATCCCTGGGATG",
"TCAGGTAATGATTAAATGGACTCGAATGGAATCATCAAATGGAATCGAATGTAATCATCATCAAATGGAATAGAATGGAGTGATCGAATGGAATCGATGGCAATCATGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTCATTGAATGGAATTGAGTGGAATCACCAACGAATGGAATCGAATGGAATCATCATCAAATGGAATAGAATGGAATAATGGAATGGACACGAATGGAAACCTG",
"TCAGAACCTAAGTGTCTACCAACAGATGAATGGGCAAAAAAATATGGTACTTATACCACAATGGAGGGCTATTTAGCCATAAAAATGAATGAGATCCCATCATTTGTAACAGCATGGGTTGGAACCGAAAGGGTTTGAATTTCAAACCCTTTCGGTTCCAACCACTTGGAATGGATATTGATCCAAAAATACATCAACAAAGTAATAGGAAACCGAAATTCAACAACACATTAAAAGTTCATTCATCATGACAGTGAATTATCCTAGGATGCAAGATGG",
"TCAGTTCTAGAAACTGTGTCTTGGGTCATCAAATCAAAGAAATGGTGAGCAAAGAAGCTCGAGAAACATTACATGTTATTTCCCCATTCTTGAATAGTCACAATACATATTGTTGGAACCGAAAGGGTTTGAATTTCAAACCCTTTCGGTTCCAACGCATTTATTTTGACACAAAAACATCTACCATTTAAAATAAAAAGTTAATTCAACTCATAAATCTACATATCCTAAGCGCATGCTTTATGGACATGTATATTTTATTCATATAGACAGATTG"],
["TCAGCAGATGATGAGTTAGTGGGTGCAGTGCACCAGCATGTCACATGTATACATATGTAACTAACCTGCACATTGTGCACATGTACCCTAAAACTTAAAGTATAATAATTAAAAAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTGATGCAAAAATCCTCAATAAAATACTGGCAAACTGAATCCAGCAGCACATCAAAAAGCTTATCCACCATGATCAAGTGGGCTTCATCCCTGGGATG",
"TCAGCAGATGATGAGTTAGTGGGTGCAGTGCACCAGCATGTCACATGTATACATATGTAACTAACCTGCACATTGTGCACATGTACCCTAAAACTTAAAGTATAATAATTAAAAAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTGATGCAAAAATCCTCAATAAAATACTGGCAAACTGAATCCAGCAGCACATCAAAAAGCTTATCCACCATGATCAAGTGGGCTTCATCCCTGGGATG",
"TCAGACAATCACAATGTCTGGAAATGAAAGACACACTTAGAGAAATGCAAATTATACTGGAAAGTTTCAACAATATAATTAAACAAGTAGAAGAAAGAACTTATTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTGATGAACATTGATGCAAAAATTCTCAATAAAATACTGGAAAACTAAATCCAGCAGCACATCAAAAAGCTTATCCACCACAATCAAGTCAGCTTCATACCTGGGATGCAAGGCTTGTTCAACACA",
"TCAGTTTTCTTGAACCAAAGAATTGAATCGAATATTTGAAGTATCAGGCAACTAATTAACCTAAAATCTGTAGAAAGAAAGGTGCCCACAGGGTATGAGCACTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCCAATATCCTTGATGAACACTGATGCAAAAATCCTCAATAAAATACTAGCAAACTGAATCTAGCAGCACATCAAAAAGCTTATCCACCATGATCAAGTCAGCTTCATCCCTGGGATGCAAGGTTGG",
"TCAGTGAGCTAAACCATATTTTTGGAGCAATGACTTGACAATGCAGTATCATGATGGAACTATCACAGATGGACAGAATGAGTCTCTTGATTCCTACATTTATTTTTCTATTGATGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACATGTAAAAATACTCAACAAAATTCTAGCAAACTGAAGCTAACAACACATCAAAAAGATAATTCATCATGATCAAGTGGGCTTTATTCCAGGGGTGCTTGAA",
"TCAGATCGGATGGAAATGAATGGAATCATCATCGAATGGAAATGAAAGGAGTCATCATCTAATGGAATTGCATGGAATCATCATAATATGGAATCGAATGGAATCAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCATCGAATGGAATCGAATGGAATCATCAAATGGACTCGAATGGAATAATCATTGAACGGAATCGAATGGAATCATCATCGGATGGAAATGAATGGAA",
"TCAGTACCCACAAAGGGAAACCCATCAGACTAACAGCAGATCTCTCAGCAGAAACCCTGCAAGCCAGAGGAGAGTGAGGGCCAATATTCAACATTCTTAAAGAAAAGAATTTTCAACCCAGAATTTCGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACGAATATTGATGCAAACATCTTCAACAAAATACTAACACATCAAATTCAGCAATACATAAGGAAGATCATTCATCATGACCAAGTGGGATTTATCCCTGGGATG",
"TCAGGTAATGATTAAATGGACTCGAATGGAATCATCAAATGGAATCGAATGTAATCATCATCAAATGGAATAGAATGGAGTGATCGAATGGAATCGATGGCAATCATGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTCATTGAATGGAATTGAGTGGAATCACCAACGAATGGAATCGAATGGAATCATCATCAAATGGAATAGAATGGAATAATGGAATGGACACGAATGGAAACCTG",
"TCAGAACCTAAGTGTCTACCAACAGATGAATGGGCAAAAAAATATGGTACTTATACCACAATGGAGGGCTATTTAGCCATAAAAATGAATGAGATCCCATCATTTGTAACAGCATGGGTTGGAACCGAAAGGGTTTGAATTTCAAACCCTTTCGGTTCCAACCACTTGGAATGGATATTGATCCAAAAATACATCAACAAAGTAATAGGAAACCGAAATTCAACAACACATTAAAAGTTCATTCATCATGACAGTGAATTATCCTAGGATGCAAGATGG",
"TCAGTTCTAGAAACTGTGTCTTGGGTCATCAAATCAAAGAAATGGTGAGCAAAGAAGCTCGAGAAACATTACATGTTATTTCCCCATTCTTGAATAGTCACAATACATATTGTTGGAACCGAAAGGGTTTGAATTTCAAACCCTTTCGGTTCCAACGCATTTATTTTGACACAAAAACATCTACCATTTAAAATAAAAAGTTAATTCAACTCATAAATCTACATATCCTAAGCGCATGCTTTATGGACATGTATATTTTATTCATATAGACAGATTG"
],
["TCAGCTAAACGAGCGTGCATATGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTANATGTGTACTCCTAGTTTACTTAGTACGGTAACTACGTACCTACTAACTTTACTTTACCTTACGTTAGGTAAGGTAAGGGTAAACCTTCCTTCGTACGAACTAGTCGGTACTTAACTTAACTACTACCACTAACTTAAACCTTTAAAACCTTTCCCCTTTCCCTCCTTCCTTCCGTACGACGTAAGGTTCGTTTCGTTTTCGTTCTTTCGTTTTGTTTTACGAAACCGAAAAAGAAGACGGCGGTCGGTTACTTAGTTTGTTTCGCTACTCCCTACCCTTCTTCGACGTCGTCTACTAGTCG",
"TCAGGATCACAATTTTGTGGAAATGATATCTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTATAAGTAAAGTTCGTGATGTGTGTTAGTTAGGTAACGGACGTAGGTACGGCCGTACCGTTAACGTTAAATTAGTTAGGTAATAAGTAGTTGTAGGTTCGGTTCGGGTTTTGGTTTTGGTTTTACGTTTAACGTAAGTCGTACCTTACCTTTACTACGAAGTACGACGTACTTACTCTTATTTACGTTTAACTTTAAATACTAGTTTCGTTTTGTATATTATTAGTTCGGTACGGAACGGTAAGGTTATACTTACCTAACCGTTCCGTACCTAACTTAACTTCTTTACTTAC",
"TCAGAAAACCATATATATGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTAGTGTAGTGTATATATNTNTATATATGTGTGTAGTATATTATATAGTNTATATATTATTAGTAGTACTACTAGTTCTTACTAAGAAAGTAAAAGGTAAAACGGTTAACCGTTTTAAACCTTTTAAACTTCTTACTACGTTACGGTTACGTTAACTTTAAGTTTGGTTCGGGTTCCGTTCCTTTACGTACGTACCGTACCTAACCTTAACCCTTCCCCTTACCCGTAAACAAACGTAACGTAACGTAAACCGTTACGTTACCGACCGACCCGGAACCGGGTACCGGGGG",
"TCAGTATTTGTGTGTGTATATGTGTGTGTGTGTGCATGTGTGTGTGTNTATGAGAGAGAGAGTATTGAGAGAGAGACAGCGTCTGAGAGAGACAGACGAGGGGAGGGGGACGAGACGAGACGAAGGACTAGTCGGACGTACGTACCTTACGTTCGTTACTAATTAAGTTAGGTTACGTTTTTCCCTTTTACCCGGACGGGACCCGTAGGTTCGTTCCGTTTCCGTTACCCCCCTTTAACCCCCCCGACGGTCCTTCGTTAGGTAGGTTAGGGAACGAACCAACCAACCTACCTTTACCGTTCCGGTTACGGGAAACCGGGTTAAAGGGTTTAGTAACTTACCCTTAACCCCGTTTCCGG",
"TCAGCTTGTATGCTGAAGACTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTAGTAGACGACGGTGTCTCTCTCTCTACCACCGAGTGGTAGGAACGTAACTACTACTACTTACGTTCGTACCGACCTACCTAACGAGTACGTCGTACTACGGTACGGTAGGTACGACTACTTACTTCGTTCGGTTCGTACTCGACGACCGTACCGGTACCGGACCGGACCCGACGGTAACGTACTAAGGTAGGTAGTTACGGTTACGGTAACGGTAAGGTTAGTTACTTAACCG",
"TCAGATGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTATAATAAATAGTAAGAAAGAAATACAAGTGACGTACGAGGTAGGTTAGGTTTTTGGTTTCGGGTCCGGGTACCCGTAACGGTTACGTTTAACGGTAAACCGGAACGGGTAACCGTTAAACGGTTTAAACGTTTCGGGTCGGGGGTCGGTGGGACGGTCTCGTCTTAGTTTAGGTTACGGGAAACGGTTAAGGGTTTAGTAACTTACCTTAACCCGTTTCCGTACCAACACGACCTACGTTAGTTAGTTAGTCGGACGGGTAGGGTACGGTACGTAGGGACGGGCGGGACGTCGGGACGGAACGCNNNNNN",
"TCAGTGCCATGTTTTTGAACACTACCTGAAAACAAGAGAAGAGAAAACTTTCTCAAGCTTGACTCAGAATGAAAAGGAAAAAAAAAAAAAAGAAAAGAGAAAGACACTATGGATTTAGTAAAAGGTAAATTAAAAGTACCATGCTTTTTCTTAAAGTAGTANAACAAACTTAACTTACACATGTACGGAACGGTAAGGTTAGTATACCTAACCGTTCCGTTACCGAACGAGTNTTGTACGACATGCACAACGTAAGGTTGGTGTCCTACCGACGAAACGAAACGTACGTCGTCGTCGTCGTTGGTCGACCAACCTTACCCTTAACCCAAAACGAAACGACGACCGTCCCG",
"TCAGACTTAAATTCCTTCTGCTGGAATTGAAGTTTGTTTTCTCTTCTGCAGTCTTTTGGGGGAAGGAGAGAAATGCTAATTACCCTCCTTCCCAAAAGACTGCAGAAGNGAAANANAATACTTACTCTCTCGACGTAGTAGTTAGTTTGTTCTTCTTCGTTCGTCTACGTTCGGTTACGGGTACGGTAGGAAGTAGTAGTATACCTCTACTCTACTTCTACTCGTACTTAGTTAGGTTGGGGTAGGTAGGTCGTACGACGTACTCTCTACGTCGTCGTTCCTACCGTTCCTACCTTCGTCGCTCCGTCCGTTCGTTACTAACG",
"TCAGTCAACTGTATGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAAGAAGAGAGAGTCGACGACGAGANAATATAANANANATAGTGTTCTTTTCGTTTCGGAGGGTACAACTACCTAACCTTCTACTACTCTCGTTAGGTACGGAACGGTAGGTTATACTACGTACCGTTCGACGAACGACTATACTCCCTACCCTCCGTCGGTAGGAGGTAAGGTAAGGTCGCTACACGAACCGAAGTACGAACGAAGGAAGGTTCGGTTCGGTTTTAGGGGTAAGGGTACGTCCGTACCTACCTAAACCC",
"TCAGTATGTGTGTGAGTGTGTGTGTGTGTGTGTGTGTGTGTCTGTGTGTGTGTGTGTGTTAGTAGGAGGAGTAGGTAAGTAACCTACTTACGTTACGTTAACTTAACTATTAGTAAGATATACATATATGTAGTAGAACAAACAACGAAACGAACGTACGTACTATAAGTAATAATTACTACAACTAAACTAACTACTTACTTACTAAACAAACTAAAGAAAGAAAAAGAAAAGTAAGGTAAGAGTCTCTCCTACCTTCTCTACGTACTTACGTTCTTACCTACCTACCTACCTACTTACCCTTACCTACCTAACC"
],
["TCAGAGCCACCACATTCTACTGAGTAGAACTTTGTCTTGAGCTACTAATTTTTAAAAAATTAATTAATTTTTAAATTTGACAAATAAAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACGTGTCTCTATTTCCTTCAGTTCTGCTCTGATTTTAGTTATTTCTTGCCTTCTGCTAGCTTCTGAATGTGTTTGCTCTTGCTTTTCTAGCTGAGCGGGCTGGCAAGGC",
"TCAGAGTCCAACTATAGGGCCTAATTTAATAATGTATGGTGTCTGCATATGAGAGATGGCCATAAAAAGCCATTTAAAAATCATGACGGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCGAATGCATCTGCAGTTGTCACATATTCACTGTCACCTTGCAGCACAATGTCAGGTCTGGGAGGCATTTCTACGGCATCACACAGGCATTCTCGCGCGTGCTGTAACTGCCCTCTTCTG",
"TCAGACTATCTATCTATCTAATCTATCTACTATCTATCTACCTATCTAATCTATCTACTATCTATCTAATCTATCTACTATCTATCTATCTATCTAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCATCTATCATTAGATATATCATCTATCAATCTACCCATCTATCATCTATCTTTCTATCTATTCTACCTACCTATCATCTATCTATTGTATCTACCTACCTATC",
"TCAGATTCGAATTCGAATCAATTACATTGAAATCCATTACTATTGAGTCCGTTTTACTCCAGTCCACTCCATTCTGCTCCATTCCGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACATTCATTTCTATTCCATTAGAGTCCATGTCTTTCGAGTCCATTCCATTCTATTCTATTCCTCTCCATTCCATTCCATTCCACTCCATTCCATCGTTGCCGTCTGAGCGGCTGCAGCN",
"TCAGATTCTCACAAAAGTCTTGAGCTAAGTAGGATAGATATTATTACTAGCCATGTTTACAGCTGAGGAAACAGATGAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTTCCTCTTTGTTATTAGTAAATAACTTATTTAGGAATAGTGTATTTCCTTTTGACACATTACACACTTTTTTGTATCCAGCTCCTGAGCGGGCTGGCAAGGCN",
"TCAGTTCCATTCTTGTCCATTCGATGATTCCATTTGATTCCATATGATGATGATTCCATTCGATTCCATACGATGATGATTCGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACGATTCCATTCAATGATGATTCACTTCTCGTCCATTGGATGATTCCATTTCATTCCATTCGATGATGATTCCATTCGATCCATTCGATGATTCCATTGATCCATGCGTCGTGA",
"TCAGTTCCAGCTTCATCCATGTCCCTGCAAAGGACATGAACTCATCCTTTTTATGGCTGCATAGTATTCCATGGTGCATATGTACCACAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTTCTCCTTCAGTGTCAGCAAATAGCCTTGATTGTGCTGCAACTGTGGTCCCTTCCACTATCTTACTTTCCGTCTATCTCAATGCCCCCCTCACACACACCCAGAGATGCTCACTTTGCCTC",
"TCAGAGTCCATTCGATGATTCCATTCGATTCCATTCGATGATGATTGCATTCGAGTCCATGGATTATTCCATTCCATTCCATTAGATGAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCAATGATTCCATTCCAGTCCATTCGATGATTCCATCTGATTCCATTCAATGAATCCATTCGATTCCATTCTATGACGATTCCATTCATTTCCATCTGATGATGATTC",
"TCAGGTATGTTTATTATTTTAAATCAGATTTTCATAAGCATGAGCATGCTATATATCTAGATCTACATCTATCCATATCTATAGCTGTTGGAACCGAAAGGGTTTGAATTCAAACCTTCGGTTCCAACTGGAGTGGAGGCATTGTCTTGAGTTGGTTCAGGAAATGTGACATTGCCTCATGGTTCTGCAGTTGTGGCCGCTGCTGAGCGGGCTGGCAAGGCN",
"TCAGCCATTCCATTCCATTCCGTTGCATTCCATTCCATTACATTCGGATTCATTCTATTCAATTCCCTTACTCTCCATTACATTCCATTGCACTCGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACATTCCATTCCATCCATTCCATTCCATCCATTCCATCCATCACATCGGTTGGTCATTCCATCATCNTCATCATCCATCGATGATCNTCATCATCGTCATCA"
],
["TCAGTTTATTTTTATTTTATTTTATTATTTTTTATTATACTTTAAGTTTTAGGGTACATGTGCACCTTGTGCAGGTTAGTTACATATGTATACATGTGCCATGCTGGGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACGTTTTGCCCTTTTGCTCTGTATTGAGGTCAGAAAATGTCCAGAGTCAAGAAAGCACCAATTTAGGGTCCACTTTGATGTATTTTCCTTCTGTCTGGCTCTTCAAGTTATGGTTGCTCCCCATTGCCTTCAAACATCTGATG",
"TCAGCAGAATAAAATATATATTTGATGTACTTTCATATTTTATATACAGTATATAATACATGCTTTGGATACTTTTGATATTTTTTTGTTGGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTGTATAGTTTGGGTACTTTGATATTTTATATACACTATAGAATATATATCTGGTGTACTTTGATATTTATGTACAGAATAAATATATATTTGATGTCTGAGCGGGCTGGCAAGGCN",
"TCAGTCTCATAAAATTCAGAATACATTCTTCATATCCAAATAGACCTACATTTTATATAACTACCCTCACACTTTAAATTAAAAAAAGAAAAAGTTCCAGATCTGACTTTGATATGTCTAGGTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTTGAATGAATGTTCTTTTTCTATAACACGTAACAGTGGTATTGGGTTACATTTGTTGAACGAGGCCTGTTTGCCCTGTTCCCTCTCTCTGGACTCTTGGCTCCTCTCTGTGAGCCATCAGA",
"TCAGATGCCATTTTGGTGCAGTTTTTCCATTATGTATTTTTTTCTTATGAGTAATACCTTGTTTCTTGAGGGCCAGTCTACTATGTGTCCTCACAGTGCCTAGAATGTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTCGGTTCCAACTTGTTATTGATATATATGTATTTTTTATTTTTTTAGTACAGGGTCTCACTCTTCTGCCCAGGCTGGAGTGCAGTGGCATGATCCTGGGCTCACCAACCTCCGTCTCCCGGGCTCATGCGATCCC",
"TCAGGCTAACTGAAATGAAAGAGCTTTGTTCCCAAAAGATTCATTTATGACAATGTTACACTACCCTAGCCGTCCTTGGCTGACCATAAAAGGACTTGTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACGCATCATGCTTTTTTGTTTCATAGAAGAAAAGAGTCCAGAGAAGTAAGTAAGCAGGCTGTGTGCCTGTCCCCCAGCTATTCATTGCTTATACCATCCCCTGAGCGGGCTGGCAAGGCN",
"TCAGTGATATTGAATAATAAGCACCTGCTATGTACTAAGCAATGAATTGGGTATTCAGACTATAGAGAGAATAAAGTACAGACTCCATTTTTAAGGAACTGGCCAATTTACAGGGGATAGTTGGAACCGAAAGGGTTTGAATTCAACCCTTCGGTTCCAACTTTGTTTTCTTTTCTTTGTCTATTCTAGAACCACACTATAAACCTTACTCTTTATTTGTAATTCTCCAGGTCCTACAGTCTTTGAACTCTGATCAAATGCCTGAGCGGGCTGGCAAGGC",
"TCAGGTTTTTCTCCAAACAAGTAATTGCATTTTGCAGTTCTTTTAAGTCACTTTATATGAAGATACAAGCCATCAAGTAGCTTTTGCTATAGAGATTTAAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTGTTGTTGTTTGGTTTTGCTTTAAGTTCTGGGATACATATGCAGAACATGCAGGTTTGTTACATAGGTATAAGTGTGCCATGGTGGTTCCTGCACCTATCGACCCATCCTCTCAATTCTCCCTTCCCCCGCTCCTCACCCCTC",
"TCAGTGGTTCATTAAGAAAACATGTGTTCTGGGGCGTTTGTCTGTGATAGTCTTCACCTGTCATTTTCAACCAGCCTCAGCCTATCTGCTCAGTCACAATCACTACTAAAATATGTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTAGTTATTTCTTGGAGCATTGCCCTTAAGCTACTGTATTATATCCCAAATTGCTTTTCTCAAATAACAGTCTGCCTGTTGGAAACTGAGCGGGCTGGCAAGGCNN",
"TCAGTTTAAGGCTATTTAAAGCAGTGATTCTGCTATTGTTATAGTGCCTTAGTATTTATCATATTACTGGCTTTGCTTGATGTAATGGAGTATGTCTCTATTCTTCCCATCATTATACATCATGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCTTTACATTTGGTTTGTTTTGTCAATGGCTGGTACCGGGTTTCCTTTCCATGTTAGTGCTTCCTTCAGGAGCTCCTGGAAGGCAGGCCTGGTGGTAAGAGTCTCTCAGC",
"TCAGGGTAGGATTGTTGTGATGATTAAATGATGTAATATGTAACAGCTTTAGCATCTAGAGAGCACACATTACCTTTTAATTCTCTTTGAATATATTTAATATGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACGTAGATATATCTTTTGTGAAAGGAACAGTCAATCAATGCAGCAAACTTCACTATTGTCTTATTTCGAGAAATTGCCACAGACCACCCTAACCTTCAGCAACAATCATCCTGATCAGTC"
],
["TCAGAGTCATCTACATTAGGTATTTTTCCTAATGCTCTGCCTCCCCTAGCACCCCACTCCCCAACAGGCTCTGGTATGTGATGTTCCCCTCCCTGTGTCCATGTGTTCTTCTTGTTCAACTCCCACATGAGTGAGAACATATGGTGTTTTGTTTTCTGTTCCTGTGTTAATTTGCTGAGAATGATGATTTCCAGCTTCATCCATGTCCCTGCAGTTGGAACCGAAAGGGTTTGAATTTCCAAAACCCTTTTCGGTTCCAAACGAGTATGACCC",
"TCAGTTAACTCCTCATTTACATTAGGCATATCTCCTAATGCTATCGCTCCCCCCTCCCCCCACCCCACTACAGGCCCCGGTGTGTGATGTTCCCCTTCCTGTGTCCAAGTGTTCTCATTGTTCAGTTCCCACCTATGAGTGAGAACATGCGGTGTTTGGTTTTTTGTCCTTGTGATAGTTTGCTGAGAATGATGGTTTCCAGCTTCATCCATGTCCCTACAAAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCAGGAGCGTGAAAATGGAC",
"TCAGGTCATTTAGCATTAGGTATATCTCCAAATGCTATCCCTCCTCCCTCCCCGACCCCACAACAGTCCCCAGTGTGTGATGTTCCCCTTTCTGTGTCCATGTGTTCTCATTGTTCAATTCCCACCTATGAGTGAGAACATGCGGTGTTTGGTTTTTTGTCCTTGCGGTAGTTTGCTGAGAATGATGGTTTCCAGTTTCATCCATGTCCCTACAAAGGACAAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCTTTTAAGCTGCTGTCCTTTGG",
"TCAGCTACATTAGGTATTTCTCCTAATGTTATCCCTCCCCTACACCCCCACACCCCACAGGCCCCAGTGTGTGATGATCCCCTCCCTGTGTCCATGTGTTCTCATTGTTCAACTCCTGCTTATGAGTGAGAACATGCGGCGTTTGGTTCTCTGATCTTGTGATAGTTTGCTGAGAATGATGGCTTCCAGCTTCATGCATGTCCCTGCAAAGGACATGAACTCATGTCCTTTTTTATGGCTGC",
"TCAGATTTAGCATTAGGTATATCTCCTAATGCTATCCCTCCCCTCTCCCCCCACCCCACGACAGTCCCCGGAGTGTGATGTTCCCCTTCCTGTGTCCATGTGTTCTCATTGTTCAATTCCCACCTATGAGTGAGAACATGCGGTGTTTGGTTTTTTGTCCTTGCCATAGTTTGCTGAGAATGATGGTTTCCAGCTTCATCCATGTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCTTATGGCTCTGTGGACATGTATG",
"TCAGTAGCATTAGGTATATCTCCCAATGCTATCCCTCCCCTGTCCCCCGACCACACAACAGTCCCCAGAGTGTGATGTTCCCCTTCCTGTGTCCATGTGATCTCATTGTTCAATTCCCACCTGTGAGTGAGAATATGCGGTGTTTGGTTTTTTGTTCTTGCGATAGTTTACTGAGAATGATGATTTCCAATTTCATCCATGTCCCTAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTCTCAAAAACTGAGCGGGCTGGC",
"TCAGTAACTCGTCATCTAGCATTAGGTATATCTCCCAATGCTATACCTCCCCTCTCCCCCACCCCACAACAGTCCCCAGAGTGTGATGTTCCCCTTGCTGTGTCCATGTGATCTCATTGTTCAATTCCCACCTATGAGTGAGAATATGCGGTGTTTGGTTTTTGTTCTTGCGATAGTTTACTGAGAATGATGATTTCCAATTTCATCCATGGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACACTGGGAATCACTTAAAG",
"TCAGAACTCGTCATTTAGCATTAGGTATATCTCCTAAAGCTATCCCTCCCCCCTCCCCCCACCCCACAACAGTCCCCAGTGTGTGATGCTCCCCTTCCTGTGTCCATGTGTTCTCATTGTTCAATTCCCACCTACGAGTGAGAATATGCGGTGTTTGGTTTTTGTTCTTGCAATAGTTTACTGAGAATGATGATTTCCAATTTCATCCATGTCCCTACAAAGGACATGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCTTATGTAATTTTTAGAG",
"TCAGGTCATTTAGCATTAGGTATATCTCCTAATGCTATCCCTCCCCCTCCCCCACCCCACAATAGTCCCCGGTGTGTGATGTTCCCCTTCCTGTGTCCCTGTGTTCTCATTGTTCAGTTCCCACCTATGAGTGAGAACATGCGGTGCTTGGTTTTTTGTCCTTGAGATAGTTTGCTGAGAATGATGGTTTCCAGCTTCATCCATGTCCCTACTTAATGTTACATAAATGTTATCATAATCTAGGTCTCCATCCACAACTTGTC",
"TCAGCTGCATGCGTTAGATATTGGTCCTAAATGCTCCTACCCTCCCCTTGCCTCCACCCTCAACAGGCCCCGGTGTGTGATGTTACCCCCTCCCTGTGTCCAATGTGTTCTTATCGATCAACTCCCACTTATGAGTGAGAACATGCGGTGTTTGGTTTCTGTTCCTGTGTTAGTTTGCTGAGAATGGATGGTTTCCAGCTTCATCATGTCCCTGCAAAGGACATGAACTCAATTCTTTTTCATGGCTGCCAGAG"
],
["TCAGATGAGGAGTGCACACACCCACATTCCAGTCTTAGTCAAAATCACCAATCCATACACTATTTTGTGGTGTCTTCAATGTATGTATTTTCTGATCATCGCACTTGGCTATAGAGTGCAATGTTAACAAGCACTTCCGCCTTGAGAGCTGTATTTTCATGATGAATGCCCCTGCTTGCATTTGCATGTGGTTGGGACAGTTTTATGCTACGGTTATCACCTTGGTTGGAACCGAAAGGGTTTGAA",
"TCAGTAAGAGTTGGAGTCAGGCACCTAATGTAGATCTTGAACAGAGTCCTTGCTCTTATTCACTCTGCTCTGTCGTCTTAGTTCCTGCAGTCTCTCACTTTGTCATCTTGCCCCTCACCTTGTTCTCAGGGCTTTGGCTGCTTGCTTGCCATGCCAGTGAGAGCTGCTGTGCTTCCTTAGGAACCTGCTTCAGCAACTCCAGCCAGACTTCTGAATTGTTGGAACCGAAGGGTTTNAATTC",
"TCAGTAAGAGTTGGAGTCAGGCACCTAATGTAGATCTTGAACAGAGTCCTTGCTCTTATTCACTCTGCTCTGTCGTCTTAGTTCCTGCAGTCTCTCACCTTGTCATCTTGCCCCTCACCTTGTTCTCAGGGCTTTGGCTGCTTGCTTGCCATTGCCAGTGAGAGCTGCTGTGCTTCCTTAGGAACCTGCTTCAGCAACTCCAGCCAGACTTCTGAATTGTTGGAACCGAAGGGTTTNAATTC",
"TCAGTAGCTGAAGCACATTCTAATCTCTAGGTCTGTCTCTATCTCTGTCTTTCTAAATTATCTATACTATTTCTATACCTATACCTATATCTCTCTACATATGTAGCTCAGAAACTTTGTACTTGCTGTTTCCTCTTTCTGGAACATTCTTTCCCCCAAATACATGGATGAGGCCTTCTGACACTATAGCAGTCCCTAACAGCAGCTGTGGGCTCTCCTGTGATTCTCATAGTTGGAACCGAAAGGGTTTG",
"TCAGTTACGATACTCTATAAACCCTCACTTTCAACTGAGGTGAGAGGAAGAGCTAGCTATTCAGCTGTGGCTTCATTTTTCCTTAATAATTTCTTTATTTCTTTATACATATTATAATAATGTATTATATTCAGATTGATGACAATTTATCATGATTGTGACATATGATTTGGAAGTTTTCCTTTGTCAAATTTTGAGGTGATAATATTTGACATTCTCTTTTCCATTCTGCTTTGATGAATGTTGGAACCGAAAGGGTTTGAA",
"TCAGGGCCAAAGTTTCTTCTTTAAGACCTCCCTCTTGCTGATGGTCTCATGCATTCTGTTTGCTCACTGTGTTCCAGGATCTCTCTCTAACTCATTTCACCTCTTTATTTTCTCTGACAGCTTTATTTTGACCTTGTAACATGTGCTTGTTTCCTCCAATCTGGAAATGACAAGTCAAAAATAAATCAGCATTTCTCTTAATTTTGCCATTCCTGCCTGCCCCACATATTGTCTCCTTGCCAGTTGGAACCGAAAGGGTTTGAA",
"TCAGTTGACAATTTGATTCCATTCGATGATGATTCCATTTGAGTTCATTCGATGATTCTATTCGATTCTCTTCGATGGTGATCCAATTCTATTATATTGGATGATTCCATTCGATTCCATTTGATGTTGATTCAATTCGATTCTATTCGATGATGATTCCATTGGATTTCACTTGATGATTCTATTCGATTCCATTCAATGATGATTCACTTCTCGTTGGAACCGAAAGGGTTTGAA",
"TCAGGAGCCAAAAGAATTGGGACTGTCTGCTGTAGTGACCAGATATGGTCAGGGGATCTGGCTTCTAGTGCCAGCTCTGCTGCCTGCTGTGTGATCTGGAACAACTCGCTTCACATCTCTGGGAGCTGCTGCTTCTGTAAAGTGGTGACATTAACATCTCAATGACACAGGAAATTTCTAAGAATCTCTTTTTTACNCTTTCATAAGGTGCCAATGTCTCCTTTGTTGGAACCGAAAGGGTTTGAAA",
"TCAGTCATTCGATGATGATTCCATTCAACTCCATTCGATGTTTCCATTCGAGTTCATTCTATTATTCCATTAGATTCCATTCGATGATGATTCCATTCGATTCCATTTGATGATTGCATTCTATTTCATTTGATGATGATTCCGTTCGAGTCCACTCGATGATTCCATTCGAGTCCATTTAATGAATCCATTGGTTTCAATTCTATGATGATTACATTGGTTGGAACCGAAAGGGTTTGAA",
"TCAGTGATAATTCCATTCGTTTCAATTCGATGGTGTTTCCATTCGATTCATTCGATGTTGATTCCATTAGCTTCCGTTGGATGATGATTCCATTCGGGTCCATTCGATGATGATCACACTGGATTTCATTCCATAATTCTATTCGATTCCATTCGATGATGATTCCATTCATTTCCATCCGATGATGATTCCATTCGATTCCGTTCAATGATTATTCCATTCGAGGTTGGAACCGAAAGGGTTTGAA"
],
["TCAGGTTTGGGAACCAAAAAGGGTTTTGAATTCAAACCCTTTCGGTTCCAACAATTTCATTCACAAATGTACTACTCTGTCTCAAAACATCGCACATGATCATGCACTGTACTAAAGCCATTAGATCAGTTCTTCAGTCAGGTTAAAGAAGTATCCCTCTAATAACTGACATTTATAATGCTATCAATATCCACTCCAATCAGTCTGCCATTGTTAATGGTGTACAGCATTACTGAATACATGGATTGATGACGCC",
"TCAGATAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTATGTCATATATACATATGTGTATGTGTGTATGCATGGACACACATTTATAAATACACATAAGTATATGATATATAAACATATATATAGGAAATTCTATAATAGCCAACATGCAACATACATTGGATAATAACCAACATATTTATAATATCCAATCTGTTTTTTAAAATGTATATTATCTAACATATAATATATACATTACAA",
"TCAGCAGGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACGGAAGATTCTTCTTTCTTAGTTCACATGTGCCCAAAAGCACCATGATGCAAGGAAGTGAACTGAGGTGGTTGATTTCAATGATGTCCCTAGGAACAGAGGTGAGGAACTAGGAAGATAAACACAAACCAGTTCAAGGTACATTGTACAAGTAGATTCTCTGTTGATTTCTTATTAAAAAATAGCACTGAGCGGGCTGGCAAGGC",
"TCAGTTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTTTAAATCATATTTACTAATTTTACTATACCTTATGAAAACTACATCTTGTATTCACAATTTTGCACGGCTGATTGTTATAAGAATTTTCTAAAGACTAGCTTCTGAGACCATACATTTCAAAACTCCTTATTCTGGATACGCACTTACCTCCAGTGCGGGTGGCTTGAGCTGAGCGGGCTGGCAAGGC",
"TCAGTTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTTAAATCTCCATAGATTCCCTCATTGCAAAGTTTATGGAGAGGATAGAAGCCATCTAAAACAAATTTCTACAATGTCTAACTTACCATATTATTTTATTCACTCTCTCTTCTTTCTCTTTTCTAGCCTGAGCGGGCTGGCAAGGC",
"TCAGAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACAAGATATTTCCCTTTTCACCGTAGGCGTCAAGGCGCTCCAAATGTCCACTTCCAGATAGTATAAAAAGAGTGTTTCAAACCTACTCTGTGAAAGGGAATATTCAACTCTGTGACTGGAATGCAGATATCACAAGGAAGTTTCTGAGAATGCTTCTGTCGAGATTTTTATATCTGAGCGGGCTGGCAAGGCNN",
"TCAGATACGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCATTTTTTCCTAAATGTAAATGTGTTCCAAAAAGTAAAATTTATTAATTTTTAAAATGTACATTCATATCAAAAGGCCTATCAAAATAATAACATTTATTGCTAAAATTAAAGACATTTAAGAATAATTCTGACTATATGCAAATGTGGGTTTATGGGATACTCTTTTCTTGAGCGGGCTGGCAAGGCN",
"TCAGTTTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTTGAATCTAATATTTTGGAAAGTACAACAAAGAAAAAAATGAAATTACAATAAATAGAAACTATCCAGAGATAACCACAGTGATATTTCCTAACTATATTTTTTAAAAAATGTTTGTGATATAGATGTGTGTTGAGGTCTGCTGAGCGGGCTGGCAAGGCN",
"TCAGCCTTAGCCTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACATGAAGATGGAAATCTCTCTTCTTTTCTCAAAAGCTTCTTCAATGAATAGGAGGCATTCAGTAGCCATGATTACTTTGAGCTAAACTGAAAATGAGAGGCCCAAAAGTACCTAAATTTCTCATGTTCTAATATATAGCGGCTCTCAACATTGCCTCATTGCCTGCATAGTCCTGAGCGGGCTGGCAAGGCN",
"TCAGTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTATTTGTACTCCTGTGTTCATAGCAGCATTATTCACAATAGTAAAATGCGGAAGGTAACCCAAGTGTCCATCAACAGATGGATAAGGAAAATGTGGCGTACGTACAATGGAACATTAATTCAGCCATGAAAAGGAAATTTGATACGTGCTATATAACATGGATGAACCTTGAGGATTATGCTCAGTGACTGAGCGGGCTGGCAAGGC"
],
["TCAGATGTTCAAGTGAAATATTTTTATTTTTATTGAGATGGAGTCTAGCTCTGTCACCCAGGCTGGAGTGCAGTGGCACGATCTCAGCTCACTGCAACCTCTACCTCCTGGGTTCAAGCTATTCTCGTGCCTCAGCCTCCCGAGTAGTTGGGATCACAGGCACCTGCCGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCAGGCTGGAATGCAGTGGTGCAATCTTAGCTCATGTCAACCTC",
"TCAGAGATATTCAGATGCTGGCTTTTTTTTTTTCTTTTTGTAGACAGAGTTTCGTCTCTTGTCACCCAGGCTGGAGTGCAGTGGTGGGATATCAGCTCACTGCAACCTCCACCTCCCGGGTTCAAGTGATTCTCCTGCCTCAGCCTCCCCAGTAGCTGGGATTACAGGCACCTGCCACCACGTTGGAACCGAAAGGGTTTGAATTCAACCCTTCGGTTCAACCAATAAAGTCATTGGAACCTGAGCGGCTGGCAAGGC",
"TCAGGCATTTGTCTGCAGTTAATTTTTTTCTTTTTTTTGAGACGGAGTCTTGCTCTGTTGCTCAGGCTGGAGTACAGTGGCATGATCTTGGCTTACTGCAACCTCTGCCTCCCAGGTTCAAGCAATTCTCCTGCCTCAGCCTCAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTTGCTTGAGCAGAGGGCCAGGTGCTGAGCGGGCTGGCAAGGC",
"TCAGTTGTTGTTGTTGTTGTTTTGTCTTTTTGAGATGGAGTCCCGCTGTGTCACCCAGGCTGGAGTGCAGTGGCACAATCTCAGCTCACTGCAACCTCCACCCCCGGATTCAAGCAATCCACCCACCTCAGCCTCCCAAGGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACAGTCTGAGCGGGCTGGCAAGGC",
"TCAGTCACTTCTTTAAGGCTCAAGCATTTTTTTTTTCTTTTGAGACAGAGTCTTGCTCTTTCACCAGGCTGGAGTGCTGTGGCATGATCTCGGCTCACTGCAAGCTCCGACTCCCTGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCAAGTAGCTGGGATTACAGGCATGTGCCACCGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACAATTGTGTTTCGCCTGAGGTCTGAAGGCTGCATAGCCCGC",
"TCAGATAAAATAACCACAACTATATATATATATTTTTTGAGACAGGGTCTCACTCTGTCCCCCAGGCTGGAGTGCAGTGGTGCCATCACCGCTCACTGTAGCCTCTACCTCTCCGGTCTCGGGTGATCCTTCCACCTCAGCTTCTCGAGTAGCTGGGACTACAGGCATGTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCTCACCCACAGCACTGCTCCCAAAGCTCTGAGCGGGCTGGCAAGGC",
"TCAGAATTATTAGTGTTATTATTATTGCTATTATTATTTTTCAGATGGAGTCTTGCTCTTGTCACCCAGGCTGGAGTGCAATGGTGCCATCTTGGCTCACTGCAACCTCCACCTCCCAGGTTCAAGCAATTCTCCTGCCTCAGCTTCCCGAGTAGCTGGGATTACAGACTTGCCCCAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACAAGTCTTTGCACATGCCTATGTCCTGAATGGTATTGCCTTAGG",
"TCAGAAAACAAAGGAAGCCTATTTTTTTTGAGATGGAGTCTCGCTCTGTCACCAGGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTGTGCCTCCCGGGTTCAAGTGATTCTCCTGCCTCAGCCTCCCAAGTAGCTGGGACTACAGGCATGCGCCACCACACCTGGCTAATTTTTGTATTTTTAGTAGAGACGGGGTTTCACCACTGAGCGGGCTGGCAAGGCN",
"TCAGTTGTTTTGTTTTGTTTTTGAGATGGAGTTTCACTCTTGTTGCCCAGGCTGGAGTGCAATGGCACAGTCTGAGCTCACTGCAACCTCTGCCTCCTGGGTTGAAGTGATTCTCCTGCCTCAGCCTCTCAAGTAGCTGGGATTGCAGGAACACGCCACCGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCCAGGTTGCCGGTTCCAAAGCCTCTGCACTCAGCAACCTGAGCGGGCTGGCAAGGC",
"TCAGGAGACAGGGTCGCACTCTGTCGCCCAGACTGGAGTGCAGTGGTGTGATCTCAGCTCGCTGCAACCTCTGCCTCCCAGGCTCAAGCAATTCCCCTGCCTCAGCCTCCTGAGTAGCGTGGGATTACGAGGTTGGAACCGTAAAGGGTTTGAACTTCCTAAACCCTTTCGGTTCCAACAGAGGCTCCCTCTGTCACCCGAGGTGCTGAGGCGGGCTGGCAGGC"
],
["TCAGATGATGTTGGAGAACTAGAAAGGAGGAGCATTCAAATAGTGTGTGGTACATGACAAGGACTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTTAAAACAATCTTAAACTTAAACTTCAGAAAAAGTGGTTTTATATATTATATATATAAATATATATAACATATAAATATACATAATATATTTATATATTAATTATTAATTTATTATTAATATATTATATAAATATATACATTATATATCAATTACTATTAATATATAATAATTAATA",
"TCAGACATACCTTTTACTTTCTACATATATGGCAAGATATTTCATTTATAGTTGTGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACAAGGAAATTTTCATTCTTGAGACAAATGTAGATTCGTTAAATTATAAGTATTCATTATACTTATAATTTTAACTATAATTAAATTATACTATAAGTATTCATTGAAAGTACTGATACATGAGCATCTATGAAATGAGGTACATGACTGCTATNACTACATTATAGAGCACA",
"TCAGCATATAGATGCATACTATCTATCTAAAAATACCCATTTTTACGCCAATTAATCTTTGGGGCGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTCATTTTCTAGGCTTATTTAGAGGAACTGGTCTATTTACAGATGTCATTCCTATCTCCTTATCACTGTCTGAAATTGAGGAAAAAAATATTTCTACTTTTACCTCTTCATACTCAGTTATGTTGGATGGACTTCCTCAGAATTTAAATTGGTCAGTGTCTAATTCTCCACTTTGAAATAAAG",
"TCAGAAATCAAAATAAATATCCATTCTGCCATTTCTAACCATGTGAACTTGTGTATGTTGCTTAATGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACATGCGTTAAGTCAGTATTAATAGTCACTTTTAAAATATATTAACAATTATTATGATGAAACAATTATAATCTAACAATAATTGAAATAATGTATTATAAACAATATATTCTGTATAAAATAAATATATTATAATAACTATAATATGCTATTATTTATATAATAATATACA",
"TCAGTTCCATTCGAGTCCATTCGATGATTCCATTCGAATCCATTCGATGATGATTGCGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACATTCCATTCGGTTCCATTTGATGATGATTCCTTTGAATTCCATTTGATGACAATTCCATTCAATACCAATTGATGATGGTTATTTTTGATTGCATTTGATGATGATTACATTCGATTCCATTTGATCATAATTCCATTCGATTCCACTCGA",
"TCAGATACTATCTTATAACACACTATTTTAAGCTGACAATGTTAAGTCAGGTTATGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACAGGCTTTCATGTTATGATAACTTAATCATACTTTCTAAATTTGTTTACAACTGGCTTTTTTCTATTCAGCCTTATGTTCTAGGATTTTTCTGTACTTTTTCATGTACCAATAATTTACTCATTTTCACTGCTATATCTGAGCGGGCTGGCAAGGC",
"TCAGAAAAAAATCTACTTTTGTAAGTTAGAATAGGACATCTCTGCTGTCATGCGAGTATCAACAGACTTGGGGGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCAGGGATTAAATATTCTTTGGTGCAATTGAATCTGTTTTCTTTTAATTTCAGAATATACTATTTCTAACTACCTGTCATATCTCCTTGAGTTATTCTAATGTTTGATACCAGTTCAATCTAAGCATTATGTCCTCTACATTAGCATACAATTAGATACCATTGG",
"TCAGATACTTTGGGTACTTTGATATTGTATGTACAGTATACAATATATACTGTACGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACCTGTACATAAATATGAAATTACATCAAATATATATTATATTAGGTAGATAAATACGAAGTACATCAATATAGATTATATACTGTACATAAATATCAAGTACCCATATATATATATACTGTACATGAATATCAAGTCACAACTATATATATGTACTGTACATAA",
"TCAGAGATCAGAGCATGTGTTTCCACGCCAAACAGAAGGTTTTTGAGAAGCAGAGAACATTATGCTGTAGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACATAGTAAATATTTTTTATGATCTCTGCTGCAAATAATTCTGCCATTGAATGAGAGTATTTGTGTTCTAACAAAAATTTAAGTATGAATATCAAAATTTCAATTTAATATAATTTCACATATCAAGAGATCTTTATTTTTTAAATGTTAGCCATTTAAAAATAGTC",
"TCAGCAGGCAATTATTTAAATATACATGCATCTCTTCCAATTCTACTTGTTCTGTGATCTAGGTTGGAACCGAAAGGGTTTGAATTCAAACCCTTTCGGTTCCAACTACTACTATTAATCTGTAAGCCCTTCCCCAAATGTCTTAGAGTAACATGATTTTAATAATATAGAGCAACCTTTCACAAATGTTGATTATGAAAGACTTTTTATAATGATAATGTATGAATAAGACACTAATCAAAGCTCCTGATATATAACATATGATGAG"
]
]
avg_jac_lst = []
print(len(result_arr[0]))
for j in range(len(result_arr)): #outer list
jac_lst = []
for k in range(len(result_arr[j])):
jac_sim = jaccard(query_lst[j],result_arr[j][k],6)
jac_lst.append(jac_sim)
avg_jac_lst. append(statistics.mean(jac_lst))
print(statistics.mean(avg_jac_lst))