8
|
1 static char* scanner_version="$Id$";
|
6
|
2
|
|
3 using namespace std;
|
|
4
|
7
|
5 enum state {// url decoder states
|
|
6 u_init,
|
|
7 u_http,
|
|
8 u_sla,
|
|
9 u_url,
|
6
|
10
|
7
|
11 // html entity decoder states
|
|
12 e_init,
|
|
13 e_amp,
|
|
14 e_num,
|
|
15
|
|
16 // mime decoder states
|
|
17 m_init,
|
6
|
18 m_eq,
|
|
19 m_1,
|
|
20
|
7
|
21 // base64 decoder states
|
|
22 b_init,
|
6
|
23 b_lf,
|
|
24 b_lf2,
|
|
25 b_64,
|
|
26
|
7
|
27 // counter for number of columns in the table
|
|
28 end_state,
|
6
|
29
|
7
|
30 // temporary mime states
|
|
31 u_reco,
|
|
32 e_semi,
|
|
33 m_2,
|
6
|
34 m_cr,
|
|
35 m_nl,
|
|
36 b_cr,
|
|
37 };
|
|
38
|
|
39 typedef state PARSE[end_state];
|
|
40
|
|
41 static PARSE parse_table[256] = {
|
7
|
42 // u_init, u_http, u_sla , u_url, e_init, e_amp, e_num, m_init, m_eq, m_1, b_init, b_lf, b_lf2, b_64
|
6
|
43
|
7
|
44 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x00
|
|
45 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x01
|
|
46 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x02
|
|
47 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x03
|
|
48 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x04
|
|
49 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x05
|
|
50 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x06
|
|
51 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x07
|
|
52 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x08
|
|
53 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x09 <tab>
|
|
54 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_nl, m_init, b_lf, b_init, b_lf2, b_init, }, // 0x0a <lf>
|
|
55 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x0b
|
|
56 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x0c
|
|
57 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_cr, m_init, b_init, b_init, b_init, b_cr, }, // 0x0d <cr>
|
|
58 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x0e
|
|
59 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x0f
|
|
60 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x10
|
|
61 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x11 xon char
|
|
62 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x12
|
|
63 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x13 xoff char
|
|
64 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x14
|
|
65 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x15
|
|
66 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x16
|
|
67 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x17
|
|
68 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x18
|
|
69 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x19
|
|
70 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x1a
|
|
71 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x1b
|
|
72 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x1c
|
|
73 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x1d
|
|
74 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x1e
|
|
75 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x1f
|
|
76 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x20 space
|
|
77 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x21 !
|
|
78 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x22 ""
|
|
79 {u_init, u_init, u_init, u_reco, e_init, e_num, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x23 #
|
|
80 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x24 $
|
|
81 {u_init, u_init, u_init, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x25 %
|
|
82 {u_init, u_init, u_init, u_reco, e_amp, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x26 &
|
|
83 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x27 '
|
|
84 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x28 (
|
|
85 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x29 )
|
|
86 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x2A *
|
|
87 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x2B +
|
|
88 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x2C ,
|
|
89 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x2D -
|
|
90 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x2E .
|
|
91 {u_init, u_sla, u_sla, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x2F /
|
|
92 {u_init, u_init, u_url, u_url, e_init, e_init, e_num, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x30 0
|
|
93 {u_init, u_init, u_url, u_url, e_init, e_init, e_num, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x31 1
|
|
94 {u_init, u_init, u_url, u_url, e_init, e_init, e_num, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x32 2
|
|
95 {u_init, u_init, u_url, u_url, e_init, e_init, e_num, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x33 3
|
|
96 {u_init, u_init, u_url, u_url, e_init, e_init, e_num, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x34 4
|
|
97 {u_init, u_init, u_url, u_url, e_init, e_init, e_num, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x35 5
|
|
98 {u_init, u_init, u_url, u_url, e_init, e_init, e_num, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x36 6
|
|
99 {u_init, u_init, u_url, u_url, e_init, e_init, e_num, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x37 7
|
|
100 {u_init, u_init, u_url, u_url, e_init, e_init, e_num, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x38 8
|
|
101 {u_init, u_init, u_url, u_url, e_init, e_init, e_num, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x39 9
|
|
102 {u_http, u_http, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x3A :
|
|
103 {u_init, u_init, u_init, u_reco, e_init, e_init, e_semi, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x3B ;
|
|
104 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x3C <
|
|
105 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_eq, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x3D =
|
|
106 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x3E >
|
|
107 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x3F ?
|
|
108 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x40 @
|
|
109 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x41 A
|
|
110 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x42 B
|
|
111 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x43 C
|
|
112 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x44 D
|
|
113 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x45 E
|
|
114 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x46 F
|
|
115 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x47 G
|
|
116 {u_http, u_http, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x48 H
|
|
117 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x49 I
|
|
118 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x4A J
|
|
119 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x4B K
|
|
120 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x4C L
|
|
121 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x4D M
|
|
122 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x4E N
|
|
123 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x4F O
|
|
124 {u_http, u_http, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x50 P
|
|
125 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x51 Q
|
|
126 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x52 R
|
|
127 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x53 S
|
|
128 {u_http, u_http, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x54 T
|
|
129 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x55 U
|
|
130 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x56 V
|
|
131 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x57 W
|
|
132 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x58 X
|
|
133 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x59 Y
|
|
134 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x5A Z
|
|
135 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x5B [
|
|
136 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x5C brace
|
|
137 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x5D ]
|
|
138 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x5E ^
|
|
139 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x5F _
|
|
140 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x60 `
|
|
141 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x61 a
|
|
142 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x62 b
|
|
143 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x63 c
|
|
144 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x64 d
|
|
145 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x65 e
|
|
146 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_1, m_2, b_init, b_64, b_64, b_64, }, // 0x66 f
|
|
147 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x67 g
|
|
148 {u_http, u_http, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x68 h
|
|
149 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x69 i
|
|
150 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x6A j
|
|
151 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x6B k
|
|
152 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x6C l
|
|
153 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x6D m
|
|
154 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x6E n
|
|
155 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x6F o
|
|
156 {u_http, u_http, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x70 p
|
|
157 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x71 q
|
|
158 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x72 r
|
|
159 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x73 s
|
|
160 {u_http, u_http, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x74 t
|
|
161 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x75 u
|
|
162 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x76 v
|
|
163 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x77 w
|
|
164 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x78 x
|
|
165 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x79 y
|
|
166 {u_init, u_init, u_url, u_url, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_64, b_64, b_64, }, // 0x7A z
|
|
167 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x7B {
|
|
168 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x7C |
|
|
169 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x7D }
|
|
170 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x7E ~
|
|
171 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x7f
|
|
172 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x80
|
|
173 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x81
|
|
174 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x82
|
|
175 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x83
|
|
176 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x84
|
|
177 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x85
|
|
178 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x86
|
|
179 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x87
|
|
180 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x88
|
|
181 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x89
|
|
182 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x8a
|
|
183 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x8b
|
|
184 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x8c
|
|
185 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x8d
|
|
186 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x8e
|
|
187 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x8f
|
|
188 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x90
|
|
189 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x91
|
|
190 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x92
|
|
191 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x93
|
|
192 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x94
|
|
193 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x95
|
|
194 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x96
|
|
195 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x97
|
|
196 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x98
|
|
197 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x99
|
|
198 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x9a
|
|
199 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x9b
|
|
200 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x9c
|
|
201 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x9d
|
|
202 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x9e
|
|
203 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0x9f
|
|
204 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xa0
|
|
205 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xa1
|
|
206 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xa2
|
|
207 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xa3
|
|
208 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xa4
|
|
209 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xa5
|
|
210 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xa6
|
|
211 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xa7
|
|
212 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xa8
|
|
213 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xa9
|
|
214 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xaa
|
|
215 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xab
|
|
216 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xac
|
|
217 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xad
|
|
218 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xae
|
|
219 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xaf
|
|
220 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xb0
|
|
221 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xb1
|
|
222 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xb2
|
|
223 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xb3
|
|
224 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xb4
|
|
225 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xb5
|
|
226 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xb6
|
|
227 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xb7
|
|
228 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xb8
|
|
229 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xb9
|
|
230 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xba
|
|
231 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xbb
|
|
232 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xbc
|
|
233 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xbd
|
|
234 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xbe
|
|
235 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xbf
|
|
236 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xc0
|
|
237 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xc1
|
|
238 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xc2
|
|
239 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xc3
|
|
240 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xc4
|
|
241 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xc5
|
|
242 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xc6
|
|
243 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xc7
|
|
244 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xc8
|
|
245 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xc9
|
|
246 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xca
|
|
247 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xcb
|
|
248 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xcc
|
|
249 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xcd
|
|
250 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xce
|
|
251 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xcf
|
|
252 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xd0
|
|
253 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xd1
|
|
254 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xd2
|
|
255 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xd3
|
|
256 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xd4
|
|
257 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xd5
|
|
258 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xd6
|
|
259 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xd7
|
|
260 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xd8
|
|
261 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xd9
|
|
262 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xda
|
|
263 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xdb
|
|
264 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xdc
|
|
265 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xdd
|
|
266 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xde
|
|
267 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xdf
|
|
268 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xe0
|
|
269 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xe1
|
|
270 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xe2
|
|
271 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xe3
|
|
272 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xe4
|
|
273 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xe5
|
|
274 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xe6
|
|
275 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xe7
|
|
276 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xe8
|
|
277 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xe9
|
|
278 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xea
|
|
279 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xeb
|
|
280 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xec
|
|
281 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xed
|
|
282 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xee
|
|
283 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xef
|
|
284 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xf0
|
|
285 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xf1
|
|
286 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xf2
|
|
287 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xf3
|
|
288 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xf4
|
|
289 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xf5
|
|
290 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xf6
|
|
291 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xf7
|
|
292 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xf8
|
|
293 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xf9
|
|
294 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xfa
|
|
295 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xfb
|
|
296 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xfc
|
|
297 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xfd
|
|
298 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xfe
|
|
299 {u_init, u_init, u_init, u_reco, e_init, e_init, e_init, m_init, m_init, m_init, b_init, b_init, b_init, b_init, }, // 0xff
|
6
|
300 };
|
|
301
|
|
302
|
|
303 u_char hex_decode[256] = {
|
|
304 0, // 0x00
|
|
305 0, // 0x01
|
|
306 0, // 0x02
|
|
307 0, // 0x03
|
|
308 0, // 0x04
|
|
309 0, // 0x05
|
|
310 0, // 0x06
|
|
311 0, // 0x07
|
|
312 0, // 0x08
|
7
|
313 0, // 0x09 <tab>
|
|
314 0, // 0x0a <lf>
|
6
|
315 0, // 0x0b
|
|
316 0, // 0x0c
|
7
|
317 0, // 0x0d <cr>
|
6
|
318 0, // 0x0e
|
|
319 0, // 0x0f
|
|
320 0, // 0x10
|
|
321 0, // 0x11 xon char
|
|
322 0, // 0x12
|
|
323 0, // 0x13 xoff char
|
|
324 0, // 0x14
|
|
325 0, // 0x15
|
|
326 0, // 0x16
|
|
327 0, // 0x17
|
|
328 0, // 0x18
|
|
329 0, // 0x19
|
|
330 0, // 0x1a
|
|
331 0, // 0x1b
|
|
332 0, // 0x1c
|
|
333 0, // 0x1d
|
|
334 0, // 0x1e
|
|
335 0, // 0x1f
|
|
336 0, // 0x20 space
|
|
337 0, // 0x21 !
|
|
338 0, // 0x22 ""
|
|
339 0, // 0x23 #
|
|
340 0, // 0x24 $
|
|
341 0, // 0x25 %
|
|
342 0, // 0x26 &
|
|
343 0, // 0x27 '
|
|
344 0, // 0x28 (
|
|
345 0, // 0x29 )
|
|
346 0, // 0x2A *
|
|
347 0, // 0x2B +
|
|
348 0, // 0x2C ,
|
|
349 0, // 0x2D -
|
|
350 0, // 0x2E .
|
|
351 0, // 0x2F /
|
|
352 0, // 0x30 0
|
|
353 1, // 0x31 1
|
|
354 2, // 0x32 2
|
|
355 3, // 0x33 3
|
|
356 4, // 0x34 4
|
|
357 5, // 0x35 5
|
|
358 6, // 0x36 6
|
|
359 7, // 0x37 7
|
|
360 8, // 0x38 8
|
|
361 9, // 0x39 9
|
|
362 0, // 0x3A :
|
|
363 0, // 0x3B ;
|
|
364 0, // 0x3C <
|
|
365 0, // 0x3D =
|
|
366 0, // 0x3E >
|
|
367 0, // 0x3F ?
|
|
368 0, // 0x40 @
|
|
369 10, // 0x41 A
|
|
370 11, // 0x42 B
|
|
371 12, // 0x43 C
|
|
372 13, // 0x44 D
|
|
373 14, // 0x45 E
|
|
374 15, // 0x46 F
|
|
375 0, // 0x47 G
|
|
376 0, // 0x48 H
|
|
377 0, // 0x49 I
|
|
378 0, // 0x4A J
|
|
379 0, // 0x4B K
|
|
380 0, // 0x4C L
|
|
381 0, // 0x4D M
|
|
382 0, // 0x4E N
|
|
383 0, // 0x4F O
|
|
384 0, // 0x50 P
|
|
385 0, // 0x51 Q
|
|
386 0, // 0x52 R
|
|
387 0, // 0x53 S
|
|
388 0, // 0x54 T
|
|
389 0, // 0x55 U
|
|
390 0, // 0x56 V
|
|
391 0, // 0x57 W
|
|
392 0, // 0x58 X
|
|
393 0, // 0x59 Y
|
|
394 0, // 0x5A Z
|
|
395 0, // 0x5B [
|
|
396 0, // 0x5C brace
|
|
397 0, // 0x5D ]
|
|
398 0, // 0x5E ^
|
|
399 0, // 0x5F _
|
|
400 0, // 0x60 `
|
|
401 10, // 0x61 a
|
|
402 11, // 0x62 b
|
|
403 12, // 0x63 c
|
|
404 13, // 0x64 d
|
|
405 14, // 0x65 e
|
|
406 15, // 0x66 f
|
|
407 0, // 0x67 g
|
|
408 0, // 0x68 h
|
|
409 0, // 0x69 i
|
|
410 0, // 0x6A j
|
|
411 0, // 0x6B k
|
|
412 0, // 0x6C l
|
|
413 0, // 0x6D m
|
|
414 0, // 0x6E n
|
|
415 0, // 0x6F o
|
|
416 0, // 0x70 p
|
|
417 0, // 0x71 q
|
|
418 0, // 0x72 r
|
|
419 0, // 0x73 s
|
|
420 0, // 0x74 t
|
|
421 0, // 0x75 u
|
|
422 0, // 0x76 v
|
|
423 0, // 0x77 w
|
|
424 0, // 0x78 x
|
|
425 0, // 0x79 y
|
|
426 0, // 0x7A z
|
|
427 0, // 0x7B {
|
|
428 0, // 0x7C |
|
|
429 0, // 0x7D }
|
|
430 0, // 0x7E ~
|
|
431 0, // 0x7f
|
|
432 0, // 0x80
|
|
433 0, // 0x81
|
|
434 0, // 0x82
|
|
435 0, // 0x83
|
|
436 0, // 0x84
|
|
437 0, // 0x85
|
|
438 0, // 0x86
|
|
439 0, // 0x87
|
|
440 0, // 0x88
|
|
441 0, // 0x89
|
|
442 0, // 0x8a
|
|
443 0, // 0x8b
|
|
444 0, // 0x8c
|
|
445 0, // 0x8d
|
|
446 0, // 0x8e
|
|
447 0, // 0x8f
|
|
448 0, // 0x90
|
|
449 0, // 0x91
|
|
450 0, // 0x92
|
|
451 0, // 0x93
|
|
452 0, // 0x94
|
|
453 0, // 0x95
|
|
454 0, // 0x96
|
|
455 0, // 0x97
|
|
456 0, // 0x98
|
|
457 0, // 0x99
|
|
458 0, // 0x9a
|
|
459 0, // 0x9b
|
|
460 0, // 0x9c
|
|
461 0, // 0x9d
|
|
462 0, // 0x9e
|
|
463 0, // 0x9f
|
|
464 0, // 0xa0
|
|
465 0, // 0xa1
|
|
466 0, // 0xa2
|
|
467 0, // 0xa3
|
|
468 0, // 0xa4
|
|
469 0, // 0xa5
|
|
470 0, // 0xa6
|
|
471 0, // 0xa7
|
|
472 0, // 0xa8
|
|
473 0, // 0xa9
|
|
474 0, // 0xaa
|
|
475 0, // 0xab
|
|
476 0, // 0xac
|
|
477 0, // 0xad
|
|
478 0, // 0xae
|
|
479 0, // 0xaf
|
|
480 0, // 0xb0
|
|
481 0, // 0xb1
|
|
482 0, // 0xb2
|
|
483 0, // 0xb3
|
|
484 0, // 0xb4
|
|
485 0, // 0xb5
|
|
486 0, // 0xb6
|
|
487 0, // 0xb7
|
|
488 0, // 0xb8
|
|
489 0, // 0xb9
|
|
490 0, // 0xba
|
|
491 0, // 0xbb
|
|
492 0, // 0xbc
|
|
493 0, // 0xbd
|
|
494 0, // 0xbe
|
|
495 0, // 0xbf
|
|
496 0, // 0xc0
|
|
497 0, // 0xc1
|
|
498 0, // 0xc2
|
|
499 0, // 0xc3
|
|
500 0, // 0xc4
|
|
501 0, // 0xc5
|
|
502 0, // 0xc6
|
|
503 0, // 0xc7
|
|
504 0, // 0xc8
|
|
505 0, // 0xc9
|
|
506 0, // 0xca
|
|
507 0, // 0xcb
|
|
508 0, // 0xcc
|
|
509 0, // 0xcd
|
|
510 0, // 0xce
|
|
511 0, // 0xcf
|
|
512 0, // 0xd0
|
|
513 0, // 0xd1
|
|
514 0, // 0xd2
|
|
515 0, // 0xd3
|
|
516 0, // 0xd4
|
|
517 0, // 0xd5
|
|
518 0, // 0xd6
|
|
519 0, // 0xd7
|
|
520 0, // 0xd8
|
|
521 0, // 0xd9
|
|
522 0, // 0xda
|
|
523 0, // 0xdb
|
|
524 0, // 0xdc
|
|
525 0, // 0xdd
|
|
526 0, // 0xde
|
|
527 0, // 0xdf
|
|
528 0, // 0xe0
|
|
529 0, // 0xe1
|
|
530 0, // 0xe2
|
|
531 0, // 0xe3
|
|
532 0, // 0xe4
|
|
533 0, // 0xe5
|
|
534 0, // 0xe6
|
|
535 0, // 0xe7
|
|
536 0, // 0xe8
|
|
537 0, // 0xe9
|
|
538 0, // 0xea
|
|
539 0, // 0xeb
|
|
540 0, // 0xec
|
|
541 0, // 0xed
|
|
542 0, // 0xee
|
|
543 0, // 0xef
|
|
544 0, // 0xf0
|
|
545 0, // 0xf1
|
|
546 0, // 0xf2
|
|
547 0, // 0xf3
|
|
548 0, // 0xf4
|
|
549 0, // 0xf5
|
|
550 0, // 0xf6
|
|
551 0, // 0xf7
|
|
552 0, // 0xf8
|
|
553 0, // 0xf9
|
|
554 0, // 0xfa
|
|
555 0, // 0xfb
|
|
556 0, // 0xfc
|
|
557 0, // 0xfd
|
|
558 0, // 0xfe
|
|
559 0, // 0xff
|
|
560 };
|
7
|
561
|
6
|
562 u_char b64_decode[256] = {
|
|
563 0, // 0x00
|
|
564 0, // 0x01
|
|
565 0, // 0x02
|
|
566 0, // 0x03
|
|
567 0, // 0x04
|
|
568 0, // 0x05
|
|
569 0, // 0x06
|
|
570 0, // 0x07
|
|
571 0, // 0x08
|
7
|
572 0, // 0x09 <tab>
|
|
573 0, // 0x0a <lf>
|
6
|
574 0, // 0x0b
|
|
575 0, // 0x0c
|
7
|
576 0, // 0x0d <cr>
|
6
|
577 0, // 0x0e
|
|
578 0, // 0x0f
|
|
579 0, // 0x10
|
|
580 0, // 0x11 xon char
|
|
581 0, // 0x12
|
|
582 0, // 0x13 xoff char
|
|
583 0, // 0x14
|
|
584 0, // 0x15
|
|
585 0, // 0x16
|
|
586 0, // 0x17
|
|
587 0, // 0x18
|
|
588 0, // 0x19
|
|
589 0, // 0x1a
|
|
590 0, // 0x1b
|
|
591 0, // 0x1c
|
|
592 0, // 0x1d
|
|
593 0, // 0x1e
|
|
594 0, // 0x1f
|
|
595 0, // 0x20 space
|
|
596 0, // 0x21 !
|
|
597 0, // 0x22 ""
|
|
598 0, // 0x23 #
|
|
599 0, // 0x24 $
|
|
600 0, // 0x25 %
|
|
601 0, // 0x26 &
|
|
602 0, // 0x27 '
|
|
603 0, // 0x28 (
|
|
604 0, // 0x29 )
|
|
605 0, // 0x2A *
|
|
606 62, // 0x2B +
|
|
607 0, // 0x2C ,
|
|
608 0, // 0x2D -
|
|
609 0, // 0x2E .
|
|
610 63, // 0x2F /
|
|
611 52, // 0x30 0
|
|
612 53, // 0x31 1
|
|
613 54, // 0x32 2
|
|
614 55, // 0x33 3
|
|
615 56, // 0x34 4
|
|
616 57, // 0x35 5
|
|
617 58, // 0x36 6
|
|
618 59, // 0x37 7
|
|
619 60, // 0x38 8
|
|
620 61, // 0x39 9
|
|
621 0, // 0x3A :
|
|
622 0, // 0x3B ;
|
|
623 0, // 0x3C <
|
|
624 0, // 0x3D =
|
|
625 0, // 0x3E >
|
|
626 0, // 0x3F ?
|
|
627 0, // 0x40 @
|
7
|
628 0, // 0x41 A
|
|
629 1, // 0x42 B
|
|
630 2, // 0x43 C
|
|
631 3, // 0x44 D
|
|
632 4, // 0x45 E
|
|
633 5, // 0x46 F
|
|
634 6, // 0x47 G
|
|
635 7, // 0x48 H
|
|
636 8, // 0x49 I
|
|
637 9, // 0x4A J
|
6
|
638 10, // 0x4B K
|
|
639 11, // 0x4C L
|
|
640 12, // 0x4D M
|
|
641 13, // 0x4E N
|
|
642 14, // 0x4F O
|
|
643 15, // 0x50 P
|
|
644 16, // 0x51 Q
|
|
645 17, // 0x52 R
|
|
646 18, // 0x53 S
|
|
647 19, // 0x54 T
|
|
648 20, // 0x55 U
|
|
649 21, // 0x56 V
|
|
650 22, // 0x57 W
|
|
651 23, // 0x58 X
|
|
652 24, // 0x59 Y
|
|
653 25, // 0x5A Z
|
|
654 0, // 0x5B [
|
|
655 0, // 0x5C brace
|
|
656 0, // 0x5D ]
|
|
657 0, // 0x5E ^
|
|
658 0, // 0x5F _
|
|
659 0, // 0x60 `
|
|
660 26, // 0x61 a
|
|
661 27, // 0x62 b
|
|
662 28, // 0x63 c
|
|
663 29, // 0x64 d
|
|
664 30, // 0x65 e
|
|
665 31, // 0x66 f
|
|
666 32, // 0x67 g
|
|
667 33, // 0x68 h
|
|
668 34, // 0x69 i
|
|
669 35, // 0x6A j
|
|
670 36, // 0x6B k
|
|
671 37, // 0x6C l
|
|
672 38, // 0x6D m
|
|
673 39, // 0x6E n
|
|
674 40, // 0x6F o
|
|
675 41, // 0x70 p
|
|
676 42, // 0x71 q
|
|
677 43, // 0x72 r
|
|
678 44, // 0x73 s
|
|
679 45, // 0x74 t
|
|
680 46, // 0x75 u
|
|
681 47, // 0x76 v
|
|
682 48, // 0x77 w
|
|
683 49, // 0x78 x
|
|
684 50, // 0x79 y
|
|
685 51, // 0x7A z
|
|
686 0, // 0x7B {
|
|
687 0, // 0x7C |
|
|
688 0, // 0x7D }
|
|
689 0, // 0x7E ~
|
|
690 0, // 0x7f
|
|
691 0, // 0x80
|
|
692 0, // 0x81
|
|
693 0, // 0x82
|
|
694 0, // 0x83
|
|
695 0, // 0x84
|
|
696 0, // 0x85
|
|
697 0, // 0x86
|
|
698 0, // 0x87
|
|
699 0, // 0x88
|
|
700 0, // 0x89
|
|
701 0, // 0x8a
|
|
702 0, // 0x8b
|
|
703 0, // 0x8c
|
|
704 0, // 0x8d
|
|
705 0, // 0x8e
|
|
706 0, // 0x8f
|
|
707 0, // 0x90
|
|
708 0, // 0x91
|
|
709 0, // 0x92
|
|
710 0, // 0x93
|
|
711 0, // 0x94
|
|
712 0, // 0x95
|
|
713 0, // 0x96
|
|
714 0, // 0x97
|
|
715 0, // 0x98
|
|
716 0, // 0x99
|
|
717 0, // 0x9a
|
|
718 0, // 0x9b
|
|
719 0, // 0x9c
|
|
720 0, // 0x9d
|
|
721 0, // 0x9e
|
|
722 0, // 0x9f
|
|
723 0, // 0xa0
|
|
724 0, // 0xa1
|
|
725 0, // 0xa2
|
|
726 0, // 0xa3
|
|
727 0, // 0xa4
|
|
728 0, // 0xa5
|
|
729 0, // 0xa6
|
|
730 0, // 0xa7
|
|
731 0, // 0xa8
|
|
732 0, // 0xa9
|
|
733 0, // 0xaa
|
|
734 0, // 0xab
|
|
735 0, // 0xac
|
|
736 0, // 0xad
|
|
737 0, // 0xae
|
|
738 0, // 0xaf
|
|
739 0, // 0xb0
|
|
740 0, // 0xb1
|
|
741 0, // 0xb2
|
|
742 0, // 0xb3
|
|
743 0, // 0xb4
|
|
744 0, // 0xb5
|
|
745 0, // 0xb6
|
|
746 0, // 0xb7
|
|
747 0, // 0xb8
|
|
748 0, // 0xb9
|
|
749 0, // 0xba
|
|
750 0, // 0xbb
|
|
751 0, // 0xbc
|
|
752 0, // 0xbd
|
|
753 0, // 0xbe
|
|
754 0, // 0xbf
|
|
755 0, // 0xc0
|
|
756 0, // 0xc1
|
|
757 0, // 0xc2
|
|
758 0, // 0xc3
|
|
759 0, // 0xc4
|
|
760 0, // 0xc5
|
|
761 0, // 0xc6
|
|
762 0, // 0xc7
|
|
763 0, // 0xc8
|
|
764 0, // 0xc9
|
|
765 0, // 0xca
|
|
766 0, // 0xcb
|
|
767 0, // 0xcc
|
|
768 0, // 0xcd
|
|
769 0, // 0xce
|
|
770 0, // 0xcf
|
|
771 0, // 0xd0
|
|
772 0, // 0xd1
|
|
773 0, // 0xd2
|
|
774 0, // 0xd3
|
|
775 0, // 0xd4
|
|
776 0, // 0xd5
|
|
777 0, // 0xd6
|
|
778 0, // 0xd7
|
|
779 0, // 0xd8
|
|
780 0, // 0xd9
|
|
781 0, // 0xda
|
|
782 0, // 0xdb
|
|
783 0, // 0xdc
|
|
784 0, // 0xdd
|
|
785 0, // 0xde
|
|
786 0, // 0xdf
|
|
787 0, // 0xe0
|
|
788 0, // 0xe1
|
|
789 0, // 0xe2
|
|
790 0, // 0xe3
|
|
791 0, // 0xe4
|
|
792 0, // 0xe5
|
|
793 0, // 0xe6
|
|
794 0, // 0xe7
|
|
795 0, // 0xe8
|
|
796 0, // 0xe9
|
|
797 0, // 0xea
|
|
798 0, // 0xeb
|
|
799 0, // 0xec
|
|
800 0, // 0xed
|
|
801 0, // 0xee
|
|
802 0, // 0xef
|
|
803 0, // 0xf0
|
|
804 0, // 0xf1
|
|
805 0, // 0xf2
|
|
806 0, // 0xf3
|
|
807 0, // 0xf4
|
|
808 0, // 0xf5
|
|
809 0, // 0xf6
|
|
810 0, // 0xf7
|
|
811 0, // 0xf8
|
|
812 0, // 0xf9
|
|
813 0, // 0xfa
|
|
814 0, // 0xfb
|
|
815 0, // 0xfc
|
|
816 0, // 0xfd
|
|
817 0, // 0xfe
|
|
818 0, // 0xff
|
|
819 };
|
|
820
|
8
|
821 #define PENDING_LIMIT 100
|
6
|
822 struct fsa {
|
|
823 u_char pending[PENDING_LIMIT];
|
|
824 int count;
|
|
825 state st;
|
|
826 state init;
|
|
827 fsa* next;
|
8
|
828 string_set *urls;
|
6
|
829
|
8
|
830 fsa(state init, fsa* next_, string_set *urls_);
|
6
|
831 void push(u_char *buf, int len);
|
|
832 };
|
|
833
|
8
|
834 fsa::fsa(state init_, fsa *next_, string_set *urls_) {
|
6
|
835 count = 0;
|
|
836 st = init_;
|
|
837 init = init_;
|
|
838 next = next_;
|
8
|
839 urls = urls_;
|
6
|
840 }
|
|
841
|
|
842 void fsa::push(u_char *buf, int len) {
|
|
843 for (int i=0; i<len; i++) {
|
|
844 u_char c = buf[i];
|
|
845 // guard against buffer overflow
|
9
|
846 if (count == (PENDING_LIMIT-1)) {
|
6
|
847 if (next) next->push(pending, count);
|
|
848 count = 0;
|
|
849 st = init;
|
|
850 }
|
|
851 pending[count++] = c;
|
|
852 st = parse_table[c][st];
|
|
853 switch (st) {
|
|
854
|
|
855 //////////////////////////////
|
7
|
856 // url recognizer
|
|
857 case u_sla: {
|
|
858 if ((count < 6) || (7 < count)) {
|
|
859 count = 0;
|
|
860 st = u_init;
|
|
861 }
|
|
862 } break;
|
|
863
|
|
864 case u_reco: {
|
9
|
865 if (count > 12) {
|
|
866 pending[count-1] = 0;
|
|
867 if (strncasecmp((const char *)pending, "http://", 7) == 0) {
|
|
868 urls->insert(strdup((const char *)pending+7));
|
|
869 }
|
8
|
870 }
|
7
|
871 } // fall thru
|
|
872
|
|
873 case u_init: {
|
|
874 count = 0; // discard all characters
|
|
875 } break;
|
|
876
|
|
877
|
|
878 //////////////////////////////
|
6
|
879 // mime decoder
|
|
880 case m_2: {
|
|
881 pending[0] = hex_decode[pending[1]] * 16 + hex_decode[pending[2]];
|
|
882 count = 1;
|
|
883 st = m_init;
|
|
884 } // fall thru
|
|
885
|
|
886 case m_init: {
|
|
887 if (next) next->push(pending, count);
|
|
888 count = 0;
|
|
889 } break;
|
|
890
|
|
891 case m_cr: {
|
|
892 count = 1;
|
|
893 st = m_eq;
|
|
894 } break;
|
|
895
|
|
896 case m_nl: {
|
|
897 count = 0;
|
|
898 st = m_init;
|
|
899 } break;
|
|
900
|
|
901 //////////////////////////////
|
|
902 // html entity decoder
|
|
903 case e_semi: {
|
|
904 pending[--count] = '\0'; // null terminate the digit string by overwriting the semicolon
|
|
905 pending[0] = atoi((const char *)pending+2);
|
|
906 count = 1;
|
|
907 st = e_init;
|
|
908 } // fall thru
|
|
909
|
|
910 case e_init: {
|
|
911 if (next) next->push(pending, count);
|
|
912 count = 0;
|
|
913 } break;
|
|
914
|
|
915 //////////////////////////////
|
|
916 // base64 decoder
|
|
917 case b_lf2: {
|
|
918 count--;
|
|
919 } break;
|
|
920
|
|
921 case b_cr: {
|
|
922 int cnt = 0;
|
|
923 if ((count % 4) == 1) {
|
|
924 count--;
|
|
925 // might have proper b64 data
|
|
926 for (int i=0; i<count; i+=4) {
|
|
927 unsigned long a1 = b64_decode[pending[i]];
|
|
928 unsigned long a2 = b64_decode[pending[i+1]];
|
|
929 unsigned long a3 = b64_decode[pending[i+2]];
|
|
930 unsigned long a4 = b64_decode[pending[i+3]];
|
|
931 unsigned long a = (a1 << 18) | (a2 << 12) | (a3 << 6) | a4;
|
|
932 pending[cnt++] = (a & 0x00ff0000) >> 16;
|
|
933 pending[cnt++] = (a & 0x0000ff00) >> 8;
|
|
934 pending[cnt++] = (a & 0x000000ff);
|
|
935 if ((char)pending[i+3] == '=') cnt--;
|
|
936 if ((char)pending[i+2] == '=') cnt--;
|
|
937 }
|
|
938 count = cnt;
|
|
939 st = b_lf2;
|
|
940 }
|
|
941 else st = b_init;
|
|
942 } // fall thru
|
|
943
|
|
944 case b_lf:
|
|
945 case b_init: {
|
|
946 if (next) next->push(pending, count);
|
|
947 count = 0;
|
|
948 } break;
|
|
949
|
|
950 //////////////////////////////
|
|
951 // states that just accumulate characters in the pending buffer
|
7
|
952 case u_http:
|
|
953 case u_url:
|
6
|
954 case e_amp:
|
|
955 case e_num:
|
|
956 case b_64:
|
|
957 case m_eq:
|
|
958 case m_1:
|
|
959 default: {
|
|
960 } break;
|
|
961 }
|
|
962 }
|
|
963 }
|
|
964
|
8
|
965 struct url_scanner {
|
|
966 fsa *urls_parser;
|
|
967 fsa *html_parser;
|
|
968 fsa *mime_parser;
|
|
969 fsa *b64_parser;
|
6
|
970
|
8
|
971 url_scanner(string_set *urls);
|
|
972 ~url_scanner();
|
|
973 void scan(u_char *buffer, size_t length);
|
|
974 };
|
|
975
|
|
976 url_scanner::url_scanner(string_set *urls) {
|
|
977 urls_parser = new fsa(u_init, NULL, urls);
|
|
978 html_parser = new fsa(e_init, urls_parser, NULL);
|
|
979 mime_parser = new fsa(m_init, html_parser, NULL);
|
|
980 b64_parser = new fsa(b_init, mime_parser, NULL);
|
6
|
981 }
|
|
982
|
8
|
983 url_scanner::~url_scanner() {
|
|
984 delete urls_parser;
|
|
985 delete html_parser;
|
|
986 delete mime_parser;
|
|
987 delete b64_parser;
|
6
|
988 }
|
|
989
|
8
|
990 void url_scanner::scan(u_char *buffer, size_t length) {
|
|
991 b64_parser->push(buffer, length);
|
6
|
992 }
|
|
993
|