/[suikacvs]/perl/lib/Encode/Charset.pm
Suika

Diff of /perl/lib/Encode/Charset.pm

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.1 by wakaba, Fri Sep 20 14:01:45 2002 UTC revision 1.4 by wakaba, Sat Oct 12 11:03:00 2002 UTC
# Line 67  for my $f (0x30..0x5F, 0x7E) { Line 67  for my $f (0x30..0x5F, 0x7E) {
67      $CHARSET{G96n}->{ $_.$F }->{chars} = 96;      $CHARSET{G96n}->{ $_.$F }->{chars} = 96;
68      $CHARSET{G96n}->{ $_.$F }->{ucs} =      $CHARSET{G96n}->{ $_.$F }->{ucs} =
69        ({'' => 0xF4C000}->{ $_ }||0) + 96*96 * ($f-0x30);        ({'' => 0xF4C000}->{ $_ }||0) + 96*96 * ($f-0x30);
70        ## BUG: 94^n DRCSes with I byte have no mapping area        ## BUG: 96^n DRCSes with I byte have no mapping area
71    }    }
72  }  }
73      $CHARSET{G94n}->{"\x20\x40"}->{ucs} = 0x70460000;     ## DRCS 94^2 04/00
74      
75  for (0x60..0x6F) {  for (0x60..0x6F) {
76    my $F = pack 'C', $_;    my $F = pack 'C', $_;
77    ## BUG: 9x^3 sets have no mapping area    ## BUG: 9x^3 sets have no mapping area
# Line 106  $CHARSET{G96}->{A}->{ucs} = 0xA0;      ## ISO Line 108  $CHARSET{G96}->{A}->{ucs} = 0xA0;      ## ISO
108  $CHARSET{G94n}->{'B@'}->{dimension} = 2;        ## JIS X 0208-1990  $CHARSET{G94n}->{'B@'}->{dimension} = 2;        ## JIS X 0208-1990
109  $CHARSET{G94n}->{'B@'}->{chars} = 94;  $CHARSET{G94n}->{'B@'}->{chars} = 94;
110  $CHARSET{G94n}->{'B@'}->{ucs} = 0xE9F6C0 + 94*94*79;  $CHARSET{G94n}->{'B@'}->{ucs} = 0xE9F6C0 + 94*94*79;
111      
112      ## SJIS G3 mapping (JIS X 0213:2000 plane 2)
113      $CHARSET{G94n}->{"\x50"}->{Csjis_kuE} = { # ku - 1
114        0xF0 => 7,  0xF1 => 3,  0xF2 => 11, 0xF3 => 13, 0xF4 => 77,
115        0xF5 => 79, 0xF6 => 81, 0xF7 => 83, 0xF8 => 85, 0xF9 => 87,
116        0xFA => 89, 0xFB => 91, 0xFC => 93,
117      };
118      $CHARSET{G94n}->{"\x50"}->{Csjis_kuO} = { # ku - 1
119        0xF0  => 0,  0xF1 => 2,  0xF2 => 4,  0xF3 => 12, 0xF4 => 14,
120        0xF5  => 78, 0xF6 => 80, 0xF7 => 82, 0xF8 => 84, 0xF9 => 86,
121        0xFA  => 88, 0xFB => 90, 0xFC => 92,
122      };
123      $CHARSET{G94n}->{"\x50"}->{Csjis_first} = { reverse (
124        %{ $CHARSET{G94n}->{"\x50"}->{Csjis_kuE} },
125        %{ $CHARSET{G94n}->{"\x50"}->{Csjis_kuO} },
126      )};
127      
128    ## -- Control character sets    ## -- Control character sets
129    $CHARSET{C0}->{'@'}->{ucs} = 0x00;    ## ISO/IEC 6429 C0    $CHARSET{C0}->{'@'}->{ucs} = 0x00;    ## ISO/IEC 6429 C0
130    for ("\x40", "\x43", "\x44", "\x45", "\x46", "\x49", "\x4A", "\x4B", "\x4C") {    for ("\x40", "\x43", "\x44", "\x45", "\x46", "\x49", "\x4A", "\x4B", "\x4C") {
# Line 169  sub make_initial_coding_system { Line 187  sub make_initial_coding_system {
187      $CODING_SYSTEM{$F} = {};      $CODING_SYSTEM{$F} = {};
188      $CODING_SYSTEM{"\x2F".$F} = {reset_state => 1};      $CODING_SYSTEM{"\x2F".$F} = {reset_state => 1};
189    }    }
190      $CODING_SYSTEM{Csjis} = {perl_name => 'shiftjis'};
191  }  }
192    
193  sub make_charset (%) {  sub make_charset (%) {
# Line 179  sub make_charset (%) { Line 198  sub make_charset (%) {
198    $CHARSET{ $settype }->{ $setid } = \%set;    $CHARSET{ $settype }->{ $setid } = \%set;
199  }  }
200    
201    ## Make a new ISO/IEC 2022-buffers object with default status
202    sub new_object {
203      my %C;
204      $C{bit} = 8;
205      $C{coding_system} = $CODING_SYSTEM{"\x40"};   ## ISO/IEC 2022
206      $C{CL} = 'C0'; $C{CR} = 'C1'; $C{ESC_Fe} = 'C1';
207      $C{C0} = $CHARSET{C0}->{"\x40"};      ## ISO/IEC 6429:1991 C0
208      $C{C1} = $CHARSET{C1}->{'64291991C1'};        ## ISO/IEC 6429:1991 C1
209      $C{GL} = 'G0'; $C{GR} = 'G1';
210      $C{G0} = $CHARSET{G94}->{"\x42"};     ## ISO/IEC 646:1991 IRV
211      #$C{G1} = $CHARSET{G96}->{"\x41"};    ## ISO/IEC 8859-1 GR
212      $C{G1} = $CHARSET{G94}->{"\x7E"};     ## empty set
213      $C{G2} = $CHARSET{G94}->{"\x7E"};     ## empty set
214      $C{G3} = $CHARSET{G94}->{"\x7E"};     ## empty set
215      $C{option} = {
216            C1invoke_to_right       => 0,   ## C1 invoked to: (0: ESC Fe, 1: CR)
217            G94n_designate_long     => 0,   ## (1: ESC 02/04 02/08 04/00..02)
218            designate_to    => {    ## Designated G buffer (-1: not be outputed)
219                    C0      => {
220                            default => 0,
221                    },
222                    C1      => {
223                            default => 1,
224                    },
225                    G94     => {
226                            "\x42"  => 0,
227                            default => 0,
228                    },
229                    G96     => {
230                            default => 1,
231                    },
232                    G94n    => {
233                            default => 0,
234                    },
235                    G96n    => {
236                            default => 1,
237                    },
238                    coding_system => {
239                            default => -1,
240                    },
241            },
242            Ginvoke_by_single_shift => [0,0,0,0],   ## Invoked by SS
243            Ginvoke_to_left => [1,1,1,1],   ## Which invoked to? (1: L, 0: R)
244            private_set     => {    ## Private set vs Final byte
245                    C0      => [],
246                    C1      => [],
247                    G94     => [],
248                    G94n    => [[],[],[],[],["\x20\x40"]],
249                    G96     => [],
250                    #G96n   => [],  ## (not implemented)
251                    U96n    => [],  ## mule-unicode sets
252                    XC1     => {
253                            '64291991C1'    => undef,       ## ISO/IEC 6429:1991 C1
254                    },
255            },
256            reset => {      ## Reset status at top of line
257                    Gdesignation    => "\x42",      ## F of designation or 0
258                    Ginvoke => 1,
259            },
260            undef_char      => ["\x3F", {type => 'G94', charset => 'B'}],
261            use_revision    => 1,   ## Output IRR
262      };
263      \%C;
264    }
265    
266    sub new_object_sjis {
267      my $C = new_object;
268      $C->{coding_system} = $CODING_SYSTEM{Csjis};
269      $C->{CR} = undef;
270      $C->{GR} = 'G2';      ## 0xA1-0xDF
271      $C->{G0} = $CHARSET{G94}->{J};        ## JIS X 0201:1997 Latin
272      $C->{G1} = $CHARSET{G94n}->{"\x4F"};  ## JIS X 0213:2000
273      $C->{G2} = $CHARSET{G94}->{I};        ## JIS X 0201:1997 Katakana
274      $C->{G3} = $CHARSET{G94n}->{"\x50"};  ## JIS X 0213:2000 plane 2
275      ## Special code area (0xFD-0xFF)
276      $C->{Gsmap} = {"\xA0" => "\x{F8F0}", "\xFD" => "\x{F8F1}", "\xFE" => "\x{F8F2}", "\xFF" => "\x{F8F3}"};
277      $C->{GsmapR} = {};    ## Reversed table
278      $C->{option}->{undef_char_sjis} = "\x81\xAC";
279      $C;
280    }
281    
282  1;  1;
283  __END__  __END__
284    

Legend:
Removed from v.1.1  
changed lines
  Added in v.1.4

admin@suikawiki.org
ViewVC Help
Powered by ViewVC 1.1.24