/[suikacvs]/markup/html/whatpm/Whatpm/HTML.pm.src
Suika

Diff of /markup/html/whatpm/Whatpm/HTML.pm.src

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.23 by wakaba, Sat Jun 23 16:01:36 2007 UTC revision 1.56 by wakaba, Sat Aug 11 07:19:18 2007 UTC
# Line 7  our $VERSION=do{my @r=(q$Revision$=~/\d+ Line 7  our $VERSION=do{my @r=(q$Revision$=~/\d+
7  ## doc.write ('');  ## doc.write ('');
8  ## alert (doc.compatMode);  ## alert (doc.compatMode);
9    
10    ## ISSUE: HTML5 revision 967 says that the encoding layer MUST NOT
11    ## strip BOM and the HTML layer MUST ignore it.  Whether we can do it
12    ## is not yet clear.
13    ## "{U+FEFF}..." in UTF-16BE/UTF-16LE is three or four characters?
14    ## "{U+FEFF}..." in GB18030?
15    
16  my $permitted_slash_tag_name = {  my $permitted_slash_tag_name = {
17    base => 1,    base => 1,
18    link => 1,    link => 1,
# Line 144  sub new ($) { Line 150  sub new ($) {
150    return $self;    return $self;
151  } # new  } # new
152    
153    sub CM_ENTITY () { 0b001 } # & markup in data
154    sub CM_LIMITED_MARKUP () { 0b010 } # < markup in data (limited)
155    sub CM_FULL_MARKUP () { 0b100 } # < markup in data (any)
156    
157    sub PLAINTEXT_CONTENT_MODEL () { 0 }
158    sub CDATA_CONTENT_MODEL () { CM_LIMITED_MARKUP }
159    sub RCDATA_CONTENT_MODEL () { CM_ENTITY | CM_LIMITED_MARKUP }
160    sub PCDATA_CONTENT_MODEL () { CM_ENTITY | CM_FULL_MARKUP }
161    
162    sub DOCTYPE_TOKEN () { 1 }
163    sub COMMENT_TOKEN () { 2 }
164    sub START_TAG_TOKEN () { 3 }
165    sub END_TAG_TOKEN () { 4 }
166    sub END_OF_FILE_TOKEN () { 5 }
167    sub CHARACTER_TOKEN () { 6 }
168    
169    sub AFTER_HTML_IMS () { 0b100 }
170    sub HEAD_IMS ()       { 0b1000 }
171    sub BODY_IMS ()       { 0b10000 }
172    sub BODY_TABLE_IMS () { 0b100000 }
173    sub TABLE_IMS ()      { 0b1000000 }
174    sub ROW_IMS ()        { 0b10000000 }
175    sub BODY_AFTER_IMS () { 0b100000000 }
176    sub FRAME_IMS ()      { 0b1000000000 }
177    
178    sub AFTER_HTML_BODY_IM () { AFTER_HTML_IMS | BODY_AFTER_IMS }
179    sub AFTER_HTML_FRAMESET_IM () { AFTER_HTML_IMS | FRAME_IMS }
180    sub IN_HEAD_IM () { HEAD_IMS | 0b00 }
181    sub IN_HEAD_NOSCRIPT_IM () { HEAD_IMS | 0b01 }
182    sub AFTER_HEAD_IM () { HEAD_IMS | 0b10 }
183    sub BEFORE_HEAD_IM () { HEAD_IMS | 0b11 }
184    sub IN_BODY_IM () { BODY_IMS }
185    sub IN_CELL_IM () { BODY_IMS | BODY_TABLE_IMS | 0b01 }
186    sub IN_CAPTION_IM () { BODY_IMS | BODY_TABLE_IMS | 0b10 }
187    sub IN_ROW_IM () { TABLE_IMS | ROW_IMS | 0b01 }
188    sub IN_TABLE_BODY_IM () { TABLE_IMS | ROW_IMS | 0b10 }
189    sub IN_TABLE_IM () { TABLE_IMS }
190    sub AFTER_BODY_IM () { BODY_AFTER_IMS }
191    sub IN_FRAMESET_IM () { FRAME_IMS | 0b01 }
192    sub AFTER_FRAMESET_IM () { FRAME_IMS | 0b10 }
193    sub IN_SELECT_IM () { 0b01 }
194    sub IN_COLUMN_GROUP_IM () { 0b10 }
195    
196  ## Implementations MUST act as if state machine in the spec  ## Implementations MUST act as if state machine in the spec
197    
198  sub _initialize_tokenizer ($) {  sub _initialize_tokenizer ($) {
199    my $self = shift;    my $self = shift;
200    $self->{state} = 'data'; # MUST    $self->{state} = 'data'; # MUST
201    $self->{content_model_flag} = 'PCDATA'; # be    $self->{content_model} = PCDATA_CONTENT_MODEL; # be
202    undef $self->{current_token}; # start tag, end tag, comment, or DOCTYPE    undef $self->{current_token}; # start tag, end tag, comment, or DOCTYPE
203    undef $self->{current_attribute};    undef $self->{current_attribute};
204    undef $self->{last_emitted_start_tag_name};    undef $self->{last_emitted_start_tag_name};
# Line 162  sub _initialize_tokenizer ($) { Line 211  sub _initialize_tokenizer ($) {
211  } # _initialize_tokenizer  } # _initialize_tokenizer
212    
213  ## A token has:  ## A token has:
214  ##   ->{type} eq 'DOCTYPE', 'start tag', 'end tag', 'comment',  ##   ->{type} == DOCTYPE_TOKEN, START_TAG_TOKEN, END_TAG_TOKEN, COMMENT_TOKEN,
215  ##       'character', or 'end-of-file'  ##       CHARACTER_TOKEN, or END_OF_FILE_TOKEN
216  ##   ->{name} (DOCTYPE, start tag (tag name), end tag (tag name))  ##   ->{name} (DOCTYPE_TOKEN)
217  ##   ->{public_identifier} (DOCTYPE)  ##   ->{tag_name} (START_TAG_TOKEN, END_TAG_TOKEN)
218  ##   ->{system_identifier} (DOCTYPE)  ##   ->{public_identifier} (DOCTYPE_TOKEN)
219  ##   ->{correct} == 1 or 0 (DOCTYPE)  ##   ->{system_identifier} (DOCTYPE_TOKEN)
220  ##   ->{attributes} isa HASH (start tag, end tag)  ##   ->{correct} == 1 or 0 (DOCTYPE_TOKEN)
221  ##   ->{data} (comment, character)  ##   ->{attributes} isa HASH (START_TAG_TOKEN, END_TAG_TOKEN)
222    ##   ->{data} (COMMENT_TOKEN, CHARACTER_TOKEN)
223    
224  ## Emitted token MUST immediately be handled by the tree construction state.  ## Emitted token MUST immediately be handled by the tree construction state.
225    
# Line 188  sub _get_next_token ($) { Line 238  sub _get_next_token ($) {
238    A: {    A: {
239      if ($self->{state} eq 'data') {      if ($self->{state} eq 'data') {
240        if ($self->{next_input_character} == 0x0026) { # &        if ($self->{next_input_character} == 0x0026) { # &
241          if ($self->{content_model_flag} eq 'PCDATA' or          if ($self->{content_model} & CM_ENTITY) { # PCDATA | RCDATA
             $self->{content_model_flag} eq 'RCDATA') {  
242            $self->{state} = 'entity data';            $self->{state} = 'entity data';
243            !!!next-input-character;            !!!next-input-character;
244            redo A;            redo A;
# Line 197  sub _get_next_token ($) { Line 246  sub _get_next_token ($) {
246            #            #
247          }          }
248        } elsif ($self->{next_input_character} == 0x002D) { # -        } elsif ($self->{next_input_character} == 0x002D) { # -
249          if ($self->{content_model_flag} eq 'RCDATA' or          if ($self->{content_model} & CM_LIMITED_MARKUP) { # RCDATA | CDATA
             $self->{content_model_flag} eq 'CDATA') {  
250            unless ($self->{escape}) {            unless ($self->{escape}) {
251              if ($self->{prev_input_character}->[0] == 0x002D and # -              if ($self->{prev_input_character}->[0] == 0x002D and # -
252                  $self->{prev_input_character}->[1] == 0x0021 and # !                  $self->{prev_input_character}->[1] == 0x0021 and # !
# Line 210  sub _get_next_token ($) { Line 258  sub _get_next_token ($) {
258                    
259          #          #
260        } elsif ($self->{next_input_character} == 0x003C) { # <        } elsif ($self->{next_input_character} == 0x003C) { # <
261          if ($self->{content_model_flag} eq 'PCDATA' or          if ($self->{content_model} & CM_FULL_MARKUP or # PCDATA
262              (($self->{content_model_flag} eq 'CDATA' or              (($self->{content_model} & CM_LIMITED_MARKUP) and # CDATA | RCDATA
               $self->{content_model_flag} eq 'RCDATA') and  
263               not $self->{escape})) {               not $self->{escape})) {
264            $self->{state} = 'tag open';            $self->{state} = 'tag open';
265            !!!next-input-character;            !!!next-input-character;
# Line 222  sub _get_next_token ($) { Line 269  sub _get_next_token ($) {
269          }          }
270        } elsif ($self->{next_input_character} == 0x003E) { # >        } elsif ($self->{next_input_character} == 0x003E) { # >
271          if ($self->{escape} and          if ($self->{escape} and
272              ($self->{content_model_flag} eq 'RCDATA' or              ($self->{content_model} & CM_LIMITED_MARKUP)) { # RCDATA | CDATA
              $self->{content_model_flag} eq 'CDATA')) {  
273            if ($self->{prev_input_character}->[0] == 0x002D and # -            if ($self->{prev_input_character}->[0] == 0x002D and # -
274                $self->{prev_input_character}->[1] == 0x002D) { # -                $self->{prev_input_character}->[1] == 0x002D) { # -
275              delete $self->{escape};              delete $self->{escape};
# Line 232  sub _get_next_token ($) { Line 278  sub _get_next_token ($) {
278                    
279          #          #
280        } elsif ($self->{next_input_character} == -1) {        } elsif ($self->{next_input_character} == -1) {
281          !!!emit ({type => 'end-of-file'});          !!!emit ({type => END_OF_FILE_TOKEN});
282          last A; ## TODO: ok?          last A; ## TODO: ok?
283        }        }
284        # Anything else        # Anything else
285        my $token = {type => 'character',        my $token = {type => CHARACTER_TOKEN,
286                     data => chr $self->{next_input_character}};                     data => chr $self->{next_input_character}};
287        ## Stay in the data state        ## Stay in the data state
288        !!!next-input-character;        !!!next-input-character;
# Line 247  sub _get_next_token ($) { Line 293  sub _get_next_token ($) {
293      } elsif ($self->{state} eq 'entity data') {      } elsif ($self->{state} eq 'entity data') {
294        ## (cannot happen in CDATA state)        ## (cannot happen in CDATA state)
295                
296        my $token = $self->_tokenize_attempt_to_consume_an_entity;        my $token = $self->_tokenize_attempt_to_consume_an_entity (0);
297    
298        $self->{state} = 'data';        $self->{state} = 'data';
299        # next-input-character is already done        # next-input-character is already done
300    
301        unless (defined $token) {        unless (defined $token) {
302          !!!emit ({type => 'character', data => '&'});          !!!emit ({type => CHARACTER_TOKEN, data => '&'});
303        } else {        } else {
304          !!!emit ($token);          !!!emit ($token);
305        }        }
306    
307        redo A;        redo A;
308      } elsif ($self->{state} eq 'tag open') {      } elsif ($self->{state} eq 'tag open') {
309        if ($self->{content_model_flag} eq 'RCDATA' or        if ($self->{content_model} & CM_LIMITED_MARKUP) { # RCDATA | CDATA
           $self->{content_model_flag} eq 'CDATA') {  
310          if ($self->{next_input_character} == 0x002F) { # /          if ($self->{next_input_character} == 0x002F) { # /
311            !!!next-input-character;            !!!next-input-character;
312            $self->{state} = 'close tag open';            $self->{state} = 'close tag open';
# Line 270  sub _get_next_token ($) { Line 315  sub _get_next_token ($) {
315            ## reconsume            ## reconsume
316            $self->{state} = 'data';            $self->{state} = 'data';
317    
318            !!!emit ({type => 'character', data => '<'});            !!!emit ({type => CHARACTER_TOKEN, data => '<'});
319    
320            redo A;            redo A;
321          }          }
322        } elsif ($self->{content_model_flag} eq 'PCDATA') {        } elsif ($self->{content_model} & CM_FULL_MARKUP) { # PCDATA
323          if ($self->{next_input_character} == 0x0021) { # !          if ($self->{next_input_character} == 0x0021) { # !
324            $self->{state} = 'markup declaration open';            $self->{state} = 'markup declaration open';
325            !!!next-input-character;            !!!next-input-character;
# Line 286  sub _get_next_token ($) { Line 331  sub _get_next_token ($) {
331          } elsif (0x0041 <= $self->{next_input_character} and          } elsif (0x0041 <= $self->{next_input_character} and
332                   $self->{next_input_character} <= 0x005A) { # A..Z                   $self->{next_input_character} <= 0x005A) { # A..Z
333            $self->{current_token}            $self->{current_token}
334              = {type => 'start tag',              = {type => START_TAG_TOKEN,
335                 tag_name => chr ($self->{next_input_character} + 0x0020)};                 tag_name => chr ($self->{next_input_character} + 0x0020)};
336            $self->{state} = 'tag name';            $self->{state} = 'tag name';
337            !!!next-input-character;            !!!next-input-character;
338            redo A;            redo A;
339          } elsif (0x0061 <= $self->{next_input_character} and          } elsif (0x0061 <= $self->{next_input_character} and
340                   $self->{next_input_character} <= 0x007A) { # a..z                   $self->{next_input_character} <= 0x007A) { # a..z
341            $self->{current_token} = {type => 'start tag',            $self->{current_token} = {type => START_TAG_TOKEN,
342                              tag_name => chr ($self->{next_input_character})};                              tag_name => chr ($self->{next_input_character})};
343            $self->{state} = 'tag name';            $self->{state} = 'tag name';
344            !!!next-input-character;            !!!next-input-character;
# Line 303  sub _get_next_token ($) { Line 348  sub _get_next_token ($) {
348            $self->{state} = 'data';            $self->{state} = 'data';
349            !!!next-input-character;            !!!next-input-character;
350    
351            !!!emit ({type => 'character', data => '<>'});            !!!emit ({type => CHARACTER_TOKEN, data => '<>'});
352    
353            redo A;            redo A;
354          } elsif ($self->{next_input_character} == 0x003F) { # ?          } elsif ($self->{next_input_character} == 0x003F) { # ?
# Line 316  sub _get_next_token ($) { Line 361  sub _get_next_token ($) {
361            $self->{state} = 'data';            $self->{state} = 'data';
362            ## reconsume            ## reconsume
363    
364            !!!emit ({type => 'character', data => '<'});            !!!emit ({type => CHARACTER_TOKEN, data => '<'});
365    
366            redo A;            redo A;
367          }          }
368        } else {        } else {
369          die "$0: $self->{content_model_flag}: Unknown content model flag";          die "$0: $self->{content_model} in tag open";
370        }        }
371      } elsif ($self->{state} eq 'close tag open') {      } elsif ($self->{state} eq 'close tag open') {
372        if ($self->{content_model_flag} eq 'RCDATA' or        if ($self->{content_model} & CM_LIMITED_MARKUP) { # RCDATA | CDATA
           $self->{content_model_flag} eq 'CDATA') {  
373          if (defined $self->{last_emitted_start_tag_name}) {          if (defined $self->{last_emitted_start_tag_name}) {
374              ## NOTE: <http://krijnhoetmer.nl/irc-logs/whatwg/20070626#l-564>
375            my @next_char;            my @next_char;
376            TAGNAME: for (my $i = 0; $i < length $self->{last_emitted_start_tag_name}; $i++) {            TAGNAME: for (my $i = 0; $i < length $self->{last_emitted_start_tag_name}; $i++) {
377              push @next_char, $self->{next_input_character};              push @next_char, $self->{next_input_character};
# Line 340  sub _get_next_token ($) { Line 385  sub _get_next_token ($) {
385                !!!back-next-input-character (@next_char);                !!!back-next-input-character (@next_char);
386                $self->{state} = 'data';                $self->{state} = 'data';
387    
388                !!!emit ({type => 'character', data => '</'});                !!!emit ({type => CHARACTER_TOKEN, data => '</'});
389        
390                redo A;                redo A;
391              }              }
# Line 358  sub _get_next_token ($) { Line 403  sub _get_next_token ($) {
403              $self->{next_input_character} = shift @next_char; # reconsume              $self->{next_input_character} = shift @next_char; # reconsume
404              !!!back-next-input-character (@next_char);              !!!back-next-input-character (@next_char);
405              $self->{state} = 'data';              $self->{state} = 'data';
406              !!!emit ({type => 'character', data => '</'});              !!!emit ({type => CHARACTER_TOKEN, data => '</'});
407              redo A;              redo A;
408            } else {            } else {
409              $self->{next_input_character} = shift @next_char;              $self->{next_input_character} = shift @next_char;
# Line 369  sub _get_next_token ($) { Line 414  sub _get_next_token ($) {
414            ## No start tag token has ever been emitted            ## No start tag token has ever been emitted
415            # next-input-character is already done            # next-input-character is already done
416            $self->{state} = 'data';            $self->{state} = 'data';
417            !!!emit ({type => 'character', data => '</'});            !!!emit ({type => CHARACTER_TOKEN, data => '</'});
418            redo A;            redo A;
419          }          }
420        }        }
421                
422        if (0x0041 <= $self->{next_input_character} and        if (0x0041 <= $self->{next_input_character} and
423            $self->{next_input_character} <= 0x005A) { # A..Z            $self->{next_input_character} <= 0x005A) { # A..Z
424          $self->{current_token} = {type => 'end tag',          $self->{current_token} = {type => END_TAG_TOKEN,
425                            tag_name => chr ($self->{next_input_character} + 0x0020)};                            tag_name => chr ($self->{next_input_character} + 0x0020)};
426          $self->{state} = 'tag name';          $self->{state} = 'tag name';
427          !!!next-input-character;          !!!next-input-character;
428          redo A;          redo A;
429        } elsif (0x0061 <= $self->{next_input_character} and        } elsif (0x0061 <= $self->{next_input_character} and
430                 $self->{next_input_character} <= 0x007A) { # a..z                 $self->{next_input_character} <= 0x007A) { # a..z
431          $self->{current_token} = {type => 'end tag',          $self->{current_token} = {type => END_TAG_TOKEN,
432                            tag_name => chr ($self->{next_input_character})};                            tag_name => chr ($self->{next_input_character})};
433          $self->{state} = 'tag name';          $self->{state} = 'tag name';
434          !!!next-input-character;          !!!next-input-character;
# Line 398  sub _get_next_token ($) { Line 443  sub _get_next_token ($) {
443          $self->{state} = 'data';          $self->{state} = 'data';
444          # reconsume          # reconsume
445    
446          !!!emit ({type => 'character', data => '</'});          !!!emit ({type => CHARACTER_TOKEN, data => '</'});
447    
448          redo A;          redo A;
449        } else {        } else {
# Line 417  sub _get_next_token ($) { Line 462  sub _get_next_token ($) {
462          !!!next-input-character;          !!!next-input-character;
463          redo A;          redo A;
464        } elsif ($self->{next_input_character} == 0x003E) { # >        } elsif ($self->{next_input_character} == 0x003E) { # >
465          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
466              $self->{current_token}->{first_start_tag}
467                  = not defined $self->{last_emitted_start_tag_name};
468            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
469          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
470            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
471            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
472              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
473            }            }
# Line 442  sub _get_next_token ($) { Line 489  sub _get_next_token ($) {
489          redo A;          redo A;
490        } elsif ($self->{next_input_character} == -1) {        } elsif ($self->{next_input_character} == -1) {
491          !!!parse-error (type => 'unclosed tag');          !!!parse-error (type => 'unclosed tag');
492          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
493              $self->{current_token}->{first_start_tag}
494                  = not defined $self->{last_emitted_start_tag_name};
495            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
496          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
497            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
498            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
499              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
500            }            }
# Line 461  sub _get_next_token ($) { Line 510  sub _get_next_token ($) {
510        } elsif ($self->{next_input_character} == 0x002F) { # /        } elsif ($self->{next_input_character} == 0x002F) { # /
511          !!!next-input-character;          !!!next-input-character;
512          if ($self->{next_input_character} == 0x003E and # >          if ($self->{next_input_character} == 0x003E and # >
513              $self->{current_token}->{type} eq 'start tag' and              $self->{current_token}->{type} == START_TAG_TOKEN and
514              $permitted_slash_tag_name->{$self->{current_token}->{tag_name}}) {              $permitted_slash_tag_name->{$self->{current_token}->{tag_name}}) {
515            # permitted slash            # permitted slash
516            #            #
# Line 488  sub _get_next_token ($) { Line 537  sub _get_next_token ($) {
537          !!!next-input-character;          !!!next-input-character;
538          redo A;          redo A;
539        } elsif ($self->{next_input_character} == 0x003E) { # >        } elsif ($self->{next_input_character} == 0x003E) { # >
540          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
541              $self->{current_token}->{first_start_tag}
542                  = not defined $self->{last_emitted_start_tag_name};
543            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
544          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
545            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
546            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
547              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
548            }            }
# Line 514  sub _get_next_token ($) { Line 565  sub _get_next_token ($) {
565        } elsif ($self->{next_input_character} == 0x002F) { # /        } elsif ($self->{next_input_character} == 0x002F) { # /
566          !!!next-input-character;          !!!next-input-character;
567          if ($self->{next_input_character} == 0x003E and # >          if ($self->{next_input_character} == 0x003E and # >
568              $self->{current_token}->{type} eq 'start tag' and              $self->{current_token}->{type} == START_TAG_TOKEN and
569              $permitted_slash_tag_name->{$self->{current_token}->{tag_name}}) {              $permitted_slash_tag_name->{$self->{current_token}->{tag_name}}) {
570            # permitted slash            # permitted slash
571            #            #
# Line 526  sub _get_next_token ($) { Line 577  sub _get_next_token ($) {
577          redo A;          redo A;
578        } elsif ($self->{next_input_character} == -1) {        } elsif ($self->{next_input_character} == -1) {
579          !!!parse-error (type => 'unclosed tag');          !!!parse-error (type => 'unclosed tag');
580          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
581              $self->{current_token}->{first_start_tag}
582                  = not defined $self->{last_emitted_start_tag_name};
583            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
584          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
585            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
586            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
587              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
588            }            }
# Line 553  sub _get_next_token ($) { Line 606  sub _get_next_token ($) {
606        my $before_leave = sub {        my $before_leave = sub {
607          if (exists $self->{current_token}->{attributes} # start tag or end tag          if (exists $self->{current_token}->{attributes} # start tag or end tag
608              ->{$self->{current_attribute}->{name}}) { # MUST              ->{$self->{current_attribute}->{name}}) { # MUST
609            !!!parse-error (type => 'dupulicate attribute');            !!!parse-error (type => 'duplicate attribute:'.$self->{current_attribute}->{name});
610            ## Discard $self->{current_attribute} # MUST            ## Discard $self->{current_attribute} # MUST
611          } else {          } else {
612            $self->{current_token}->{attributes}->{$self->{current_attribute}->{name}}            $self->{current_token}->{attributes}->{$self->{current_attribute}->{name}}
# Line 577  sub _get_next_token ($) { Line 630  sub _get_next_token ($) {
630          redo A;          redo A;
631        } elsif ($self->{next_input_character} == 0x003E) { # >        } elsif ($self->{next_input_character} == 0x003E) { # >
632          $before_leave->();          $before_leave->();
633          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
634              $self->{current_token}->{first_start_tag}
635                  = not defined $self->{last_emitted_start_tag_name};
636            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
637          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
638            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
639            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
640              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
641            }            }
# Line 603  sub _get_next_token ($) { Line 658  sub _get_next_token ($) {
658          $before_leave->();          $before_leave->();
659          !!!next-input-character;          !!!next-input-character;
660          if ($self->{next_input_character} == 0x003E and # >          if ($self->{next_input_character} == 0x003E and # >
661              $self->{current_token}->{type} eq 'start tag' and              $self->{current_token}->{type} == START_TAG_TOKEN and
662              $permitted_slash_tag_name->{$self->{current_token}->{tag_name}}) {              $permitted_slash_tag_name->{$self->{current_token}->{tag_name}}) {
663            # permitted slash            # permitted slash
664            #            #
# Line 616  sub _get_next_token ($) { Line 671  sub _get_next_token ($) {
671        } elsif ($self->{next_input_character} == -1) {        } elsif ($self->{next_input_character} == -1) {
672          !!!parse-error (type => 'unclosed tag');          !!!parse-error (type => 'unclosed tag');
673          $before_leave->();          $before_leave->();
674          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
675              $self->{current_token}->{first_start_tag}
676                  = not defined $self->{last_emitted_start_tag_name};
677            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
678          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
679            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
680            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
681              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
682            }            }
# Line 652  sub _get_next_token ($) { Line 709  sub _get_next_token ($) {
709          !!!next-input-character;          !!!next-input-character;
710          redo A;          redo A;
711        } elsif ($self->{next_input_character} == 0x003E) { # >        } elsif ($self->{next_input_character} == 0x003E) { # >
712          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
713              $self->{current_token}->{first_start_tag}
714                  = not defined $self->{last_emitted_start_tag_name};
715            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
716          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
717            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
718            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
719              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
720            }            }
# Line 678  sub _get_next_token ($) { Line 737  sub _get_next_token ($) {
737        } elsif ($self->{next_input_character} == 0x002F) { # /        } elsif ($self->{next_input_character} == 0x002F) { # /
738          !!!next-input-character;          !!!next-input-character;
739          if ($self->{next_input_character} == 0x003E and # >          if ($self->{next_input_character} == 0x003E and # >
740              $self->{current_token}->{type} eq 'start tag' and              $self->{current_token}->{type} == START_TAG_TOKEN and
741              $permitted_slash_tag_name->{$self->{current_token}->{tag_name}}) {              $permitted_slash_tag_name->{$self->{current_token}->{tag_name}}) {
742            # permitted slash            # permitted slash
743            #            #
744          } else {          } else {
745            !!!parse-error (type => 'nestc');            !!!parse-error (type => 'nestc');
746              ## TODO: Different error type for <aa / bb> than <aa/>
747          }          }
748          $self->{state} = 'before attribute name';          $self->{state} = 'before attribute name';
749          # next-input-character is already done          # next-input-character is already done
750          redo A;          redo A;
751        } elsif ($self->{next_input_character} == -1) {        } elsif ($self->{next_input_character} == -1) {
752          !!!parse-error (type => 'unclosed tag');          !!!parse-error (type => 'unclosed tag');
753          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
754              $self->{current_token}->{first_start_tag}
755                  = not defined $self->{last_emitted_start_tag_name};
756            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
757          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
758            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
759            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
760              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
761            }            }
# Line 735  sub _get_next_token ($) { Line 797  sub _get_next_token ($) {
797          !!!next-input-character;          !!!next-input-character;
798          redo A;          redo A;
799        } elsif ($self->{next_input_character} == 0x003E) { # >        } elsif ($self->{next_input_character} == 0x003E) { # >
800          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
801              $self->{current_token}->{first_start_tag}
802                  = not defined $self->{last_emitted_start_tag_name};
803            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
804          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
805            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
806            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
807              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
808            }            }
# Line 753  sub _get_next_token ($) { Line 817  sub _get_next_token ($) {
817          redo A;          redo A;
818        } elsif ($self->{next_input_character} == -1) {        } elsif ($self->{next_input_character} == -1) {
819          !!!parse-error (type => 'unclosed tag');          !!!parse-error (type => 'unclosed tag');
820          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
821              $self->{current_token}->{first_start_tag}
822                  = not defined $self->{last_emitted_start_tag_name};
823            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
824          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
825            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
826            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
827              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
828            }            }
# Line 787  sub _get_next_token ($) { Line 853  sub _get_next_token ($) {
853          redo A;          redo A;
854        } elsif ($self->{next_input_character} == -1) {        } elsif ($self->{next_input_character} == -1) {
855          !!!parse-error (type => 'unclosed attribute value');          !!!parse-error (type => 'unclosed attribute value');
856          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
857              $self->{current_token}->{first_start_tag}
858                  = not defined $self->{last_emitted_start_tag_name};
859            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
860          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
861            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
862            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
863              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
864            }            }
# Line 821  sub _get_next_token ($) { Line 889  sub _get_next_token ($) {
889          redo A;          redo A;
890        } elsif ($self->{next_input_character} == -1) {        } elsif ($self->{next_input_character} == -1) {
891          !!!parse-error (type => 'unclosed attribute value');          !!!parse-error (type => 'unclosed attribute value');
892          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
893              $self->{current_token}->{first_start_tag}
894                  = not defined $self->{last_emitted_start_tag_name};
895            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
896          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
897            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
898            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
899              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
900            }            }
# Line 858  sub _get_next_token ($) { Line 928  sub _get_next_token ($) {
928          !!!next-input-character;          !!!next-input-character;
929          redo A;          redo A;
930        } elsif ($self->{next_input_character} == 0x003E) { # >        } elsif ($self->{next_input_character} == 0x003E) { # >
931          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
932              $self->{current_token}->{first_start_tag}
933                  = not defined $self->{last_emitted_start_tag_name};
934            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
935          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
936            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
937            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
938              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
939            }            }
# Line 876  sub _get_next_token ($) { Line 948  sub _get_next_token ($) {
948          redo A;          redo A;
949        } elsif ($self->{next_input_character} == -1) {        } elsif ($self->{next_input_character} == -1) {
950          !!!parse-error (type => 'unclosed tag');          !!!parse-error (type => 'unclosed tag');
951          if ($self->{current_token}->{type} eq 'start tag') {          if ($self->{current_token}->{type} == START_TAG_TOKEN) {
952              $self->{current_token}->{first_start_tag}
953                  = not defined $self->{last_emitted_start_tag_name};
954            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};            $self->{last_emitted_start_tag_name} = $self->{current_token}->{tag_name};
955          } elsif ($self->{current_token}->{type} eq 'end tag') {          } elsif ($self->{current_token}->{type} == END_TAG_TOKEN) {
956            $self->{content_model_flag} = 'PCDATA'; # MUST            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
957            if ($self->{current_token}->{attributes}) {            if ($self->{current_token}->{attributes}) {
958              !!!parse-error (type => 'end tag attribute');              !!!parse-error (type => 'end tag attribute');
959            }            }
# Line 899  sub _get_next_token ($) { Line 973  sub _get_next_token ($) {
973          redo A;          redo A;
974        }        }
975      } elsif ($self->{state} eq 'entity in attribute value') {      } elsif ($self->{state} eq 'entity in attribute value') {
976        my $token = $self->_tokenize_attempt_to_consume_an_entity;        my $token = $self->_tokenize_attempt_to_consume_an_entity (1);
977    
978        unless (defined $token) {        unless (defined $token) {
979          $self->{current_attribute}->{value} .= '&';          $self->{current_attribute}->{value} .= '&';
# Line 914  sub _get_next_token ($) { Line 988  sub _get_next_token ($) {
988      } elsif ($self->{state} eq 'bogus comment') {      } elsif ($self->{state} eq 'bogus comment') {
989        ## (only happen if PCDATA state)        ## (only happen if PCDATA state)
990                
991        my $token = {type => 'comment', data => ''};        my $token = {type => COMMENT_TOKEN, data => ''};
992    
993        BC: {        BC: {
994          if ($self->{next_input_character} == 0x003E) { # >          if ($self->{next_input_character} == 0x003E) { # >
# Line 947  sub _get_next_token ($) { Line 1021  sub _get_next_token ($) {
1021          !!!next-input-character;          !!!next-input-character;
1022          push @next_char, $self->{next_input_character};          push @next_char, $self->{next_input_character};
1023          if ($self->{next_input_character} == 0x002D) { # -          if ($self->{next_input_character} == 0x002D) { # -
1024            $self->{current_token} = {type => 'comment', data => ''};            $self->{current_token} = {type => COMMENT_TOKEN, data => ''};
1025            $self->{state} = 'comment start';            $self->{state} = 'comment start';
1026            !!!next-input-character;            !!!next-input-character;
1027            redo A;            redo A;
# Line 990  sub _get_next_token ($) { Line 1064  sub _get_next_token ($) {
1064          }          }
1065        }        }
1066    
1067        !!!parse-error (type => 'bogus comment open');        !!!parse-error (type => 'bogus comment');
1068        $self->{next_input_character} = shift @next_char;        $self->{next_input_character} = shift @next_char;
1069        !!!back-next-input-character (@next_char);        !!!back-next-input-character (@next_char);
1070        $self->{state} = 'bogus comment';        $self->{state} = 'bogus comment';
# Line 1049  sub _get_next_token ($) { Line 1123  sub _get_next_token ($) {
1123          redo A;          redo A;
1124        } else {        } else {
1125          $self->{current_token}->{data} # comment          $self->{current_token}->{data} # comment
1126              .= chr ($self->{next_input_character});              .= '-' . chr ($self->{next_input_character});
1127          $self->{state} = 'comment';          $self->{state} = 'comment';
1128          !!!next-input-character;          !!!next-input-character;
1129          redo A;          redo A;
# Line 1150  sub _get_next_token ($) { Line 1224  sub _get_next_token ($) {
1224          $self->{state} = 'data';          $self->{state} = 'data';
1225          !!!next-input-character;          !!!next-input-character;
1226    
1227          !!!emit ({type => 'DOCTYPE'}); # incorrect          !!!emit ({type => DOCTYPE_TOKEN}); # incorrect
1228    
1229          redo A;          redo A;
1230        } elsif ($self->{next_input_character} == -1) {        } elsif ($self->{next_input_character} == -1) {
# Line 1158  sub _get_next_token ($) { Line 1232  sub _get_next_token ($) {
1232          $self->{state} = 'data';          $self->{state} = 'data';
1233          ## reconsume          ## reconsume
1234    
1235          !!!emit ({type => 'DOCTYPE'}); # incorrect          !!!emit ({type => DOCTYPE_TOKEN}); # incorrect
1236    
1237          redo A;          redo A;
1238        } else {        } else {
1239          $self->{current_token}          $self->{current_token}
1240              = {type => 'DOCTYPE',              = {type => DOCTYPE_TOKEN,
1241                 name => chr ($self->{next_input_character}),                 name => chr ($self->{next_input_character}),
1242                 correct => 1};                 correct => 1};
1243  ## ISSUE: "Set the token's name name to the" in the spec  ## ISSUE: "Set the token's name name to the" in the spec
# Line 1409  sub _get_next_token ($) { Line 1483  sub _get_next_token ($) {
1483          !!!parse-error (type => 'unclosed DOCTYPE');          !!!parse-error (type => 'unclosed DOCTYPE');
1484    
1485          $self->{state} = 'data';          $self->{state} = 'data';
1486          ## recomsume          ## reconsume
1487    
1488          delete $self->{current_token}->{correct};          delete $self->{current_token}->{correct};
1489          !!!emit ($self->{current_token}); # DOCTYPE          !!!emit ($self->{current_token}); # DOCTYPE
# Line 1452  sub _get_next_token ($) { Line 1526  sub _get_next_token ($) {
1526          !!!parse-error (type => 'unclosed DOCTYPE');          !!!parse-error (type => 'unclosed DOCTYPE');
1527    
1528          $self->{state} = 'data';          $self->{state} = 'data';
1529          ## recomsume          ## reconsume
1530    
1531          delete $self->{current_token}->{correct};          delete $self->{current_token}->{correct};
1532          !!!emit ($self->{current_token}); # DOCTYPE          !!!emit ($self->{current_token}); # DOCTYPE
1533    
1534          redo A;          redo A;
1535        } else {        } else {
1536          !!!parse-error (type => 'string after PUBLIC literal');          !!!parse-error (type => 'string after SYSTEM');
1537          $self->{state} = 'bogus DOCTYPE';          $self->{state} = 'bogus DOCTYPE';
1538          !!!next-input-character;          !!!next-input-character;
1539          redo A;          redo A;
# Line 1527  sub _get_next_token ($) { Line 1601  sub _get_next_token ($) {
1601          !!!parse-error (type => 'unclosed DOCTYPE');          !!!parse-error (type => 'unclosed DOCTYPE');
1602    
1603          $self->{state} = 'data';          $self->{state} = 'data';
1604          ## recomsume          ## reconsume
1605    
1606          delete $self->{current_token}->{correct};          delete $self->{current_token}->{correct};
1607          !!!emit ($self->{current_token}); # DOCTYPE          !!!emit ($self->{current_token}); # DOCTYPE
# Line 1570  sub _get_next_token ($) { Line 1644  sub _get_next_token ($) {
1644    die "$0: _get_next_token: unexpected case";    die "$0: _get_next_token: unexpected case";
1645  } # _get_next_token  } # _get_next_token
1646    
1647  sub _tokenize_attempt_to_consume_an_entity ($) {  sub _tokenize_attempt_to_consume_an_entity ($$) {
1648    my $self = shift;    my ($self, $in_attr) = @_;
1649    
1650    if ({    if ({
1651         0x0009 => 1, 0x000A => 1, 0x000B => 1, 0x000C => 1, # HT, LF, VT, FF,         0x0009 => 1, 0x000A => 1, 0x000B => 1, 0x000C => 1, # HT, LF, VT, FF,
# Line 1584  sub _tokenize_attempt_to_consume_an_enti Line 1658  sub _tokenize_attempt_to_consume_an_enti
1658      !!!next-input-character;      !!!next-input-character;
1659      if ($self->{next_input_character} == 0x0078 or # x      if ($self->{next_input_character} == 0x0078 or # x
1660          $self->{next_input_character} == 0x0058) { # X          $self->{next_input_character} == 0x0058) { # X
1661        my $num;        my $code;
1662        X: {        X: {
1663          my $x_char = $self->{next_input_character};          my $x_char = $self->{next_input_character};
1664          !!!next-input-character;          !!!next-input-character;
1665          if (0x0030 <= $self->{next_input_character} and          if (0x0030 <= $self->{next_input_character} and
1666              $self->{next_input_character} <= 0x0039) { # 0..9              $self->{next_input_character} <= 0x0039) { # 0..9
1667            $num ||= 0;            $code ||= 0;
1668            $num *= 0x10;            $code *= 0x10;
1669            $num += $self->{next_input_character} - 0x0030;            $code += $self->{next_input_character} - 0x0030;
1670            redo X;            redo X;
1671          } elsif (0x0061 <= $self->{next_input_character} and          } elsif (0x0061 <= $self->{next_input_character} and
1672                   $self->{next_input_character} <= 0x0066) { # a..f                   $self->{next_input_character} <= 0x0066) { # a..f
1673            ## ISSUE: the spec says U+0078, which is apparently incorrect            $code ||= 0;
1674            $num ||= 0;            $code *= 0x10;
1675            $num *= 0x10;            $code += $self->{next_input_character} - 0x0060 + 9;
           $num += $self->{next_input_character} - 0x0060 + 9;  
1676            redo X;            redo X;
1677          } elsif (0x0041 <= $self->{next_input_character} and          } elsif (0x0041 <= $self->{next_input_character} and
1678                   $self->{next_input_character} <= 0x0046) { # A..F                   $self->{next_input_character} <= 0x0046) { # A..F
1679            ## ISSUE: the spec says U+0058, which is apparently incorrect            $code ||= 0;
1680            $num ||= 0;            $code *= 0x10;
1681            $num *= 0x10;            $code += $self->{next_input_character} - 0x0040 + 9;
           $num += $self->{next_input_character} - 0x0040 + 9;  
1682            redo X;            redo X;
1683          } elsif (not defined $num) { # no hexadecimal digit          } elsif (not defined $code) { # no hexadecimal digit
1684            !!!parse-error (type => 'bare hcro');            !!!parse-error (type => 'bare hcro');
1685              !!!back-next-input-character ($x_char, $self->{next_input_character});
1686            $self->{next_input_character} = 0x0023; # #            $self->{next_input_character} = 0x0023; # #
           !!!back-next-input-character ($x_char);  
1687            return undef;            return undef;
1688          } elsif ($self->{next_input_character} == 0x003B) { # ;          } elsif ($self->{next_input_character} == 0x003B) { # ;
1689            !!!next-input-character;            !!!next-input-character;
# Line 1619  sub _tokenize_attempt_to_consume_an_enti Line 1691  sub _tokenize_attempt_to_consume_an_enti
1691            !!!parse-error (type => 'no refc');            !!!parse-error (type => 'no refc');
1692          }          }
1693    
1694          ## TODO: check the definition for |a valid Unicode character|.          if ($code == 0 or (0xD800 <= $code and $code <= 0xDFFF)) {
1695          ## <http://lists.whatwg.org/pipermail/whatwg-whatwg.org/2006-December/thread.html#8189>            !!!parse-error (type => sprintf 'invalid character reference:U+%04X', $code);
1696          if ($num > 1114111 or $num == 0) {            $code = 0xFFFD;
1697            $num = 0xFFFD; # REPLACEMENT CHARACTER          } elsif ($code > 0x10FFFF) {
1698            ## ISSUE: Why this is not an error?            !!!parse-error (type => sprintf 'invalid character reference:U-%08X', $code);
1699          } elsif (0x80 <= $num and $num <= 0x9F) {            $code = 0xFFFD;
1700            !!!parse-error (type => sprintf 'c1 entity:U+%04X', $num);          } elsif ($code == 0x000D) {
1701            $num = $c1_entity_char->{$num};            !!!parse-error (type => 'CR character reference');
1702              $code = 0x000A;
1703            } elsif (0x80 <= $code and $code <= 0x9F) {
1704              !!!parse-error (type => sprintf 'C1 character reference:U+%04X', $code);
1705              $code = $c1_entity_char->{$code};
1706          }          }
1707    
1708          return {type => 'character', data => chr $num};          return {type => CHARACTER_TOKEN, data => chr $code};
1709        } # X        } # X
1710      } elsif (0x0030 <= $self->{next_input_character} and      } elsif (0x0030 <= $self->{next_input_character} and
1711               $self->{next_input_character} <= 0x0039) { # 0..9               $self->{next_input_character} <= 0x0039) { # 0..9
# Line 1650  sub _tokenize_attempt_to_consume_an_enti Line 1726  sub _tokenize_attempt_to_consume_an_enti
1726          !!!parse-error (type => 'no refc');          !!!parse-error (type => 'no refc');
1727        }        }
1728    
1729        ## TODO: check the definition for |a valid Unicode character|.        if ($code == 0 or (0xD800 <= $code and $code <= 0xDFFF)) {
1730        if ($code > 1114111 or $code == 0) {          !!!parse-error (type => sprintf 'invalid character reference:U+%04X', $code);
1731          $code = 0xFFFD; # REPLACEMENT CHARACTER          $code = 0xFFFD;
1732          ## ISSUE: Why this is not an error?        } elsif ($code > 0x10FFFF) {
1733            !!!parse-error (type => sprintf 'invalid character reference:U-%08X', $code);
1734            $code = 0xFFFD;
1735          } elsif ($code == 0x000D) {
1736            !!!parse-error (type => 'CR character reference');
1737            $code = 0x000A;
1738        } elsif (0x80 <= $code and $code <= 0x9F) {        } elsif (0x80 <= $code and $code <= 0x9F) {
1739          !!!parse-error (type => sprintf 'c1 entity:U+%04X', $code);          !!!parse-error (type => sprintf 'C1 character reference:U+%04X', $code);
1740          $code = $c1_entity_char->{$code};          $code = $c1_entity_char->{$code};
1741        }        }
1742                
1743        return {type => 'character', data => chr $code};        return {type => CHARACTER_TOKEN, data => chr $code};
1744      } else {      } else {
1745        !!!parse-error (type => 'bare nero');        !!!parse-error (type => 'bare nero');
1746        !!!back-next-input-character ($self->{next_input_character});        !!!back-next-input-character ($self->{next_input_character});
# Line 1674  sub _tokenize_attempt_to_consume_an_enti Line 1755  sub _tokenize_attempt_to_consume_an_enti
1755      !!!next-input-character;      !!!next-input-character;
1756    
1757      my $value = $entity_name;      my $value = $entity_name;
1758      my $match;      my $match = 0;
1759      require Whatpm::_NamedEntityList;      require Whatpm::_NamedEntityList;
1760      our $EntityChar;      our $EntityChar;
1761    
# Line 1689  sub _tokenize_attempt_to_consume_an_enti Line 1770  sub _tokenize_attempt_to_consume_an_enti
1770              $self->{next_input_character} == 0x003B)) { # ;              $self->{next_input_character} == 0x003B)) { # ;
1771        $entity_name .= chr $self->{next_input_character};        $entity_name .= chr $self->{next_input_character};
1772        if (defined $EntityChar->{$entity_name}) {        if (defined $EntityChar->{$entity_name}) {
         $value = $EntityChar->{$entity_name};  
1773          if ($self->{next_input_character} == 0x003B) { # ;          if ($self->{next_input_character} == 0x003B) { # ;
1774              $value = $EntityChar->{$entity_name};
1775            $match = 1;            $match = 1;
1776            !!!next-input-character;            !!!next-input-character;
1777            last;            last;
1778          } else {          } else {
1779              $value = $EntityChar->{$entity_name};
1780            $match = -1;            $match = -1;
1781              !!!next-input-character;
1782          }          }
1783        } else {        } else {
1784          $value .= chr $self->{next_input_character};          $value .= chr $self->{next_input_character};
1785            $match *= 2;
1786            !!!next-input-character;
1787        }        }
       !!!next-input-character;  
1788      }      }
1789            
1790      if ($match > 0) {      if ($match > 0) {
1791        return {type => 'character', data => $value};        return {type => CHARACTER_TOKEN, data => $value};
1792      } elsif ($match < 0) {      } elsif ($match < 0) {
1793        !!!parse-error (type => 'refc');        !!!parse-error (type => 'no refc');
1794        return {type => 'character', data => $value};        if ($in_attr and $match < -1) {
1795            return {type => CHARACTER_TOKEN, data => '&'.$entity_name};
1796          } else {
1797            return {type => CHARACTER_TOKEN, data => $value};
1798          }
1799      } else {      } else {
1800        !!!parse-error (type => 'bare ero');        !!!parse-error (type => 'bare ero');
1801        ## NOTE: No characters are consumed in the spec.        ## NOTE: No characters are consumed in the spec.
1802        !!!back-token ({type => 'character', data => $value});        return {type => CHARACTER_TOKEN, data => '&'.$value};
       return undef;  
1803      }      }
1804    } else {    } else {
1805      ## no characters are consumed      ## no characters are consumed
# Line 1754  sub _construct_tree ($) { Line 1841  sub _construct_tree ($) {
1841        
1842    !!!next-token;    !!!next-token;
1843    
1844    $self->{insertion_mode} = 'before head';    $self->{insertion_mode} = BEFORE_HEAD_IM;
1845    undef $self->{form_element};    undef $self->{form_element};
1846    undef $self->{head_element};    undef $self->{head_element};
1847    $self->{open_elements} = [];    $self->{open_elements} = [];
# Line 1768  sub _construct_tree ($) { Line 1855  sub _construct_tree ($) {
1855  sub _tree_construction_initial ($) {  sub _tree_construction_initial ($) {
1856    my $self = shift;    my $self = shift;
1857    INITIAL: {    INITIAL: {
1858      if ($token->{type} eq 'DOCTYPE') {      if ($token->{type} == DOCTYPE_TOKEN) {
1859        ## NOTE: Conformance checkers MAY, instead of reporting "not HTML5"        ## NOTE: Conformance checkers MAY, instead of reporting "not HTML5"
1860        ## error, switch to a conformance checking mode for another        ## error, switch to a conformance checking mode for another
1861        ## language.        ## language.
# Line 1895  sub _tree_construction_initial ($) { Line 1982  sub _tree_construction_initial ($) {
1982        !!!next-token;        !!!next-token;
1983        return;        return;
1984      } elsif ({      } elsif ({
1985                'start tag' => 1,                START_TAG_TOKEN, 1,
1986                'end tag' => 1,                END_TAG_TOKEN, 1,
1987                'end-of-file' => 1,                END_OF_FILE_TOKEN, 1,
1988               }->{$token->{type}}) {               }->{$token->{type}}) {
1989        !!!parse-error (type => 'no DOCTYPE');        !!!parse-error (type => 'no DOCTYPE');
1990        $self->{document}->manakai_compat_mode ('quirks');        $self->{document}->manakai_compat_mode ('quirks');
1991        ## Go to the root element phase        ## Go to the root element phase
1992        ## reprocess        ## reprocess
1993        return;        return;
1994      } elsif ($token->{type} eq 'character') {      } elsif ($token->{type} == CHARACTER_TOKEN) {
1995        if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) { # \x0D        if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) { # \x0D
1996          ## Ignore the token          ## Ignore the token
1997    
1998          unless (length $token->{data}) {          unless (length $token->{data}) {
1999            ## Stay in the phase            ## Stay in the phase
2000            !!!next-token;            !!!next-token;
# Line 1919  sub _tree_construction_initial ($) { Line 2007  sub _tree_construction_initial ($) {
2007        ## Go to the root element phase        ## Go to the root element phase
2008        ## reprocess        ## reprocess
2009        return;        return;
2010      } elsif ($token->{type} eq 'comment') {      } elsif ($token->{type} == COMMENT_TOKEN) {
2011        my $comment = $self->{document}->create_comment ($token->{data});        my $comment = $self->{document}->create_comment ($token->{data});
2012        $self->{document}->append_child ($comment);        $self->{document}->append_child ($comment);
2013                
# Line 1927  sub _tree_construction_initial ($) { Line 2015  sub _tree_construction_initial ($) {
2015        !!!next-token;        !!!next-token;
2016        redo INITIAL;        redo INITIAL;
2017      } else {      } else {
2018        die "$0: $token->{type}: Unknown token";        die "$0: $token->{type}: Unknown token type";
2019      }      }
2020    } # INITIAL    } # INITIAL
2021  } # _tree_construction_initial  } # _tree_construction_initial
# Line 1936  sub _tree_construction_root_element ($) Line 2024  sub _tree_construction_root_element ($)
2024    my $self = shift;    my $self = shift;
2025        
2026    B: {    B: {
2027        if ($token->{type} eq 'DOCTYPE') {        if ($token->{type} == DOCTYPE_TOKEN) {
2028          !!!parse-error (type => 'in html:#DOCTYPE');          !!!parse-error (type => 'in html:#DOCTYPE');
2029          ## Ignore the token          ## Ignore the token
2030          ## Stay in the phase          ## Stay in the phase
2031          !!!next-token;          !!!next-token;
2032          redo B;          redo B;
2033        } elsif ($token->{type} eq 'comment') {        } elsif ($token->{type} == COMMENT_TOKEN) {
2034          my $comment = $self->{document}->create_comment ($token->{data});          my $comment = $self->{document}->create_comment ($token->{data});
2035          $self->{document}->append_child ($comment);          $self->{document}->append_child ($comment);
2036          ## Stay in the phase          ## Stay in the phase
2037          !!!next-token;          !!!next-token;
2038          redo B;          redo B;
2039        } elsif ($token->{type} eq 'character') {        } elsif ($token->{type} == CHARACTER_TOKEN) {
2040          if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {          if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) { # \x0D
2041            $self->{document}->manakai_append_text ($1);            ## Ignore the token.
2042            ## ISSUE: DOM3 Core does not allow Document > Text  
2043            unless (length $token->{data}) {            unless (length $token->{data}) {
2044              ## Stay in the phase              ## Stay in the phase
2045              !!!next-token;              !!!next-token;
# Line 1960  sub _tree_construction_root_element ($) Line 2048  sub _tree_construction_root_element ($)
2048          }          }
2049          #          #
2050        } elsif ({        } elsif ({
2051                  'start tag' => 1,                  START_TAG_TOKEN, 1,
2052                  'end tag' => 1,                  END_TAG_TOKEN, 1,
2053                  'end-of-file' => 1,                  END_OF_FILE_TOKEN, 1,
2054                 }->{$token->{type}}) {                 }->{$token->{type}}) {
2055          ## ISSUE: There is an issue in the spec          ## ISSUE: There is an issue in the spec
2056          #          #
2057        } else {        } else {
2058          die "$0: $token->{type}: Unknown token";          die "$0: $token->{type}: Unknown token type";
2059        }        }
2060        my $root_element; !!!create-element ($root_element, 'html');        my $root_element; !!!create-element ($root_element, 'html');
2061        $self->{document}->append_child ($root_element);        $self->{document}->append_child ($root_element);
2062        push @{$self->{open_elements}}, [$root_element, 'html'];        push @{$self->{open_elements}}, [$root_element, 'html'];
       #$phase = 'main';  
2063        ## reprocess        ## reprocess
2064        #redo B;        #redo B;
2065        return;        return; ## Go to the main phase.
2066    } # B    } # B
2067  } # _tree_construction_root_element  } # _tree_construction_root_element
2068    
# Line 1991  sub _reset_insertion_mode ($) { Line 2078  sub _reset_insertion_mode ($) {
2078            
2079      ## Step 3      ## Step 3
2080      S3: {      S3: {
2081        $last = 1 if $self->{open_elements}->[0]->[0] eq $node->[0];        ## ISSUE: Oops! "If node is the first node in the stack of open
2082        if (defined $self->{inner_html_node}) {        ## elements, then set last to true. If the context element of the
2083          if ($self->{inner_html_node}->[1] eq 'td' or        ## HTML fragment parsing algorithm is neither a td element nor a
2084              $self->{inner_html_node}->[1] eq 'th') {        ## th element, then set node to the context element. (fragment case)":
2085            #        ## The second "if" is in the scope of the first "if"!?
2086          } else {        if ($self->{open_elements}->[0]->[0] eq $node->[0]) {
2087            $node = $self->{inner_html_node};          $last = 1;
2088            if (defined $self->{inner_html_node}) {
2089              if ($self->{inner_html_node}->[1] eq 'td' or
2090                  $self->{inner_html_node}->[1] eq 'th') {
2091                #
2092              } else {
2093                $node = $self->{inner_html_node};
2094              }
2095          }          }
2096        }        }
2097            
2098        ## Step 4..13        ## Step 4..13
2099        my $new_mode = {        my $new_mode = {
2100                        select => 'in select',                        select => IN_SELECT_IM,
2101                        td => 'in cell',                        td => IN_CELL_IM,
2102                        th => 'in cell',                        th => IN_CELL_IM,
2103                        tr => 'in row',                        tr => IN_ROW_IM,
2104                        tbody => 'in table body',                        tbody => IN_TABLE_BODY_IM,
2105                        thead => 'in table head',                        thead => IN_TABLE_BODY_IM,
2106                        tfoot => 'in table foot',                        tfoot => IN_TABLE_BODY_IM,
2107                        caption => 'in caption',                        caption => IN_CAPTION_IM,
2108                        colgroup => 'in column group',                        colgroup => IN_COLUMN_GROUP_IM,
2109                        table => 'in table',                        table => IN_TABLE_IM,
2110                        head => 'in body', # not in head!                        head => IN_BODY_IM, # not in head!
2111                        body => 'in body',                        body => IN_BODY_IM,
2112                        frameset => 'in frameset',                        frameset => IN_FRAMESET_IM,
2113                       }->{$node->[1]};                       }->{$node->[1]};
2114        $self->{insertion_mode} = $new_mode and return if defined $new_mode;        $self->{insertion_mode} = $new_mode and return if defined $new_mode;
2115                
2116        ## Step 14        ## Step 14
2117        if ($node->[1] eq 'html') {        if ($node->[1] eq 'html') {
2118          unless (defined $self->{head_element}) {          unless (defined $self->{head_element}) {
2119            $self->{insertion_mode} = 'before head';            $self->{insertion_mode} = BEFORE_HEAD_IM;
2120          } else {          } else {
2121            $self->{insertion_mode} = 'after head';            $self->{insertion_mode} = AFTER_HEAD_IM;
2122          }          }
2123          return;          return;
2124        }        }
2125                
2126        ## Step 15        ## Step 15
2127        $self->{insertion_mode} = 'in body' and return if $last;        $self->{insertion_mode} = IN_BODY_IM and return if $last;
2128                
2129        ## Step 16        ## Step 16
2130        $i--;        $i--;
# Line 2044  sub _reset_insertion_mode ($) { Line 2138  sub _reset_insertion_mode ($) {
2138  sub _tree_construction_main ($) {  sub _tree_construction_main ($) {
2139    my $self = shift;    my $self = shift;
2140    
   my $phase = 'main';  
   
2141    my $active_formatting_elements = [];    my $active_formatting_elements = [];
2142    
2143    my $reconstruct_active_formatting_elements = sub { # MUST    my $reconstruct_active_formatting_elements = sub { # MUST
# Line 2128  sub _tree_construction_main ($) { Line 2220  sub _tree_construction_main ($) {
2220      }      }
2221    }; # $clear_up_to_marker    }; # $clear_up_to_marker
2222    
2223    my $style_start_tag = sub {    my $parse_rcdata = sub ($$) {
2224      my $style_el; !!!create-element ($style_el, 'style', $token->{attributes});      my ($content_model_flag, $insert) = @_;
2225      ## $self->{insertion_mode} eq 'in head' and ... (always true)  
2226      (($self->{insertion_mode} eq 'in head' and defined $self->{head_element})      ## Step 1
2227       ? $self->{head_element} : $self->{open_elements}->[-1]->[0])      my $start_tag_name = $token->{tag_name};
2228        ->append_child ($style_el);      my $el;
2229      $self->{content_model_flag} = 'CDATA';      !!!create-element ($el, $start_tag_name, $token->{attributes});
2230    
2231        ## Step 2
2232        $insert->($el); # /context node/->append_child ($el)
2233    
2234        ## Step 3
2235        $self->{content_model} = $content_model_flag; # CDATA or RCDATA
2236      delete $self->{escape}; # MUST      delete $self->{escape}; # MUST
2237                  
2238        ## Step 4
2239      my $text = '';      my $text = '';
2240      !!!next-token;      !!!next-token;
2241      while ($token->{type} eq 'character') {      while ($token->{type} == CHARACTER_TOKEN) { # or until stop tokenizing
2242        $text .= $token->{data};        $text .= $token->{data};
2243        !!!next-token;        !!!next-token;
2244      } # stop if non-character token or tokenizer stops tokenising      }
2245    
2246        ## Step 5
2247      if (length $text) {      if (length $text) {
2248        $style_el->manakai_append_text ($text);        my $text = $self->{document}->create_text_node ($text);
2249          $el->append_child ($text);
2250      }      }
2251        
2252      $self->{content_model_flag} = 'PCDATA';      ## Step 6
2253                      $self->{content_model} = PCDATA_CONTENT_MODEL;
2254      if ($token->{type} eq 'end tag' and $token->{tag_name} eq 'style') {  
2255        ## Step 7
2256        if ($token->{type} == END_TAG_TOKEN and $token->{tag_name} eq $start_tag_name) {
2257        ## Ignore the token        ## Ignore the token
2258      } else {      } elsif ($content_model_flag == CDATA_CONTENT_MODEL) {
2259        !!!parse-error (type => 'in CDATA:#'.$token->{type});        !!!parse-error (type => 'in CDATA:#'.$token->{type});
2260        ## ISSUE: And ignore?      } elsif ($content_model_flag == RCDATA_CONTENT_MODEL) {
2261          !!!parse-error (type => 'in RCDATA:#'.$token->{type});
2262        } else {
2263          die "$0: $content_model_flag in parse_rcdata";
2264      }      }
2265      !!!next-token;      !!!next-token;
2266    }; # $style_start_tag    }; # $parse_rcdata
2267    
2268    my $script_start_tag = sub {    my $script_start_tag = sub ($) {
2269        my $insert = $_[0];
2270      my $script_el;      my $script_el;
2271      !!!create-element ($script_el, 'script', $token->{attributes});      !!!create-element ($script_el, 'script', $token->{attributes});
2272      ## TODO: mark as "parser-inserted"      ## TODO: mark as "parser-inserted"
2273    
2274      $self->{content_model_flag} = 'CDATA';      $self->{content_model} = CDATA_CONTENT_MODEL;
2275      delete $self->{escape}; # MUST      delete $self->{escape}; # MUST
2276            
2277      my $text = '';      my $text = '';
2278      !!!next-token;      !!!next-token;
2279      while ($token->{type} eq 'character') {      while ($token->{type} == CHARACTER_TOKEN) {
2280        $text .= $token->{data};        $text .= $token->{data};
2281        !!!next-token;        !!!next-token;
2282      } # stop if non-character token or tokenizer stops tokenising      } # stop if non-character token or tokenizer stops tokenising
# Line 2176  sub _tree_construction_main ($) { Line 2284  sub _tree_construction_main ($) {
2284        $script_el->manakai_append_text ($text);        $script_el->manakai_append_text ($text);
2285      }      }
2286                                
2287      $self->{content_model_flag} = 'PCDATA';      $self->{content_model} = PCDATA_CONTENT_MODEL;
2288    
2289      if ($token->{type} eq 'end tag' and      if ($token->{type} == END_TAG_TOKEN and
2290          $token->{tag_name} eq 'script') {          $token->{tag_name} eq 'script') {
2291        ## Ignore the token        ## Ignore the token
2292      } else {      } else {
# Line 2192  sub _tree_construction_main ($) { Line 2300  sub _tree_construction_main ($) {
2300      } else {      } else {
2301        ## TODO: $old_insertion_point = current insertion point        ## TODO: $old_insertion_point = current insertion point
2302        ## TODO: insertion point = just before the next input character        ## TODO: insertion point = just before the next input character
2303          
2304        (($self->{insertion_mode} eq 'in head' and defined $self->{head_element})        $insert->($script_el);
        ? $self->{head_element} : $self->{open_elements}->[-1]->[0])->append_child ($script_el);  
2305                
2306        ## TODO: insertion point = $old_insertion_point (might be "undefined")        ## TODO: insertion point = $old_insertion_point (might be "undefined")
2307                
# Line 2388  sub _tree_construction_main ($) { Line 2495  sub _tree_construction_main ($) {
2495    }; # $formatting_end_tag    }; # $formatting_end_tag
2496    
2497    my $insert_to_current = sub {    my $insert_to_current = sub {
2498      $self->{open_elements}->[-1]->[0]->append_child (shift);      $self->{open_elements}->[-1]->[0]->append_child ($_[0]);
2499    }; # $insert_to_current    }; # $insert_to_current
2500    
2501    my $insert_to_foster = sub {    my $insert_to_foster = sub {
# Line 2422  sub _tree_construction_main ($) { Line 2529  sub _tree_construction_main ($) {
2529                         }                         }
2530    }; # $insert_to_foster    }; # $insert_to_foster
2531    
2532    my $in_body = sub {    my $insert;
2533      my $insert = shift;  
2534      if ($token->{type} eq 'start tag') {    B: {
2535        if ($token->{tag_name} eq 'script') {      if ($token->{type} == DOCTYPE_TOKEN) {
2536          $script_start_tag->();        !!!parse-error (type => 'DOCTYPE in the middle');
2537          return;        ## Ignore the token
2538        } elsif ($token->{tag_name} eq 'style') {        ## Stay in the phase
2539          $style_start_tag->();        !!!next-token;
2540          return;        redo B;
2541        } elsif ({      } elsif ($token->{type} == END_OF_FILE_TOKEN) {
2542                  base => 1, link => 1, meta => 1,        if ($self->{insertion_mode} & AFTER_HTML_IMS) {
2543                 }->{$token->{tag_name}}) {          #
2544          !!!parse-error (type => 'in body:'.$token->{tag_name});        } else {
2545          ## NOTE: This is an "as if in head" code clone          ## Generate implied end tags
2546          my $el;          if ({
2547          !!!create-element ($el, $token->{tag_name}, $token->{attributes});               dd => 1, dt => 1, li => 1, p => 1, td => 1, th => 1, tr => 1,
2548          if (defined $self->{head_element}) {               tbody => 1, tfoot=> 1, thead => 1,
2549            $self->{head_element}->append_child ($el);              }->{$self->{open_elements}->[-1]->[1]}) {
2550          } else {            !!!back-token;
2551            $insert->($el);            $token = {type => END_TAG_TOKEN, tag_name => $self->{open_elements}->[-1]->[1]};
2552              redo B;
2553          }          }
2554                    
2555          !!!next-token;          if (@{$self->{open_elements}} > 2 or
2556          return;              (@{$self->{open_elements}} == 2 and $self->{open_elements}->[1]->[1] ne 'body')) {
2557        } elsif ($token->{tag_name} eq 'title') {            !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
2558          !!!parse-error (type => 'in body:title');          } elsif (defined $self->{inner_html_node} and
2559          ## NOTE: There is an "as if in head" code clone                   @{$self->{open_elements}} > 1 and
2560          my $title_el;                   $self->{open_elements}->[1]->[1] ne 'body') {
2561          !!!create-element ($title_el, 'title', $token->{attributes});            !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
2562          (defined $self->{head_element} ? $self->{head_element} : $self->{open_elements}->[-1]->[0])          }
2563            ->append_child ($title_el);  
2564          $self->{content_model_flag} = 'RCDATA';          ## ISSUE: There is an issue in the spec.
2565          delete $self->{escape}; # MUST        }
2566            
2567          my $text = '';        ## Stop parsing
2568          !!!next-token;        last B;
2569          while ($token->{type} eq 'character') {      } elsif ($token->{type} == START_TAG_TOKEN and
2570            $text .= $token->{data};               $token->{tag_name} eq 'html') {
2571          if ($self->{insertion_mode} == AFTER_HTML_BODY_IM) {
2572            ## Turn into the main phase
2573            !!!parse-error (type => 'after html:html');
2574            $self->{insertion_mode} = AFTER_BODY_IM;
2575          } elsif ($self->{insertion_mode} == AFTER_HTML_FRAMESET_IM) {
2576            ## Turn into the main phase
2577            !!!parse-error (type => 'after html:html');
2578            $self->{insertion_mode} = AFTER_FRAMESET_IM;
2579          }
2580    
2581    ## ISSUE: "aa<html>" is not a parse error.
2582    ## ISSUE: "<html>" in fragment is not a parse error.
2583          unless ($token->{first_start_tag}) {
2584            !!!parse-error (type => 'not first start tag');
2585          }
2586          my $top_el = $self->{open_elements}->[0]->[0];
2587          for my $attr_name (keys %{$token->{attributes}}) {
2588            unless ($top_el->has_attribute_ns (undef, $attr_name)) {
2589              $top_el->set_attribute_ns
2590                (undef, [undef, $attr_name],
2591                 $token->{attributes}->{$attr_name}->{value});
2592            }
2593          }
2594          !!!next-token;
2595          redo B;
2596        } elsif ($token->{type} == COMMENT_TOKEN) {
2597          my $comment = $self->{document}->create_comment ($token->{data});
2598          if ($self->{insertion_mode} & AFTER_HTML_IMS) {
2599            $self->{document}->append_child ($comment);
2600          } elsif ($self->{insertion_mode} == AFTER_BODY_IM) {
2601            $self->{open_elements}->[0]->[0]->append_child ($comment);
2602          } else {
2603            $self->{open_elements}->[-1]->[0]->append_child ($comment);
2604          }
2605          !!!next-token;
2606          redo B;
2607        } elsif ($self->{insertion_mode} & HEAD_IMS) {
2608          if ($token->{type} == CHARACTER_TOKEN) {
2609            if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {
2610              $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);
2611              unless (length $token->{data}) {
2612                !!!next-token;
2613                redo B;
2614              }
2615            }
2616    
2617            if ($self->{insertion_mode} == BEFORE_HEAD_IM) {
2618              ## As if <head>
2619              !!!create-element ($self->{head_element}, 'head');
2620              $self->{open_elements}->[-1]->[0]->append_child ($self->{head_element});
2621              push @{$self->{open_elements}}, [$self->{head_element}, 'head'];
2622    
2623              ## Reprocess in the "in head" insertion mode...
2624              pop @{$self->{open_elements}};
2625    
2626              ## Reprocess in the "after head" insertion mode...
2627            } elsif ($self->{insertion_mode} == IN_HEAD_NOSCRIPT_IM) {
2628              ## As if </noscript>
2629              pop @{$self->{open_elements}};
2630              !!!parse-error (type => 'in noscript:#character');
2631              
2632              ## Reprocess in the "in head" insertion mode...
2633              ## As if </head>
2634              pop @{$self->{open_elements}};
2635    
2636              ## Reprocess in the "after head" insertion mode...
2637            } elsif ($self->{insertion_mode} == IN_HEAD_IM) {
2638              pop @{$self->{open_elements}};
2639    
2640              ## Reprocess in the "after head" insertion mode...
2641            }
2642    
2643                ## "after head" insertion mode
2644                ## As if <body>
2645                !!!insert-element ('body');
2646                $self->{insertion_mode} = IN_BODY_IM;
2647                ## reprocess
2648                redo B;
2649              } elsif ($token->{type} == START_TAG_TOKEN) {
2650                if ($token->{tag_name} eq 'head') {
2651                  if ($self->{insertion_mode} == BEFORE_HEAD_IM) {
2652                    !!!create-element ($self->{head_element}, $token->{tag_name}, $token->{attributes});
2653                    $self->{open_elements}->[-1]->[0]->append_child ($self->{head_element});
2654                    push @{$self->{open_elements}}, [$self->{head_element}, $token->{tag_name}];
2655                    $self->{insertion_mode} = IN_HEAD_IM;
2656                    !!!next-token;
2657                    redo B;
2658                  } elsif ($self->{insertion_mode} == AFTER_HEAD_IM) {
2659                    #
2660                  } else {
2661                    !!!parse-error (type => 'in head:head'); # or in head noscript
2662                    ## Ignore the token
2663                    !!!next-token;
2664                    redo B;
2665                  }
2666                } elsif ($self->{insertion_mode} == BEFORE_HEAD_IM) {
2667                  ## As if <head>
2668                  !!!create-element ($self->{head_element}, 'head');
2669                  $self->{open_elements}->[-1]->[0]->append_child ($self->{head_element});
2670                  push @{$self->{open_elements}}, [$self->{head_element}, 'head'];
2671    
2672                  $self->{insertion_mode} = IN_HEAD_IM;
2673                  ## Reprocess in the "in head" insertion mode...
2674                }
2675    
2676                if ($token->{tag_name} eq 'base') {
2677                  if ($self->{insertion_mode} == IN_HEAD_NOSCRIPT_IM) {
2678                    ## As if </noscript>
2679                    pop @{$self->{open_elements}};
2680                    !!!parse-error (type => 'in noscript:base');
2681                  
2682                    $self->{insertion_mode} = IN_HEAD_IM;
2683                    ## Reprocess in the "in head" insertion mode...
2684                  }
2685    
2686                  ## NOTE: There is a "as if in head" code clone.
2687                  if ($self->{insertion_mode} == AFTER_HEAD_IM) {
2688                    !!!parse-error (type => 'after head:'.$token->{tag_name});
2689                    push @{$self->{open_elements}}, [$self->{head_element}, 'head'];
2690                  }
2691                  !!!insert-element ($token->{tag_name}, $token->{attributes});
2692                  pop @{$self->{open_elements}}; ## ISSUE: This step is missing in the spec.
2693                  pop @{$self->{open_elements}}
2694                      if $self->{insertion_mode} == AFTER_HEAD_IM;
2695                  !!!next-token;
2696                  redo B;
2697                } elsif ($token->{tag_name} eq 'link') {
2698                  ## NOTE: There is a "as if in head" code clone.
2699                  if ($self->{insertion_mode} == AFTER_HEAD_IM) {
2700                    !!!parse-error (type => 'after head:'.$token->{tag_name});
2701                    push @{$self->{open_elements}}, [$self->{head_element}, 'head'];
2702                  }
2703                  !!!insert-element ($token->{tag_name}, $token->{attributes});
2704                  pop @{$self->{open_elements}}; ## ISSUE: This step is missing in the spec.
2705                  pop @{$self->{open_elements}}
2706                      if $self->{insertion_mode} == AFTER_HEAD_IM;
2707                  !!!next-token;
2708                  redo B;
2709                } elsif ($token->{tag_name} eq 'meta') {
2710                  ## NOTE: There is a "as if in head" code clone.
2711                  if ($self->{insertion_mode} == AFTER_HEAD_IM) {
2712                    !!!parse-error (type => 'after head:'.$token->{tag_name});
2713                    push @{$self->{open_elements}}, [$self->{head_element}, 'head'];
2714                  }
2715                  !!!insert-element ($token->{tag_name}, $token->{attributes});
2716                  pop @{$self->{open_elements}}; ## ISSUE: This step is missing in the spec.
2717    
2718                  unless ($self->{confident}) {
2719                    my $charset;
2720                    if ($token->{attributes}->{charset}) { ## TODO: And if supported
2721                      $charset = $token->{attributes}->{charset}->{value};
2722                    }
2723                    if ($token->{attributes}->{'http-equiv'}) {
2724                      ## ISSUE: Algorithm name in the spec was incorrect so that not linked to the definition.
2725                      if ($token->{attributes}->{'http-equiv'}->{value}
2726                          =~ /\A[^;]*;[\x09-\x0D\x20]*charset[\x09-\x0D\x20]*=
2727                              [\x09-\x0D\x20]*(?>"([^"]*)"|'([^']*)'|
2728                              ([^"'\x09-\x0D\x20][^\x09-\x0D\x20]*))/x) {
2729                        $charset = defined $1 ? $1 : defined $2 ? $2 : $3;
2730                      } ## TODO: And if supported
2731                    }
2732                    ## TODO: Change the encoding
2733                  }
2734    
2735                  ## TODO: Extracting |charset| from |meta|.
2736                  pop @{$self->{open_elements}}
2737                      if $self->{insertion_mode} == AFTER_HEAD_IM;
2738                  !!!next-token;
2739                  redo B;
2740                } elsif ($token->{tag_name} eq 'title') {
2741                  if ($self->{insertion_mode} == IN_HEAD_NOSCRIPT_IM) {
2742                    ## As if </noscript>
2743                    pop @{$self->{open_elements}};
2744                    !!!parse-error (type => 'in noscript:title');
2745                  
2746                    $self->{insertion_mode} = IN_HEAD_IM;
2747                    ## Reprocess in the "in head" insertion mode...
2748                  } elsif ($self->{insertion_mode} == AFTER_HEAD_IM) {
2749                    !!!parse-error (type => 'after head:'.$token->{tag_name});
2750                    push @{$self->{open_elements}}, [$self->{head_element}, 'head'];
2751                  }
2752    
2753                  ## NOTE: There is a "as if in head" code clone.
2754                  my $parent = defined $self->{head_element} ? $self->{head_element}
2755                      : $self->{open_elements}->[-1]->[0];
2756                  $parse_rcdata->(RCDATA_CONTENT_MODEL,
2757                                  sub { $parent->append_child ($_[0]) });
2758                  pop @{$self->{open_elements}}
2759                      if $self->{insertion_mode} == AFTER_HEAD_IM;
2760                  redo B;
2761                } elsif ($token->{tag_name} eq 'style') {
2762                  ## NOTE: Or (scripting is enabled and tag_name eq 'noscript' and
2763                  ## insertion mode IN_HEAD_IM)
2764                  ## NOTE: There is a "as if in head" code clone.
2765                  if ($self->{insertion_mode} == AFTER_HEAD_IM) {
2766                    !!!parse-error (type => 'after head:'.$token->{tag_name});
2767                    push @{$self->{open_elements}}, [$self->{head_element}, 'head'];
2768                  }
2769                  $parse_rcdata->(CDATA_CONTENT_MODEL, $insert_to_current);
2770                  pop @{$self->{open_elements}}
2771                      if $self->{insertion_mode} == AFTER_HEAD_IM;
2772                  redo B;
2773                } elsif ($token->{tag_name} eq 'noscript') {
2774                  if ($self->{insertion_mode} == IN_HEAD_IM) {
2775                    ## NOTE: and scripting is disalbed
2776                    !!!insert-element ($token->{tag_name}, $token->{attributes});
2777                    $self->{insertion_mode} = IN_HEAD_NOSCRIPT_IM;
2778                    !!!next-token;
2779                    redo B;
2780                  } elsif ($self->{insertion_mode} == IN_HEAD_NOSCRIPT_IM) {
2781                    !!!parse-error (type => 'in noscript:noscript');
2782                    ## Ignore the token
2783                    !!!next-token;
2784                    redo B;
2785                  } else {
2786                    #
2787                  }
2788                } elsif ($token->{tag_name} eq 'script') {
2789                  if ($self->{insertion_mode} == IN_HEAD_NOSCRIPT_IM) {
2790                    ## As if </noscript>
2791                    pop @{$self->{open_elements}};
2792                    !!!parse-error (type => 'in noscript:script');
2793                  
2794                    $self->{insertion_mode} = IN_HEAD_IM;
2795                    ## Reprocess in the "in head" insertion mode...
2796                  } elsif ($self->{insertion_mode} == AFTER_HEAD_IM) {
2797                    !!!parse-error (type => 'after head:'.$token->{tag_name});
2798                    push @{$self->{open_elements}}, [$self->{head_element}, 'head'];
2799                  }
2800    
2801                  ## NOTE: There is a "as if in head" code clone.
2802                  $script_start_tag->($insert_to_current);
2803                  pop @{$self->{open_elements}}
2804                      if $self->{insertion_mode} == AFTER_HEAD_IM;
2805                  redo B;
2806                } elsif ($token->{tag_name} eq 'body' or
2807                         $token->{tag_name} eq 'frameset') {
2808                  if ($self->{insertion_mode} == IN_HEAD_NOSCRIPT_IM) {
2809                    ## As if </noscript>
2810                    pop @{$self->{open_elements}};
2811                    !!!parse-error (type => 'in noscript:'.$token->{tag_name});
2812                    
2813                    ## Reprocess in the "in head" insertion mode...
2814                    ## As if </head>
2815                    pop @{$self->{open_elements}};
2816                    
2817                    ## Reprocess in the "after head" insertion mode...
2818                  } elsif ($self->{insertion_mode} == IN_HEAD_IM) {
2819                    pop @{$self->{open_elements}};
2820                    
2821                    ## Reprocess in the "after head" insertion mode...
2822                  }
2823    
2824                  ## "after head" insertion mode
2825                  !!!insert-element ($token->{tag_name}, $token->{attributes});
2826                  if ($token->{tag_name} eq 'body') {
2827                    $self->{insertion_mode} = IN_BODY_IM;
2828                  } elsif ($token->{tag_name} eq 'frameset') {
2829                    $self->{insertion_mode} = IN_FRAMESET_IM;
2830                  } else {
2831                    die "$0: tag name: $self->{tag_name}";
2832                  }
2833                  !!!next-token;
2834                  redo B;
2835                } else {
2836                  #
2837                }
2838    
2839                if ($self->{insertion_mode} == IN_HEAD_NOSCRIPT_IM) {
2840                  ## As if </noscript>
2841                  pop @{$self->{open_elements}};
2842                  !!!parse-error (type => 'in noscript:/'.$token->{tag_name});
2843                  
2844                  ## Reprocess in the "in head" insertion mode...
2845                  ## As if </head>
2846                  pop @{$self->{open_elements}};
2847    
2848                  ## Reprocess in the "after head" insertion mode...
2849                } elsif ($self->{insertion_mode} == IN_HEAD_IM) {
2850                  ## As if </head>
2851                  pop @{$self->{open_elements}};
2852    
2853                  ## Reprocess in the "after head" insertion mode...
2854                }
2855    
2856                ## "after head" insertion mode
2857                ## As if <body>
2858                !!!insert-element ('body');
2859                $self->{insertion_mode} = IN_BODY_IM;
2860                ## reprocess
2861                redo B;
2862              } elsif ($token->{type} == END_TAG_TOKEN) {
2863                if ($token->{tag_name} eq 'head') {
2864                  if ($self->{insertion_mode} == BEFORE_HEAD_IM) {
2865                    ## As if <head>
2866                    !!!create-element ($self->{head_element}, 'head');
2867                    $self->{open_elements}->[-1]->[0]->append_child ($self->{head_element});
2868                    push @{$self->{open_elements}}, [$self->{head_element}, 'head'];
2869    
2870                    ## Reprocess in the "in head" insertion mode...
2871                    pop @{$self->{open_elements}};
2872                    $self->{insertion_mode} = AFTER_HEAD_IM;
2873                    !!!next-token;
2874                    redo B;
2875                  } elsif ($self->{insertion_mode} == IN_HEAD_NOSCRIPT_IM) {
2876                    ## As if </noscript>
2877                    pop @{$self->{open_elements}};
2878                    !!!parse-error (type => 'in noscript:script');
2879                    
2880                    ## Reprocess in the "in head" insertion mode...
2881                    pop @{$self->{open_elements}};
2882                    $self->{insertion_mode} = AFTER_HEAD_IM;
2883                    !!!next-token;
2884                    redo B;
2885                  } elsif ($self->{insertion_mode} == IN_HEAD_IM) {
2886                    pop @{$self->{open_elements}};
2887                    $self->{insertion_mode} = AFTER_HEAD_IM;
2888                    !!!next-token;
2889                    redo B;
2890                  } else {
2891                    #
2892                  }
2893                } elsif ($token->{tag_name} eq 'noscript') {
2894                  if ($self->{insertion_mode} == IN_HEAD_NOSCRIPT_IM) {
2895                    pop @{$self->{open_elements}};
2896                    $self->{insertion_mode} = IN_HEAD_IM;
2897                    !!!next-token;
2898                    redo B;
2899                  } elsif ($self->{insertion_mode} == BEFORE_HEAD_IM) {
2900                    !!!parse-error (type => 'unmatched end tag:noscript');
2901                    ## Ignore the token ## ISSUE: An issue in the spec.
2902                    !!!next-token;
2903                    redo B;
2904                  } else {
2905                    #
2906                  }
2907                } elsif ({
2908                          body => 1, html => 1,
2909                         }->{$token->{tag_name}}) {
2910                  if ($self->{insertion_mode} == BEFORE_HEAD_IM) {
2911                    ## As if <head>
2912                    !!!create-element ($self->{head_element}, 'head');
2913                    $self->{open_elements}->[-1]->[0]->append_child ($self->{head_element});
2914                    push @{$self->{open_elements}}, [$self->{head_element}, 'head'];
2915    
2916                    $self->{insertion_mode} = IN_HEAD_IM;
2917                    ## Reprocess in the "in head" insertion mode...
2918                  } elsif ($self->{insertion_mode} == IN_HEAD_NOSCRIPT_IM) {
2919                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
2920                    ## Ignore the token
2921                    !!!next-token;
2922                    redo B;
2923                  }
2924                  
2925                  #
2926                } elsif ({
2927                          p => 1, br => 1,
2928                         }->{$token->{tag_name}}) {
2929                  if ($self->{insertion_mode} == BEFORE_HEAD_IM) {
2930                    ## As if <head>
2931                    !!!create-element ($self->{head_element}, 'head');
2932                    $self->{open_elements}->[-1]->[0]->append_child ($self->{head_element});
2933                    push @{$self->{open_elements}}, [$self->{head_element}, 'head'];
2934    
2935                    $self->{insertion_mode} = IN_HEAD_IM;
2936                    ## Reprocess in the "in head" insertion mode...
2937                  }
2938    
2939                  #
2940                } else {
2941                  if ($self->{insertion_mode} == AFTER_HEAD_IM) {
2942                    #
2943                  } else {
2944                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
2945                    ## Ignore the token
2946                    !!!next-token;
2947                    redo B;
2948                  }
2949                }
2950    
2951                if ($self->{insertion_mode} == IN_HEAD_NOSCRIPT_IM) {
2952                  ## As if </noscript>
2953                  pop @{$self->{open_elements}};
2954                  !!!parse-error (type => 'in noscript:/'.$token->{tag_name});
2955                  
2956                  ## Reprocess in the "in head" insertion mode...
2957                  ## As if </head>
2958                  pop @{$self->{open_elements}};
2959    
2960                  ## Reprocess in the "after head" insertion mode...
2961                } elsif ($self->{insertion_mode} == IN_HEAD_IM) {
2962                  ## As if </head>
2963                  pop @{$self->{open_elements}};
2964    
2965                  ## Reprocess in the "after head" insertion mode...
2966                } elsif ($self->{insertion_mode} == BEFORE_HEAD_IM) {
2967                  !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
2968                  ## Ignore the token ## ISSUE: An issue in the spec.
2969                  !!!next-token;
2970                  redo B;
2971                }
2972    
2973                ## "after head" insertion mode
2974                ## As if <body>
2975                !!!insert-element ('body');
2976                $self->{insertion_mode} = IN_BODY_IM;
2977                ## reprocess
2978                redo B;
2979              } else {
2980                die "$0: $token->{type}: Unknown token type";
2981              }
2982    
2983              ## ISSUE: An issue in the spec.
2984        } elsif ($self->{insertion_mode} & BODY_IMS) {
2985              if ($token->{type} == CHARACTER_TOKEN) {
2986                ## NOTE: There is a code clone of "character in body".
2987                $reconstruct_active_formatting_elements->($insert_to_current);
2988                
2989                $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});
2990    
2991                !!!next-token;
2992                redo B;
2993              } elsif ($token->{type} == START_TAG_TOKEN) {
2994                if ({
2995                     caption => 1, col => 1, colgroup => 1, tbody => 1,
2996                     td => 1, tfoot => 1, th => 1, thead => 1, tr => 1,
2997                    }->{$token->{tag_name}}) {
2998                  if ($self->{insertion_mode} == IN_CELL_IM) {
2999                    ## have an element in table scope
3000                    my $tn;
3001                    INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3002                      my $node = $self->{open_elements}->[$_];
3003                      if ($node->[1] eq 'td' or $node->[1] eq 'th') {
3004                        $tn = $node->[1];
3005                        last INSCOPE;
3006                      } elsif ({
3007                                table => 1, html => 1,
3008                               }->{$node->[1]}) {
3009                        last INSCOPE;
3010                      }
3011                    } # INSCOPE
3012                      unless (defined $tn) {
3013                        !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3014                        ## Ignore the token
3015                        !!!next-token;
3016                        redo B;
3017                      }
3018                    
3019                    ## Close the cell
3020                    !!!back-token; # <?>
3021                    $token = {type => END_TAG_TOKEN, tag_name => $tn};
3022                    redo B;
3023                  } elsif ($self->{insertion_mode} == IN_CAPTION_IM) {
3024                    !!!parse-error (type => 'not closed:caption');
3025                    
3026                    ## As if </caption>
3027                    ## have a table element in table scope
3028                    my $i;
3029                    INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3030                      my $node = $self->{open_elements}->[$_];
3031                      if ($node->[1] eq 'caption') {
3032                        $i = $_;
3033                        last INSCOPE;
3034                      } elsif ({
3035                                table => 1, html => 1,
3036                               }->{$node->[1]}) {
3037                        last INSCOPE;
3038                      }
3039                    } # INSCOPE
3040                      unless (defined $i) {
3041                        !!!parse-error (type => 'unmatched end tag:caption');
3042                        ## Ignore the token
3043                        !!!next-token;
3044                        redo B;
3045                      }
3046                    
3047                    ## generate implied end tags
3048                    if ({
3049                         dd => 1, dt => 1, li => 1, p => 1,
3050                         td => 1, th => 1, tr => 1,
3051                         tbody => 1, tfoot=> 1, thead => 1,
3052                        }->{$self->{open_elements}->[-1]->[1]}) {
3053                      !!!back-token; # <?>
3054                      $token = {type => END_TAG_TOKEN, tag_name => 'caption'};
3055                      !!!back-token;
3056                      $token = {type => END_TAG_TOKEN,
3057                                tag_name => $self->{open_elements}->[-1]->[1]}; # MUST
3058                      redo B;
3059                    }
3060    
3061                    if ($self->{open_elements}->[-1]->[1] ne 'caption') {
3062                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3063                    }
3064                    
3065                    splice @{$self->{open_elements}}, $i;
3066                    
3067                    $clear_up_to_marker->();
3068                    
3069                    $self->{insertion_mode} = IN_TABLE_IM;
3070                    
3071                    ## reprocess
3072                    redo B;
3073                  } else {
3074                    #
3075                  }
3076                } else {
3077                  #
3078                }
3079              } elsif ($token->{type} == END_TAG_TOKEN) {
3080                if ($token->{tag_name} eq 'td' or $token->{tag_name} eq 'th') {
3081                  if ($self->{insertion_mode} == IN_CELL_IM) {
3082                    ## have an element in table scope
3083                    my $i;
3084                    INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3085                      my $node = $self->{open_elements}->[$_];
3086                      if ($node->[1] eq $token->{tag_name}) {
3087                        $i = $_;
3088                        last INSCOPE;
3089                      } elsif ({
3090                                table => 1, html => 1,
3091                               }->{$node->[1]}) {
3092                        last INSCOPE;
3093                      }
3094                    } # INSCOPE
3095                      unless (defined $i) {
3096                        !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3097                        ## Ignore the token
3098                        !!!next-token;
3099                        redo B;
3100                      }
3101                    
3102                    ## generate implied end tags
3103                    if ({
3104                         dd => 1, dt => 1, li => 1, p => 1,
3105                         td => ($token->{tag_name} eq 'th'),
3106                         th => ($token->{tag_name} eq 'td'),
3107                         tr => 1,
3108                         tbody => 1, tfoot=> 1, thead => 1,
3109                        }->{$self->{open_elements}->[-1]->[1]}) {
3110                      !!!back-token;
3111                      $token = {type => END_TAG_TOKEN,
3112                                tag_name => $self->{open_elements}->[-1]->[1]}; # MUST
3113                      redo B;
3114                    }
3115                    
3116                    if ($self->{open_elements}->[-1]->[1] ne $token->{tag_name}) {
3117                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3118                    }
3119                    
3120                    splice @{$self->{open_elements}}, $i;
3121                    
3122                    $clear_up_to_marker->();
3123                    
3124                    $self->{insertion_mode} = IN_ROW_IM;
3125                    
3126                    !!!next-token;
3127                    redo B;
3128                  } elsif ($self->{insertion_mode} == IN_CAPTION_IM) {
3129                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3130                    ## Ignore the token
3131                    !!!next-token;
3132                    redo B;
3133                  } else {
3134                    #
3135                  }
3136                } elsif ($token->{tag_name} eq 'caption') {
3137                  if ($self->{insertion_mode} == IN_CAPTION_IM) {
3138                    ## have a table element in table scope
3139                    my $i;
3140                    INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3141                      my $node = $self->{open_elements}->[$_];
3142                      if ($node->[1] eq $token->{tag_name}) {
3143                        $i = $_;
3144                        last INSCOPE;
3145                      } elsif ({
3146                                table => 1, html => 1,
3147                               }->{$node->[1]}) {
3148                        last INSCOPE;
3149                      }
3150                    } # INSCOPE
3151                      unless (defined $i) {
3152                        !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3153                        ## Ignore the token
3154                        !!!next-token;
3155                        redo B;
3156                      }
3157                    
3158                    ## generate implied end tags
3159                    if ({
3160                         dd => 1, dt => 1, li => 1, p => 1,
3161                         td => 1, th => 1, tr => 1,
3162                         tbody => 1, tfoot=> 1, thead => 1,
3163                        }->{$self->{open_elements}->[-1]->[1]}) {
3164                      !!!back-token;
3165                      $token = {type => END_TAG_TOKEN,
3166                                tag_name => $self->{open_elements}->[-1]->[1]}; # MUST
3167                      redo B;
3168                    }
3169                    
3170                    if ($self->{open_elements}->[-1]->[1] ne 'caption') {
3171                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3172                    }
3173                    
3174                    splice @{$self->{open_elements}}, $i;
3175                    
3176                    $clear_up_to_marker->();
3177                    
3178                    $self->{insertion_mode} = IN_TABLE_IM;
3179                    
3180                    !!!next-token;
3181                    redo B;
3182                  } elsif ($self->{insertion_mode} == IN_CELL_IM) {
3183                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3184                    ## Ignore the token
3185                    !!!next-token;
3186                    redo B;
3187                  } else {
3188                    #
3189                  }
3190                } elsif ({
3191                          table => 1, tbody => 1, tfoot => 1,
3192                          thead => 1, tr => 1,
3193                         }->{$token->{tag_name}} and
3194                         $self->{insertion_mode} == IN_CELL_IM) {
3195                  ## have an element in table scope
3196                  my $i;
3197                  my $tn;
3198                  INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3199                    my $node = $self->{open_elements}->[$_];
3200                    if ($node->[1] eq $token->{tag_name}) {
3201                      $i = $_;
3202                      last INSCOPE;
3203                    } elsif ($node->[1] eq 'td' or $node->[1] eq 'th') {
3204                      $tn = $node->[1];
3205                      ## NOTE: There is exactly one |td| or |th| element
3206                      ## in scope in the stack of open elements by definition.
3207                    } elsif ({
3208                              table => 1, html => 1,
3209                             }->{$node->[1]}) {
3210                      last INSCOPE;
3211                    }
3212                  } # INSCOPE
3213                  unless (defined $i) {
3214                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3215                    ## Ignore the token
3216                    !!!next-token;
3217                    redo B;
3218                  }
3219    
3220                  ## Close the cell
3221                  !!!back-token; # </?>
3222                  $token = {type => END_TAG_TOKEN, tag_name => $tn};
3223                  redo B;
3224                } elsif ($token->{tag_name} eq 'table' and
3225                         $self->{insertion_mode} == IN_CAPTION_IM) {
3226                  !!!parse-error (type => 'not closed:caption');
3227    
3228                  ## As if </caption>
3229                  ## have a table element in table scope
3230                  my $i;
3231                  INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3232                    my $node = $self->{open_elements}->[$_];
3233                    if ($node->[1] eq 'caption') {
3234                      $i = $_;
3235                      last INSCOPE;
3236                    } elsif ({
3237                              table => 1, html => 1,
3238                             }->{$node->[1]}) {
3239                      last INSCOPE;
3240                    }
3241                  } # INSCOPE
3242                  unless (defined $i) {
3243                    !!!parse-error (type => 'unmatched end tag:caption');
3244                    ## Ignore the token
3245                    !!!next-token;
3246                    redo B;
3247                  }
3248                  
3249                  ## generate implied end tags
3250                  if ({
3251                       dd => 1, dt => 1, li => 1, p => 1,
3252                       td => 1, th => 1, tr => 1,
3253                       tbody => 1, tfoot=> 1, thead => 1,
3254                      }->{$self->{open_elements}->[-1]->[1]}) {
3255                    !!!back-token; # </table>
3256                    $token = {type => END_TAG_TOKEN, tag_name => 'caption'};
3257                    !!!back-token;
3258                    $token = {type => END_TAG_TOKEN,
3259                              tag_name => $self->{open_elements}->[-1]->[1]}; # MUST
3260                    redo B;
3261                  }
3262    
3263                  if ($self->{open_elements}->[-1]->[1] ne 'caption') {
3264                    !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3265                  }
3266    
3267                  splice @{$self->{open_elements}}, $i;
3268    
3269                  $clear_up_to_marker->();
3270    
3271                  $self->{insertion_mode} = IN_TABLE_IM;
3272    
3273                  ## reprocess
3274                  redo B;
3275                } elsif ({
3276                          body => 1, col => 1, colgroup => 1, html => 1,
3277                         }->{$token->{tag_name}}) {
3278                  if ($self->{insertion_mode} & BODY_TABLE_IMS) {
3279                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3280                    ## Ignore the token
3281                    !!!next-token;
3282                    redo B;
3283                  } else {
3284                    #
3285                  }
3286                } elsif ({
3287                          tbody => 1, tfoot => 1,
3288                          thead => 1, tr => 1,
3289                         }->{$token->{tag_name}} and
3290                         $self->{insertion_mode} == IN_CAPTION_IM) {
3291                  !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3292                  ## Ignore the token
3293                  !!!next-token;
3294                  redo B;
3295                } else {
3296                  #
3297                }
3298          } else {
3299            die "$0: $token->{type}: Unknown token type";
3300          }
3301    
3302          $insert = $insert_to_current;
3303          #
3304        } elsif ($self->{insertion_mode} & TABLE_IMS) {
3305              if ($token->{type} == CHARACTER_TOKEN) {
3306                ## NOTE: There are "character in table" code clones.
3307                if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {
3308                  $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);
3309                  
3310                  unless (length $token->{data}) {
3311                    !!!next-token;
3312                    redo B;
3313                  }
3314                }
3315    
3316                !!!parse-error (type => 'in table:#character');
3317    
3318                ## As if in body, but insert into foster parent element
3319                ## ISSUE: Spec says that "whenever a node would be inserted
3320                ## into the current node" while characters might not be
3321                ## result in a new Text node.
3322                $reconstruct_active_formatting_elements->($insert_to_foster);
3323                
3324                if ({
3325                     table => 1, tbody => 1, tfoot => 1,
3326                     thead => 1, tr => 1,
3327                    }->{$self->{open_elements}->[-1]->[1]}) {
3328                  # MUST
3329                  my $foster_parent_element;
3330                  my $next_sibling;
3331                  my $prev_sibling;
3332                  OE: for (reverse 0..$#{$self->{open_elements}}) {
3333                    if ($self->{open_elements}->[$_]->[1] eq 'table') {
3334                      my $parent = $self->{open_elements}->[$_]->[0]->parent_node;
3335                      if (defined $parent and $parent->node_type == 1) {
3336                        $foster_parent_element = $parent;
3337                        $next_sibling = $self->{open_elements}->[$_]->[0];
3338                        $prev_sibling = $next_sibling->previous_sibling;
3339                      } else {
3340                        $foster_parent_element = $self->{open_elements}->[$_ - 1]->[0];
3341                        $prev_sibling = $foster_parent_element->last_child;
3342                      }
3343                      last OE;
3344                    }
3345                  } # OE
3346                  $foster_parent_element = $self->{open_elements}->[0]->[0] and
3347                  $prev_sibling = $foster_parent_element->last_child
3348                    unless defined $foster_parent_element;
3349                  if (defined $prev_sibling and
3350                      $prev_sibling->node_type == 3) {
3351                    $prev_sibling->manakai_append_text ($token->{data});
3352                  } else {
3353                    $foster_parent_element->insert_before
3354                      ($self->{document}->create_text_node ($token->{data}),
3355                       $next_sibling);
3356                  }
3357                } else {
3358                  $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});
3359                }
3360                
3361                !!!next-token;
3362                redo B;
3363              } elsif ($token->{type} == START_TAG_TOKEN) {
3364                if ({
3365                     tr => ($self->{insertion_mode} != IN_ROW_IM),
3366                     th => 1, td => 1,
3367                    }->{$token->{tag_name}}) {
3368                  if ($self->{insertion_mode} == IN_TABLE_IM) {
3369                    ## Clear back to table context
3370                    while ($self->{open_elements}->[-1]->[1] ne 'table' and
3371                           $self->{open_elements}->[-1]->[1] ne 'html') {
3372                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3373                      pop @{$self->{open_elements}};
3374                    }
3375                    
3376                    !!!insert-element ('tbody');
3377                    $self->{insertion_mode} = IN_TABLE_BODY_IM;
3378                    ## reprocess in the "in table body" insertion mode...
3379                  }
3380    
3381                  if ($self->{insertion_mode} == IN_TABLE_BODY_IM) {
3382                    unless ($token->{tag_name} eq 'tr') {
3383                      !!!parse-error (type => 'missing start tag:tr');
3384                    }
3385                    
3386                    ## Clear back to table body context
3387                    while (not {
3388                      tbody => 1, tfoot => 1, thead => 1, html => 1,
3389                    }->{$self->{open_elements}->[-1]->[1]}) {
3390                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3391                      pop @{$self->{open_elements}};
3392                    }
3393                    
3394                    $self->{insertion_mode} = IN_ROW_IM;
3395                    if ($token->{tag_name} eq 'tr') {
3396                      !!!insert-element ($token->{tag_name}, $token->{attributes});
3397                      !!!next-token;
3398                      redo B;
3399                    } else {
3400                      !!!insert-element ('tr');
3401                      ## reprocess in the "in row" insertion mode
3402                    }
3403                  }
3404    
3405                  ## Clear back to table row context
3406                  while (not {
3407                    tr => 1, html => 1,
3408                  }->{$self->{open_elements}->[-1]->[1]}) {
3409                    !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3410                    pop @{$self->{open_elements}};
3411                  }
3412                  
3413                  !!!insert-element ($token->{tag_name}, $token->{attributes});
3414                  $self->{insertion_mode} = IN_CELL_IM;
3415    
3416                  push @$active_formatting_elements, ['#marker', ''];
3417                  
3418                  !!!next-token;
3419                  redo B;
3420                } elsif ({
3421                          caption => 1, col => 1, colgroup => 1,
3422                          tbody => 1, tfoot => 1, thead => 1,
3423                          tr => 1, # $self->{insertion_mode} == IN_ROW_IM
3424                         }->{$token->{tag_name}}) {
3425                  if ($self->{insertion_mode} == IN_ROW_IM) {
3426                    ## As if </tr>
3427                    ## have an element in table scope
3428                    my $i;
3429                    INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3430                      my $node = $self->{open_elements}->[$_];
3431                      if ($node->[1] eq 'tr') {
3432                        $i = $_;
3433                        last INSCOPE;
3434                      } elsif ({
3435                                table => 1, html => 1,
3436                               }->{$node->[1]}) {
3437                        last INSCOPE;
3438                      }
3439                    } # INSCOPE
3440                    unless (defined $i) {
3441                      !!!parse-error (type => 'unmacthed end tag:'.$token->{tag_name});
3442                      ## Ignore the token
3443                      !!!next-token;
3444                      redo B;
3445                    }
3446                    
3447                    ## Clear back to table row context
3448                    while (not {
3449                      tr => 1, html => 1,
3450                    }->{$self->{open_elements}->[-1]->[1]}) {
3451                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3452                      pop @{$self->{open_elements}};
3453                    }
3454                    
3455                    pop @{$self->{open_elements}}; # tr
3456                    $self->{insertion_mode} = IN_TABLE_BODY_IM;
3457                    if ($token->{tag_name} eq 'tr') {
3458                      ## reprocess
3459                      redo B;
3460                    } else {
3461                      ## reprocess in the "in table body" insertion mode...
3462                    }
3463                  }
3464    
3465                  if ($self->{insertion_mode} == IN_TABLE_BODY_IM) {
3466                    ## have an element in table scope
3467                    my $i;
3468                    INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3469                      my $node = $self->{open_elements}->[$_];
3470                      if ({
3471                           tbody => 1, thead => 1, tfoot => 1,
3472                          }->{$node->[1]}) {
3473                        $i = $_;
3474                        last INSCOPE;
3475                      } elsif ({
3476                                table => 1, html => 1,
3477                               }->{$node->[1]}) {
3478                        last INSCOPE;
3479                      }
3480                    } # INSCOPE
3481                    unless (defined $i) {
3482                      !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3483                      ## Ignore the token
3484                      !!!next-token;
3485                      redo B;
3486                    }
3487    
3488                    ## Clear back to table body context
3489                    while (not {
3490                      tbody => 1, tfoot => 1, thead => 1, html => 1,
3491                    }->{$self->{open_elements}->[-1]->[1]}) {
3492                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3493                      pop @{$self->{open_elements}};
3494                    }
3495                    
3496                    ## As if <{current node}>
3497                    ## have an element in table scope
3498                    ## true by definition
3499                    
3500                    ## Clear back to table body context
3501                    ## nop by definition
3502                    
3503                    pop @{$self->{open_elements}};
3504                    $self->{insertion_mode} = IN_TABLE_IM;
3505                    ## reprocess in "in table" insertion mode...
3506                  }
3507    
3508                  if ($token->{tag_name} eq 'col') {
3509                    ## Clear back to table context
3510                    while ($self->{open_elements}->[-1]->[1] ne 'table' and
3511                           $self->{open_elements}->[-1]->[1] ne 'html') {
3512                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3513                      pop @{$self->{open_elements}};
3514                    }
3515                    
3516                    !!!insert-element ('colgroup');
3517                    $self->{insertion_mode} = IN_COLUMN_GROUP_IM;
3518                    ## reprocess
3519                    redo B;
3520                  } elsif ({
3521                            caption => 1,
3522                            colgroup => 1,
3523                            tbody => 1, tfoot => 1, thead => 1,
3524                           }->{$token->{tag_name}}) {
3525                    ## Clear back to table context
3526                    while ($self->{open_elements}->[-1]->[1] ne 'table' and
3527                           $self->{open_elements}->[-1]->[1] ne 'html') {
3528                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3529                      pop @{$self->{open_elements}};
3530                    }
3531                    
3532                    push @$active_formatting_elements, ['#marker', '']
3533                        if $token->{tag_name} eq 'caption';
3534                    
3535                    !!!insert-element ($token->{tag_name}, $token->{attributes});
3536                    $self->{insertion_mode} = {
3537                                               caption => IN_CAPTION_IM,
3538                                               colgroup => IN_COLUMN_GROUP_IM,
3539                                               tbody => IN_TABLE_BODY_IM,
3540                                               tfoot => IN_TABLE_BODY_IM,
3541                                               thead => IN_TABLE_BODY_IM,
3542                                              }->{$token->{tag_name}};
3543                    !!!next-token;
3544                    redo B;
3545                  } else {
3546                    die "$0: in table: <>: $token->{tag_name}";
3547                  }
3548                } elsif ($token->{tag_name} eq 'table') {
3549                  ## NOTE: There are code clones for this "table in table"
3550                  !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3551    
3552                  ## As if </table>
3553                  ## have a table element in table scope
3554                  my $i;
3555                  INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3556                    my $node = $self->{open_elements}->[$_];
3557                    if ($node->[1] eq 'table') {
3558                      $i = $_;
3559                      last INSCOPE;
3560                    } elsif ({
3561                              table => 1, html => 1,
3562                             }->{$node->[1]}) {
3563                      last INSCOPE;
3564                    }
3565                  } # INSCOPE
3566                  unless (defined $i) {
3567                    !!!parse-error (type => 'unmatched end tag:table');
3568                    ## Ignore tokens </table><table>
3569                    !!!next-token;
3570                    redo B;
3571                  }
3572                  
3573                  ## generate implied end tags
3574                  if ({
3575                       dd => 1, dt => 1, li => 1, p => 1,
3576                       td => 1, th => 1, tr => 1,
3577                       tbody => 1, tfoot=> 1, thead => 1,
3578                      }->{$self->{open_elements}->[-1]->[1]}) {
3579                    !!!back-token; # <table>
3580                    $token = {type => END_TAG_TOKEN, tag_name => 'table'};
3581                    !!!back-token;
3582                    $token = {type => END_TAG_TOKEN,
3583                              tag_name => $self->{open_elements}->[-1]->[1]}; # MUST
3584                    redo B;
3585                  }
3586    
3587                  if ($self->{open_elements}->[-1]->[1] ne 'table') {
3588                    !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3589                  }
3590    
3591                  splice @{$self->{open_elements}}, $i;
3592    
3593                  $self->_reset_insertion_mode;
3594    
3595                  ## reprocess
3596                  redo B;
3597                } else {
3598                  #
3599                }
3600              } elsif ($token->{type} == END_TAG_TOKEN) {
3601                if ($token->{tag_name} eq 'tr' and
3602                    $self->{insertion_mode} == IN_ROW_IM) {
3603                  ## have an element in table scope
3604                  my $i;
3605                  INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3606                    my $node = $self->{open_elements}->[$_];
3607                    if ($node->[1] eq $token->{tag_name}) {
3608                      $i = $_;
3609                      last INSCOPE;
3610                    } elsif ({
3611                              table => 1, html => 1,
3612                             }->{$node->[1]}) {
3613                      last INSCOPE;
3614                    }
3615                  } # INSCOPE
3616                  unless (defined $i) {
3617                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3618                    ## Ignore the token
3619                    !!!next-token;
3620                    redo B;
3621                  }
3622    
3623                  ## Clear back to table row context
3624                  while (not {
3625                    tr => 1, html => 1,
3626                  }->{$self->{open_elements}->[-1]->[1]}) {
3627                    !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3628                    pop @{$self->{open_elements}};
3629                  }
3630    
3631                  pop @{$self->{open_elements}}; # tr
3632                  $self->{insertion_mode} = IN_TABLE_BODY_IM;
3633                  !!!next-token;
3634                  redo B;
3635                } elsif ($token->{tag_name} eq 'table') {
3636                  if ($self->{insertion_mode} == IN_ROW_IM) {
3637                    ## As if </tr>
3638                    ## have an element in table scope
3639                    my $i;
3640                    INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3641                      my $node = $self->{open_elements}->[$_];
3642                      if ($node->[1] eq 'tr') {
3643                        $i = $_;
3644                        last INSCOPE;
3645                      } elsif ({
3646                                table => 1, html => 1,
3647                               }->{$node->[1]}) {
3648                        last INSCOPE;
3649                      }
3650                    } # INSCOPE
3651                    unless (defined $i) {
3652                      !!!parse-error (type => 'unmatched end tag:'.$token->{type});
3653                      ## Ignore the token
3654                      !!!next-token;
3655                      redo B;
3656                    }
3657                    
3658                    ## Clear back to table row context
3659                    while (not {
3660                      tr => 1, html => 1,
3661                    }->{$self->{open_elements}->[-1]->[1]}) {
3662                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3663                      pop @{$self->{open_elements}};
3664                    }
3665                    
3666                    pop @{$self->{open_elements}}; # tr
3667                    $self->{insertion_mode} = IN_TABLE_BODY_IM;
3668                    ## reprocess in the "in table body" insertion mode...
3669                  }
3670    
3671                  if ($self->{insertion_mode} == IN_TABLE_BODY_IM) {
3672                    ## have an element in table scope
3673                    my $i;
3674                    INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3675                      my $node = $self->{open_elements}->[$_];
3676                      if ({
3677                           tbody => 1, thead => 1, tfoot => 1,
3678                          }->{$node->[1]}) {
3679                        $i = $_;
3680                        last INSCOPE;
3681                      } elsif ({
3682                                table => 1, html => 1,
3683                               }->{$node->[1]}) {
3684                        last INSCOPE;
3685                      }
3686                    } # INSCOPE
3687                    unless (defined $i) {
3688                      !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3689                      ## Ignore the token
3690                      !!!next-token;
3691                      redo B;
3692                    }
3693                    
3694                    ## Clear back to table body context
3695                    while (not {
3696                      tbody => 1, tfoot => 1, thead => 1, html => 1,
3697                    }->{$self->{open_elements}->[-1]->[1]}) {
3698                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3699                      pop @{$self->{open_elements}};
3700                    }
3701                    
3702                    ## As if <{current node}>
3703                    ## have an element in table scope
3704                    ## true by definition
3705                    
3706                    ## Clear back to table body context
3707                    ## nop by definition
3708                    
3709                    pop @{$self->{open_elements}};
3710                    $self->{insertion_mode} = IN_TABLE_IM;
3711                    ## reprocess in the "in table" insertion mode...
3712                  }
3713    
3714                  ## have a table element in table scope
3715                  my $i;
3716                  INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3717                    my $node = $self->{open_elements}->[$_];
3718                    if ($node->[1] eq $token->{tag_name}) {
3719                      $i = $_;
3720                      last INSCOPE;
3721                    } elsif ({
3722                              table => 1, html => 1,
3723                             }->{$node->[1]}) {
3724                      last INSCOPE;
3725                    }
3726                  } # INSCOPE
3727                  unless (defined $i) {
3728                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3729                    ## Ignore the token
3730                    !!!next-token;
3731                    redo B;
3732                  }
3733    
3734                  ## generate implied end tags
3735                  if ({
3736                       dd => 1, dt => 1, li => 1, p => 1,
3737                       td => 1, th => 1, tr => 1,
3738                       tbody => 1, tfoot=> 1, thead => 1,
3739                      }->{$self->{open_elements}->[-1]->[1]}) {
3740                    !!!back-token;
3741                    $token = {type => END_TAG_TOKEN,
3742                              tag_name => $self->{open_elements}->[-1]->[1]}; # MUST
3743                    redo B;
3744                  }
3745                  
3746                  if ($self->{open_elements}->[-1]->[1] ne 'table') {
3747                    !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3748                  }
3749                    
3750                  splice @{$self->{open_elements}}, $i;
3751                  
3752                  $self->_reset_insertion_mode;
3753                  
3754                  !!!next-token;
3755                  redo B;
3756                } elsif ({
3757                          tbody => 1, tfoot => 1, thead => 1,
3758                         }->{$token->{tag_name}} and
3759                         $self->{insertion_mode} & ROW_IMS) {
3760                  if ($self->{insertion_mode} == IN_ROW_IM) {
3761                    ## have an element in table scope
3762                    my $i;
3763                    INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3764                      my $node = $self->{open_elements}->[$_];
3765                      if ($node->[1] eq $token->{tag_name}) {
3766                        $i = $_;
3767                        last INSCOPE;
3768                      } elsif ({
3769                                table => 1, html => 1,
3770                               }->{$node->[1]}) {
3771                        last INSCOPE;
3772                      }
3773                    } # INSCOPE
3774                      unless (defined $i) {
3775                        !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3776                        ## Ignore the token
3777                        !!!next-token;
3778                        redo B;
3779                      }
3780                    
3781                    ## As if </tr>
3782                    ## have an element in table scope
3783                    my $i;
3784                    INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3785                      my $node = $self->{open_elements}->[$_];
3786                      if ($node->[1] eq 'tr') {
3787                        $i = $_;
3788                        last INSCOPE;
3789                      } elsif ({
3790                                table => 1, html => 1,
3791                               }->{$node->[1]}) {
3792                        last INSCOPE;
3793                      }
3794                    } # INSCOPE
3795                      unless (defined $i) {
3796                        !!!parse-error (type => 'unmatched end tag:tr');
3797                        ## Ignore the token
3798                        !!!next-token;
3799                        redo B;
3800                      }
3801                    
3802                    ## Clear back to table row context
3803                    while (not {
3804                      tr => 1, html => 1,
3805                    }->{$self->{open_elements}->[-1]->[1]}) {
3806                      !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3807                      pop @{$self->{open_elements}};
3808                    }
3809                    
3810                    pop @{$self->{open_elements}}; # tr
3811                    $self->{insertion_mode} = IN_TABLE_BODY_IM;
3812                    ## reprocess in the "in table body" insertion mode...
3813                  }
3814    
3815                  ## have an element in table scope
3816                  my $i;
3817                  INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3818                    my $node = $self->{open_elements}->[$_];
3819                    if ($node->[1] eq $token->{tag_name}) {
3820                      $i = $_;
3821                      last INSCOPE;
3822                    } elsif ({
3823                              table => 1, html => 1,
3824                             }->{$node->[1]}) {
3825                      last INSCOPE;
3826                    }
3827                  } # INSCOPE
3828                  unless (defined $i) {
3829                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3830                    ## Ignore the token
3831                    !!!next-token;
3832                    redo B;
3833                  }
3834    
3835                  ## Clear back to table body context
3836                  while (not {
3837                    tbody => 1, tfoot => 1, thead => 1, html => 1,
3838                  }->{$self->{open_elements}->[-1]->[1]}) {
3839                    !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
3840                    pop @{$self->{open_elements}};
3841                  }
3842    
3843                  pop @{$self->{open_elements}};
3844                  $self->{insertion_mode} = IN_TABLE_IM;
3845                  !!!next-token;
3846                  redo B;
3847                } elsif ({
3848                          body => 1, caption => 1, col => 1, colgroup => 1,
3849                          html => 1, td => 1, th => 1,
3850                          tr => 1, # $self->{insertion_mode} == IN_ROW_IM
3851                          tbody => 1, tfoot => 1, thead => 1, # $self->{insertion_mode} == IN_TABLE_IM
3852                         }->{$token->{tag_name}}) {
3853                  !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3854                  ## Ignore the token
3855                  !!!next-token;
3856                  redo B;
3857                } else {
3858                  #
3859                }
3860              } else {
3861                die "$0: $token->{type}: Unknown token type";
3862              }
3863    
3864          !!!parse-error (type => 'in table:'.$token->{tag_name});
3865    
3866          $insert = $insert_to_foster;
3867          #
3868        } elsif ($self->{insertion_mode} == IN_COLUMN_GROUP_IM) {
3869              if ($token->{type} == CHARACTER_TOKEN) {
3870                if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {
3871                  $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);
3872                  unless (length $token->{data}) {
3873                    !!!next-token;
3874                    redo B;
3875                  }
3876                }
3877                
3878                #
3879              } elsif ($token->{type} == START_TAG_TOKEN) {
3880                if ($token->{tag_name} eq 'col') {
3881                  !!!insert-element ($token->{tag_name}, $token->{attributes});
3882                  pop @{$self->{open_elements}};
3883                  !!!next-token;
3884                  redo B;
3885                } else {
3886                  #
3887                }
3888              } elsif ($token->{type} == END_TAG_TOKEN) {
3889                if ($token->{tag_name} eq 'colgroup') {
3890                  if ($self->{open_elements}->[-1]->[1] eq 'html') {
3891                    !!!parse-error (type => 'unmatched end tag:colgroup');
3892                    ## Ignore the token
3893                    !!!next-token;
3894                    redo B;
3895                  } else {
3896                    pop @{$self->{open_elements}}; # colgroup
3897                    $self->{insertion_mode} = IN_TABLE_IM;
3898                    !!!next-token;
3899                    redo B;            
3900                  }
3901                } elsif ($token->{tag_name} eq 'col') {
3902                  !!!parse-error (type => 'unmatched end tag:col');
3903                  ## Ignore the token
3904                  !!!next-token;
3905                  redo B;
3906                } else {
3907                  #
3908                }
3909              } else {
3910                #
3911              }
3912    
3913              ## As if </colgroup>
3914              if ($self->{open_elements}->[-1]->[1] eq 'html') {
3915                !!!parse-error (type => 'unmatched end tag:colgroup');
3916                ## Ignore the token
3917                !!!next-token;
3918                redo B;
3919              } else {
3920                pop @{$self->{open_elements}}; # colgroup
3921                $self->{insertion_mode} = IN_TABLE_IM;
3922                ## reprocess
3923                redo B;
3924              }
3925        } elsif ($self->{insertion_mode} == IN_SELECT_IM) {
3926              if ($token->{type} == CHARACTER_TOKEN) {
3927                $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});
3928                !!!next-token;
3929                redo B;
3930              } elsif ($token->{type} == START_TAG_TOKEN) {
3931                if ($token->{tag_name} eq 'option') {
3932                  if ($self->{open_elements}->[-1]->[1] eq 'option') {
3933                    ## As if </option>
3934                    pop @{$self->{open_elements}};
3935                  }
3936    
3937                  !!!insert-element ($token->{tag_name}, $token->{attributes});
3938                  !!!next-token;
3939                  redo B;
3940                } elsif ($token->{tag_name} eq 'optgroup') {
3941                  if ($self->{open_elements}->[-1]->[1] eq 'option') {
3942                    ## As if </option>
3943                    pop @{$self->{open_elements}};
3944                  }
3945    
3946                  if ($self->{open_elements}->[-1]->[1] eq 'optgroup') {
3947                    ## As if </optgroup>
3948                    pop @{$self->{open_elements}};
3949                  }
3950    
3951                  !!!insert-element ($token->{tag_name}, $token->{attributes});
3952                  !!!next-token;
3953                  redo B;
3954                } elsif ($token->{tag_name} eq 'select') {
3955                  !!!parse-error (type => 'not closed:select');
3956                  ## As if </select> instead
3957                  ## have an element in table scope
3958                  my $i;
3959                  INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
3960                    my $node = $self->{open_elements}->[$_];
3961                    if ($node->[1] eq $token->{tag_name}) {
3962                      $i = $_;
3963                      last INSCOPE;
3964                    } elsif ({
3965                              table => 1, html => 1,
3966                             }->{$node->[1]}) {
3967                      last INSCOPE;
3968                    }
3969                  } # INSCOPE
3970                  unless (defined $i) {
3971                    !!!parse-error (type => 'unmatched end tag:select');
3972                    ## Ignore the token
3973                    !!!next-token;
3974                    redo B;
3975                  }
3976                  
3977                  splice @{$self->{open_elements}}, $i;
3978    
3979                  $self->_reset_insertion_mode;
3980    
3981                  !!!next-token;
3982                  redo B;
3983                } else {
3984                  #
3985                }
3986              } elsif ($token->{type} == END_TAG_TOKEN) {
3987                if ($token->{tag_name} eq 'optgroup') {
3988                  if ($self->{open_elements}->[-1]->[1] eq 'option' and
3989                      $self->{open_elements}->[-2]->[1] eq 'optgroup') {
3990                    ## As if </option>
3991                    splice @{$self->{open_elements}}, -2;
3992                  } elsif ($self->{open_elements}->[-1]->[1] eq 'optgroup') {
3993                    pop @{$self->{open_elements}};
3994                  } else {
3995                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
3996                    ## Ignore the token
3997                  }
3998                  !!!next-token;
3999                  redo B;
4000                } elsif ($token->{tag_name} eq 'option') {
4001                  if ($self->{open_elements}->[-1]->[1] eq 'option') {
4002                    pop @{$self->{open_elements}};
4003                  } else {
4004                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
4005                    ## Ignore the token
4006                  }
4007                  !!!next-token;
4008                  redo B;
4009                } elsif ($token->{tag_name} eq 'select') {
4010                  ## have an element in table scope
4011                  my $i;
4012                  INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
4013                    my $node = $self->{open_elements}->[$_];
4014                    if ($node->[1] eq $token->{tag_name}) {
4015                      $i = $_;
4016                      last INSCOPE;
4017                    } elsif ({
4018                              table => 1, html => 1,
4019                             }->{$node->[1]}) {
4020                      last INSCOPE;
4021                    }
4022                  } # INSCOPE
4023                  unless (defined $i) {
4024                    !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
4025                    ## Ignore the token
4026                    !!!next-token;
4027                    redo B;
4028                  }
4029                  
4030                  splice @{$self->{open_elements}}, $i;
4031    
4032                  $self->_reset_insertion_mode;
4033    
4034                  !!!next-token;
4035                  redo B;
4036                } elsif ({
4037                          caption => 1, table => 1, tbody => 1,
4038                          tfoot => 1, thead => 1, tr => 1, td => 1, th => 1,
4039                         }->{$token->{tag_name}}) {
4040                  !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
4041                  
4042                  ## have an element in table scope
4043                  my $i;
4044                  INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
4045                    my $node = $self->{open_elements}->[$_];
4046                    if ($node->[1] eq $token->{tag_name}) {
4047                      $i = $_;
4048                      last INSCOPE;
4049                    } elsif ({
4050                              table => 1, html => 1,
4051                             }->{$node->[1]}) {
4052                      last INSCOPE;
4053                    }
4054                  } # INSCOPE
4055                  unless (defined $i) {
4056                    ## Ignore the token
4057                    !!!next-token;
4058                    redo B;
4059                  }
4060                  
4061                  ## As if </select>
4062                  ## have an element in table scope
4063                  undef $i;
4064                  INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
4065                    my $node = $self->{open_elements}->[$_];
4066                    if ($node->[1] eq 'select') {
4067                      $i = $_;
4068                      last INSCOPE;
4069                    } elsif ({
4070                              table => 1, html => 1,
4071                             }->{$node->[1]}) {
4072                      last INSCOPE;
4073                    }
4074                  } # INSCOPE
4075                  unless (defined $i) {
4076                    !!!parse-error (type => 'unmatched end tag:select');
4077                    ## Ignore the </select> token
4078                    !!!next-token; ## TODO: ok?
4079                    redo B;
4080                  }
4081                  
4082                  splice @{$self->{open_elements}}, $i;
4083    
4084                  $self->_reset_insertion_mode;
4085    
4086                  ## reprocess
4087                  redo B;
4088                } else {
4089                  #
4090                }
4091              } else {
4092                #
4093              }
4094    
4095              !!!parse-error (type => 'in select:'.$token->{tag_name});
4096              ## Ignore the token
4097            !!!next-token;            !!!next-token;
4098              redo B;
4099        } elsif ($self->{insertion_mode} & BODY_AFTER_IMS) {
4100          if ($token->{type} == CHARACTER_TOKEN) {
4101            if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {
4102              my $data = $1;
4103              ## As if in body
4104              $reconstruct_active_formatting_elements->($insert_to_current);
4105                  
4106              $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);
4107              
4108              unless (length $token->{data}) {
4109                !!!next-token;
4110                redo B;
4111              }
4112          }          }
4113          if (length $text) {          
4114            $title_el->manakai_append_text ($text);          if ($self->{insertion_mode} == AFTER_HTML_BODY_IM) {
4115              !!!parse-error (type => 'after html:#character');
4116    
4117              ## Reprocess in the "main" phase, "after body" insertion mode...
4118            }
4119            
4120            ## "after body" insertion mode
4121            !!!parse-error (type => 'after body:#character');
4122    
4123            $self->{insertion_mode} = IN_BODY_IM;
4124            ## reprocess
4125            redo B;
4126          } elsif ($token->{type} == START_TAG_TOKEN) {
4127            if ($self->{insertion_mode} == AFTER_HTML_BODY_IM) {
4128              !!!parse-error (type => 'after html:'.$token->{tag_name});
4129              
4130              ## Reprocess in the "main" phase, "after body" insertion mode...
4131            }
4132    
4133            ## "after body" insertion mode
4134            !!!parse-error (type => 'after body:'.$token->{tag_name});
4135    
4136            $self->{insertion_mode} = IN_BODY_IM;
4137            ## reprocess
4138            redo B;
4139          } elsif ($token->{type} == END_TAG_TOKEN) {
4140            if ($self->{insertion_mode} == AFTER_HTML_BODY_IM) {
4141              !!!parse-error (type => 'after html:/'.$token->{tag_name});
4142              
4143              $self->{insertion_mode} = AFTER_BODY_IM;
4144              ## Reprocess in the "main" phase, "after body" insertion mode...
4145            }
4146    
4147            ## "after body" insertion mode
4148            if ($token->{tag_name} eq 'html') {
4149              if (defined $self->{inner_html_node}) {
4150                !!!parse-error (type => 'unmatched end tag:html');
4151                ## Ignore the token
4152                !!!next-token;
4153                redo B;
4154              } else {
4155                $self->{insertion_mode} = AFTER_HTML_BODY_IM;
4156                !!!next-token;
4157                redo B;
4158              }
4159            } else {
4160              !!!parse-error (type => 'after body:/'.$token->{tag_name});
4161    
4162              $self->{insertion_mode} = IN_BODY_IM;
4163              ## reprocess
4164              redo B;
4165            }
4166          } else {
4167            die "$0: $token->{type}: Unknown token type";
4168          }
4169        } elsif ($self->{insertion_mode} & FRAME_IMS) {
4170          if ($token->{type} == CHARACTER_TOKEN) {
4171            if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {
4172              $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);
4173              
4174              unless (length $token->{data}) {
4175                !!!next-token;
4176                redo B;
4177              }
4178          }          }
4179                    
4180          $self->{content_model_flag} = 'PCDATA';          if ($token->{data} =~ s/^[^\x09\x0A\x0B\x0C\x20]+//) {
4181              if ($self->{insertion_mode} == IN_FRAMESET_IM) {
4182                !!!parse-error (type => 'in frameset:#character');
4183              } elsif ($self->{insertion_mode} == AFTER_FRAMESET_IM) {
4184                !!!parse-error (type => 'after frameset:#character');
4185              } else { # "after html frameset"
4186                !!!parse-error (type => 'after html:#character');
4187    
4188                $self->{insertion_mode} = AFTER_FRAMESET_IM;
4189                ## Reprocess in the "main" phase, "after frameset"...
4190                !!!parse-error (type => 'after frameset:#character');
4191              }
4192              
4193              ## Ignore the token.
4194              if (length $token->{data}) {
4195                ## reprocess the rest of characters
4196              } else {
4197                !!!next-token;
4198              }
4199              redo B;
4200            }
4201                    
4202          if ($token->{type} eq 'end tag' and          die qq[$0: Character "$token->{data}"];
4203              $token->{tag_name} eq 'title') {        } elsif ($token->{type} == START_TAG_TOKEN) {
4204            if ($self->{insertion_mode} == AFTER_HTML_FRAMESET_IM) {
4205              !!!parse-error (type => 'after html:'.$token->{tag_name});
4206    
4207              $self->{insertion_mode} = AFTER_FRAMESET_IM;
4208              ## Process in the "main" phase, "after frameset" insertion mode...
4209            }
4210    
4211            if ($token->{tag_name} eq 'frameset' and
4212                $self->{insertion_mode} == IN_FRAMESET_IM) {
4213              !!!insert-element ($token->{tag_name}, $token->{attributes});
4214              !!!next-token;
4215              redo B;
4216            } elsif ($token->{tag_name} eq 'frame' and
4217                     $self->{insertion_mode} == IN_FRAMESET_IM) {
4218              !!!insert-element ($token->{tag_name}, $token->{attributes});
4219              pop @{$self->{open_elements}};
4220              !!!next-token;
4221              redo B;
4222            } elsif ($token->{tag_name} eq 'noframes') {
4223              ## NOTE: As if in body.
4224              $parse_rcdata->(CDATA_CONTENT_MODEL, $insert_to_current);
4225              redo B;
4226            } else {
4227              if ($self->{insertion_mode} == IN_FRAMESET_IM) {
4228                !!!parse-error (type => 'in frameset:'.$token->{tag_name});
4229              } else {
4230                !!!parse-error (type => 'after frameset:'.$token->{tag_name});
4231              }
4232            ## Ignore the token            ## Ignore the token
4233              !!!next-token;
4234              redo B;
4235            }
4236          } elsif ($token->{type} == END_TAG_TOKEN) {
4237            if ($self->{insertion_mode} == AFTER_HTML_FRAMESET_IM) {
4238              !!!parse-error (type => 'after html:/'.$token->{tag_name});
4239    
4240              $self->{insertion_mode} = AFTER_FRAMESET_IM;
4241              ## Process in the "main" phase, "after frameset" insertion mode...
4242            }
4243    
4244            if ($token->{tag_name} eq 'frameset' and
4245                $self->{insertion_mode} == IN_FRAMESET_IM) {
4246              if ($self->{open_elements}->[-1]->[1] eq 'html' and
4247                  @{$self->{open_elements}} == 1) {
4248                !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
4249                ## Ignore the token
4250                !!!next-token;
4251              } else {
4252                pop @{$self->{open_elements}};
4253                !!!next-token;
4254              }
4255    
4256              if (not defined $self->{inner_html_node} and
4257                  $self->{open_elements}->[-1]->[1] ne 'frameset') {
4258                $self->{insertion_mode} = AFTER_FRAMESET_IM;
4259              }
4260              redo B;
4261            } elsif ($token->{tag_name} eq 'html' and
4262                     $self->{insertion_mode} == AFTER_FRAMESET_IM) {
4263              $self->{insertion_mode} = AFTER_HTML_FRAMESET_IM;
4264              !!!next-token;
4265              redo B;
4266          } else {          } else {
4267            !!!parse-error (type => 'in RCDATA:#'.$token->{type});            if ($self->{insertion_mode} == IN_FRAMESET_IM) {
4268            ## ISSUE: And ignore?              !!!parse-error (type => 'in frameset:/'.$token->{tag_name});
4269              } else {
4270                !!!parse-error (type => 'after frameset:/'.$token->{tag_name});
4271              }
4272              ## Ignore the token
4273              !!!next-token;
4274              redo B;
4275            }
4276          } else {
4277            die "$0: $token->{type}: Unknown token type";
4278          }
4279    
4280          ## ISSUE: An issue in spec here
4281        } else {
4282          die "$0: $self->{insertion_mode}: Unknown insertion mode";
4283        }
4284    
4285        ## "in body" insertion mode
4286        if ($token->{type} == START_TAG_TOKEN) {
4287          if ($token->{tag_name} eq 'script') {
4288            ## NOTE: This is an "as if in head" code clone
4289            $script_start_tag->($insert);
4290            redo B;
4291          } elsif ($token->{tag_name} eq 'style') {
4292            ## NOTE: This is an "as if in head" code clone
4293            $parse_rcdata->(CDATA_CONTENT_MODEL, $insert);
4294            redo B;
4295          } elsif ({
4296                    base => 1, link => 1,
4297                   }->{$token->{tag_name}}) {
4298            ## NOTE: This is an "as if in head" code clone, only "-t" differs
4299            !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4300            pop @{$self->{open_elements}}; ## ISSUE: This step is missing in the spec.
4301            !!!next-token;
4302            redo B;
4303          } elsif ($token->{tag_name} eq 'meta') {
4304            ## NOTE: This is an "as if in head" code clone, only "-t" differs
4305            !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4306            pop @{$self->{open_elements}}; ## ISSUE: This step is missing in the spec.
4307    
4308            unless ($self->{confident}) {
4309              my $charset;
4310              if ($token->{attributes}->{charset}) { ## TODO: And if supported
4311                $charset = $token->{attributes}->{charset}->{value};
4312              }
4313              if ($token->{attributes}->{'http-equiv'}) {
4314                ## ISSUE: Algorithm name in the spec was incorrect so that not linked to the definition.
4315                if ($token->{attributes}->{'http-equiv'}->{value}
4316                    =~ /\A[^;]*;[\x09-\x0D\x20]*charset[\x09-\x0D\x20]*=
4317                        [\x09-\x0D\x20]*(?>"([^"]*)"|'([^']*)'|
4318                        ([^"'\x09-\x0D\x20][^\x09-\x0D\x20]*))/x) {
4319                  $charset = defined $1 ? $1 : defined $2 ? $2 : $3;
4320                } ## TODO: And if supported
4321              }
4322              ## TODO: Change the encoding
4323          }          }
4324    
4325          !!!next-token;          !!!next-token;
4326          return;          redo B;
4327          } elsif ($token->{tag_name} eq 'title') {
4328            !!!parse-error (type => 'in body:title');
4329            ## NOTE: This is an "as if in head" code clone
4330            $parse_rcdata->(RCDATA_CONTENT_MODEL, sub {
4331              if (defined $self->{head_element}) {
4332                $self->{head_element}->append_child ($_[0]);
4333              } else {
4334                $insert->($_[0]);
4335              }
4336            });
4337            redo B;
4338        } elsif ($token->{tag_name} eq 'body') {        } elsif ($token->{tag_name} eq 'body') {
4339          !!!parse-error (type => 'in body:body');          !!!parse-error (type => 'in body:body');
4340                                
# Line 2494  sub _tree_construction_main ($) { Line 4352  sub _tree_construction_main ($) {
4352            }            }
4353          }          }
4354          !!!next-token;          !!!next-token;
4355          return;          redo B;
4356        } elsif ({        } elsif ({
4357                  address => 1, blockquote => 1, center => 1, dir => 1,                  address => 1, blockquote => 1, center => 1, dir => 1,
4358                  div => 1, dl => 1, fieldset => 1, listing => 1,                  div => 1, dl => 1, fieldset => 1, listing => 1,
# Line 2505  sub _tree_construction_main ($) { Line 4363  sub _tree_construction_main ($) {
4363          INSCOPE: for (reverse @{$self->{open_elements}}) {          INSCOPE: for (reverse @{$self->{open_elements}}) {
4364            if ($_->[1] eq 'p') {            if ($_->[1] eq 'p') {
4365              !!!back-token;              !!!back-token;
4366              $token = {type => 'end tag', tag_name => 'p'};              $token = {type => END_TAG_TOKEN, tag_name => 'p'};
4367              return;              redo B;
4368            } elsif ({            } elsif ({
4369                      table => 1, caption => 1, td => 1, th => 1,                      table => 1, caption => 1, td => 1, th => 1,
4370                      button => 1, marquee => 1, object => 1, html => 1,                      button => 1, marquee => 1, object => 1, html => 1,
# Line 2518  sub _tree_construction_main ($) { Line 4376  sub _tree_construction_main ($) {
4376          !!!insert-element-t ($token->{tag_name}, $token->{attributes});          !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4377          if ($token->{tag_name} eq 'pre') {          if ($token->{tag_name} eq 'pre') {
4378            !!!next-token;            !!!next-token;
4379            if ($token->{type} eq 'character') {            if ($token->{type} == CHARACTER_TOKEN) {
4380              $token->{data} =~ s/^\x0A//;              $token->{data} =~ s/^\x0A//;
4381              unless (length $token->{data}) {              unless (length $token->{data}) {
4382                !!!next-token;                !!!next-token;
# Line 2527  sub _tree_construction_main ($) { Line 4385  sub _tree_construction_main ($) {
4385          } else {          } else {
4386            !!!next-token;            !!!next-token;
4387          }          }
4388          return;          redo B;
4389        } elsif ($token->{tag_name} eq 'form') {        } elsif ($token->{tag_name} eq 'form') {
4390          if (defined $self->{form_element}) {          if (defined $self->{form_element}) {
4391            !!!parse-error (type => 'in form:form');            !!!parse-error (type => 'in form:form');
4392            ## Ignore the token            ## Ignore the token
4393            !!!next-token;            !!!next-token;
4394            return;            redo B;
4395          } else {          } else {
4396            ## has a p element in scope            ## has a p element in scope
4397            INSCOPE: for (reverse @{$self->{open_elements}}) {            INSCOPE: for (reverse @{$self->{open_elements}}) {
4398              if ($_->[1] eq 'p') {              if ($_->[1] eq 'p') {
4399                !!!back-token;                !!!back-token;
4400                $token = {type => 'end tag', tag_name => 'p'};                $token = {type => END_TAG_TOKEN, tag_name => 'p'};
4401                return;                redo B;
4402              } elsif ({              } elsif ({
4403                        table => 1, caption => 1, td => 1, th => 1,                        table => 1, caption => 1, td => 1, th => 1,
4404                        button => 1, marquee => 1, object => 1, html => 1,                        button => 1, marquee => 1, object => 1, html => 1,
# Line 2552  sub _tree_construction_main ($) { Line 4410  sub _tree_construction_main ($) {
4410            !!!insert-element-t ($token->{tag_name}, $token->{attributes});            !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4411            $self->{form_element} = $self->{open_elements}->[-1]->[0];            $self->{form_element} = $self->{open_elements}->[-1]->[0];
4412            !!!next-token;            !!!next-token;
4413            return;            redo B;
4414          }          }
4415        } elsif ($token->{tag_name} eq 'li') {        } elsif ($token->{tag_name} eq 'li') {
4416          ## has a p element in scope          ## has a p element in scope
4417          INSCOPE: for (reverse @{$self->{open_elements}}) {          INSCOPE: for (reverse @{$self->{open_elements}}) {
4418            if ($_->[1] eq 'p') {            if ($_->[1] eq 'p') {
4419              !!!back-token;              !!!back-token;
4420              $token = {type => 'end tag', tag_name => 'p'};              $token = {type => END_TAG_TOKEN, tag_name => 'p'};
4421              return;              redo B;
4422            } elsif ({            } elsif ({
4423                      table => 1, caption => 1, td => 1, th => 1,                      table => 1, caption => 1, td => 1, th => 1,
4424                      button => 1, marquee => 1, object => 1, html => 1,                      button => 1, marquee => 1, object => 1, html => 1,
# Line 2578  sub _tree_construction_main ($) { Line 4436  sub _tree_construction_main ($) {
4436              if ($i != -1) {              if ($i != -1) {
4437                !!!parse-error (type => 'end tag missing:'.                !!!parse-error (type => 'end tag missing:'.
4438                                $self->{open_elements}->[-1]->[1]);                                $self->{open_elements}->[-1]->[1]);
               ## TODO: test  
4439              }              }
4440              splice @{$self->{open_elements}}, $i;              splice @{$self->{open_elements}}, $i;
4441              last LI;              last LI;
# Line 2601  sub _tree_construction_main ($) { Line 4458  sub _tree_construction_main ($) {
4458                        
4459          !!!insert-element-t ($token->{tag_name}, $token->{attributes});          !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4460          !!!next-token;          !!!next-token;
4461          return;          redo B;
4462        } elsif ($token->{tag_name} eq 'dd' or $token->{tag_name} eq 'dt') {        } elsif ($token->{tag_name} eq 'dd' or $token->{tag_name} eq 'dt') {
4463          ## has a p element in scope          ## has a p element in scope
4464          INSCOPE: for (reverse @{$self->{open_elements}}) {          INSCOPE: for (reverse @{$self->{open_elements}}) {
4465            if ($_->[1] eq 'p') {            if ($_->[1] eq 'p') {
4466              !!!back-token;              !!!back-token;
4467              $token = {type => 'end tag', tag_name => 'p'};              $token = {type => END_TAG_TOKEN, tag_name => 'p'};
4468              return;              redo B;
4469            } elsif ({            } elsif ({
4470                      table => 1, caption => 1, td => 1, th => 1,                      table => 1, caption => 1, td => 1, th => 1,
4471                      button => 1, marquee => 1, object => 1, html => 1,                      button => 1, marquee => 1, object => 1, html => 1,
# Line 2626  sub _tree_construction_main ($) { Line 4483  sub _tree_construction_main ($) {
4483              if ($i != -1) {              if ($i != -1) {
4484                !!!parse-error (type => 'end tag missing:'.                !!!parse-error (type => 'end tag missing:'.
4485                                $self->{open_elements}->[-1]->[1]);                                $self->{open_elements}->[-1]->[1]);
               ## TODO: test  
4486              }              }
4487              splice @{$self->{open_elements}}, $i;              splice @{$self->{open_elements}}, $i;
4488              last LI;              last LI;
# Line 2649  sub _tree_construction_main ($) { Line 4505  sub _tree_construction_main ($) {
4505                        
4506          !!!insert-element-t ($token->{tag_name}, $token->{attributes});          !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4507          !!!next-token;          !!!next-token;
4508          return;          redo B;
4509        } elsif ($token->{tag_name} eq 'plaintext') {        } elsif ($token->{tag_name} eq 'plaintext') {
4510          ## has a p element in scope          ## has a p element in scope
4511          INSCOPE: for (reverse @{$self->{open_elements}}) {          INSCOPE: for (reverse @{$self->{open_elements}}) {
4512            if ($_->[1] eq 'p') {            if ($_->[1] eq 'p') {
4513              !!!back-token;              !!!back-token;
4514              $token = {type => 'end tag', tag_name => 'p'};              $token = {type => END_TAG_TOKEN, tag_name => 'p'};
4515              return;              redo B;
4516            } elsif ({            } elsif ({
4517                      table => 1, caption => 1, td => 1, th => 1,                      table => 1, caption => 1, td => 1, th => 1,
4518                      button => 1, marquee => 1, object => 1, html => 1,                      button => 1, marquee => 1, object => 1, html => 1,
# Line 2667  sub _tree_construction_main ($) { Line 4523  sub _tree_construction_main ($) {
4523                        
4524          !!!insert-element-t ($token->{tag_name}, $token->{attributes});          !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4525                        
4526          $self->{content_model_flag} = 'PLAINTEXT';          $self->{content_model} = PLAINTEXT_CONTENT_MODEL;
4527                        
4528          !!!next-token;          !!!next-token;
4529          return;          redo B;
4530        } elsif ({        } elsif ({
4531                  h1 => 1, h2 => 1, h3 => 1, h4 => 1, h5 => 1, h6 => 1,                  h1 => 1, h2 => 1, h3 => 1, h4 => 1, h5 => 1, h6 => 1,
4532                 }->{$token->{tag_name}}) {                 }->{$token->{tag_name}}) {
# Line 2679  sub _tree_construction_main ($) { Line 4535  sub _tree_construction_main ($) {
4535            my $node = $self->{open_elements}->[$_];            my $node = $self->{open_elements}->[$_];
4536            if ($node->[1] eq 'p') {            if ($node->[1] eq 'p') {
4537              !!!back-token;              !!!back-token;
4538              $token = {type => 'end tag', tag_name => 'p'};              $token = {type => END_TAG_TOKEN, tag_name => 'p'};
4539              return;              redo B;
4540            } elsif ({            } elsif ({
4541                      table => 1, caption => 1, td => 1, th => 1,                      table => 1, caption => 1, td => 1, th => 1,
4542                      button => 1, marquee => 1, object => 1, html => 1,                      button => 1, marquee => 1, object => 1, html => 1,
# Line 2715  sub _tree_construction_main ($) { Line 4571  sub _tree_construction_main ($) {
4571          !!!insert-element-t ($token->{tag_name}, $token->{attributes});          !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4572                        
4573          !!!next-token;          !!!next-token;
4574          return;          redo B;
4575        } elsif ($token->{tag_name} eq 'a') {        } elsif ($token->{tag_name} eq 'a') {
4576          AFE: for my $i (reverse 0..$#$active_formatting_elements) {          AFE: for my $i (reverse 0..$#$active_formatting_elements) {
4577            my $node = $active_formatting_elements->[$i];            my $node = $active_formatting_elements->[$i];
# Line 2723  sub _tree_construction_main ($) { Line 4579  sub _tree_construction_main ($) {
4579              !!!parse-error (type => 'in a:a');              !!!parse-error (type => 'in a:a');
4580                            
4581              !!!back-token;              !!!back-token;
4582              $token = {type => 'end tag', tag_name => 'a'};              $token = {type => END_TAG_TOKEN, tag_name => 'a'};
4583              $formatting_end_tag->($token->{tag_name});              $formatting_end_tag->($token->{tag_name});
4584                            
4585              AFE2: for (reverse 0..$#$active_formatting_elements) {              AFE2: for (reverse 0..$#$active_formatting_elements) {
# Line 2750  sub _tree_construction_main ($) { Line 4606  sub _tree_construction_main ($) {
4606          push @$active_formatting_elements, $self->{open_elements}->[-1];          push @$active_formatting_elements, $self->{open_elements}->[-1];
4607    
4608          !!!next-token;          !!!next-token;
4609          return;          redo B;
4610        } elsif ({        } elsif ({
4611                  b => 1, big => 1, em => 1, font => 1, i => 1,                  b => 1, big => 1, em => 1, font => 1, i => 1,
4612                  s => 1, small => 1, strile => 1,                  s => 1, small => 1, strile => 1,
# Line 2762  sub _tree_construction_main ($) { Line 4618  sub _tree_construction_main ($) {
4618          push @$active_formatting_elements, $self->{open_elements}->[-1];          push @$active_formatting_elements, $self->{open_elements}->[-1];
4619                    
4620          !!!next-token;          !!!next-token;
4621          return;          redo B;
4622        } elsif ($token->{tag_name} eq 'nobr') {        } elsif ($token->{tag_name} eq 'nobr') {
4623          $reconstruct_active_formatting_elements->($insert_to_current);          $reconstruct_active_formatting_elements->($insert_to_current);
4624    
# Line 2770  sub _tree_construction_main ($) { Line 4626  sub _tree_construction_main ($) {
4626          INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {          INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
4627            my $node = $self->{open_elements}->[$_];            my $node = $self->{open_elements}->[$_];
4628            if ($node->[1] eq 'nobr') {            if ($node->[1] eq 'nobr') {
4629                !!!parse-error (type => 'not closed:nobr');
4630              !!!back-token;              !!!back-token;
4631              $token = {type => 'end tag', tag_name => 'nobr'};              $token = {type => END_TAG_TOKEN, tag_name => 'nobr'};
4632              return;              redo B;
4633            } elsif ({            } elsif ({
4634                      table => 1, caption => 1, td => 1, th => 1,                      table => 1, caption => 1, td => 1, th => 1,
4635                      button => 1, marquee => 1, object => 1, html => 1,                      button => 1, marquee => 1, object => 1, html => 1,
# Line 2785  sub _tree_construction_main ($) { Line 4642  sub _tree_construction_main ($) {
4642          push @$active_formatting_elements, $self->{open_elements}->[-1];          push @$active_formatting_elements, $self->{open_elements}->[-1];
4643                    
4644          !!!next-token;          !!!next-token;
4645          return;          redo B;
4646        } elsif ($token->{tag_name} eq 'button') {        } elsif ($token->{tag_name} eq 'button') {
4647          ## has a button element in scope          ## has a button element in scope
4648          INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {          INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
# Line 2793  sub _tree_construction_main ($) { Line 4650  sub _tree_construction_main ($) {
4650            if ($node->[1] eq 'button') {            if ($node->[1] eq 'button') {
4651              !!!parse-error (type => 'in button:button');              !!!parse-error (type => 'in button:button');
4652              !!!back-token;              !!!back-token;
4653              $token = {type => 'end tag', tag_name => 'button'};              $token = {type => END_TAG_TOKEN, tag_name => 'button'};
4654              return;              redo B;
4655            } elsif ({            } elsif ({
4656                      table => 1, caption => 1, td => 1, th => 1,                      table => 1, caption => 1, td => 1, th => 1,
4657                      button => 1, marquee => 1, object => 1, html => 1,                      button => 1, marquee => 1, object => 1, html => 1,
# Line 2809  sub _tree_construction_main ($) { Line 4666  sub _tree_construction_main ($) {
4666          push @$active_formatting_elements, ['#marker', ''];          push @$active_formatting_elements, ['#marker', ''];
4667    
4668          !!!next-token;          !!!next-token;
4669          return;          redo B;
4670        } elsif ($token->{tag_name} eq 'marquee' or        } elsif ($token->{tag_name} eq 'marquee' or
4671                 $token->{tag_name} eq 'object') {                 $token->{tag_name} eq 'object') {
4672          $reconstruct_active_formatting_elements->($insert_to_current);          $reconstruct_active_formatting_elements->($insert_to_current);
# Line 2818  sub _tree_construction_main ($) { Line 4675  sub _tree_construction_main ($) {
4675          push @$active_formatting_elements, ['#marker', ''];          push @$active_formatting_elements, ['#marker', ''];
4676                    
4677          !!!next-token;          !!!next-token;
4678          return;          redo B;
4679        } elsif ($token->{tag_name} eq 'xmp') {        } elsif ($token->{tag_name} eq 'xmp') {
4680          $reconstruct_active_formatting_elements->($insert_to_current);          $reconstruct_active_formatting_elements->($insert_to_current);
4681                    $parse_rcdata->(CDATA_CONTENT_MODEL, $insert);
4682          !!!insert-element-t ($token->{tag_name}, $token->{attributes});          redo B;
           
         $self->{content_model_flag} = 'CDATA';  
         delete $self->{escape}; # MUST  
           
         !!!next-token;  
         return;  
4683        } elsif ($token->{tag_name} eq 'table') {        } elsif ($token->{tag_name} eq 'table') {
4684          ## has a p element in scope          ## has a p element in scope
4685          INSCOPE: for (reverse @{$self->{open_elements}}) {          INSCOPE: for (reverse @{$self->{open_elements}}) {
4686            if ($_->[1] eq 'p') {            if ($_->[1] eq 'p') {
4687              !!!back-token;              !!!back-token;
4688              $token = {type => 'end tag', tag_name => 'p'};              $token = {type => END_TAG_TOKEN, tag_name => 'p'};
4689              return;              redo B;
4690            } elsif ({            } elsif ({
4691                      table => 1, caption => 1, td => 1, th => 1,                      table => 1, caption => 1, td => 1, th => 1,
4692                      button => 1, marquee => 1, object => 1, html => 1,                      button => 1, marquee => 1, object => 1, html => 1,
# Line 2846  sub _tree_construction_main ($) { Line 4697  sub _tree_construction_main ($) {
4697                        
4698          !!!insert-element-t ($token->{tag_name}, $token->{attributes});          !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4699                        
4700          $self->{insertion_mode} = 'in table';          $self->{insertion_mode} = IN_TABLE_IM;
4701                        
4702          !!!next-token;          !!!next-token;
4703          return;          redo B;
4704        } elsif ({        } elsif ({
4705                  area => 1, basefont => 1, bgsound => 1, br => 1,                  area => 1, basefont => 1, bgsound => 1, br => 1,
4706                  embed => 1, img => 1, param => 1, spacer => 1, wbr => 1,                  embed => 1, img => 1, param => 1, spacer => 1, wbr => 1,
# Line 2859  sub _tree_construction_main ($) { Line 4710  sub _tree_construction_main ($) {
4710            !!!parse-error (type => 'image');            !!!parse-error (type => 'image');
4711            $token->{tag_name} = 'img';            $token->{tag_name} = 'img';
4712          }          }
4713            
4714            ## NOTE: There is an "as if <br>" code clone.
4715          $reconstruct_active_formatting_elements->($insert_to_current);          $reconstruct_active_formatting_elements->($insert_to_current);
4716                    
4717          !!!insert-element-t ($token->{tag_name}, $token->{attributes});          !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4718          pop @{$self->{open_elements}};          pop @{$self->{open_elements}};
4719                    
4720          !!!next-token;          !!!next-token;
4721          return;          redo B;
4722        } elsif ($token->{tag_name} eq 'hr') {        } elsif ($token->{tag_name} eq 'hr') {
4723          ## has a p element in scope          ## has a p element in scope
4724          INSCOPE: for (reverse @{$self->{open_elements}}) {          INSCOPE: for (reverse @{$self->{open_elements}}) {
4725            if ($_->[1] eq 'p') {            if ($_->[1] eq 'p') {
4726              !!!back-token;              !!!back-token;
4727              $token = {type => 'end tag', tag_name => 'p'};              $token = {type => END_TAG_TOKEN, tag_name => 'p'};
4728              return;              redo B;
4729            } elsif ({            } elsif ({
4730                      table => 1, caption => 1, td => 1, th => 1,                      table => 1, caption => 1, td => 1, th => 1,
4731                      button => 1, marquee => 1, object => 1, html => 1,                      button => 1, marquee => 1, object => 1, html => 1,
# Line 2886  sub _tree_construction_main ($) { Line 4738  sub _tree_construction_main ($) {
4738          pop @{$self->{open_elements}};          pop @{$self->{open_elements}};
4739                        
4740          !!!next-token;          !!!next-token;
4741          return;          redo B;
4742        } elsif ($token->{tag_name} eq 'input') {        } elsif ($token->{tag_name} eq 'input') {
4743          $reconstruct_active_formatting_elements->($insert_to_current);          $reconstruct_active_formatting_elements->($insert_to_current);
4744                    
# Line 2895  sub _tree_construction_main ($) { Line 4747  sub _tree_construction_main ($) {
4747          pop @{$self->{open_elements}};          pop @{$self->{open_elements}};
4748                    
4749          !!!next-token;          !!!next-token;
4750          return;          redo B;
4751        } elsif ($token->{tag_name} eq 'isindex') {        } elsif ($token->{tag_name} eq 'isindex') {
4752          !!!parse-error (type => 'isindex');          !!!parse-error (type => 'isindex');
4753                    
4754          if (defined $self->{form_element}) {          if (defined $self->{form_element}) {
4755            ## Ignore the token            ## Ignore the token
4756            !!!next-token;            !!!next-token;
4757            return;            redo B;
4758          } else {          } else {
4759            my $at = $token->{attributes};            my $at = $token->{attributes};
4760            my $form_attrs;            my $form_attrs;
# Line 2912  sub _tree_construction_main ($) { Line 4764  sub _tree_construction_main ($) {
4764            delete $at->{action};            delete $at->{action};
4765            delete $at->{prompt};            delete $at->{prompt};
4766            my @tokens = (            my @tokens = (
4767                          {type => 'start tag', tag_name => 'form',                          {type => START_TAG_TOKEN, tag_name => 'form',
4768                           attributes => $form_attrs},                           attributes => $form_attrs},
4769                          {type => 'start tag', tag_name => 'hr'},                          {type => START_TAG_TOKEN, tag_name => 'hr'},
4770                          {type => 'start tag', tag_name => 'p'},                          {type => START_TAG_TOKEN, tag_name => 'p'},
4771                          {type => 'start tag', tag_name => 'label'},                          {type => START_TAG_TOKEN, tag_name => 'label'},
4772                         );                         );
4773            if ($prompt_attr) {            if ($prompt_attr) {
4774              push @tokens, {type => 'character', data => $prompt_attr->{value}};              push @tokens, {type => CHARACTER_TOKEN, data => $prompt_attr->{value}};
4775            } else {            } else {
4776              push @tokens, {type => 'character',              push @tokens, {type => CHARACTER_TOKEN,
4777                             data => 'This is a searchable index. Insert your search keywords here: '}; # SHOULD                             data => 'This is a searchable index. Insert your search keywords here: '}; # SHOULD
4778              ## TODO: make this configurable              ## TODO: make this configurable
4779            }            }
4780            push @tokens,            push @tokens,
4781                          {type => 'start tag', tag_name => 'input', attributes => $at},                          {type => START_TAG_TOKEN, tag_name => 'input', attributes => $at},
4782                          #{type => 'character', data => ''}, # SHOULD                          #{type => CHARACTER_TOKEN, data => ''}, # SHOULD
4783                          {type => 'end tag', tag_name => 'label'},                          {type => END_TAG_TOKEN, tag_name => 'label'},
4784                          {type => 'end tag', tag_name => 'p'},                          {type => END_TAG_TOKEN, tag_name => 'p'},
4785                          {type => 'start tag', tag_name => 'hr'},                          {type => START_TAG_TOKEN, tag_name => 'hr'},
4786                          {type => 'end tag', tag_name => 'form'};                          {type => END_TAG_TOKEN, tag_name => 'form'};
4787            $token = shift @tokens;            $token = shift @tokens;
4788            !!!back-token (@tokens);            !!!back-token (@tokens);
4789            return;            redo B;
4790          }          }
4791        } elsif ({        } elsif ($token->{tag_name} eq 'textarea') {
                 textarea => 1,  
                 iframe => 1,  
                 noembed => 1,  
                 noframes => 1,  
                 noscript => 0, ## TODO: 1 if scripting is enabled  
                }->{$token->{tag_name}}) {  
4792          my $tag_name = $token->{tag_name};          my $tag_name = $token->{tag_name};
4793          my $el;          my $el;
4794          !!!create-element ($el, $token->{tag_name}, $token->{attributes});          !!!create-element ($el, $token->{tag_name}, $token->{attributes});
4795                    
4796          if ($token->{tag_name} eq 'textarea') {          ## TODO: $self->{form_element} if defined
4797            ## TODO: $self->{form_element} if defined          $self->{content_model} = RCDATA_CONTENT_MODEL;
           $self->{content_model_flag} = 'RCDATA';  
         } else {  
           $self->{content_model_flag} = 'CDATA';  
         }  
4798          delete $self->{escape}; # MUST          delete $self->{escape}; # MUST
4799                    
4800          $insert->($el);          $insert->($el);
4801                    
4802          my $text = '';          my $text = '';
4803          if ($token->{tag_name} eq 'textarea') {          !!!next-token;
4804            !!!next-token;          if ($token->{type} == CHARACTER_TOKEN) {
4805            if ($token->{type} eq 'character') {            $token->{data} =~ s/^\x0A//;
4806              $token->{data} =~ s/^\x0A//;            unless (length $token->{data}) {
4807              unless (length $token->{data}) {              !!!next-token;
               !!!next-token;  
             }  
4808            }            }
         } else {  
           !!!next-token;  
4809          }          }
4810          while ($token->{type} eq 'character') {          while ($token->{type} == CHARACTER_TOKEN) {
4811            $text .= $token->{data};            $text .= $token->{data};
4812            !!!next-token;            !!!next-token;
4813          }          }
# Line 2977  sub _tree_construction_main ($) { Line 4815  sub _tree_construction_main ($) {
4815            $el->manakai_append_text ($text);            $el->manakai_append_text ($text);
4816          }          }
4817                    
4818          $self->{content_model_flag} = 'PCDATA';          $self->{content_model} = PCDATA_CONTENT_MODEL;
4819                    
4820          if ($token->{type} eq 'end tag' and          if ($token->{type} == END_TAG_TOKEN and
4821              $token->{tag_name} eq $tag_name) {              $token->{tag_name} eq $tag_name) {
4822            ## Ignore the token            ## Ignore the token
4823          } else {          } else {
4824            if ($token->{tag_name} eq 'textarea') {            !!!parse-error (type => 'in RCDATA:#'.$token->{type});
             !!!parse-error (type => 'in RCDATA:#'.$token->{type});  
           } else {  
             !!!parse-error (type => 'in CDATA:#'.$token->{type});  
           }  
           ## ISSUE: And ignore?  
4825          }          }
4826          !!!next-token;          !!!next-token;
4827          return;          redo B;
4828          } elsif ({
4829                    iframe => 1,
4830                    noembed => 1,
4831                    noframes => 1,
4832                    noscript => 0, ## TODO: 1 if scripting is enabled
4833                   }->{$token->{tag_name}}) {
4834            ## NOTE: There are two "as if in body" code clones.
4835            $parse_rcdata->(CDATA_CONTENT_MODEL, $insert);
4836            redo B;
4837        } elsif ($token->{tag_name} eq 'select') {        } elsif ($token->{tag_name} eq 'select') {
4838          $reconstruct_active_formatting_elements->($insert_to_current);          $reconstruct_active_formatting_elements->($insert_to_current);
4839                    
4840          !!!insert-element-t ($token->{tag_name}, $token->{attributes});          !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4841                    
4842          $self->{insertion_mode} = 'in select';          $self->{insertion_mode} = IN_SELECT_IM;
4843          !!!next-token;          !!!next-token;
4844          return;          redo B;
4845        } elsif ({        } elsif ({
4846                  caption => 1, col => 1, colgroup => 1, frame => 1,                  caption => 1, col => 1, colgroup => 1, frame => 1,
4847                  frameset => 1, head => 1, option => 1, optgroup => 1,                  frameset => 1, head => 1, option => 1, optgroup => 1,
# Line 3009  sub _tree_construction_main ($) { Line 4851  sub _tree_construction_main ($) {
4851          !!!parse-error (type => 'in body:'.$token->{tag_name});          !!!parse-error (type => 'in body:'.$token->{tag_name});
4852          ## Ignore the token          ## Ignore the token
4853          !!!next-token;          !!!next-token;
4854          return;          redo B;
4855                    
4856          ## ISSUE: An issue on HTML5 new elements in the spec.          ## ISSUE: An issue on HTML5 new elements in the spec.
4857        } else {        } else {
# Line 3018  sub _tree_construction_main ($) { Line 4860  sub _tree_construction_main ($) {
4860          !!!insert-element-t ($token->{tag_name}, $token->{attributes});          !!!insert-element-t ($token->{tag_name}, $token->{attributes});
4861                    
4862          !!!next-token;          !!!next-token;
4863          return;          redo B;
4864        }        }
4865      } elsif ($token->{type} eq 'end tag') {      } elsif ($token->{type} == END_TAG_TOKEN) {
4866        if ($token->{tag_name} eq 'body') {        if ($token->{tag_name} eq 'body') {
4867          if (@{$self->{open_elements}} > 1 and          if (@{$self->{open_elements}} > 1 and
4868              $self->{open_elements}->[1]->[1] eq 'body') {              $self->{open_elements}->[1]->[1] eq 'body') {
# Line 3028  sub _tree_construction_main ($) { Line 4870  sub _tree_construction_main ($) {
4870              unless ({              unless ({
4871                         dd => 1, dt => 1, li => 1, p => 1, td => 1,                         dd => 1, dt => 1, li => 1, p => 1, td => 1,
4872                         th => 1, tr => 1, body => 1, html => 1,                         th => 1, tr => 1, body => 1, html => 1,
4873                         tbody => 1, tfoot => 1, thead => 1,
4874                      }->{$_->[1]}) {                      }->{$_->[1]}) {
4875                !!!parse-error (type => 'not closed:'.$_->[1]);                !!!parse-error (type => 'not closed:'.$_->[1]);
4876              }              }
4877            }            }
4878    
4879            $self->{insertion_mode} = 'after body';            $self->{insertion_mode} = AFTER_BODY_IM;
4880            !!!next-token;            !!!next-token;
4881            return;            redo B;
4882          } else {          } else {
4883            !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});            !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
4884            ## Ignore the token            ## Ignore the token
4885            !!!next-token;            !!!next-token;
4886            return;            redo B;
4887          }          }
4888        } elsif ($token->{tag_name} eq 'html') {        } elsif ($token->{tag_name} eq 'html') {
4889          if (@{$self->{open_elements}} > 1 and $self->{open_elements}->[1]->[1] eq 'body') {          if (@{$self->{open_elements}} > 1 and $self->{open_elements}->[1]->[1] eq 'body') {
# Line 3048  sub _tree_construction_main ($) { Line 4891  sub _tree_construction_main ($) {
4891            if ($self->{open_elements}->[-1]->[1] ne 'body') {            if ($self->{open_elements}->[-1]->[1] ne 'body') {
4892              !!!parse-error (type => 'not closed:'.$self->{open_elements}->[1]->[1]);              !!!parse-error (type => 'not closed:'.$self->{open_elements}->[1]->[1]);
4893            }            }
4894            $self->{insertion_mode} = 'after body';            $self->{insertion_mode} = AFTER_BODY_IM;
4895            ## reprocess            ## reprocess
4896            return;            redo B;
4897          } else {          } else {
4898            !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});            !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
4899            ## Ignore the token            ## Ignore the token
4900            !!!next-token;            !!!next-token;
4901            return;            redo B;
4902          }          }
4903        } elsif ({        } elsif ({
4904                  address => 1, blockquote => 1, center => 1, dir => 1,                  address => 1, blockquote => 1, center => 1, dir => 1,
# Line 3077  sub _tree_construction_main ($) { Line 4920  sub _tree_construction_main ($) {
4920                   li => ($token->{tag_name} ne 'li'),                   li => ($token->{tag_name} ne 'li'),
4921                   p => ($token->{tag_name} ne 'p'),                   p => ($token->{tag_name} ne 'p'),
4922                   td => 1, th => 1, tr => 1,                   td => 1, th => 1, tr => 1,
4923                     tbody => 1, tfoot=> 1, thead => 1,
4924                  }->{$self->{open_elements}->[-1]->[1]}) {                  }->{$self->{open_elements}->[-1]->[1]}) {
4925                !!!back-token;                !!!back-token;
4926                $token = {type => 'end tag',                $token = {type => END_TAG_TOKEN,
4927                          tag_name => $self->{open_elements}->[-1]->[1]}; # MUST                          tag_name => $self->{open_elements}->[-1]->[1]}; # MUST
4928                return;                redo B;
4929              }              }
4930              $i = $_;              $i = $_;
4931              last INSCOPE unless $token->{tag_name} eq 'p';              last INSCOPE unless $token->{tag_name} eq 'p';
# Line 3094  sub _tree_construction_main ($) { Line 4938  sub _tree_construction_main ($) {
4938          } # INSCOPE          } # INSCOPE
4939                    
4940          if ($self->{open_elements}->[-1]->[1] ne $token->{tag_name}) {          if ($self->{open_elements}->[-1]->[1] ne $token->{tag_name}) {
4941            !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);            if (defined $i) {
4942                !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);
4943              } else {
4944                !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
4945              }
4946          }          }
4947                    
4948          splice @{$self->{open_elements}}, $i if defined $i;          if (defined $i) {
4949              splice @{$self->{open_elements}}, $i;
4950            } elsif ($token->{tag_name} eq 'p') {
4951              ## As if <p>, then reprocess the current token
4952              my $el;
4953              !!!create-element ($el, 'p');
4954              $insert->($el);
4955            }
4956          $clear_up_to_marker->()          $clear_up_to_marker->()
4957            if {            if {
4958              button => 1, marquee => 1, object => 1,              button => 1, marquee => 1, object => 1,
4959            }->{$token->{tag_name}};            }->{$token->{tag_name}};
4960          !!!next-token;          !!!next-token;
4961          return;          redo B;
4962        } elsif ($token->{tag_name} eq 'form') {        } elsif ($token->{tag_name} eq 'form') {
4963          ## has an element in scope          ## has an element in scope
4964          INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {          INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {
# Line 3113  sub _tree_construction_main ($) { Line 4968  sub _tree_construction_main ($) {
4968              if ({              if ({
4969                   dd => 1, dt => 1, li => 1, p => 1,                   dd => 1, dt => 1, li => 1, p => 1,
4970                   td => 1, th => 1, tr => 1,                   td => 1, th => 1, tr => 1,
4971                     tbody => 1, tfoot=> 1, thead => 1,
4972                  }->{$self->{open_elements}->[-1]->[1]}) {                  }->{$self->{open_elements}->[-1]->[1]}) {
4973                !!!back-token;                !!!back-token;
4974                $token = {type => 'end tag',                $token = {type => END_TAG_TOKEN,
4975                          tag_name => $self->{open_elements}->[-1]->[1]}; # MUST                          tag_name => $self->{open_elements}->[-1]->[1]}; # MUST
4976                return;                redo B;
4977              }              }
4978              last INSCOPE;              last INSCOPE;
4979            } elsif ({            } elsif ({
# Line 3136  sub _tree_construction_main ($) { Line 4992  sub _tree_construction_main ($) {
4992    
4993          undef $self->{form_element};          undef $self->{form_element};
4994          !!!next-token;          !!!next-token;
4995          return;          redo B;
4996        } elsif ({        } elsif ({
4997                  h1 => 1, h2 => 1, h3 => 1, h4 => 1, h5 => 1, h6 => 1,                  h1 => 1, h2 => 1, h3 => 1, h4 => 1, h5 => 1, h6 => 1,
4998                 }->{$token->{tag_name}}) {                 }->{$token->{tag_name}}) {
# Line 3151  sub _tree_construction_main ($) { Line 5007  sub _tree_construction_main ($) {
5007              if ({              if ({
5008                   dd => 1, dt => 1, li => 1, p => 1,                   dd => 1, dt => 1, li => 1, p => 1,
5009                   td => 1, th => 1, tr => 1,                   td => 1, th => 1, tr => 1,
5010                     tbody => 1, tfoot=> 1, thead => 1,
5011                  }->{$self->{open_elements}->[-1]->[1]}) {                  }->{$self->{open_elements}->[-1]->[1]}) {
5012                !!!back-token;                !!!back-token;
5013                $token = {type => 'end tag',                $token = {type => END_TAG_TOKEN,
5014                          tag_name => $self->{open_elements}->[-1]->[1]}; # MUST                          tag_name => $self->{open_elements}->[-1]->[1]}; # MUST
5015                return;                redo B;
5016              }              }
5017              $i = $_;              $i = $_;
5018              last INSCOPE;              last INSCOPE;
# Line 3173  sub _tree_construction_main ($) { Line 5030  sub _tree_construction_main ($) {
5030                    
5031          splice @{$self->{open_elements}}, $i if defined $i;          splice @{$self->{open_elements}}, $i if defined $i;
5032          !!!next-token;          !!!next-token;
5033          return;          redo B;
5034        } elsif ({        } elsif ({
5035                  a => 1,                  a => 1,
5036                  b => 1, big => 1, em => 1, font => 1, i => 1,                  b => 1, big => 1, em => 1, font => 1, i => 1,
# Line 3181  sub _tree_construction_main ($) { Line 5038  sub _tree_construction_main ($) {
5038                  strong => 1, tt => 1, u => 1,                  strong => 1, tt => 1, u => 1,
5039                 }->{$token->{tag_name}}) {                 }->{$token->{tag_name}}) {
5040          $formatting_end_tag->($token->{tag_name});          $formatting_end_tag->($token->{tag_name});
5041  ## TODO: <http://html5.org/tools/web-apps-tracker?from=883&to=884>          redo B;
5042          return;        } elsif ($token->{tag_name} eq 'br') {
5043            !!!parse-error (type => 'unmatched end tag:br');
5044    
5045            ## As if <br>
5046            $reconstruct_active_formatting_elements->($insert_to_current);
5047            
5048            my $el;
5049            !!!create-element ($el, 'br');
5050            $insert->($el);
5051            
5052            ## Ignore the token.
5053            !!!next-token;
5054            redo B;
5055        } elsif ({        } elsif ({
5056                  caption => 1, col => 1, colgroup => 1, frame => 1,                  caption => 1, col => 1, colgroup => 1, frame => 1,
5057                  frameset => 1, head => 1, option => 1, optgroup => 1,                  frameset => 1, head => 1, option => 1, optgroup => 1,
5058                  tbody => 1, td => 1, tfoot => 1, th => 1,                  tbody => 1, td => 1, tfoot => 1, th => 1,
5059                  thead => 1, tr => 1,                  thead => 1, tr => 1,
5060                  area => 1, basefont => 1, bgsound => 1, br => 1,                  area => 1, basefont => 1, bgsound => 1,
5061                  embed => 1, hr => 1, iframe => 1, image => 1,                  embed => 1, hr => 1, iframe => 1, image => 1,
5062                  img => 1, input => 1, isindex => 1, noembed => 1,                  img => 1, input => 1, isindex => 1, noembed => 1,
5063                  noframes => 1, param => 1, select => 1, spacer => 1,                  noframes => 1, param => 1, select => 1, spacer => 1,
# Line 3198  sub _tree_construction_main ($) { Line 5067  sub _tree_construction_main ($) {
5067          !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});          !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
5068          ## Ignore the token          ## Ignore the token
5069          !!!next-token;          !!!next-token;
5070          return;          redo B;
5071                    
5072          ## ISSUE: Issue on HTML5 new elements in spec          ## ISSUE: Issue on HTML5 new elements in spec
5073                    
# Line 3215  sub _tree_construction_main ($) { Line 5084  sub _tree_construction_main ($) {
5084              if ({              if ({
5085                   dd => 1, dt => 1, li => 1, p => 1,                   dd => 1, dt => 1, li => 1, p => 1,
5086                   td => 1, th => 1, tr => 1,                   td => 1, th => 1, tr => 1,
5087                     tbody => 1, tfoot => 1, thead => 1,
5088                  }->{$self->{open_elements}->[-1]->[1]}) {                  }->{$self->{open_elements}->[-1]->[1]}) {
5089                !!!back-token;                !!!back-token;
5090                $token = {type => 'end tag',                $token = {type => END_TAG_TOKEN,
5091                          tag_name => $self->{open_elements}->[-1]->[1]}; # MUST                          tag_name => $self->{open_elements}->[-1]->[1]}; # MUST
5092                return;                redo B;
5093              }              }
5094                    
5095              ## Step 2              ## Step 2
# Line 3238  sub _tree_construction_main ($) { Line 5108  sub _tree_construction_main ($) {
5108                  #not $phrasing_category->{$node->[1]} and                  #not $phrasing_category->{$node->[1]} and
5109                  ($special_category->{$node->[1]} or                  ($special_category->{$node->[1]} or
5110                   $scoping_category->{$node->[1]})) {                   $scoping_category->{$node->[1]})) {
5111                !!!parse-error (type => 'not closed:'.$node->[1]);                !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});
5112                ## Ignore the token                ## Ignore the token
5113                !!!next-token;                !!!next-token;
5114                last S2;                last S2;
# Line 3252  sub _tree_construction_main ($) { Line 5122  sub _tree_construction_main ($) {
5122            ## Step 5;            ## Step 5;
5123            redo S2;            redo S2;
5124          } # S2          } # S2
5125          return;          redo B;
       }  
     }  
   }; # $in_body  
   
   B: {  
     if ($phase eq 'main') {  
       if ($token->{type} eq 'DOCTYPE') {  
         !!!parse-error (type => 'in html:#DOCTYPE');  
         ## Ignore the token  
         ## Stay in the phase  
         !!!next-token;  
         redo B;  
       } elsif ($token->{type} eq 'start tag' and  
                $token->{tag_name} eq 'html') {  
         ## TODO: unless it is the first start tag token, parse-error  
         my $top_el = $self->{open_elements}->[0]->[0];  
         for my $attr_name (keys %{$token->{attributes}}) {  
           unless ($top_el->has_attribute_ns (undef, $attr_name)) {  
             $top_el->set_attribute_ns  
               (undef, [undef, $attr_name],  
                $token->{attributes}->{$attr_name}->{value});  
           }  
         }  
         !!!next-token;  
         redo B;  
       } elsif ($token->{type} eq 'end-of-file') {  
         ## Generate implied end tags  
         if ({  
              dd => 1, dt => 1, li => 1, p => 1, td => 1, th => 1, tr => 1,  
             }->{$self->{open_elements}->[-1]->[1]}) {  
           !!!back-token;  
           $token = {type => 'end tag', tag_name => $self->{open_elements}->[-1]->[1]};  
           redo B;  
         }  
           
         if (@{$self->{open_elements}} > 2 or  
             (@{$self->{open_elements}} == 2 and $self->{open_elements}->[1]->[1] ne 'body')) {  
           !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
         } elsif (defined $self->{inner_html_node} and  
                  @{$self->{open_elements}} > 1 and  
                  $self->{open_elements}->[1]->[1] ne 'body') {  
           !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
         }  
   
         ## Stop parsing  
         last B;  
   
         ## ISSUE: There is an issue in the spec.  
       } else {  
         if ($self->{insertion_mode} eq 'before head') {  
           if ($token->{type} eq 'character') {  
             if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);  
               unless (length $token->{data}) {  
                 !!!next-token;  
                 redo B;  
               }  
             }  
             ## As if <head>  
             !!!create-element ($self->{head_element}, 'head');  
             $self->{open_elements}->[-1]->[0]->append_child ($self->{head_element});  
             push @{$self->{open_elements}}, [$self->{head_element}, 'head'];  
             $self->{insertion_mode} = 'in head';  
             ## reprocess  
             redo B;  
           } elsif ($token->{type} eq 'comment') {  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             my $attr = $token->{tag_name} eq 'head' ? $token->{attributes} : {};  
             !!!create-element ($self->{head_element}, 'head', $attr);  
             $self->{open_elements}->[-1]->[0]->append_child ($self->{head_element});  
             push @{$self->{open_elements}}, [$self->{head_element}, 'head'];  
             $self->{insertion_mode} = 'in head';  
             if ($token->{tag_name} eq 'head') {  
               !!!next-token;  
             #} elsif ({  
             #          base => 1, link => 1, meta => 1,  
             #          script => 1, style => 1, title => 1,  
             #         }->{$token->{tag_name}}) {  
             #  ## reprocess  
             } else {  
               ## reprocess  
             }  
             redo B;  
           } elsif ($token->{type} eq 'end tag') {  
             if ({head => 1, body => 1, html => 1}->{$token->{tag_name}}) {  
               ## As if <head>  
               !!!create-element ($self->{head_element}, 'head');  
               $self->{open_elements}->[-1]->[0]->append_child ($self->{head_element});  
               push @{$self->{open_elements}}, [$self->{head_element}, 'head'];  
               $self->{insertion_mode} = 'in head';  
               ## reprocess  
               redo B;  
             } else {  
               !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
               ## Ignore the token ## ISSUE: An issue in the spec.  
               !!!next-token;  
               redo B;  
             }  
           } else {  
             die "$0: $token->{type}: Unknown type";  
           }  
         } elsif ($self->{insertion_mode} eq 'in head') {  
           if ($token->{type} eq 'character') {  
             if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);  
               unless (length $token->{data}) {  
                 !!!next-token;  
                 redo B;  
               }  
             }  
               
             #  
           } elsif ($token->{type} eq 'comment') {  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             if ($token->{tag_name} eq 'title') {  
               ## NOTE: There is an "as if in head" code clone  
               my $title_el;  
               !!!create-element ($title_el, 'title', $token->{attributes});  
               (defined $self->{head_element} ? $self->{head_element} : $self->{open_elements}->[-1]->[0])  
                 ->append_child ($title_el);  
               $self->{content_model_flag} = 'RCDATA';  
               delete $self->{escape}; # MUST  
   
               my $text = '';  
               !!!next-token;  
               while ($token->{type} eq 'character') {  
                 $text .= $token->{data};  
                 !!!next-token;  
               }  
               if (length $text) {  
                 $title_el->manakai_append_text ($text);  
               }  
                 
               $self->{content_model_flag} = 'PCDATA';  
                 
               if ($token->{type} eq 'end tag' and  
                   $token->{tag_name} eq 'title') {  
                 ## Ignore the token  
               } else {  
                 !!!parse-error (type => 'in RCDATA:#'.$token->{type});  
                 ## ISSUE: And ignore?  
               }  
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'style') {  
               $style_start_tag->();  
               redo B;  
             } elsif ($token->{tag_name} eq 'script') {  
               $script_start_tag->();  
               redo B;  
             } elsif ({base => 1, link => 1, meta => 1}->{$token->{tag_name}}) {  
               ## NOTE: There are "as if in head" code clones  
               my $el;  
               !!!create-element ($el, $token->{tag_name}, $token->{attributes});  
               (defined $self->{head_element} ? $self->{head_element} : $self->{open_elements}->[-1]->[0])  
                 ->append_child ($el);  
   
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'head') {  
               !!!parse-error (type => 'in head:head');  
               ## Ignore the token  
               !!!next-token;  
               redo B;  
             } else {  
               #  
             }  
           } elsif ($token->{type} eq 'end tag') {  
             if ($token->{tag_name} eq 'head') {  
               if ($self->{open_elements}->[-1]->[1] eq 'head') {  
                 pop @{$self->{open_elements}};  
               } else {  
                 !!!parse-error (type => 'unmatched end tag:head');  
               }  
               $self->{insertion_mode} = 'after head';  
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'body' or  
                      $token->{tag_name} eq 'html') {  
               #  
             } else {  
               !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
               ## Ignore the token  
               !!!next-token;  
               redo B;  
             }  
           } else {  
             #  
           }  
   
           if ($self->{open_elements}->[-1]->[1] eq 'head') {  
             ## As if </head>  
             pop @{$self->{open_elements}};  
           }  
           $self->{insertion_mode} = 'after head';  
           ## reprocess  
           redo B;  
   
           ## ISSUE: An issue in the spec.  
         } elsif ($self->{insertion_mode} eq 'after head') {  
           if ($token->{type} eq 'character') {  
             if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);  
               unless (length $token->{data}) {  
                 !!!next-token;  
                 redo B;  
               }  
             }  
               
             #  
           } elsif ($token->{type} eq 'comment') {  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             if ($token->{tag_name} eq 'body') {  
               !!!insert-element ('body', $token->{attributes});  
               $self->{insertion_mode} = 'in body';  
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'frameset') {  
               !!!insert-element ('frameset', $token->{attributes});  
               $self->{insertion_mode} = 'in frameset';  
               !!!next-token;  
               redo B;  
             } elsif ({  
                       base => 1, link => 1, meta => 1,  
                       script => 1, style => 1, title => 1,  
                      }->{$token->{tag_name}}) {  
               !!!parse-error (type => 'after head:'.$token->{tag_name});  
               $self->{insertion_mode} = 'in head';  
               ## reprocess  
               redo B;  
             } else {  
               #  
             }  
           } else {  
             #  
           }  
             
           ## As if <body>  
           !!!insert-element ('body');  
           $self->{insertion_mode} = 'in body';  
           ## reprocess  
           redo B;  
         } elsif ($self->{insertion_mode} eq 'in body') {  
           if ($token->{type} eq 'character') {  
             ## NOTE: There is a code clone of "character in body".  
             $reconstruct_active_formatting_elements->($insert_to_current);  
               
             $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});  
   
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'comment') {  
             ## NOTE: There is a code clone of "comment in body".  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } else {  
             $in_body->($insert_to_current);  
             redo B;  
           }  
         } elsif ($self->{insertion_mode} eq 'in table') {  
           if ($token->{type} eq 'character') {  
             ## NOTE: There are "character in table" code clones.  
             if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);  
                 
               unless (length $token->{data}) {  
                 !!!next-token;  
                 redo B;  
               }  
             }  
   
             !!!parse-error (type => 'in table:#character');  
   
             ## As if in body, but insert into foster parent element  
             ## ISSUE: Spec says that "whenever a node would be inserted  
             ## into the current node" while characters might not be  
             ## result in a new Text node.  
             $reconstruct_active_formatting_elements->($insert_to_foster);  
               
             if ({  
                  table => 1, tbody => 1, tfoot => 1,  
                  thead => 1, tr => 1,  
                 }->{$self->{open_elements}->[-1]->[1]}) {  
               # MUST  
               my $foster_parent_element;  
               my $next_sibling;  
               my $prev_sibling;  
               OE: for (reverse 0..$#{$self->{open_elements}}) {  
                 if ($self->{open_elements}->[$_]->[1] eq 'table') {  
                   my $parent = $self->{open_elements}->[$_]->[0]->parent_node;  
                   if (defined $parent and $parent->node_type == 1) {  
                     $foster_parent_element = $parent;  
                     $next_sibling = $self->{open_elements}->[$_]->[0];  
                     $prev_sibling = $next_sibling->previous_sibling;  
                   } else {  
                     $foster_parent_element = $self->{open_elements}->[$_ - 1]->[0];  
                     $prev_sibling = $foster_parent_element->last_child;  
                   }  
                   last OE;  
                 }  
               } # OE  
               $foster_parent_element = $self->{open_elements}->[0]->[0] and  
               $prev_sibling = $foster_parent_element->last_child  
                 unless defined $foster_parent_element;  
               if (defined $prev_sibling and  
                   $prev_sibling->node_type == 3) {  
                 $prev_sibling->manakai_append_text ($token->{data});  
               } else {  
                 $foster_parent_element->insert_before  
                   ($self->{document}->create_text_node ($token->{data}),  
                    $next_sibling);  
               }  
             } else {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});  
             }  
               
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'comment') {  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             if ({  
                  caption => 1,  
                  colgroup => 1,  
                  tbody => 1, tfoot => 1, thead => 1,  
                 }->{$token->{tag_name}}) {  
               ## Clear back to table context  
               while ($self->{open_elements}->[-1]->[1] ne 'table' and  
                      $self->{open_elements}->[-1]->[1] ne 'html') {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
                 pop @{$self->{open_elements}};  
               }  
   
               push @$active_formatting_elements, ['#marker', '']  
                 if $token->{tag_name} eq 'caption';  
   
               !!!insert-element ($token->{tag_name}, $token->{attributes});  
               $self->{insertion_mode} = {  
                                  caption => 'in caption',  
                                  colgroup => 'in column group',  
                                  tbody => 'in table body',  
                                  tfoot => 'in table body',  
                                  thead => 'in table body',  
                                 }->{$token->{tag_name}};  
               !!!next-token;  
               redo B;  
             } elsif ({  
                       col => 1,  
                       td => 1, th => 1, tr => 1,  
                      }->{$token->{tag_name}}) {  
               ## Clear back to table context  
               while ($self->{open_elements}->[-1]->[1] ne 'table' and  
                      $self->{open_elements}->[-1]->[1] ne 'html') {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
                 pop @{$self->{open_elements}};  
               }  
   
               !!!insert-element ($token->{tag_name} eq 'col' ? 'colgroup' : 'tbody');  
               $self->{insertion_mode} = $token->{tag_name} eq 'col'  
                 ? 'in column group' : 'in table body';  
               ## reprocess  
               redo B;  
             } elsif ($token->{tag_name} eq 'table') {  
               ## NOTE: There are code clones for this "table in table"  
               !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
   
               ## As if </table>  
               ## have a table element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq 'table') {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:table');  
                 ## Ignore tokens </table><table>  
                 !!!next-token;  
                 redo B;  
               }  
                 
               ## generate implied end tags  
               if ({  
                    dd => 1, dt => 1, li => 1, p => 1,  
                    td => 1, th => 1, tr => 1,  
                   }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!back-token; # <table>  
                 $token = {type => 'end tag', tag_name => 'table'};  
                 !!!back-token;  
                 $token = {type => 'end tag',  
                           tag_name => $self->{open_elements}->[-1]->[1]}; # MUST  
                 redo B;  
               }  
   
               if ($self->{open_elements}->[-1]->[1] ne 'table') {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
               }  
   
               splice @{$self->{open_elements}}, $i;  
   
               $self->_reset_insertion_mode;  
   
               ## reprocess  
               redo B;  
             } else {  
               #  
             }  
           } elsif ($token->{type} eq 'end tag') {  
             if ($token->{tag_name} eq 'table') {  
               ## have a table element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq $token->{tag_name}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
                 
               ## generate implied end tags  
               if ({  
                    dd => 1, dt => 1, li => 1, p => 1,  
                    td => 1, th => 1, tr => 1,  
                   }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!back-token;  
                 $token = {type => 'end tag',  
                           tag_name => $self->{open_elements}->[-1]->[1]}; # MUST  
                 redo B;  
               }  
   
               if ($self->{open_elements}->[-1]->[1] ne 'table') {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
               }  
   
               splice @{$self->{open_elements}}, $i;  
   
               $self->_reset_insertion_mode;  
   
               !!!next-token;  
               redo B;  
             } elsif ({  
                       body => 1, caption => 1, col => 1, colgroup => 1,  
                       html => 1, tbody => 1, td => 1, tfoot => 1, th => 1,  
                       thead => 1, tr => 1,  
                      }->{$token->{tag_name}}) {  
               !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
               ## Ignore the token  
               !!!next-token;  
               redo B;  
             } else {  
               #  
             }  
           } else {  
             #  
           }  
   
           !!!parse-error (type => 'in table:'.$token->{tag_name});  
           $in_body->($insert_to_foster);  
           redo B;  
         } elsif ($self->{insertion_mode} eq 'in caption') {  
           if ($token->{type} eq 'character') {  
             ## NOTE: This is a code clone of "character in body".  
             $reconstruct_active_formatting_elements->($insert_to_current);  
               
             $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});  
   
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'comment') {  
             ## NOTE: This is a code clone of "comment in body".  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             if ({  
                  caption => 1, col => 1, colgroup => 1, tbody => 1,  
                  td => 1, tfoot => 1, th => 1, thead => 1, tr => 1,  
                 }->{$token->{tag_name}}) {  
               !!!parse-error (type => 'not closed:caption');  
   
               ## As if </caption>  
               ## have a table element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq 'caption') {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:caption');  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
                 
               ## generate implied end tags  
               if ({  
                    dd => 1, dt => 1, li => 1, p => 1,  
                    td => 1, th => 1, tr => 1,  
                   }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!back-token; # <?>  
                 $token = {type => 'end tag', tag_name => 'caption'};  
                 !!!back-token;  
                 $token = {type => 'end tag',  
                           tag_name => $self->{open_elements}->[-1]->[1]}; # MUST  
                 redo B;  
               }  
   
               if ($self->{open_elements}->[-1]->[1] ne 'caption') {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
               }  
   
               splice @{$self->{open_elements}}, $i;  
   
               $clear_up_to_marker->();  
   
               $self->{insertion_mode} = 'in table';  
   
               ## reprocess  
               redo B;  
             } else {  
               #  
             }  
           } elsif ($token->{type} eq 'end tag') {  
             if ($token->{tag_name} eq 'caption') {  
               ## have a table element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq $token->{tag_name}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
                 
               ## generate implied end tags  
               if ({  
                    dd => 1, dt => 1, li => 1, p => 1,  
                    td => 1, th => 1, tr => 1,  
                   }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!back-token;  
                 $token = {type => 'end tag',  
                           tag_name => $self->{open_elements}->[-1]->[1]}; # MUST  
                 redo B;  
               }  
   
               if ($self->{open_elements}->[-1]->[1] ne 'caption') {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
               }  
   
               splice @{$self->{open_elements}}, $i;  
   
               $clear_up_to_marker->();  
   
               $self->{insertion_mode} = 'in table';  
   
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'table') {  
               !!!parse-error (type => 'not closed:caption');  
   
               ## As if </caption>  
               ## have a table element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq 'caption') {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:caption');  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
                 
               ## generate implied end tags  
               if ({  
                    dd => 1, dt => 1, li => 1, p => 1,  
                    td => 1, th => 1, tr => 1,  
                   }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!back-token; # </table>  
                 $token = {type => 'end tag', tag_name => 'caption'};  
                 !!!back-token;  
                 $token = {type => 'end tag',  
                           tag_name => $self->{open_elements}->[-1]->[1]}; # MUST  
                 redo B;  
               }  
   
               if ($self->{open_elements}->[-1]->[1] ne 'caption') {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
               }  
   
               splice @{$self->{open_elements}}, $i;  
   
               $clear_up_to_marker->();  
   
               $self->{insertion_mode} = 'in table';  
   
               ## reprocess  
               redo B;  
             } elsif ({  
                       body => 1, col => 1, colgroup => 1,  
                       html => 1, tbody => 1, td => 1, tfoot => 1,  
                       th => 1, thead => 1, tr => 1,  
                      }->{$token->{tag_name}}) {  
               !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
               ## Ignore the token  
               redo B;  
             } else {  
               #  
             }  
           } else {  
             #  
           }  
                 
           $in_body->($insert_to_current);  
           redo B;  
         } elsif ($self->{insertion_mode} eq 'in column group') {  
           if ($token->{type} eq 'character') {  
             if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);  
               unless (length $token->{data}) {  
                 !!!next-token;  
                 redo B;  
               }  
             }  
               
             #  
           } elsif ($token->{type} eq 'comment') {  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             if ($token->{tag_name} eq 'col') {  
               !!!insert-element ($token->{tag_name}, $token->{attributes});  
               pop @{$self->{open_elements}};  
               !!!next-token;  
               redo B;  
             } else {  
               #  
             }  
           } elsif ($token->{type} eq 'end tag') {  
             if ($token->{tag_name} eq 'colgroup') {  
               if ($self->{open_elements}->[-1]->[1] eq 'html') {  
                 !!!parse-error (type => 'unmatched end tag:colgroup');  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               } else {  
                 pop @{$self->{open_elements}}; # colgroup  
                 $self->{insertion_mode} = 'in table';  
                 !!!next-token;  
                 redo B;              
               }  
             } elsif ($token->{tag_name} eq 'col') {  
               !!!parse-error (type => 'unmatched end tag:col');  
               ## Ignore the token  
               !!!next-token;  
               redo B;  
             } else {  
               #  
             }  
           } else {  
             #  
           }  
   
           ## As if </colgroup>  
           if ($self->{open_elements}->[-1]->[1] eq 'html') {  
             !!!parse-error (type => 'unmatched end tag:colgroup');  
             ## Ignore the token  
             !!!next-token;  
             redo B;  
           } else {  
             pop @{$self->{open_elements}}; # colgroup  
             $self->{insertion_mode} = 'in table';  
             ## reprocess  
             redo B;  
           }  
         } elsif ($self->{insertion_mode} eq 'in table body') {  
           if ($token->{type} eq 'character') {  
             ## NOTE: This is a "character in table" code clone.  
             if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);  
                 
               unless (length $token->{data}) {  
                 !!!next-token;  
                 redo B;  
               }  
             }  
   
             !!!parse-error (type => 'in table:#character');  
   
             ## As if in body, but insert into foster parent element  
             ## ISSUE: Spec says that "whenever a node would be inserted  
             ## into the current node" while characters might not be  
             ## result in a new Text node.  
             $reconstruct_active_formatting_elements->($insert_to_foster);  
   
             if ({  
                  table => 1, tbody => 1, tfoot => 1,  
                  thead => 1, tr => 1,  
                 }->{$self->{open_elements}->[-1]->[1]}) {  
               # MUST  
               my $foster_parent_element;  
               my $next_sibling;  
               my $prev_sibling;  
               OE: for (reverse 0..$#{$self->{open_elements}}) {  
                 if ($self->{open_elements}->[$_]->[1] eq 'table') {  
                   my $parent = $self->{open_elements}->[$_]->[0]->parent_node;  
                   if (defined $parent and $parent->node_type == 1) {  
                     $foster_parent_element = $parent;  
                     $next_sibling = $self->{open_elements}->[$_]->[0];  
                     $prev_sibling = $next_sibling->previous_sibling;  
                   } else {  
                     $foster_parent_element = $self->{open_elements}->[$_ - 1]->[0];  
                     $prev_sibling = $foster_parent_element->last_child;  
                   }  
                   last OE;  
                 }  
               } # OE  
               $foster_parent_element = $self->{open_elements}->[0]->[0] and  
               $prev_sibling = $foster_parent_element->last_child  
                 unless defined $foster_parent_element;  
               if (defined $prev_sibling and  
                   $prev_sibling->node_type == 3) {  
                 $prev_sibling->manakai_append_text ($token->{data});  
               } else {  
                 $foster_parent_element->insert_before  
                   ($self->{document}->create_text_node ($token->{data}),  
                    $next_sibling);  
               }  
             } else {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});  
             }  
               
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'comment') {  
             ## Copied from 'in table'  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             if ({  
                  tr => 1,  
                  th => 1, td => 1,  
                 }->{$token->{tag_name}}) {  
               unless ($token->{tag_name} eq 'tr') {  
                 !!!parse-error (type => 'missing start tag:tr');  
               }  
   
               ## Clear back to table body context  
               while (not {  
                 tbody => 1, tfoot => 1, thead => 1, html => 1,  
               }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
                 pop @{$self->{open_elements}};  
               }  
                 
               $self->{insertion_mode} = 'in row';  
               if ($token->{tag_name} eq 'tr') {  
                 !!!insert-element ($token->{tag_name}, $token->{attributes});  
                 !!!next-token;  
               } else {  
                 !!!insert-element ('tr');  
                 ## reprocess  
               }  
               redo B;  
             } elsif ({  
                       caption => 1, col => 1, colgroup => 1,  
                       tbody => 1, tfoot => 1, thead => 1,  
                      }->{$token->{tag_name}}) {  
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ({  
                      tbody => 1, thead => 1, tfoot => 1,  
                     }->{$node->[1]}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
   
               ## Clear back to table body context  
               while (not {  
                 tbody => 1, tfoot => 1, thead => 1, html => 1,  
               }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
                 pop @{$self->{open_elements}};  
               }  
   
               ## As if <{current node}>  
               ## have an element in table scope  
               ## true by definition  
   
               ## Clear back to table body context  
               ## nop by definition  
   
               pop @{$self->{open_elements}};  
               $self->{insertion_mode} = 'in table';  
               ## reprocess  
               redo B;  
             } elsif ($token->{tag_name} eq 'table') {  
               ## NOTE: This is a code clone of "table in table"  
               !!!parse-error (type => 'not closed:table');  
   
               ## As if </table>  
               ## have a table element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq 'table') {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:table');  
                 ## Ignore tokens </table><table>  
                 !!!next-token;  
                 redo B;  
               }  
                 
               ## generate implied end tags  
               if ({  
                    dd => 1, dt => 1, li => 1, p => 1,  
                    td => 1, th => 1, tr => 1,  
                   }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!back-token; # <table>  
                 $token = {type => 'end tag', tag_name => 'table'};  
                 !!!back-token;  
                 $token = {type => 'end tag',  
                           tag_name => $self->{open_elements}->[-1]->[1]}; # MUST  
                 redo B;  
               }  
   
               if ($self->{open_elements}->[-1]->[1] ne 'table') {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
               }  
   
               splice @{$self->{open_elements}}, $i;  
   
               $self->_reset_insertion_mode;  
   
               ## reprocess  
               redo B;  
             } else {  
               #  
             }  
           } elsif ($token->{type} eq 'end tag') {  
             if ({  
                  tbody => 1, tfoot => 1, thead => 1,  
                 }->{$token->{tag_name}}) {  
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq $token->{tag_name}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
   
               ## Clear back to table body context  
               while (not {  
                 tbody => 1, tfoot => 1, thead => 1, html => 1,  
               }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
                 pop @{$self->{open_elements}};  
               }  
   
               pop @{$self->{open_elements}};  
               $self->{insertion_mode} = 'in table';  
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'table') {  
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ({  
                      tbody => 1, thead => 1, tfoot => 1,  
                     }->{$node->[1]}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
   
               ## Clear back to table body context  
               while (not {  
                 tbody => 1, tfoot => 1, thead => 1, html => 1,  
               }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
                 pop @{$self->{open_elements}};  
               }  
   
               ## As if <{current node}>  
               ## have an element in table scope  
               ## true by definition  
   
               ## Clear back to table body context  
               ## nop by definition  
   
               pop @{$self->{open_elements}};  
               $self->{insertion_mode} = 'in table';  
               ## reprocess  
               redo B;  
             } elsif ({  
                       body => 1, caption => 1, col => 1, colgroup => 1,  
                       html => 1, td => 1, th => 1, tr => 1,  
                      }->{$token->{tag_name}}) {  
               !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
               ## Ignore the token  
               !!!next-token;  
               redo B;  
             } else {  
               #  
             }  
           } else {  
             #  
           }  
             
           ## As if in table  
           !!!parse-error (type => 'in table:'.$token->{tag_name});  
           $in_body->($insert_to_foster);  
           redo B;  
         } elsif ($self->{insertion_mode} eq 'in row') {  
           if ($token->{type} eq 'character') {  
             ## NOTE: This is a "character in table" code clone.  
             if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($1);  
                 
               unless (length $token->{data}) {  
                 !!!next-token;  
                 redo B;  
               }  
             }  
   
             !!!parse-error (type => 'in table:#character');  
   
             ## As if in body, but insert into foster parent element  
             ## ISSUE: Spec says that "whenever a node would be inserted  
             ## into the current node" while characters might not be  
             ## result in a new Text node.  
             $reconstruct_active_formatting_elements->($insert_to_foster);  
               
             if ({  
                  table => 1, tbody => 1, tfoot => 1,  
                  thead => 1, tr => 1,  
                 }->{$self->{open_elements}->[-1]->[1]}) {  
               # MUST  
               my $foster_parent_element;  
               my $next_sibling;  
               my $prev_sibling;  
               OE: for (reverse 0..$#{$self->{open_elements}}) {  
                 if ($self->{open_elements}->[$_]->[1] eq 'table') {  
                   my $parent = $self->{open_elements}->[$_]->[0]->parent_node;  
                   if (defined $parent and $parent->node_type == 1) {  
                     $foster_parent_element = $parent;  
                     $next_sibling = $self->{open_elements}->[$_]->[0];  
                     $prev_sibling = $next_sibling->previous_sibling;  
                   } else {  
                     $foster_parent_element = $self->{open_elements}->[$_ - 1]->[0];  
                     $prev_sibling = $foster_parent_element->last_child;  
                   }  
                   last OE;  
                 }  
               } # OE  
               $foster_parent_element = $self->{open_elements}->[0]->[0] and  
               $prev_sibling = $foster_parent_element->last_child  
                 unless defined $foster_parent_element;  
               if (defined $prev_sibling and  
                   $prev_sibling->node_type == 3) {  
                 $prev_sibling->manakai_append_text ($token->{data});  
               } else {  
                 $foster_parent_element->insert_before  
                   ($self->{document}->create_text_node ($token->{data}),  
                    $next_sibling);  
               }  
             } else {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});  
             }  
               
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'comment') {  
             ## Copied from 'in table'  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             if ($token->{tag_name} eq 'th' or  
                 $token->{tag_name} eq 'td') {  
               ## Clear back to table row context  
               while (not {  
                 tr => 1, html => 1,  
               }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
                 pop @{$self->{open_elements}};  
               }  
                 
               !!!insert-element ($token->{tag_name}, $token->{attributes});  
               $self->{insertion_mode} = 'in cell';  
   
               push @$active_formatting_elements, ['#marker', ''];  
                 
               !!!next-token;  
               redo B;  
             } elsif ({  
                       caption => 1, col => 1, colgroup => 1,  
                       tbody => 1, tfoot => 1, thead => 1, tr => 1,  
                      }->{$token->{tag_name}}) {  
               ## As if </tr>  
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq 'tr') {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmacthed end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
   
               ## Clear back to table row context  
               while (not {  
                 tr => 1, html => 1,  
               }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
                 pop @{$self->{open_elements}};  
               }  
   
               pop @{$self->{open_elements}}; # tr  
               $self->{insertion_mode} = 'in table body';  
               ## reprocess  
               redo B;  
             } elsif ($token->{tag_name} eq 'table') {  
               ## NOTE: This is a code clone of "table in table"  
               !!!parse-error (type => 'not closed:table');  
   
               ## As if </table>  
               ## have a table element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq 'table') {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:table');  
                 ## Ignore tokens </table><table>  
                 !!!next-token;  
                 redo B;  
               }  
                 
               ## generate implied end tags  
               if ({  
                    dd => 1, dt => 1, li => 1, p => 1,  
                    td => 1, th => 1, tr => 1,  
                   }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!back-token; # <table>  
                 $token = {type => 'end tag', tag_name => 'table'};  
                 !!!back-token;  
                 $token = {type => 'end tag',  
                           tag_name => $self->{open_elements}->[-1]->[1]}; # MUST  
                 redo B;  
               }  
   
               if ($self->{open_elements}->[-1]->[1] ne 'table') {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
               }  
   
               splice @{$self->{open_elements}}, $i;  
   
               $self->_reset_insertion_mode;  
   
               ## reprocess  
               redo B;  
             } else {  
               #  
             }  
           } elsif ($token->{type} eq 'end tag') {  
             if ($token->{tag_name} eq 'tr') {  
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq $token->{tag_name}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
   
               ## Clear back to table row context  
               while (not {  
                 tr => 1, html => 1,  
               }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
                 pop @{$self->{open_elements}};  
               }  
   
               pop @{$self->{open_elements}}; # tr  
               $self->{insertion_mode} = 'in table body';  
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'table') {  
               ## As if </tr>  
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq 'tr') {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{type});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
   
               ## Clear back to table row context  
               while (not {  
                 tr => 1, html => 1,  
               }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
                 pop @{$self->{open_elements}};  
               }  
   
               pop @{$self->{open_elements}}; # tr  
               $self->{insertion_mode} = 'in table body';  
               ## reprocess  
               redo B;  
             } elsif ({  
                       tbody => 1, tfoot => 1, thead => 1,  
                      }->{$token->{tag_name}}) {  
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq $token->{tag_name}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
   
               ## As if </tr>  
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq 'tr') {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:tr');  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
   
               ## Clear back to table row context  
               while (not {  
                 tr => 1, html => 1,  
               }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
                 pop @{$self->{open_elements}};  
               }  
   
               pop @{$self->{open_elements}}; # tr  
               $self->{insertion_mode} = 'in table body';  
               ## reprocess  
               redo B;  
             } elsif ({  
                       body => 1, caption => 1, col => 1,  
                       colgroup => 1, html => 1, td => 1, th => 1,  
                      }->{$token->{tag_name}}) {  
               !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
               ## Ignore the token  
               !!!next-token;  
               redo B;  
             } else {  
               #  
             }  
           } else {  
             #  
           }  
   
           ## As if in table  
           !!!parse-error (type => 'in table:'.$token->{tag_name});  
           $in_body->($insert_to_foster);  
           redo B;  
         } elsif ($self->{insertion_mode} eq 'in cell') {  
           if ($token->{type} eq 'character') {  
             ## NOTE: This is a code clone of "character in body".  
             $reconstruct_active_formatting_elements->($insert_to_current);  
               
             $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});  
   
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'comment') {  
             ## NOTE: This is a code clone of "comment in body".  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             if ({  
                  caption => 1, col => 1, colgroup => 1,  
                  tbody => 1, td => 1, tfoot => 1, th => 1,  
                  thead => 1, tr => 1,  
                 }->{$token->{tag_name}}) {  
               ## have an element in table scope  
               my $tn;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq 'td' or $node->[1] eq 'th') {  
                   $tn = $node->[1];  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $tn) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
   
               ## Close the cell  
               !!!back-token; # <?>  
               $token = {type => 'end tag', tag_name => $tn};  
               redo B;  
             } else {  
               #  
             }  
           } elsif ($token->{type} eq 'end tag') {  
             if ($token->{tag_name} eq 'td' or $token->{tag_name} eq 'th') {  
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq $token->{tag_name}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
                 
               ## generate implied end tags  
               if ({  
                    dd => 1, dt => 1, li => 1, p => 1,  
                    td => ($token->{tag_name} eq 'th'),  
                    th => ($token->{tag_name} eq 'td'),  
                    tr => 1,  
                   }->{$self->{open_elements}->[-1]->[1]}) {  
                 !!!back-token;  
                 $token = {type => 'end tag',  
                           tag_name => $self->{open_elements}->[-1]->[1]}; # MUST  
                 redo B;  
               }  
   
               if ($self->{open_elements}->[-1]->[1] ne $token->{tag_name}) {  
                 !!!parse-error (type => 'not closed:'.$self->{open_elements}->[-1]->[1]);  
               }  
   
               splice @{$self->{open_elements}}, $i;  
   
               $clear_up_to_marker->();  
   
               $self->{insertion_mode} = 'in row';  
   
               !!!next-token;  
               redo B;  
             } elsif ({  
                       body => 1, caption => 1, col => 1,  
                       colgroup => 1, html => 1,  
                      }->{$token->{tag_name}}) {  
               !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
               ## Ignore the token  
               !!!next-token;  
               redo B;  
             } elsif ({  
                       table => 1, tbody => 1, tfoot => 1,  
                       thead => 1, tr => 1,  
                      }->{$token->{tag_name}}) {  
               ## have an element in table scope  
               my $i;  
               my $tn;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq $token->{tag_name}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ($node->[1] eq 'td' or $node->[1] eq 'th') {  
                   $tn = $node->[1];  
                   ## NOTE: There is exactly one |td| or |th| element  
                   ## in scope in the stack of open elements by definition.  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
   
               ## Close the cell  
               !!!back-token; # </?>  
               $token = {type => 'end tag', tag_name => $tn};  
               redo B;  
             } else {  
               #  
             }  
           } else {  
             #  
           }  
             
           $in_body->($insert_to_current);  
           redo B;  
         } elsif ($self->{insertion_mode} eq 'in select') {  
           if ($token->{type} eq 'character') {  
             $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'comment') {  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             if ($token->{tag_name} eq 'option') {  
               if ($self->{open_elements}->[-1]->[1] eq 'option') {  
                 ## As if </option>  
                 pop @{$self->{open_elements}};  
               }  
   
               !!!insert-element ($token->{tag_name}, $token->{attributes});  
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'optgroup') {  
               if ($self->{open_elements}->[-1]->[1] eq 'option') {  
                 ## As if </option>  
                 pop @{$self->{open_elements}};  
               }  
   
               if ($self->{open_elements}->[-1]->[1] eq 'optgroup') {  
                 ## As if </optgroup>  
                 pop @{$self->{open_elements}};  
               }  
   
               !!!insert-element ($token->{tag_name}, $token->{attributes});  
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'select') {  
               !!!parse-error (type => 'not closed:select');  
               ## As if </select> instead  
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq $token->{tag_name}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:select');  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
                 
               splice @{$self->{open_elements}}, $i;  
   
               $self->_reset_insertion_mode;  
   
               !!!next-token;  
               redo B;  
             } else {  
               #  
             }  
           } elsif ($token->{type} eq 'end tag') {  
             if ($token->{tag_name} eq 'optgroup') {  
               if ($self->{open_elements}->[-1]->[1] eq 'option' and  
                   $self->{open_elements}->[-2]->[1] eq 'optgroup') {  
                 ## As if </option>  
                 splice @{$self->{open_elements}}, -2;  
               } elsif ($self->{open_elements}->[-1]->[1] eq 'optgroup') {  
                 pop @{$self->{open_elements}};  
               } else {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
               }  
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'option') {  
               if ($self->{open_elements}->[-1]->[1] eq 'option') {  
                 pop @{$self->{open_elements}};  
               } else {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
               }  
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'select') {  
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq $token->{tag_name}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
                 
               splice @{$self->{open_elements}}, $i;  
   
               $self->_reset_insertion_mode;  
   
               !!!next-token;  
               redo B;  
             } elsif ({  
                       caption => 1, table => 1, tbody => 1,  
                       tfoot => 1, thead => 1, tr => 1, td => 1, th => 1,  
                      }->{$token->{tag_name}}) {  
               !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 
               ## have an element in table scope  
               my $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq $token->{tag_name}) {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               }  
                 
               ## As if </select>  
               ## have an element in table scope  
               undef $i;  
               INSCOPE: for (reverse 0..$#{$self->{open_elements}}) {  
                 my $node = $self->{open_elements}->[$_];  
                 if ($node->[1] eq 'select') {  
                   $i = $_;  
                   last INSCOPE;  
                 } elsif ({  
                           table => 1, html => 1,  
                          }->{$node->[1]}) {  
                   last INSCOPE;  
                 }  
               } # INSCOPE  
               unless (defined $i) {  
                 !!!parse-error (type => 'unmatched end tag:select');  
                 ## Ignore the </select> token  
                 !!!next-token; ## TODO: ok?  
                 redo B;  
               }  
                 
               splice @{$self->{open_elements}}, $i;  
   
               $self->_reset_insertion_mode;  
   
               ## reprocess  
               redo B;  
             } else {  
               #  
             }  
           } else {  
             #  
           }  
   
           !!!parse-error (type => 'in select:'.$token->{tag_name});  
           ## Ignore the token  
           !!!next-token;  
           redo B;  
         } elsif ($self->{insertion_mode} eq 'after body') {  
           if ($token->{type} eq 'character') {  
             if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {  
               ## As if in body  
               $reconstruct_active_formatting_elements->($insert_to_current);  
                 
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});  
   
               unless (length $token->{data}) {  
                 !!!next-token;  
                 redo B;  
               }  
             }  
               
             #  
             !!!parse-error (type => 'after body:#'.$token->{type});  
           } elsif ($token->{type} eq 'comment') {  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[0]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             !!!parse-error (type => 'after body:'.$token->{tag_name});  
             #  
           } elsif ($token->{type} eq 'end tag') {  
             if ($token->{tag_name} eq 'html') {  
               if (defined $self->{inner_html_node}) {  
                 !!!parse-error (type => 'unmatched end tag:html');  
                 ## Ignore the token  
                 !!!next-token;  
                 redo B;  
               } else {  
                 $phase = 'trailing end';  
                 !!!next-token;  
                 redo B;  
               }  
             } else {  
               !!!parse-error (type => 'after body:/'.$token->{tag_name});  
             }  
           } else {  
             !!!parse-error (type => 'after body:#'.$token->{type});  
           }  
   
           $self->{insertion_mode} = 'in body';  
           ## reprocess  
           redo B;  
         } elsif ($self->{insertion_mode} eq 'in frameset') {  
           if ($token->{type} eq 'character') {  
             if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});  
   
               unless (length $token->{data}) {  
                 !!!next-token;  
                 redo B;  
               }  
             }  
   
             #  
           } elsif ($token->{type} eq 'comment') {  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             if ($token->{tag_name} eq 'frameset') {  
               !!!insert-element ($token->{tag_name}, $token->{attributes});  
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'frame') {  
               !!!insert-element ($token->{tag_name}, $token->{attributes});  
               pop @{$self->{open_elements}};  
               !!!next-token;  
               redo B;  
             } elsif ($token->{tag_name} eq 'noframes') {  
               $in_body->($insert_to_current);  
               redo B;  
             } else {  
               #  
             }  
           } elsif ($token->{type} eq 'end tag') {  
             if ($token->{tag_name} eq 'frameset') {  
               if ($self->{open_elements}->[-1]->[1] eq 'html' and  
                   @{$self->{open_elements}} == 1) {  
                 !!!parse-error (type => 'unmatched end tag:'.$token->{tag_name});  
                 ## Ignore the token  
                 !!!next-token;  
               } else {  
                 pop @{$self->{open_elements}};  
                 !!!next-token;  
               }  
                 
               ## if not inner_html and  
               if ($self->{open_elements}->[-1]->[1] ne 'frameset') {  
                 $self->{insertion_mode} = 'after frameset';  
               }  
               redo B;  
             } else {  
               #  
             }  
           } else {  
             #  
           }  
             
           if (defined $token->{tag_name}) {  
             !!!parse-error (type => 'in frameset:'.$token->{tag_name});  
           } else {  
             !!!parse-error (type => 'in frameset:#'.$token->{type});  
           }  
           ## Ignore the token  
           !!!next-token;  
           redo B;  
         } elsif ($self->{insertion_mode} eq 'after frameset') {  
           if ($token->{type} eq 'character') {  
             if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {  
               $self->{open_elements}->[-1]->[0]->manakai_append_text ($token->{data});  
   
               unless (length $token->{data}) {  
                 !!!next-token;  
                 redo B;  
               }  
             }  
   
             #  
           } elsif ($token->{type} eq 'comment') {  
             my $comment = $self->{document}->create_comment ($token->{data});  
             $self->{open_elements}->[-1]->[0]->append_child ($comment);  
             !!!next-token;  
             redo B;  
           } elsif ($token->{type} eq 'start tag') {  
             if ($token->{tag_name} eq 'noframes') {  
               $in_body->($insert_to_current);  
               redo B;  
             } else {  
               #  
             }  
           } elsif ($token->{type} eq 'end tag') {  
             if ($token->{tag_name} eq 'html') {  
               $phase = 'trailing end';  
               !!!next-token;  
               redo B;  
             } else {  
               #  
             }  
           } else {  
             #  
           }  
             
           if (defined $token->{tag_name}) {  
             !!!parse-error (type => 'after frameset:'.$token->{tag_name});  
           } else {  
             !!!parse-error (type => 'after frameset:#'.$token->{type});  
           }  
           ## Ignore the token  
           !!!next-token;  
           redo B;  
   
           ## ISSUE: An issue in spec there  
         } else {  
           die "$0: $self->{insertion_mode}: Unknown insertion mode";  
         }  
       }  
     } elsif ($phase eq 'trailing end') {  
       ## states in the main stage is preserved yet # MUST  
         
       if ($token->{type} eq 'DOCTYPE') {  
         !!!parse-error (type => 'after html:#DOCTYPE');  
         ## Ignore the token  
         !!!next-token;  
         redo B;  
       } elsif ($token->{type} eq 'comment') {  
         my $comment = $self->{document}->create_comment ($token->{data});  
         $self->{document}->append_child ($comment);  
         !!!next-token;  
         redo B;  
       } elsif ($token->{type} eq 'character') {  
         if ($token->{data} =~ s/^([\x09\x0A\x0B\x0C\x20]+)//) {  
           my $data = $1;  
           ## As if in the main phase.  
           ## NOTE: The insertion mode in the main phase  
           ## just before the phase has been changed to the trailing  
           ## end phase is either "after body" or "after frameset".  
           $reconstruct_active_formatting_elements->($insert_to_current)  
             if $phase eq 'main';  
             
           $self->{open_elements}->[-1]->[0]->manakai_append_text ($data);  
             
           unless (length $token->{data}) {  
             !!!next-token;  
             redo B;  
           }  
         }  
   
         !!!parse-error (type => 'after html:#character');  
         $phase = 'main';  
         ## reprocess  
         redo B;  
       } elsif ($token->{type} eq 'start tag' or  
                $token->{type} eq 'end tag') {  
         !!!parse-error (type => 'after html:'.$token->{tag_name});  
         $phase = 'main';  
         ## reprocess  
         redo B;  
       } elsif ($token->{type} eq 'end-of-file') {  
         ## Stop parsing  
         last B;  
       } else {  
         die "$0: $token->{type}: Unknown token";  
5126        }        }
5127      }      }
5128        redo B;
5129    } # B    } # B
5130    
5131      ## NOTE: The "trailing end" phase in HTML5 is split into
5132      ## two insertion modes: "after html body" and "after html frameset".
5133      ## NOTE: States in the main stage is preserved while
5134      ## the parser stays in the trailing end phase. # MUST
5135    
5136    ## Stop parsing # MUST    ## Stop parsing # MUST
5137        
5138    ## TODO: script stuffs    ## TODO: script stuffs
# Line 5206  sub set_inner_html ($$$) { Line 5217  sub set_inner_html ($$$) {
5217    
5218      ## Step 2      ## Step 2
5219      my $node_ln = $node->local_name;      my $node_ln = $node->local_name;
5220      $p->{content_model_flag} = {      $p->{content_model} = {
5221        title => 'RCDATA',        title => RCDATA_CONTENT_MODEL,
5222        textarea => 'RCDATA',        textarea => RCDATA_CONTENT_MODEL,
5223        style => 'CDATA',        style => CDATA_CONTENT_MODEL,
5224        script => 'CDATA',        script => CDATA_CONTENT_MODEL,
5225        xmp => 'CDATA',        xmp => CDATA_CONTENT_MODEL,
5226        iframe => 'CDATA',        iframe => CDATA_CONTENT_MODEL,
5227        noembed => 'CDATA',        noembed => CDATA_CONTENT_MODEL,
5228        noframes => 'CDATA',        noframes => CDATA_CONTENT_MODEL,
5229        noscript => 'CDATA',        noscript => CDATA_CONTENT_MODEL,
5230        plaintext => 'PLAINTEXT',        plaintext => PLAINTEXT_CONTENT_MODEL,
5231      }->{$node_ln} || 'PCDATA';      }->{$node_ln};
5232         ## ISSUE: What is "the name of the element"? local name?      $p->{content_model} = PCDATA_CONTENT_MODEL
5233            unless defined $p->{content_model};
5234            ## ISSUE: What is "the name of the element"? local name?
5235    
5236      $p->{inner_html_node} = [$node, $node_ln];      $p->{inner_html_node} = [$node, $node_ln];
5237    
# Line 5318  sub get_inner_html ($$$) { Line 5331  sub get_inner_html ($$$) {
5331            
5332      my $nt = $child->node_type;      my $nt = $child->node_type;
5333      if ($nt == 1) { # Element      if ($nt == 1) { # Element
5334        my $tag_name = lc $child->tag_name; ## ISSUE: Definition of "lowercase"        my $tag_name = $child->tag_name; ## TODO: manakai_tag_name
5335        $s .= '<' . $tag_name;        $s .= '<' . $tag_name;
5336          ## NOTE: Non-HTML case:
5337        ## ISSUE: Non-html elements        ## <http://permalink.gmane.org/gmane.org.w3c.whatwg.discuss/11191>
5338    
5339        my @attrs = @{$child->attributes}; # sort order MUST be stable        my @attrs = @{$child->attributes}; # sort order MUST be stable
5340        for my $attr (@attrs) { # order is implementation dependent        for my $attr (@attrs) { # order is implementation dependent
5341          my $attr_name = lc $attr->name; ## ISSUE: Definition of "lowercase"          my $attr_name = $attr->name; ## TODO: manakai_name
5342          $s .= ' ' . $attr_name . '="';          $s .= ' ' . $attr_name . '="';
5343          my $attr_value = $attr->value;          my $attr_value = $attr->value;
5344          ## escape          ## escape
# Line 5349  sub get_inner_html ($$$) { Line 5362  sub get_inner_html ($$$) {
5362        if (not $in_cdata and {        if (not $in_cdata and {
5363          style => 1, script => 1, xmp => 1, iframe => 1,          style => 1, script => 1, xmp => 1, iframe => 1,
5364          noembed => 1, noframes => 1, noscript => 1,          noembed => 1, noframes => 1, noscript => 1,
5365            plaintext => 1,
5366        }->{$tag_name}) {        }->{$tag_name}) {
5367          unshift @node, 'cdata-out';          unshift @node, 'cdata-out';
5368          $in_cdata = 1;          $in_cdata = 1;

Legend:
Removed from v.1.23  
changed lines
  Added in v.1.56

admin@suikawiki.org
ViewVC Help
Powered by ViewVC 1.1.24