/[suikacvs]/markup/html/whatpm/Whatpm/HTML/Tokenizer.pm

Diff of /markup/html/whatpm/Whatpm/HTML/Tokenizer.pm

Parent Directory | Revision Log | View Patch Patch

-revision 1.13 by wakaba,
Thu Oct 16 03:39:57 2008 UTC
+revision 1.32 by wakaba,
Sat Sep  5 09:57:55 2009 UTC
 Line 16 
 BEGIN {
      PI_TOKEN
      ABORT_TOKEN
      END_OF_DOCTYPE_TOKEN
+     ATTLIST_TOKEN
+     ELEMENT_TOKEN
+     GENERAL_ENTITY_TOKEN
+     PARAMETER_ENTITY_TOKEN
+     NOTATION_TOKEN
    );
    our %EXPORT_TAGS = (
-Line 29 
 BEGIN {
+Line 34 
 BEGIN {
        PI_TOKEN
        ABORT_TOKEN
        END_OF_DOCTYPE_TOKEN
+       ATTLIST_TOKEN
+       ELEMENT_TOKEN
+       GENERAL_ENTITY_TOKEN
+       PARAMETER_ENTITY_TOKEN
+       NOTATION_TOKEN
      )],
    );
  }
-Line 45 
 sub END_OF_FILE_TOKEN () { 5 }
+Line 55 
 sub END_OF_FILE_TOKEN () { 5 }
  sub CHARACTER_TOKEN () { 6 }
  sub PI_TOKEN () { 7 } ## NOTE: XML only.
  sub ABORT_TOKEN () { 8 } ## NOTE: For internal processing.
- sub END_OF_DOCTYPE_TOKEN () { 9 } ## NOTE: XML only
+ sub END_OF_DOCTYPE_TOKEN () { 9 } ## NOTE: XML only.
+ sub ATTLIST_TOKEN () { 10 } ## NOTE: XML only.
+ sub ELEMENT_TOKEN () { 11 } ## NOTE: XML only.
+ sub GENERAL_ENTITY_TOKEN () { 12 } ## NOTE: XML only.
+ sub PARAMETER_ENTITY_TOKEN () { 13 } ## NOTE: XML only.
+ sub NOTATION_TOKEN () { 14 } ## NOTE: XML only.
  ## XML5: XML5 has "empty tag token".  In this implementation, it is
  ## represented as a start tag token with $self->{self_closing} flag
-Line 90 
 sub COMMENT_START_STATE () { 14 }
+Line 105 
 sub COMMENT_START_STATE () { 14 }
  sub COMMENT_START_DASH_STATE () { 15 }
  sub COMMENT_STATE () { 16 }
  sub COMMENT_END_STATE () { 17 }
+ sub COMMENT_END_BANG_STATE () { 102 }
+ sub COMMENT_END_SPACE_STATE () { 103 } ## LAST
  sub COMMENT_END_DASH_STATE () { 18 }
  sub BOGUS_COMMENT_STATE () { 19 }
  sub DOCTYPE_STATE () { 20 }
-Line 136 
 sub PI_AFTER_STATE () { 55 }
+Line 153 
 sub PI_AFTER_STATE () { 55 }
  sub PI_DATA_AFTER_STATE () { 56 }
  sub DOCTYPE_INTERNAL_SUBSET_STATE () { 57 }
  sub DOCTYPE_INTERNAL_SUBSET_AFTER_STATE () { 58 }
- sub DOCTYPE_TAG_STATE () { 59 }
+ sub BOGUS_DOCTYPE_INTERNAL_SUBSET_AFTER_STATE () { 59 }
- sub BOGUS_DOCTYPE_INTERNAL_SUBSET_AFTER_STATE () { 60 }
+ sub DOCTYPE_TAG_STATE () { 60 }
+ sub DOCTYPE_MARKUP_DECLARATION_OPEN_STATE () { 61 }
+ sub MD_ATTLIST_STATE () { 62 }
+ sub MD_E_STATE () { 63 }
+ sub MD_ELEMENT_STATE () { 64 }
+ sub MD_ENTITY_STATE () { 65 }
+ sub MD_NOTATION_STATE () { 66 }
+ sub DOCTYPE_MD_STATE () { 67 }
+ sub BEFORE_MD_NAME_STATE () { 68 }
+ sub MD_NAME_STATE () { 69 }
+ sub DOCTYPE_ENTITY_PARAMETER_BEFORE_STATE () { 70 }
+ sub DOCTYPE_ATTLIST_NAME_AFTER_STATE () { 71 }
+ sub DOCTYPE_ATTLIST_ATTRIBUTE_NAME_STATE () { 72 }
+ sub DOCTYPE_ATTLIST_ATTRIBUTE_NAME_AFTER_STATE () { 73 }
+ sub DOCTYPE_ATTLIST_ATTRIBUTE_TYPE_STATE () { 74 }
+ sub DOCTYPE_ATTLIST_ATTRIBUTE_TYPE_AFTER_STATE () { 75 }
+ sub BEFORE_ALLOWED_TOKEN_STATE () { 76 }
+ sub ALLOWED_TOKEN_STATE () { 77 }
+ sub AFTER_ALLOWED_TOKEN_STATE () { 78 }
+ sub AFTER_ALLOWED_TOKENS_STATE () { 79 }
+ sub BEFORE_ATTR_DEFAULT_STATE () { 80 }
+ sub DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_BEFORE_STATE () { 81 }
+ sub DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_STATE () { 82 }
+ sub DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_AFTER_STATE () { 83 }
+ sub AFTER_ATTLIST_ATTR_VALUE_QUOTED_STATE () { 84 }
+ sub BEFORE_NDATA_STATE () { 85 }
+ sub NDATA_STATE () { 86 }
+ sub AFTER_NDATA_STATE () { 87 }
+ sub BEFORE_NOTATION_NAME_STATE () { 88 }
+ sub NOTATION_NAME_STATE () { 89 }
+ sub DOCTYPE_ENTITY_VALUE_DOUBLE_QUOTED_STATE () { 90 }
+ sub DOCTYPE_ENTITY_VALUE_SINGLE_QUOTED_STATE () { 91 }
+ sub ENTITY_VALUE_ENTITY_STATE () { 92 }
+ sub AFTER_ELEMENT_NAME_STATE () { 93 }
+ sub BEFORE_ELEMENT_CONTENT_STATE () { 94 }
+ sub CONTENT_KEYWORD_STATE () { 95 }
+ sub AFTER_CM_GROUP_OPEN_STATE () { 96 }
+ sub CM_ELEMENT_NAME_STATE () { 97 }
+ sub AFTER_CM_ELEMENT_NAME_STATE () { 98 }
+ sub AFTER_CM_GROUP_CLOSE_STATE () { 99 }
+ sub AFTER_MD_DEF_STATE () { 100 }
+ sub BOGUS_MD_STATE () { 101 }
  ## Tree constructor state constants (see Whatpm::HTML for the full
  ## list and descriptions)
-Line 1192 
 sub _get_next_token ($) {
+Line 1250 
 sub _get_next_token ($) {
          if ({
 x0022 => 1, # "
 x0027 => 1, # '
+x003C => 1, # <
 x003D => 1, # =
              }->{$self->{nc}}) {
-Line 1374 
 sub _get_next_token ($) {
+Line 1433 
 sub _get_next_token ($) {
          redo A;
        } else {
-         if ($self->{nc} == 0x0022 or # "
+         if ({
-             $self->{nc} == 0x0027) { # '
+x0022 => 1, # "
+x0027 => 1, # '
+x003C => 1, # <
+             }->{$self->{nc}}) {
            ## XML5: Not a parse error.
            $self->{parse_error}->(level => $self->{level}->{must}, type => 'bad attribute name');
-Line 1546 
 sub _get_next_token ($) {
+Line 1608 
 sub _get_next_token ($) {
          }
-         if ($self->{nc} == 0x0022 or # "
+         if ({
-             $self->{nc} == 0x0027) { # '
+x0022 => 1, # "
+x0027 => 1, # '
+x003C => 1, # <
+             }->{$self->{nc}}) {
            ## XML5: Not a parse error.
            $self->{parse_error}->(level => $self->{level}->{must}, type => 'bad attribute name');
-Line 1684 
 sub _get_next_token ($) {
+Line 1749 
 sub _get_next_token ($) {
          redo A;
        } else {
-         if ($self->{nc} == 0x003D) { # =
+         if ($self->{nc} == 0x003D or $self->{nc} == 0x003C) { # =, <
            ## XML5: Not a parse error.
            $self->{parse_error}->(level => $self->{level}->{must}, type => 'bad attribute value');
-Line 1711 
 sub _get_next_token ($) {
+Line 1776 
 sub _get_next_token ($) {
          redo A;
        }
      } elsif ($self->{state} == ATTRIBUTE_VALUE_DOUBLE_QUOTED_STATE) {
-       ## XML5: "Tag attribute value double quoted state".
+       ## XML5: "Tag attribute value double quoted state" and "DOCTYPE
+       ## ATTLIST attribute value double quoted state".
        if ($self->{nc} == 0x0022) { # "
+         if ($self->{ct}->{type} == ATTLIST_TOKEN) {
-         ## XML5: "Tag attribute name before state".
-         $self->{state} = AFTER_ATTRIBUTE_VALUE_QUOTED_STATE;
+           ## XML5: "DOCTYPE ATTLIST name after state".
+           push @{$self->{ct}->{attrdefs}}, $self->{ca};
+           $self->{state} = AFTER_ATTLIST_ATTR_VALUE_QUOTED_STATE;
+         } else {
+           ## XML5: "Tag attribute name before state".
+           $self->{state} = AFTER_ATTRIBUTE_VALUE_QUOTED_STATE;
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 1752 
 sub _get_next_token ($) {
+Line 1825 
 sub _get_next_token ($) {
      }
          redo A;
+       } elsif ($self->{is_xml} and
+                $is_space->{$self->{nc}}) {
+         $self->{ca}->{value} .= ' ';
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
        } elsif ($self->{nc} == -1) {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed attribute value');
          if ($self->{ct}->{type} == START_TAG_TOKEN) {
            $self->{last_stag_name} = $self->{ct}->{tag_name};
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           ## reconsume
+           return  ($self->{ct}); # start tag
+           redo A;
          } elsif ($self->{ct}->{type} == END_TAG_TOKEN) {
            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
            if ($self->{ct}->{attributes}) {
-Line 1766 
 sub _get_next_token ($) {
+Line 1862 
 sub _get_next_token ($) {
              ## NOTE: This state should never be reached.
            }
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           ## reconsume
+           return  ($self->{ct}); # end tag
+           redo A;
+         } elsif ($self->{ct}->{type} == ATTLIST_TOKEN) {
+           ## XML5: No parse error above; not defined yet.
+           push @{$self->{ct}->{attrdefs}}, $self->{ca};
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+           ## Reconsume.
+           return  ($self->{ct}); # ATTLIST
+           redo A;
          } else {
            die "$0: $self->{ct}->{type}: Unknown token type";
          }
-         $self->{state} = DATA_STATE;
-         $self->{s_kwd} = '';
-         ## reconsume
-         return  ($self->{ct}); # start tag or end tag
-         redo A;
        } else {
+         ## XML5 [ATTLIST]: Not defined yet.
          if ($self->{is_xml} and $self->{nc} == 0x003C) { # <
            ## XML5: Not a parse error.
-Line 1786 
 sub _get_next_token ($) {
+Line 1889 
 sub _get_next_token ($) {
          }
          $self->{ca}->{value} .= chr ($self->{nc});
          $self->{read_until}->($self->{ca}->{value},
-                               q["&<],
+                               qq["&<\x09\x0C\x20],
                                length $self->{ca}->{value});
          ## Stay in the state
-Line 1804 
 sub _get_next_token ($) {
+Line 1907 
 sub _get_next_token ($) {
          redo A;
        }
      } elsif ($self->{state} == ATTRIBUTE_VALUE_SINGLE_QUOTED_STATE) {
-       ## XML5: "Tag attribute value single quoted state".
+       ## XML5: "Tag attribute value single quoted state" and "DOCTYPE
+       ## ATTLIST attribute value single quoted state".
        if ($self->{nc} == 0x0027) { # '
+         if ($self->{ct}->{type} == ATTLIST_TOKEN) {
-         ## XML5: "Before attribute name state" (sic).
-         $self->{state} = AFTER_ATTRIBUTE_VALUE_QUOTED_STATE;
+           ## XML5: "DOCTYPE ATTLIST name after state".
+           push @{$self->{ct}->{attrdefs}}, $self->{ca};
+           $self->{state} = AFTER_ATTLIST_ATTR_VALUE_QUOTED_STATE;
+         } else {
+           ## XML5: "Before attribute name state" (sic).
+           $self->{state} = AFTER_ATTRIBUTE_VALUE_QUOTED_STATE;
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 1845 
 sub _get_next_token ($) {
+Line 1956 
 sub _get_next_token ($) {
      }
          redo A;
+       } elsif ($self->{is_xml} and
+                $is_space->{$self->{nc}}) {
+         $self->{ca}->{value} .= ' ';
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
        } elsif ($self->{nc} == -1) {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed attribute value');
          if ($self->{ct}->{type} == START_TAG_TOKEN) {
            $self->{last_stag_name} = $self->{ct}->{tag_name};
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           ## reconsume
+           return  ($self->{ct}); # start tag
+           redo A;
          } elsif ($self->{ct}->{type} == END_TAG_TOKEN) {
            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
            if ($self->{ct}->{attributes}) {
-Line 1859 
 sub _get_next_token ($) {
+Line 1993 
 sub _get_next_token ($) {
              ## NOTE: This state should never be reached.
            }
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           ## reconsume
+           return  ($self->{ct}); # end tag
+           redo A;
+         } elsif ($self->{ct}->{type} == ATTLIST_TOKEN) {
+           ## XML5: No parse error above; not defined yet.
+           push @{$self->{ct}->{attrdefs}}, $self->{ca};
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+           ## Reconsume.
+           return  ($self->{ct}); # ATTLIST
+           redo A;
          } else {
            die "$0: $self->{ct}->{type}: Unknown token type";
          }
-         $self->{state} = DATA_STATE;
-         $self->{s_kwd} = '';
-         ## reconsume
-         return  ($self->{ct}); # start tag or end tag
-         redo A;
        } else {
+         ## XML5 [ATTLIST]: Not defined yet.
          if ($self->{is_xml} and $self->{nc} == 0x003C) { # <
            ## XML5: Not a parse error.
-Line 1879 
 sub _get_next_token ($) {
+Line 2020 
 sub _get_next_token ($) {
          }
          $self->{ca}->{value} .= chr ($self->{nc});
          $self->{read_until}->($self->{ca}->{value},
-                               q['&<],
+                               qq['&<\x09\x0C\x20],
                                length $self->{ca}->{value});
          ## Stay in the state
-Line 1900 
 sub _get_next_token ($) {
+Line 2041 
 sub _get_next_token ($) {
        ## XML5: "Tag attribute value unquoted state".
        if ($is_space->{$self->{nc}}) {
+         if ($self->{ct}->{type} == ATTLIST_TOKEN) {
-         ## XML5: "Tag attribute name before state".
-         $self->{state} = BEFORE_ATTRIBUTE_NAME_STATE;
+           push @{$self->{ct}->{attrdefs}}, $self->{ca};
+           $self->{state} = DOCTYPE_ATTLIST_NAME_AFTER_STATE;
+         } else {
+           ## XML5: "Tag attribute name before state".
+           $self->{state} = BEFORE_ATTRIBUTE_NAME_STATE;
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 1943 
 sub _get_next_token ($) {
+Line 2090 
 sub _get_next_token ($) {
          if ($self->{ct}->{type} == START_TAG_TOKEN) {
            $self->{last_stag_name} = $self->{ct}->{tag_name};
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+           return  ($self->{ct}); # start tag
+           redo A;
          } elsif ($self->{ct}->{type} == END_TAG_TOKEN) {
            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
            if ($self->{ct}->{attributes}) {
-Line 1952 
 sub _get_next_token ($) {
+Line 2115 
 sub _get_next_token ($) {
              ## NOTE: This state should never be reached.
            }
-         } else {
-           die "$0: $self->{ct}->{type}: Unknown token type";
+           $self->{state} = DATA_STATE;
-         }
+           $self->{s_kwd} = '';
-         $self->{state} = DATA_STATE;
-         $self->{s_kwd} = '';
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
        $self->{column_prev} = $self->{column};
-Line 1968 
 sub _get_next_token ($) {
+Line 2129 
 sub _get_next_token ($) {
        $self->{set_nc}->($self);
      }
+           return  ($self->{ct}); # end tag
-         return  ($self->{ct}); # start tag or end tag
+           redo A;
+         } elsif ($self->{ct}->{type} == ATTLIST_TOKEN) {
-         redo A;
+           push @{$self->{ct}->{attrdefs}}, $self->{ca};
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+           return  ($self->{ct}); # ATTLIST
+           redo A;
+         } else {
+           die "$0: $self->{ct}->{type}: Unknown token type";
+         }
        } elsif ($self->{nc} == -1) {
-         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed tag');
          if ($self->{ct}->{type} == START_TAG_TOKEN) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed tag');
            $self->{last_stag_name} = $self->{ct}->{tag_name};
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           ## reconsume
+           return  ($self->{ct}); # start tag
+           redo A;
          } elsif ($self->{ct}->{type} == END_TAG_TOKEN) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed tag');
            $self->{content_model} = PCDATA_CONTENT_MODEL; # MUST
            if ($self->{ct}->{attributes}) {
-Line 1986 
 sub _get_next_token ($) {
+Line 2171 
 sub _get_next_token ($) {
              ## NOTE: This state should never be reached.
            }
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           ## reconsume
+           return  ($self->{ct}); # end tag
+           redo A;
+         } elsif ($self->{ct}->{type} == ATTLIST_TOKEN) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+           push @{$self->{ct}->{attrdefs}}, $self->{ca};
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+           ## Reconsume.
+           return  ($self->{ct}); # ATTLIST
+           redo A;
          } else {
            die "$0: $self->{ct}->{type}: Unknown token type";
          }
-         $self->{state} = DATA_STATE;
-         $self->{s_kwd} = '';
-         ## reconsume
-         return  ($self->{ct}); # start tag or end tag
-         redo A;
        } else {
          if ({
 x0022 => 1, # "
 x0027 => 1, # '
 x003D => 1, # =
+x003C => 1, # <
              }->{$self->{nc}}) {
            ## XML5: Not a parse error.
-Line 2010 
 sub _get_next_token ($) {
+Line 2202 
 sub _get_next_token ($) {
          }
          $self->{ca}->{value} .= chr ($self->{nc});
          $self->{read_until}->($self->{ca}->{value},
-                               q["'=& >],
+                               qq["'=& \x09\x0C>],
                                length $self->{ca}->{value});
          ## Stay in the state
-Line 2188 
 sub _get_next_token ($) {
+Line 2380 
 sub _get_next_token ($) {
          redo A;
        }
      } elsif ($self->{state} == BOGUS_COMMENT_STATE) {
+       ## XML5: "Bogus comment state" and "DOCTYPE bogus comment state".
        ## NOTE: Unlike spec's "bogus comment state", this implementation
        ## consumes characters one-by-one basis.
-Line 2249 
 sub _get_next_token ($) {
+Line 2443 
 sub _get_next_token ($) {
          redo A;
        }
      } elsif ($self->{state} == MARKUP_DECLARATION_OPEN_STATE) {
-       ## XML5: "Markup declaration state" and "DOCTYPE markup
+       ## XML5: "Markup declaration state".
-       ## declaration state".
        if ($self->{nc} == 0x002D) { # -
-Line 2648 
 sub _get_next_token ($) {
+Line 2841 
 sub _get_next_token ($) {
          redo A;
        }
      } elsif ($self->{state} == COMMENT_STATE) {
+       ## XML5: "Comment state" and "DOCTYPE comment state".
        if ($self->{nc} == 0x002D) { # -
          $self->{state} = COMMENT_END_DASH_STATE;
-Line 2700 
 sub _get_next_token ($) {
+Line 2895 
 sub _get_next_token ($) {
          redo A;
        }
      } elsif ($self->{state} == COMMENT_END_DASH_STATE) {
-       ## XML5: "comment dash state".
+       ## XML5: "Comment dash state" and "DOCTYPE comment dash state".
        if ($self->{nc} == 0x002D) { # -
-Line 2749 
 sub _get_next_token ($) {
+Line 2944 
 sub _get_next_token ($) {
          redo A;
        }
-     } elsif ($self->{state} == COMMENT_END_STATE) {
+     } elsif ($self->{state} == COMMENT_END_STATE or
+              $self->{state} == COMMENT_END_BANG_STATE) {
+       ## XML5: "Comment end state" and "DOCTYPE comment end state".
+       ## (No comment end bang state.)
        if ($self->{nc} == 0x003E) { # >
          if ($self->{in_subset}) {
-Line 2775 
 sub _get_next_token ($) {
+Line 2974 
 sub _get_next_token ($) {
          redo A;
        } elsif ($self->{nc} == 0x002D) { # -
+         if ($self->{state} == COMMENT_END_BANG_STATE) {
+           $self->{ct}->{data} .= '--!'; # comment
+           $self->{state} = COMMENT_END_DASH_STATE;
+         } else {
+           ## XML5: Not a parse error.
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'dash in comment',
+                           line => $self->{line_prev},
+                           column => $self->{column_prev});
+           $self->{ct}->{data} .= '-'; # comment
+           ## Stay in the state
+         }
-         ## XML5: Not a parse error.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
-         $self->{parse_error}->(level => $self->{level}->{must}, type => 'dash in comment',
+       $self->{line_prev} = $self->{line};
-                         line => $self->{line_prev},
+       $self->{column_prev} = $self->{column};
-                         column => $self->{column_prev});
+       $self->{column}++;
-         $self->{ct}->{data} .= '-'; # comment
+       $self->{nc}
-         ## Stay in the state
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{state} != COMMENT_END_BANG_STATE and
+                $is_space->{$self->{nc}}) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'comment end space'); # XXX error type
+         $self->{ct}->{data} .= '--' . chr ($self->{nc}); # comment
+         $self->{state} = COMMENT_END_SPACE_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{state} != COMMENT_END_BANG_STATE and
+                $self->{nc} == 0x0021) { # !
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'comment end bang'); # XXX error type
+         $self->{state} = COMMENT_END_BANG_STATE;
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 2804 
 sub _get_next_token ($) {
+Line 3044 
 sub _get_next_token ($) {
            $self->{state} = DATA_STATE;
            $self->{s_kwd} = '';
          }
-         ## reconsume
+         ## Reconsume.
          return  ($self->{ct}); # comment
          redo A;
        } else {
-         ## XML5: Not a parse error.
+         if ($self->{state} == COMMENT_END_BANG_STATE) {
-         $self->{parse_error}->(level => $self->{level}->{must}, type => 'dash in comment',
+           $self->{ct}->{data} .= '--!' . chr ($self->{nc}); # comment
-                         line => $self->{line_prev},
+         } else {
-                         column => $self->{column_prev});
+           $self->{ct}->{data} .= '--' . chr ($self->{nc}); # comment
-         $self->{ct}->{data} .= '--' . chr ($self->{nc}); # comment
+         }
          $self->{state} = COMMENT_STATE;
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
-Line 2830 
 sub _get_next_token ($) {
+Line 3070 
 sub _get_next_token ($) {
          redo A;
        }
+     } elsif ($self->{state} == COMMENT_END_SPACE_STATE) {
+       ## XML5: Not exist.
+       if ($self->{nc} == 0x003E) { # >
+         if ($self->{in_subset}) {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         } else {
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+         }
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # comment
+         redo A;
+       } elsif ($is_space->{$self->{nc}}) {
+         $self->{ct}->{data} .= chr ($self->{nc}); # comment
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed comment');
+         if ($self->{in_subset}) {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         } else {
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+         }
+         ## Reconsume.
+         return  ($self->{ct}); # comment
+         redo A;
+       } else {
+         $self->{ct}->{data} .= chr ($self->{nc}); # comment
+         $self->{state} = COMMENT_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
      } elsif ($self->{state} == DOCTYPE_STATE) {
        if ($is_space->{$self->{nc}}) {
-Line 2846 
 sub _get_next_token ($) {
+Line 3161 
 sub _get_next_token ($) {
      }
          redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
+         $self->{ct}->{quirks} = 1;
+         $self->{state} = DATA_STATE;
+         ## Reconsume.
+         return  ($self->{ct}); # DOCTYPE (quirks)
+         redo A;
        } else {
-         ## XML5: Unless EOF, swith to the bogus comment state.
+         ## XML5: Swith to the bogus comment state.
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before DOCTYPE name');
          $self->{state} = BEFORE_DOCTYPE_NAME_STATE;
          ## reconsume
-Line 2893 
 sub _get_next_token ($) {
+Line 3218 
 sub _get_next_token ($) {
          return  ($self->{ct}); # DOCTYPE (quirks)
          redo A;
+       } elsif (0x0041 <= $self->{nc} and $self->{nc} <= 0x005A) { # A..Z
+         $self->{ct}->{name} # DOCTYPE
+             = chr ($self->{nc} + ($self->{is_xml} ? 0 : 0x0020));
+         delete $self->{ct}->{quirks};
+         $self->{state} = DOCTYPE_NAME_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
        } elsif ($self->{nc} == -1) {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'no DOCTYPE name');
-Line 2979 
 sub _get_next_token ($) {
+Line 3322 
 sub _get_next_token ($) {
          return  ($self->{ct}); # DOCTYPE
          redo A;
+       } elsif (0x0041 <= $self->{nc} and $self->{nc} <= 0x005A) { # A..Z
+         $self->{ct}->{name} # DOCTYPE
+             .= chr ($self->{nc} + ($self->{is_xml} ? 0 : 0x0020));
+         delete $self->{ct}->{quirks};
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
        } elsif ($self->{nc} == -1) {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
-Line 3010 
 sub _get_next_token ($) {
+Line 3371 
 sub _get_next_token ($) {
          redo A;
        } else {
-         $self->{ct}->{name}
+         $self->{ct}->{name} .= chr ($self->{nc}); # DOCTYPE
-           .= chr ($self->{nc}); # DOCTYPE
+         ## Stay in the state.
-         ## Stay in the state
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3046 
 sub _get_next_token ($) {
+Line 3406 
 sub _get_next_token ($) {
          redo A;
        } elsif ($self->{nc} == 0x003E) { # >
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+         } else {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'no md def'); ## TODO: type
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
-         $self->{state} = DATA_STATE;
-         $self->{s_kwd} = '';
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3060 
 sub _get_next_token ($) {
+Line 3427 
 sub _get_next_token ($) {
        $self->{set_nc}->($self);
      }
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
-         return  ($self->{ct}); # DOCTYPE
          redo A;
        } elsif ($self->{nc} == -1) {
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
-         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
+         ## Reconsume.
-         $self->{state} = DATA_STATE;
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
-         $self->{s_kwd} = '';
-         ## reconsume
-         $self->{ct}->{quirks} = 1;
-         return  ($self->{ct}); # DOCTYPE
          redo A;
        } elsif ($self->{nc} == 0x0050 or # P
                 $self->{nc} == 0x0070) { # p
-Line 3109 
 sub _get_next_token ($) {
+Line 3479 
 sub _get_next_token ($) {
      }
          redo A;
-       } elsif ($self->{is_xml} and $self->{nc} == 0x005B) { # [
+       } elsif ($self->{nc} == 0x0022 and # "
+                ($self->{ct}->{type} == GENERAL_ENTITY_TOKEN or
+                 $self->{ct}->{type} == PARAMETER_ENTITY_TOKEN)) {
+         $self->{state} = DOCTYPE_ENTITY_VALUE_DOUBLE_QUOTED_STATE;
+         $self->{ct}->{value} = ''; # ENTITY
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0027 and # '
+                ($self->{ct}->{type} == GENERAL_ENTITY_TOKEN or
+                 $self->{ct}->{type} == PARAMETER_ENTITY_TOKEN)) {
+         $self->{state} = DOCTYPE_ENTITY_VALUE_SINGLE_QUOTED_STATE;
+         $self->{ct}->{value} = ''; # ENTITY
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{is_xml} and
+                $self->{ct}->{type} == DOCTYPE_TOKEN and
+                $self->{nc} == 0x005B) { # [
          $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
          $self->{ct}->{has_internal_subset} = 1; # DOCTYPE
-Line 3128 
 sub _get_next_token ($) {
+Line 3536 
 sub _get_next_token ($) {
          return  ($self->{ct}); # DOCTYPE
          redo A;
        } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after DOCTYPE name'); ## TODO: type
-         $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after DOCTYPE name');
-         $self->{ct}->{quirks} = 1;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           $self->{ct}->{quirks} = 1;
+           $self->{state} = BOGUS_DOCTYPE_STATE;
+         } else {
+           $self->{state} = BOGUS_MD_STATE;
+         }
-         $self->{state} = BOGUS_DOCTYPE_STATE;
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3204 
 sub _get_next_token ($) {
+Line 3618 
 sub _get_next_token ($) {
          redo A;
        } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after DOCTYPE name', ## TODO: type
-         $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after DOCTYPE name',
                          line => $self->{line_prev},
                          column => $self->{column_prev} + 1 - length $self->{kwd});
-         $self->{ct}->{quirks} = 1;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         $self->{state} = BOGUS_DOCTYPE_STATE;
+           $self->{ct}->{quirks} = 1;
+           $self->{state} = BOGUS_DOCTYPE_STATE;
+         } else {
+           $self->{state} = BOGUS_MD_STATE;
+         }
          ## Reconsume.
          redo A;
        }
-Line 3272 
 sub _get_next_token ($) {
+Line 3690 
 sub _get_next_token ($) {
          redo A;
        } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after DOCTYPE name', ## TODO: type
-         $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after DOCTYPE name',
                          line => $self->{line_prev},
                          column => $self->{column_prev} + 1 - length $self->{kwd});
-         $self->{ct}->{quirks} = 1;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         $self->{state} = BOGUS_DOCTYPE_STATE;
+           $self->{ct}->{quirks} = 1;
+           $self->{state} = BOGUS_DOCTYPE_STATE;
+         } else {
+           $self->{state} = BOGUS_MD_STATE;
+         }
          ## Reconsume.
          redo A;
        }
-Line 3331 
 sub _get_next_token ($) {
+Line 3753 
 sub _get_next_token ($) {
          redo A;
        } elsif ($self->{nc} eq 0x003E) { # >
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'no PUBLIC literal');
-         $self->{state} = DATA_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         $self->{s_kwd} = '';
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3347 
 sub _get_next_token ($) {
+Line 3776 
 sub _get_next_token ($) {
        $self->{set_nc}->($self);
      }
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
-         $self->{ct}->{quirks} = 1;
-         return  ($self->{ct}); # DOCTYPE
          redo A;
        } elsif ($self->{nc} == -1) {
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
-         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
-         $self->{state} = DATA_STATE;
-         $self->{s_kwd} = '';
          ## reconsume
-         $self->{ct}->{quirks} = 1;
          return  ($self->{ct}); # DOCTYPE
          redo A;
-       } elsif ($self->{is_xml} and $self->{nc} == 0x005B) { # [
+       } elsif ($self->{is_xml} and
+                $self->{ct}->{type} == DOCTYPE_TOKEN and
+                $self->{nc} == 0x005B) { # [
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'no PUBLIC literal');
          $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
-Line 3384 
 sub _get_next_token ($) {
+Line 3816 
 sub _get_next_token ($) {
          return  ($self->{ct}); # DOCTYPE
          redo A;
        } else {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after PUBLIC');
-         $self->{ct}->{quirks} = 1;
-         $self->{state} = BOGUS_DOCTYPE_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           $self->{ct}->{quirks} = 1;
+           $self->{state} = BOGUS_DOCTYPE_STATE;
+         } else {
+           $self->{state} = BOGUS_MD_STATE;
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3419 
 sub _get_next_token ($) {
+Line 3857 
 sub _get_next_token ($) {
          redo A;
        } elsif ($self->{nc} == 0x003E) { # >
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed PUBLIC literal');
-         $self->{state} = DATA_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         $self->{s_kwd} = '';
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3435 
 sub _get_next_token ($) {
+Line 3880 
 sub _get_next_token ($) {
        $self->{set_nc}->($self);
      }
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
-         $self->{ct}->{quirks} = 1;
-         return  ($self->{ct}); # DOCTYPE
          redo A;
        } elsif ($self->{nc} == -1) {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed PUBLIC literal');
-         $self->{state} = DATA_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         $self->{s_kwd} = '';
-         ## reconsume
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
-         $self->{ct}->{quirks} = 1;
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
+         ## Reconsume.
          return  ($self->{ct}); # DOCTYPE
          redo A;
        } else {
-         $self->{ct}->{pubid} # DOCTYPE
+         $self->{ct}->{pubid} .= chr $self->{nc}; # DOCTYPE/ENTITY/NOTATION
-             .= chr $self->{nc};
          $self->{read_until}->($self->{ct}->{pubid}, q[">],
                                length $self->{ct}->{pubid});
-Line 3490 
 sub _get_next_token ($) {
+Line 3935 
 sub _get_next_token ($) {
          redo A;
        } elsif ($self->{nc} == 0x003E) { # >
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed PUBLIC literal');
-         $self->{state} = DATA_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         $self->{s_kwd} = '';
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3506 
 sub _get_next_token ($) {
+Line 3958 
 sub _get_next_token ($) {
        $self->{set_nc}->($self);
      }
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
-         $self->{ct}->{quirks} = 1;
-         return  ($self->{ct}); # DOCTYPE
          redo A;
        } elsif ($self->{nc} == -1) {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed PUBLIC literal');
-         $self->{state} = DATA_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         $self->{s_kwd} = '';
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
          ## reconsume
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
-         $self->{ct}->{quirks} = 1;
-         return  ($self->{ct}); # DOCTYPE
          redo A;
        } else {
-         $self->{ct}->{pubid} # DOCTYPE
+         $self->{ct}->{pubid} .= chr $self->{nc}; # DOCTYPE/ENTITY/NOTATION
-             .= chr $self->{nc};
          $self->{read_until}->($self->{ct}->{pubid}, q['>],
                                length $self->{ct}->{pubid});
-Line 3562 
 sub _get_next_token ($) {
+Line 4014 
 sub _get_next_token ($) {
          redo A;
        } elsif ($self->{nc} == 0x0022) { # "
-         $self->{ct}->{sysid} = ''; # DOCTYPE
+         $self->{ct}->{sysid} = ''; # DOCTYPE/ENTITY/NOTATION
          $self->{state} = DOCTYPE_SYSTEM_IDENTIFIER_DOUBLE_QUOTED_STATE;
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
-Line 3578 
 sub _get_next_token ($) {
+Line 4030 
 sub _get_next_token ($) {
          redo A;
        } elsif ($self->{nc} == 0x0027) { # '
-         $self->{ct}->{sysid} = ''; # DOCTYPE
+         $self->{ct}->{sysid} = ''; # DOCTYPE/ENTITY/NOTATION
          $self->{state} = DOCTYPE_SYSTEM_IDENTIFIER_SINGLE_QUOTED_STATE;
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
-Line 3593 
 sub _get_next_token ($) {
+Line 4045 
 sub _get_next_token ($) {
          redo A;
        } elsif ($self->{nc} == 0x003E) { # >
-         if ($self->{is_xml}) {
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           if ($self->{is_xml}) {
-           $self->{parse_error}->(level => $self->{level}->{must}, type => 'no SYSTEM literal');
+             $self->{parse_error}->(level => $self->{level}->{must}, type => 'no SYSTEM literal');
+           } else {
+           }
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
          } else {
+           if ($self->{ct}->{type} == NOTATION_TOKEN) {
+           } else {
+             $self->{parse_error}->(level => $self->{level}->{must}, type => 'no SYSTEM literal');
+           }
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
          }
-         $self->{state} = DATA_STATE;
-         $self->{s_kwd} = '';
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3612 
 sub _get_next_token ($) {
+Line 4075 
 sub _get_next_token ($) {
        $self->{set_nc}->($self);
      }
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
-         return  ($self->{ct}); # DOCTYPE
          redo A;
        } elsif ($self->{nc} == -1) {
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
-         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
-         $self->{state} = DATA_STATE;
-         $self->{s_kwd} = '';
          ## reconsume
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
-         $self->{ct}->{quirks} = 1;
-         return  ($self->{ct}); # DOCTYPE
          redo A;
-       } elsif ($self->{is_xml} and $self->{nc} == 0x005B) { # [
+       } elsif ($self->{is_xml} and
+                $self->{ct}->{type} == DOCTYPE_TOKEN and
+                $self->{nc} == 0x005B) { # [
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'no SYSTEM literal');
          $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
-Line 3648 
 sub _get_next_token ($) {
+Line 4115 
 sub _get_next_token ($) {
          return  ($self->{ct}); # DOCTYPE
          redo A;
        } else {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after PUBLIC literal');
-         $self->{ct}->{quirks} = 1;
-         $self->{state} = BOGUS_DOCTYPE_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           $self->{ct}->{quirks} = 1;
+           $self->{state} = BOGUS_DOCTYPE_STATE;
+         } else {
+           $self->{state} = BOGUS_MD_STATE;
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3715 
 sub _get_next_token ($) {
+Line 4188 
 sub _get_next_token ($) {
          redo A;
        } elsif ($self->{nc} == 0x003E) { # >
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'no SYSTEM literal');
-         $self->{state} = DATA_STATE;
-         $self->{s_kwd} = '';
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3731 
 sub _get_next_token ($) {
+Line 4201 
 sub _get_next_token ($) {
      }
-         $self->{ct}->{quirks} = 1;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         return  ($self->{ct}); # DOCTYPE
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
          redo A;
        } elsif ($self->{nc} == -1) {
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
-         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
-         $self->{state} = DATA_STATE;
-         $self->{s_kwd} = '';
          ## reconsume
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
-         $self->{ct}->{quirks} = 1;
-         return  ($self->{ct}); # DOCTYPE
          redo A;
-       } elsif ($self->{is_xml} and $self->{nc} == 0x005B) { # [
+       } elsif ($self->{is_xml} and
+                $self->{ct}->{type} == DOCTYPE_TOKEN and
+                $self->{nc} == 0x005B) { # [
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'no SYSTEM literal');
-Line 3768 
 sub _get_next_token ($) {
+Line 4252 
 sub _get_next_token ($) {
          return  ($self->{ct}); # DOCTYPE
          redo A;
        } else {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after SYSTEM');
-         $self->{ct}->{quirks} = 1;
-         $self->{state} = BOGUS_DOCTYPE_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           $self->{ct}->{quirks} = 1;
+           $self->{state} = BOGUS_DOCTYPE_STATE;
+         } else {
+           $self->{state} = BOGUS_MD_STATE;
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3803 
 sub _get_next_token ($) {
+Line 4293 
 sub _get_next_token ($) {
          redo A;
        } elsif (not $self->{is_xml} and $self->{nc} == 0x003E) { # >
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed SYSTEM literal');
-         $self->{state} = DATA_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         $self->{s_kwd} = '';
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3819 
 sub _get_next_token ($) {
+Line 4316 
 sub _get_next_token ($) {
        $self->{set_nc}->($self);
      }
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
-         $self->{ct}->{quirks} = 1;
-         return  ($self->{ct}); # DOCTYPE
          redo A;
        } elsif ($self->{nc} == -1) {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed SYSTEM literal');
-         $self->{state} = DATA_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         $self->{s_kwd} = '';
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
+         } else {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
          ## reconsume
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
-         $self->{ct}->{quirks} = 1;
-         return  ($self->{ct}); # DOCTYPE
          redo A;
        } else {
-         $self->{ct}->{sysid} # DOCTYPE
+         $self->{ct}->{sysid} .= chr $self->{nc}; # DOCTYPE/ENTITY/NOTATION
-             .= chr $self->{nc};
          $self->{read_until}->($self->{ct}->{sysid}, q[">],
                                length $self->{ct}->{sysid});
-Line 3896 
 sub _get_next_token ($) {
+Line 4393 
 sub _get_next_token ($) {
          redo A;
        } elsif ($self->{nc} == -1) {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed SYSTEM literal');
-         $self->{state} = DATA_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         $self->{s_kwd} = '';
-         ## reconsume
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
-         $self->{ct}->{quirks} = 1;
+           $self->{ct}->{quirks} = 1;
-         return  ($self->{ct}); # DOCTYPE
+         } else {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
+         ## reconsume
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
          redo A;
        } else {
-         $self->{ct}->{sysid} # DOCTYPE
+         $self->{ct}->{sysid} .= chr $self->{nc}; # DOCTYPE/ENTITY/NOTATION
-             .= chr $self->{nc};
          $self->{read_until}->($self->{ct}->{sysid}, q['>],
                                length $self->{ct}->{sysid});
-Line 3930 
 sub _get_next_token ($) {
+Line 4430 
 sub _get_next_token ($) {
        }
      } elsif ($self->{state} == AFTER_DOCTYPE_SYSTEM_IDENTIFIER_STATE) {
        if ($is_space->{$self->{nc}}) {
+         if ($self->{ct}->{type} == GENERAL_ENTITY_TOKEN) {
-         ## Stay in the state
+           $self->{state} = BEFORE_NDATA_STATE;
+         } else {
+           ## Stay in the state
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3945 
 sub _get_next_token ($) {
+Line 4450 
 sub _get_next_token ($) {
          redo A;
        } elsif ($self->{nc} == 0x003E) { # >
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           $self->{state} = DATA_STATE;
+           $self->{s_kwd} = '';
+         } else {
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
-         $self->{state} = DATA_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
-         $self->{s_kwd} = '';
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
+         redo A;
+       } elsif ($self->{ct}->{type} == GENERAL_ENTITY_TOKEN and
+                ($self->{nc} == 0x004E or # N
+                 $self->{nc} == 0x006E)) { # n
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before NDATA'); ## TODO: type
+         $self->{state} = NDATA_STATE;
+         $self->{kwd} = chr $self->{nc};
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 3959 
 sub _get_next_token ($) {
+Line 4490 
 sub _get_next_token ($) {
        $self->{set_nc}->($self);
      }
-         return  ($self->{ct}); # DOCTYPE
          redo A;
        } elsif ($self->{nc} == -1) {
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
-         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
-         $self->{state} = DATA_STATE;
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed DOCTYPE');
-         $self->{s_kwd} = '';
+           $self->{state} = DATA_STATE;
-         ## reconsume
+           $self->{s_kwd} = '';
+           $self->{ct}->{quirks} = 1;
-         $self->{ct}->{quirks} = 1;
+         } else {
-         return  ($self->{ct}); # DOCTYPE
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         }
+         ## reconsume
+         return  ($self->{ct}); # DOCTYPE/ENTITY/NOTATION
          redo A;
-       } elsif ($self->{is_xml} and $self->{nc} == 0x005B) { # [
+       } elsif ($self->{is_xml} and
+                $self->{ct}->{type} == DOCTYPE_TOKEN and
+                $self->{nc} == 0x005B) { # [
          $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
          $self->{ct}->{has_internal_subset} = 1; # DOCTYPE
-Line 3993 
 sub _get_next_token ($) {
+Line 4528 
 sub _get_next_token ($) {
          return  ($self->{ct}); # DOCTYPE
          redo A;
        } else {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after SYSTEM literal');
-         #$self->{ct}->{quirks} = 1;
-         $self->{state} = BOGUS_DOCTYPE_STATE;
+         if ($self->{ct}->{type} == DOCTYPE_TOKEN) {
+           #$self->{ct}->{quirks} = 1;
+           $self->{state} = BOGUS_DOCTYPE_STATE;
+         } else {
+           $self->{state} = BOGUS_MD_STATE;
+         }
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == BEFORE_NDATA_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ENTITY
+         redo A;
+       } elsif ($self->{nc} == 0x004E or # N
+                $self->{nc} == 0x006E) { # n
+         $self->{state} = NDATA_STATE;
+         $self->{kwd} = chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         ## reconsume
+         return  ($self->{ct}); # ENTITY
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after SYSTEM literal');
+         $self->{state} = BOGUS_MD_STATE;
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 4221 
 sub _get_next_token ($) {
+Line 4835 
 sub _get_next_token ($) {
 x003C => 1, 0x0026 => 1, -1 => 1, # <, &
              $self->{entity_add} => 1,
            }->{$self->{nc}}) {
+         if ($self->{is_xml}) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'bare ero',
+                           line => $self->{line_prev},
+                           column => $self->{column_prev}
+                               + ($self->{nc} == -1 ? 1 : 0));
+         } else {
+           ## No error
+         }
          ## Don't consume
-         ## No error
          ## Return nothing.
          #
        } elsif ($self->{nc} == 0x0023) { # #
-Line 4242 
 sub _get_next_token ($) {
+Line 4864 
 sub _get_next_token ($) {
      }
          redo A;
-       } elsif ((0x0041 <= $self->{nc} and
+       } elsif ($self->{is_xml} or
+                (0x0041 <= $self->{nc} and
                  $self->{nc} <= 0x005A) or # A..Z
                 (0x0061 <= $self->{nc} and
                  $self->{nc} <= 0x007A)) { # a..z
-Line 4296 
 sub _get_next_token ($) {
+Line 4919 
 sub _get_next_token ($) {
          redo A;
        }
      } elsif ($self->{state} == ENTITY_HASH_STATE) {
-       if ($self->{nc} == 0x0078 or # x
+       if ($self->{nc} == 0x0078) { # x
-           $self->{nc} == 0x0058) { # X
          $self->{state} = HEXREF_X_STATE;
          $self->{kwd} .= chr $self->{nc};
-Line 4313 
 sub _get_next_token ($) {
+Line 4935 
 sub _get_next_token ($) {
      }
          redo A;
+       } elsif ($self->{nc} == 0x0058) { # X
+         if ($self->{is_xml}) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'uppercase hcro'); ## TODO: type
+         }
+         $self->{state} = HEXREF_X_STATE;
+         $self->{kwd} .= chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
        } elsif (0x0030 <= $self->{nc} and
                 $self->{nc} <= 0x0039) { # 0..9
-Line 4403 
 sub _get_next_token ($) {
+Line 5044 
 sub _get_next_token ($) {
        my $code = $self->{kwd};
        my $l = $self->{line_prev};
        my $c = $self->{column_prev};
-       if ($charref_map->{$code}) {
+       if ((not $self->{is_xml} and $charref_map->{$code}) or
+           ($self->{is_xml} and 0xD800 <= $code and $code <= 0xDFFF) or
+           ($self->{is_xml} and $code == 0x0000)) {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'invalid character reference',
                          text => (sprintf 'U+%04X', $code),
-Line 4556 
 sub _get_next_token ($) {
+Line 5199 
 sub _get_next_token ($) {
        my $code = $self->{kwd};
        my $l = $self->{line_prev};
        my $c = $self->{column_prev};
-       if ($charref_map->{$code}) {
+       if ((not $self->{is_xml} and $charref_map->{$code}) or
+           ($self->{is_xml} and 0xD800 <= $code and $code <= 0xDFFF) or
+           ($self->{is_xml} and $code == 0x0000)) {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'invalid character reference',
                          text => (sprintf 'U+%04X', $code),
-Line 4590 
 sub _get_next_token ($) {
+Line 5235 
 sub _get_next_token ($) {
          redo A;
        }
      } elsif ($self->{state} == ENTITY_NAME_STATE) {
-       if (length $self->{kwd} < 30 and
+       if ((0x0041 <= $self->{nc} and # a
-           ## NOTE: Some number greater than the maximum length of entity name
+            $self->{nc} <= 0x005A) or # x
-           ((0x0041 <= $self->{nc} and # a
+           (0x0061 <= $self->{nc} and # a
-             $self->{nc} <= 0x005A) or # x
+            $self->{nc} <= 0x007A) or # z
-            (0x0061 <= $self->{nc} and # a
+           (0x0030 <= $self->{nc} and # 0
-             $self->{nc} <= 0x007A) or # z
+            $self->{nc} <= 0x0039) or # 9
-            (0x0030 <= $self->{nc} and # 0
+           $self->{nc} == 0x003B or # ;
-             $self->{nc} <= 0x0039) or # 9
+           ($self->{is_xml} and
-            $self->{nc} == 0x003B)) { # ;
+            not ($is_space->{$self->{nc}} or
+                 {
+x003C => 1, 0x0026 => 1, -1 => 1, # <, &
+                   $self->{entity_add} => 1,
+                 }->{$self->{nc}}))) {
          our $EntityChar;
          $self->{kwd} .= chr $self->{nc};
-         if (defined $EntityChar->{$self->{kwd}}) {
+         if (defined $EntityChar->{$self->{kwd}} or
+             $self->{ge}->{$self->{kwd}}) {
            if ($self->{nc} == 0x003B) { # ;
+             if (defined $self->{ge}->{$self->{kwd}}) {
-             $self->{entity__value} = $EntityChar->{$self->{kwd}};
+               if ($self->{ge}->{$self->{kwd}}->{only_text}) {
+                 $self->{entity__value} = $self->{ge}->{$self->{kwd}}->{value};
+               } else {
+                 if (defined $self->{ge}->{$self->{kwd}}->{notation}) {
+                   $self->{parse_error}->(level => $self->{level}->{must}, type => 'unparsed entity', ## TODO: type
+                                   value => $self->{kwd});
+                 } else {
+                 }
+                 $self->{entity__value} = '&' . $self->{kwd}; ## TODO: expand
+               }
+             } else {
+               if ($self->{is_xml}) {
+                 $self->{parse_error}->(level => $self->{level}->{must}, type => 'entity not declared', ## TODO: type
+                                 value => $self->{kwd},
+                                 level => {
+                                           'amp;' => $self->{level}->{warn},
+                                           'quot;' => $self->{level}->{warn},
+                                           'lt;' => $self->{level}->{warn},
+                                           'gt;' => $self->{level}->{warn},
+                                           'apos;' => $self->{level}->{warn},
+                                          }->{$self->{kwd}} ||
+                                          $self->{level}->{must});
+               } else {
+               }
+               $self->{entity__value} = $EntityChar->{$self->{kwd}};
+             }
              $self->{entity__match} = 1;
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
-Line 4720 
 sub _get_next_token ($) {
+Line 5400 
 sub _get_next_token ($) {
      ## XML-only states
      } elsif ($self->{state} == PI_STATE) {
+       ## XML5: "Pi state" and "DOCTYPE pi state".
        if ($is_space->{$self->{nc}} or
-           $self->{nc} == 0x003F or # ? ## XML5: Same as "Anything else"
+           $self->{nc} == 0x003F or # ?
            $self->{nc} == -1) {
+         ## XML5: U+003F: "pi state": Same as "Anything else"; "DOCTYPE
+         ## pi state": Switch to the "DOCTYPE pi after state".  EOF:
+         ## "DOCTYPE pi state": Parse error, switch to the "data
+         ## state".
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'bare pio', ## TODO: type
                          line => $self->{line_prev},
                          column => $self->{column_prev}
-Line 4737 
 sub _get_next_token ($) {
+Line 5423 
 sub _get_next_token ($) {
                        };
          redo A;
        } else {
+         ## XML5: "DOCTYPE pi state": Stay in the state.
          $self->{ct} = {type => PI_TOKEN,
                         target => chr $self->{nc},
                         data => '',
-Line 4851 
 sub _get_next_token ($) {
+Line 5538 
 sub _get_next_token ($) {
        } elsif ($self->{nc} == -1) {
          $self->{parse_error}->(level => $self->{level}->{must}, type => 'no pic'); ## TODO: type
          if ($self->{in_subset}) {
-           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+           $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state"
          } else {
            $self->{state} = DATA_STATE;
            $self->{s_kwd} = '';
-Line 4879 
 sub _get_next_token ($) {
+Line 5566 
 sub _get_next_token ($) {
          redo A;
        }
      } elsif ($self->{state} == PI_AFTER_STATE) {
+       ## XML5: Part of "Pi after state".
        if ($self->{nc} == 0x003E) { # >
          if ($self->{in_subset}) {
            $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
-Line 4928 
 sub _get_next_token ($) {
+Line 5617 
 sub _get_next_token ($) {
          redo A;
        }
      } elsif ($self->{state} == PI_DATA_AFTER_STATE) {
-       ## XML5: Same as "pi after state" in XML5
+       ## XML5: Same as "pi after state" and "DOCTYPE pi after state".
        if ($self->{nc} == 0x003E) { # >
          if ($self->{in_subset}) {
            $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
-Line 4990 
 sub _get_next_token ($) {
+Line 5680 
 sub _get_next_token ($) {
          ## XML5: Not defined yet.
          ## TODO:
+         if (not $self->{stop_processing} and
+             not $self->{document}->xml_standalone) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'stop processing', ## TODO: type
+                           level => $self->{level}->{info});
+           $self->{stop_processing} = 1;
+         }
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 5141 
 sub _get_next_token ($) {
+Line 5839 
 sub _get_next_token ($) {
        }
      } elsif ($self->{state} == DOCTYPE_TAG_STATE) {
        if ($self->{nc} == 0x0021) { # !
-         $self->{state} = MARKUP_DECLARATION_OPEN_STATE;
+         $self->{state} = DOCTYPE_MARKUP_DECLARATION_OPEN_STATE;
      if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
        $self->{line_prev} = $self->{line};
-Line 5195 
 sub _get_next_token ($) {
+Line 5893 
 sub _get_next_token ($) {
          redo A;
        }
+     } elsif ($self->{state} == DOCTYPE_MARKUP_DECLARATION_OPEN_STATE) {
+       ## XML5: "DOCTYPE markup declaration state".
+       if ($self->{nc} == 0x002D) { # -
+         $self->{state} = MD_HYPHEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0045 or # E
+                $self->{nc} == 0x0065) { # e
+         $self->{state} = MD_E_STATE;
+         $self->{kwd} = chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0041 or # A
+                $self->{nc} == 0x0061) { # a
+         $self->{state} = MD_ATTLIST_STATE;
+         $self->{kwd} = chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x004E or # N
+                $self->{nc} == 0x006E) { # n
+         $self->{state} = MD_NOTATION_STATE;
+         $self->{kwd} = chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } else {
+         #
+       }
+       ## XML5: No parse error.
+       $self->{parse_error}->(level => $self->{level}->{must}, type => 'bogus comment',
+                       line => $self->{line_prev},
+                       column => $self->{column_prev} - 1);
+       ## Reconsume.
+       $self->{state} = BOGUS_COMMENT_STATE;
+       $self->{ct} = {type => COMMENT_TOKEN, data => ''}; ## Will be discarded.
+       redo A;
+     } elsif ($self->{state} == MD_E_STATE) {
+       if ($self->{nc} == 0x004E or # N
+           $self->{nc} == 0x006E) { # n
+         $self->{state} = MD_ENTITY_STATE;
+         $self->{kwd} .= chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x004C or # L
+                $self->{nc} == 0x006C) { # l
+         ## XML5: <!ELEMENT> not supported.
+         $self->{state} = MD_ELEMENT_STATE;
+         $self->{kwd} .= chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } else {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'bogus comment',
+                         line => $self->{line_prev},
+                         column => $self->{column_prev} - 2
+                             + 1 * ($self->{nc} == -1));
+         ## Reconsume.
+         $self->{state} = BOGUS_COMMENT_STATE;
+         $self->{ct} = {type => COMMENT_TOKEN, data => ''}; ## Will be discarded
+         redo A;
+       }
+     } elsif ($self->{state} == MD_ENTITY_STATE) {
+       if ($self->{nc} == [
+             undef,
+             undef,
+x0054, # T
+x0049, # I
+x0054, # T
+           ]->[length $self->{kwd}] or
+           $self->{nc} == [
+             undef,
+             undef,
+x0074, # t
+x0069, # i
+x0074, # t
+           ]->[length $self->{kwd}]) {
+         ## Stay in the state.
+         $self->{kwd} .= chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ((length $self->{kwd}) == 5 and
+                ($self->{nc} == 0x0059 or # Y
+                 $self->{nc} == 0x0079)) { # y
+         if ($self->{kwd} ne 'ENTIT' or $self->{nc} == 0x0079) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'lowercase keyword', ## TODO: type
+                           text => 'ENTITY',
+                           line => $self->{line_prev},
+                           column => $self->{column_prev} - 4);
+         }
+         $self->{ct} = {type => GENERAL_ENTITY_TOKEN, name => '',
+                        line => $self->{line_prev},
+                        column => $self->{column_prev} - 6};
+         $self->{state} = DOCTYPE_MD_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'bogus comment',
+                         line => $self->{line_prev},
+                         column => $self->{column_prev} - 1
+                             - (length $self->{kwd})
+                             + 1 * ($self->{nc} == -1));
+         $self->{state} = BOGUS_COMMENT_STATE;
+         ## Reconsume.
+         $self->{ct} = {type => COMMENT_TOKEN, data => ''}; ## Will be discarded
+         redo A;
+       }
+     } elsif ($self->{state} == MD_ELEMENT_STATE) {
+       if ($self->{nc} == [
+            undef,
+            undef,
+x0045, # E
+x004D, # M
+x0045, # E
+x004E, # N
+           ]->[length $self->{kwd}] or
+           $self->{nc} == [
+            undef,
+            undef,
+x0065, # e
+x006D, # m
+x0065, # e
+x006E, # n
+           ]->[length $self->{kwd}]) {
+         ## Stay in the state.
+         $self->{kwd} .= chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ((length $self->{kwd}) == 6 and
+                ($self->{nc} == 0x0054 or # T
+                 $self->{nc} == 0x0074)) { # t
+         if ($self->{kwd} ne 'ELEMEN' or $self->{nc} == 0x0074) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'lowercase keyword', ## TODO: type
+                           text => 'ELEMENT',
+                           line => $self->{line_prev},
+                           column => $self->{column_prev} - 5);
+         }
+         $self->{ct} = {type => ELEMENT_TOKEN, name => '',
+                        line => $self->{line_prev},
+                        column => $self->{column_prev} - 7};
+         $self->{state} = DOCTYPE_MD_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'bogus comment',
+                         line => $self->{line_prev},
+                         column => $self->{column_prev} - 1
+                             - (length $self->{kwd})
+                             + 1 * ($self->{nc} == -1));
+         $self->{state} = BOGUS_COMMENT_STATE;
+         ## Reconsume.
+         $self->{ct} = {type => COMMENT_TOKEN, data => ''}; ## Will be discarded
+         redo A;
+       }
+     } elsif ($self->{state} == MD_ATTLIST_STATE) {
+       if ($self->{nc} == [
+            undef,
+x0054, # T
+x0054, # T
+x004C, # L
+x0049, # I
+x0053, # S
+           ]->[length $self->{kwd}] or
+           $self->{nc} == [
+            undef,
+x0074, # t
+x0074, # t
+x006C, # l
+x0069, # i
+x0073, # s
+           ]->[length $self->{kwd}]) {
+         ## Stay in the state.
+         $self->{kwd} .= chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ((length $self->{kwd}) == 6 and
+                ($self->{nc} == 0x0054 or # T
+                 $self->{nc} == 0x0074)) { # t
+         if ($self->{kwd} ne 'ATTLIS' or $self->{nc} == 0x0074) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'lowercase keyword', ## TODO: type
+                           text => 'ATTLIST',
+                           line => $self->{line_prev},
+                           column => $self->{column_prev} - 5);
+         }
+         $self->{ct} = {type => ATTLIST_TOKEN, name => '',
+                        attrdefs => [],
+                        line => $self->{line_prev},
+                        column => $self->{column_prev} - 7};
+         $self->{state} = DOCTYPE_MD_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'bogus comment',
+                         line => $self->{line_prev},
+                         column => $self->{column_prev} - 1
+                              - (length $self->{kwd})
+                              + 1 * ($self->{nc} == -1));
+         $self->{state} = BOGUS_COMMENT_STATE;
+         ## Reconsume.
+         $self->{ct} = {type => COMMENT_TOKEN, data => ''}; ## Will be discarded
+         redo A;
+       }
+     } elsif ($self->{state} == MD_NOTATION_STATE) {
+       if ($self->{nc} == [
+            undef,
+x004F, # O
+x0054, # T
+x0041, # A
+x0054, # T
+x0049, # I
+x004F, # O
+           ]->[length $self->{kwd}] or
+           $self->{nc} == [
+            undef,
+x006F, # o
+x0074, # t
+x0061, # a
+x0074, # t
+x0069, # i
+x006F, # o
+           ]->[length $self->{kwd}]) {
+         ## Stay in the state.
+         $self->{kwd} .= chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ((length $self->{kwd}) == 7 and
+                ($self->{nc} == 0x004E or # N
+                 $self->{nc} == 0x006E)) { # n
+         if ($self->{kwd} ne 'NOTATIO' or $self->{nc} == 0x006E) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'lowercase keyword', ## TODO: type
+                           text => 'NOTATION',
+                           line => $self->{line_prev},
+                           column => $self->{column_prev} - 6);
+         }
+         $self->{ct} = {type => NOTATION_TOKEN, name => '',
+                        line => $self->{line_prev},
+                        column => $self->{column_prev} - 8};
+         $self->{state} = DOCTYPE_MD_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'bogus comment',
+                         line => $self->{line_prev},
+                         column => $self->{column_prev} - 1
+                             - (length $self->{kwd})
+                             + 1 * ($self->{nc} == -1));
+         $self->{state} = BOGUS_COMMENT_STATE;
+         ## Reconsume.
+         $self->{ct} = {type => COMMENT_TOKEN, data => ''}; ## Will be discarded
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_MD_STATE) {
+       ## XML5: "DOCTYPE ENTITY state", "DOCTYPE ATTLIST state", and
+       ## "DOCTYPE NOTATION state".
+       if ($is_space->{$self->{nc}}) {
+         ## XML5: [NOTATION] Switch to the "DOCTYPE NOTATION identifier state".
+         $self->{state} = BEFORE_MD_NAME_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{ct}->{type} == GENERAL_ENTITY_TOKEN and
+                $self->{nc} == 0x0025) { # %
+         ## XML5: Switch to the "DOCTYPE bogus comment state".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before md name'); ## TODO: type
+         $self->{state} = DOCTYPE_ENTITY_PARAMETER_BEFORE_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+         ## Reconsume.
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         ## XML5: Switch to the "DOCTYPE bogus comment state".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no md name'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } else {
+         ## XML5: Switch to the "DOCTYPE bogus comment state".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before md name'); ## TODO: type
+         $self->{state} = BEFORE_MD_NAME_STATE;
+         redo A;
+       }
+     } elsif ($self->{state} == BEFORE_MD_NAME_STATE) {
+       ## XML5: "DOCTYPE ENTITY parameter state", "DOCTYPE ENTITY type
+       ## before state", "DOCTYPE ATTLIST name before state".
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{ct}->{type} == GENERAL_ENTITY_TOKEN and
+                $self->{nc} == 0x0025) { # %
+         $self->{state} = DOCTYPE_ENTITY_PARAMETER_BEFORE_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         ## XML5: Same as "Anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no md name'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+         ## Reconsume.
+         redo A;
+       } else {
+         ## XML5: [ATTLIST] Not defined yet.
+         $self->{ct}->{name} .= chr $self->{nc};
+         $self->{state} = MD_NAME_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_ENTITY_PARAMETER_BEFORE_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## XML5: Switch to the "DOCTYPE ENTITY parameter state".
+         $self->{ct}->{type} = PARAMETER_ENTITY_TOKEN;
+         $self->{state} = BEFORE_MD_NAME_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         ## XML5: Same as "Anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no md name'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md');
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+         ## Reconsume.
+         redo A;
+       } else {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space after ENTITY percent'); ## TODO: type
+         $self->{state} = BOGUS_COMMENT_STATE;
+         $self->{ct} = {type => COMMENT_TOKEN, data => ''}; ## Will be discarded
+         ## Reconsume.
+         redo A;
+       }
+     } elsif ($self->{state} == MD_NAME_STATE) {
+       ## XML5: "DOCTYPE ENTITY name state" and "DOCTYPE ATTLIST name state".
+       if ($is_space->{$self->{nc}}) {
+         if ($self->{ct}->{type} == ATTLIST_TOKEN) {
+           $self->{state} = DOCTYPE_ATTLIST_NAME_AFTER_STATE;
+         } elsif ($self->{ct}->{type} == ELEMENT_TOKEN) {
+           $self->{state} = AFTER_ELEMENT_NAME_STATE;
+         } else { # ENTITY/NOTATION
+           $self->{state} = AFTER_DOCTYPE_NAME_STATE;
+         }
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         if ($self->{ct}->{type} == ATTLIST_TOKEN) {
+           #
+         } else {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'no md def'); ## TODO: type
+         }
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT/ENTITY/ATTLIST/NOTATION
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: [ATTLIST] No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md');
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+         ## Reconsume.
+         return  ($self->{ct}); # ELEMENT/ENTITY/ATTLIST/NOTATION
+         redo A;
+       } else {
+         ## XML5: [ATTLIST] Not defined yet.
+         $self->{ct}->{name} .= chr $self->{nc};
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_ATTLIST_NAME_AFTER_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+         return  ($self->{ct});
+         redo A;
+       } else {
+         ## XML5: Not defined yet.
+         $self->{ca} = {name => chr ($self->{nc}), # attrdef
+                        tokens => [],
+                        line => $self->{line}, column => $self->{column}};
+         $self->{state} = DOCTYPE_ATTLIST_ATTRIBUTE_NAME_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_ATTLIST_ATTRIBUTE_NAME_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         $self->{state} = DOCTYPE_ATTLIST_ATTRIBUTE_NAME_AFTER_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no attr type'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == 0x0028) { # (
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before paren'); ## TODO: type
+         $self->{state} = BEFORE_ALLOWED_TOKEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } else {
+         ## XML5: Not defined yet.
+         $self->{ca}->{name} .= chr $self->{nc};
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_ATTLIST_ATTRIBUTE_NAME_AFTER_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no attr type'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == 0x0028) { # (
+         ## XML5: Same as "anything else".
+         $self->{state} = BEFORE_ALLOWED_TOKEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct});
+         redo A;
+       } else {
+         ## XML5: Not defined yet.
+         $self->{ca}->{type} = chr $self->{nc};
+         $self->{state} = DOCTYPE_ATTLIST_ATTRIBUTE_TYPE_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_ATTLIST_ATTRIBUTE_TYPE_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         $self->{state} = DOCTYPE_ATTLIST_ATTRIBUTE_TYPE_AFTER_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0023) { # #
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before default value'); ## TODO: type
+         $self->{state} = DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_BEFORE_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0022) { # "
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before default value'); ## TODO: type
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_DOUBLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0027) { # '
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before default value'); ## TODO: type
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_SINGLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no attr default'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == 0x0028) { # (
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before paren'); ## TODO: type
+         $self->{state} = BEFORE_ALLOWED_TOKEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct});
+         redo A;
+       } else {
+         ## XML5: Not defined yet.
+         $self->{ca}->{type} .= chr $self->{nc};
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_ATTLIST_ATTRIBUTE_TYPE_AFTER_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0028) { # (
+         ## XML5: Same as "anything else".
+         $self->{state} = BEFORE_ALLOWED_TOKEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0023) { # #
+         $self->{state} = DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_BEFORE_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0022) { # "
+         ## XML5: Same as "anything else".
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_DOUBLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0027) { # '
+         ## XML5: Same as "anything else".
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_SINGLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no attr default'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct});
+         redo A;
+       } else {
+         ## XML5: Switch to the "DOCTYPE bogus comment state".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unquoted attr value'); ## TODO: type
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_UNQUOTED_STATE;
+         ## Reconsume.
+         redo A;
+       }
+     } elsif ($self->{state} == BEFORE_ALLOWED_TOKEN_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x007C) { # |
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'empty allowed token'); ## TODO: type
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0029) { # )
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'empty allowed token'); ## TODO: type
+         $self->{state} = AFTER_ALLOWED_TOKENS_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed allowed tokens'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct});
+         redo A;
+       } else {
+         push @{$self->{ca}->{tokens}}, chr $self->{nc};
+         $self->{state} = ALLOWED_TOKEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == ALLOWED_TOKEN_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         $self->{state} = AFTER_ALLOWED_TOKEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x007C) { # |
+         $self->{state} = BEFORE_ALLOWED_TOKEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0029) { # )
+         $self->{state} = AFTER_ALLOWED_TOKENS_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed allowed tokens'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct});
+         redo A;
+       } else {
+         $self->{ca}->{tokens}->[-1] .= chr $self->{nc};
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == AFTER_ALLOWED_TOKEN_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x007C) { # |
+         $self->{state} = BEFORE_ALLOWED_TOKEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0029) { # )
+         $self->{state} = AFTER_ALLOWED_TOKENS_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed allowed tokens'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct});
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'space in allowed token', ## TODO: type
+                         line => $self->{line_prev},
+                         column => $self->{column_prev});
+         $self->{ca}->{tokens}->[-1] .= ' ' . chr $self->{nc};
+         $self->{state} = ALLOWED_TOKEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == AFTER_ALLOWED_TOKENS_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         $self->{state} = BEFORE_ATTR_DEFAULT_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0023) { # #
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before default value'); ## TODO: type
+         $self->{state} = DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_BEFORE_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0022) { # "
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before default value'); ## TODO: type
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_DOUBLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0027) { # '
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before default value'); ## TODO: type
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_SINGLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no attr default'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct});
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unquoted attr value'); ## TODO: type
+         $self->{state} = ATTRIBUTE_VALUE_UNQUOTED_STATE;
+         ## Reconsume.
+         redo A;
+       }
+     } elsif ($self->{state} == BEFORE_ATTR_DEFAULT_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0023) { # #
+         $self->{state} = DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_BEFORE_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0022) { # "
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_DOUBLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0027) { # '
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_SINGLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no attr default'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct});
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unquoted attr value'); ## TODO: type
+         $self->{state} = ATTRIBUTE_VALUE_UNQUOTED_STATE;
+         ## Reconsume.
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_BEFORE_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no default type'); ## TODO: type
+         $self->{state} = BOGUS_MD_STATE;
+         ## Reconsume.
+         redo A;
+       } elsif ($self->{nc} == 0x0022) { # "
+         ## XML5: Same as "anything else".
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_DOUBLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0027) { # '
+         ## XML5: Same as "anything else".
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_SINGLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no attr default'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct});
+         redo A;
+       } else {
+         $self->{ca}->{default} = chr $self->{nc};
+         $self->{state} = DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         $self->{state} = DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_AFTER_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0022) { # "
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before default value'); ## TODO: type
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_DOUBLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0027) { # '
+         ## XML5: Same as "anything else".
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before default value'); ## TODO: type
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_SINGLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         ## XML5: Same as "anything else".
+         push @{$self->{ct}->{attrdefs}}, $self->{ca};
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         push @{$self->{ct}->{attrdefs}}, $self->{ca};
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct});
+         redo A;
+       } else {
+         $self->{ca}->{default} .= chr $self->{nc};
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_ATTLIST_ATTRIBUTE_DECLARATION_AFTER_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0022) { # "
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_DOUBLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0027) { # '
+         $self->{ca}->{value} = '';
+         $self->{state} = ATTRIBUTE_VALUE_SINGLE_QUOTED_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         push @{$self->{ct}->{attrdefs}}, $self->{ca};
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         ## XML5: No parse error.
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         push @{$self->{ct}->{attrdefs}}, $self->{ca};
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE; ## XML5: "Data state".
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct});
+         redo A;
+       } else {
+         ## XML5: Not defined yet.
+         if ($self->{ca}->{default} eq 'FIXED') {
+           $self->{state} = ATTRIBUTE_VALUE_UNQUOTED_STATE;
+         } else {
+           push @{$self->{ct}->{attrdefs}}, $self->{ca};
+           $self->{state} = DOCTYPE_ATTLIST_NAME_AFTER_STATE;
+         }
+         ## Reconsume.
+         redo A;
+       }
+     } elsif ($self->{state} == AFTER_ATTLIST_ATTR_VALUE_QUOTED_STATE) {
+       if ($is_space->{$self->{nc}} or
+           $self->{nc} == -1 or
+           $self->{nc} == 0x003E) { # >
+         $self->{state} = DOCTYPE_ATTLIST_NAME_AFTER_STATE;
+         ## Reconsume.
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no space before attr name'); ## TODO: type
+         $self->{state} = DOCTYPE_ATTLIST_NAME_AFTER_STATE;
+         ## Reconsume.
+         redo A;
+       }
+     } elsif ($self->{state} == NDATA_STATE) {
+       ## ASCII case-insensitive
+       if ($self->{nc} == [
+             undef,
+x0044, # D
+x0041, # A
+x0054, # T
+           ]->[length $self->{kwd}] or
+           $self->{nc} == [
+             undef,
+x0064, # d
+x0061, # a
+x0074, # t
+           ]->[length $self->{kwd}]) {
+         ## Stay in the state.
+         $self->{kwd} .= chr $self->{nc};
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ((length $self->{kwd}) == 4 and
+                ($self->{nc} == 0x0041 or # A
+                 $self->{nc} == 0x0061)) { # a
+         if ($self->{kwd} ne 'NDAT' or $self->{nc} == 0x0061) { # a
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'lowercase keyword', ## TODO: type
+                           text => 'NDATA',
+                           line => $self->{line_prev},
+                           column => $self->{column_prev} - 4);
+         } else {
+         }
+         $self->{state} = AFTER_NDATA_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after literal', ## TODO: type
+                         line => $self->{line_prev},
+                         column => $self->{column_prev} + 1
+                             - length $self->{kwd});
+         $self->{state} = BOGUS_MD_STATE;
+         ## Reconsume.
+         redo A;
+       }
+     } elsif ($self->{state} == AFTER_NDATA_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         $self->{state} = BEFORE_NOTATION_NAME_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no notation name'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ENTITY
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ENTITY
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after literal', ## TODO: type
+                         line => $self->{line_prev},
+                         column => $self->{column_prev} + 1
+                             - length $self->{kwd});
+         $self->{state} = BOGUS_MD_STATE;
+         ## Reconsume.
+         redo A;
+       }
+     } elsif ($self->{state} == BEFORE_NOTATION_NAME_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no notation name'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ENTITY
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ENTITY
+         redo A;
+       } else {
+         $self->{ct}->{notation} = chr $self->{nc}; # ENTITY
+         $self->{state} = NOTATION_NAME_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == NOTATION_NAME_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         $self->{state} = AFTER_MD_DEF_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ENTITY
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ENTITY
+         redo A;
+       } else {
+         $self->{ct}->{notation} .= chr $self->{nc}; # ENTITY
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_ENTITY_VALUE_DOUBLE_QUOTED_STATE) {
+       if ($self->{nc} == 0x0022) { # "
+         $self->{state} = AFTER_MD_DEF_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0026) { # &
+         $self->{prev_state} = $self->{state};
+         $self->{state} = ENTITY_VALUE_ENTITY_STATE;
+         $self->{entity_add} = 0x0022; # "
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+ ## TODO: %
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed entity value'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         ## Reconsume.
+         return  ($self->{ct}); # ENTITY
+         redo A;
+       } else {
+         $self->{ct}->{value} .= chr $self->{nc}; # ENTITY
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == DOCTYPE_ENTITY_VALUE_SINGLE_QUOTED_STATE) {
+       if ($self->{nc} == 0x0027) { # '
+         $self->{state} = AFTER_MD_DEF_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0026) { # &
+         $self->{prev_state} = $self->{state};
+         $self->{state} = ENTITY_VALUE_ENTITY_STATE;
+         $self->{entity_add} = 0x0027; # '
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+ ## TODO: %
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed entity value'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         ## Reconsume.
+         return  ($self->{ct}); # ENTITY
+         redo A;
+       } else {
+         $self->{ct}->{value} .= chr $self->{nc}; # ENTITY
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == ENTITY_VALUE_ENTITY_STATE) {
+       if ($is_space->{$self->{nc}} or
+           {
+x003C => 1, 0x0026 => 1, -1 => 1, # <, &
+             $self->{entity_add} => 1,
+           }->{$self->{nc}}) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'bare ero',
+                         line => $self->{line_prev},
+                         column => $self->{column_prev}
+                             + ($self->{nc} == -1 ? 1 : 0));
+         ## Don't consume
+         ## Return nothing.
+         #
+       } elsif ($self->{nc} == 0x0023) { # #
+         $self->{ca} = $self->{ct};
+         $self->{state} = ENTITY_HASH_STATE;
+         $self->{kwd} = '#';
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } else {
+         #
+       }
+       $self->{ct}->{value} .= '&';
+       $self->{state} = $self->{prev_state};
+       ## Reconsume.
+       redo A;
+     } elsif ($self->{state} == AFTER_ELEMENT_NAME_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         $self->{state} = BEFORE_ELEMENT_CONTENT_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0028) { # (
+         $self->{state} = AFTER_CM_GROUP_OPEN_STATE;
+         $self->{ct}->{content} = ['('];
+         $self->{group_depth} = 1;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'no md def'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } else {
+         $self->{ct}->{content} = [chr $self->{nc}];
+         $self->{state} = CONTENT_KEYWORD_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == CONTENT_KEYWORD_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         $self->{state} = AFTER_MD_DEF_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } else {
+         $self->{ct}->{content}->[-1] .= chr $self->{nc}; # ELEMENT
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == AFTER_CM_GROUP_OPEN_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0028) { # (
+         $self->{group_depth}++;
+         push @{$self->{ct}->{content}}, chr $self->{nc};
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x007C or # |
+                $self->{nc} == 0x002C) { # ,
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'empty element name'); ## TODO: type
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0029) { # )
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'empty element name'); ## TODO: type
+         push @{$self->{ct}->{content}}, chr $self->{nc};
+         $self->{group_depth}--;
+         $self->{state} = AFTER_CM_GROUP_CLOSE_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed cm group'); ## TODO: type
+         push @{$self->{ct}->{content}}, (')') x $self->{group_depth};
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         push @{$self->{ct}->{content}}, (')') x $self->{group_depth};
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } else {
+         push @{$self->{ct}->{content}}, chr $self->{nc};
+         $self->{state} = CM_ELEMENT_NAME_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == CM_ELEMENT_NAME_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         $self->{state} = AFTER_CM_ELEMENT_NAME_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x002A or # *
+                $self->{nc} == 0x002B or # +
+                $self->{nc} == 0x003F) { # ?
+         push @{$self->{ct}->{content}}, chr $self->{nc};
+         $self->{state} = AFTER_CM_ELEMENT_NAME_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x007C or # |
+                $self->{nc} == 0x002C) { # ,
+         push @{$self->{ct}->{content}}, $self->{nc} == 0x007C ? ' | ' : ', ';
+         $self->{state} = AFTER_CM_GROUP_OPEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0029) { # )
+         $self->{group_depth}--;
+         push @{$self->{ct}->{content}}, chr $self->{nc};
+         $self->{state} = AFTER_CM_GROUP_CLOSE_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed cm group'); ## TODO: type
+         push @{$self->{ct}->{content}}, (')') x $self->{group_depth};
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         push @{$self->{ct}->{content}}, (')') x $self->{group_depth};
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } else {
+         $self->{ct}->{content}->[-1] .= chr $self->{nc};
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == AFTER_CM_ELEMENT_NAME_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x007C or # |
+                $self->{nc} == 0x002C) { # ,
+         push @{$self->{ct}->{content}}, $self->{nc} == 0x007C ? ' | ' : ', ';
+         $self->{state} = AFTER_CM_GROUP_OPEN_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0029) { # )
+         $self->{group_depth}--;
+         push @{$self->{ct}->{content}}, chr $self->{nc};
+         $self->{state} = AFTER_CM_GROUP_CLOSE_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed cm group'); ## TODO: type
+         push @{$self->{ct}->{content}}, (')') x $self->{group_depth};
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         push @{$self->{ct}->{content}}, (')') x $self->{group_depth};
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'after element name'); ## TODO: type
+         push @{$self->{ct}->{content}}, (')') x $self->{group_depth};
+         $self->{state} = BOGUS_MD_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
+     } elsif ($self->{state} == AFTER_CM_GROUP_CLOSE_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         if ($self->{group_depth}) {
+           $self->{state} = AFTER_CM_ELEMENT_NAME_STATE;
+         } else {
+           $self->{state} = AFTER_MD_DEF_STATE;
+         }
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x002A or # *
+                $self->{nc} == 0x002B or # +
+                $self->{nc} == 0x003F) { # ?
+         push @{$self->{ct}->{content}}, chr $self->{nc};
+         if ($self->{group_depth}) {
+           $self->{state} = AFTER_CM_ELEMENT_NAME_STATE;
+         } else {
+           $self->{state} = AFTER_MD_DEF_STATE;
+         }
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x0029) { # )
+         if ($self->{group_depth}) {
+           $self->{group_depth}--;
+           push @{$self->{ct}->{content}}, chr $self->{nc};
+           ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+           redo A;
+         } else {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after md def'); ## TODO: type
+           $self->{state} = BOGUS_MD_STATE;
+           ## Reconsume.
+           redo A;
+         }
+       } elsif ($self->{nc} == 0x003E) { # >
+         if ($self->{group_depth}) {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed cm group'); ## TODO: type
+           push @{$self->{ct}->{content}}, (')') x $self->{group_depth};
+         }
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         push @{$self->{ct}->{content}}, (')') x $self->{group_depth};
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ELEMENT
+         redo A;
+       } else {
+         if ($self->{group_depth}) {
+           $self->{state} = AFTER_CM_ELEMENT_NAME_STATE;
+         } else {
+           $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after md def'); ## TODO: type
+           $self->{state} = BOGUS_MD_STATE;
+         }
+         ## Reconsume.
+         redo A;
+       }
+     } elsif ($self->{state} == AFTER_MD_DEF_STATE) {
+       if ($is_space->{$self->{nc}}) {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       } elsif ($self->{nc} == 0x003E) { # >
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ENTITY/ELEMENT
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'unclosed md'); ## TODO: type
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ENTITY/ELEMENT
+         redo A;
+       } else {
+         $self->{parse_error}->(level => $self->{level}->{must}, type => 'string after md def'); ## TODO: type
+         $self->{state} = BOGUS_MD_STATE;
+         ## Reconsume.
+         redo A;
+       }
+     } elsif ($self->{state} == BOGUS_MD_STATE) {
+       if ($self->{nc} == 0x003E) { # >
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         return  ($self->{ct}); # ATTLIST/ENTITY/NOTATION
+         redo A;
+       } elsif ($self->{nc} == -1) {
+         $self->{state} = DOCTYPE_INTERNAL_SUBSET_STATE;
+         ## Reconsume.
+         return  ($self->{ct}); # ATTLIST/ENTITY/NOTATION
+         redo A;
+       } else {
+         ## Stay in the state.
+     if ($self->{char_buffer_pos} < length $self->{char_buffer}) {
+       $self->{line_prev} = $self->{line};
+       $self->{column_prev} = $self->{column};
+       $self->{column}++;
+       $self->{nc}
+           = ord substr ($self->{char_buffer}, $self->{char_buffer_pos}++, 1);
+     } else {
+       $self->{set_nc}->($self);
+     }
+         redo A;
+       }
      } else {
        die "$0: $self->{state}: Unknown state";
      }
-Line 5206 
 sub _get_next_token ($) {
+Line 8831 
 sub _get_next_token ($) {
 ;
  ## $Date$

 Legend:



Removed from v.1.13
 


changed lines


 
Added in v.1.32
 Legend:



Removed from v.1.13
 


changed lines


 
Added in v.1.32
-Removed from v.1.13
+Added in v.1.32

admin@suikawiki.org	ViewVC Help
Powered by ViewVC 1.1.24