import pytest
from parsers.defaultparser import TokenIter, Token, Tokens


def test_i_can_tokenize():
    source = "+*-/{}[]()    ,;:.?\n\n\r\r\r\nidentifier_0\t  \t10.15 10 'string\n' \"another string\""
    tokens = list(TokenIter(source))
    assert tokens[0] == Token(Tokens.PLUS, "+", 0, 1, 1)
    assert tokens[1] == Token(Tokens.STAR, "*", 1, 1, 2)
    assert tokens[2] == Token(Tokens.MINUS, "-", 2, 1, 3)
    assert tokens[3] == Token(Tokens.SLASH, "/", 3, 1, 4)
    assert tokens[4] == Token(Tokens.LBRACE, "{", 4, 1, 5)
    assert tokens[5] == Token(Tokens.RBRACE, "}", 5, 1, 6)
    assert tokens[6] == Token(Tokens.LBRACKET, "[", 6, 1, 7)
    assert tokens[7] == Token(Tokens.RBRACKET, "]", 7, 1, 8)
    assert tokens[8] == Token(Tokens.LPAR, "(", 8, 1, 9)
    assert tokens[9] == Token(Tokens.RPAR, ")", 9, 1, 10)
    assert tokens[10] == Token(Tokens.WHITESPACE, "    ", 10, 1, 11)
    assert tokens[11] == Token(Tokens.COMMA, ",", 14, 1, 15)
    assert tokens[12] == Token(Tokens.SEMICOLON, ";", 15, 1, 16)
    assert tokens[13] == Token(Tokens.COLON, ":", 16, 1, 17)
    assert tokens[14] == Token(Tokens.DOT, ".", 17, 1, 18)
    assert tokens[15] == Token(Tokens.QMARK, "?", 18, 1, 19)
    assert tokens[16] == Token(Tokens.NEWLINE, "\n", 19, 1, 20)
    assert tokens[17] == Token(Tokens.NEWLINE, "\n\r", 20, 2, 1)
    assert tokens[18] == Token(Tokens.NEWLINE, "\r", 22, 3, 1)
    assert tokens[19] == Token(Tokens.NEWLINE, "\r\n", 23, 4, 1)
    assert tokens[20] == Token(Tokens.IDENTIFIER, "identifier_0", 25, 5, 1)
    assert tokens[21] == Token(Tokens.WHITESPACE, "\t  \t", 37, 5, 13)
    assert tokens[22] == Token(Tokens.NUMBER, "10.15", 41, 5, 17)
    assert tokens[23] == Token(Tokens.WHITESPACE, " ", 46, 5, 22)
    assert tokens[24] == Token(Tokens.NUMBER, "10", 47, 5, 23)
    assert tokens[25] == Token(Tokens.WHITESPACE, " ", 49, 5, 25)
    assert tokens[26] == Token(Tokens.STRING, "'string\n'", 50, 5, 26)
    assert tokens[27] == Token(Tokens.WHITESPACE, " ", 59, 6, 1)
    assert tokens[28] == Token(Tokens.STRING, '"another string"', 60, 6, 2)


@pytest.mark.parametrize("text, expected", [
    ("_ident", True),
    ("ident", True),
    ("ident123", True),
    ("ident_123", True),
    ("ident-like-this", True),
    ("àèùéû", True),
    ("011254", False),
    ("0abcd", False),
    ("-abcd", False)
])
def test_i_can_tokenize_identifiers(text, expected):
    tokens = list(TokenIter(text))
    comparison = tokens[0].type == Tokens.IDENTIFIER
    assert comparison == expected


@pytest.mark.parametrize("text, expected_text, expected_newlines", [
    ("'foo'", "'foo'", 0),
    ('"foo"', '"foo"', 0),
    ("'foo\rbar'", "'foo\rbar'", 1),
    ("'foo\nbar'", "'foo\nbar'", 1),
    ("'foo\n\rbar'", "'foo\n\rbar'", 1),
    ("'foo\r\nbar'", "'foo\r\nbar'", 1),
    ("'foo\r\rbar'", "'foo\r\rbar'", 2),
    ("'foo\n\nbar'", "'foo\n\nbar'", 2),
    ("'foo\r\n\n\rbar'", "'foo\r\n\n\rbar'", 2),
    ("'\rfoo\rbar\r'", "'\rfoo\rbar\r'", 3),
    ("'\nfoo\nbar\n'", "'\nfoo\nbar\n'", 3),
    ("'\n\rfoo\r\n'", "'\n\rfoo\r\n'", 2),
    (r"'foo\'bar'", r"'foo\'bar'", 0),
    (r'"foo\"bar"', r'"foo\"bar"', 0),
    ('"foo"bar"', '"foo"', 0),
    ("'foo'bar'", "'foo'", 0),
])
def test_i_can_parse_strings(text, expected_text, expected_newlines):
    lexer = TokenIter(text)
    text_found, nb_of_newlines = lexer.eat_string(0)

    assert nb_of_newlines == expected_newlines
    assert text_found == expected_text


@pytest.mark.parametrize("text", [
    "1", "3.1415", "0.5", "01", "-5", "-5.10"
])
def test_i_can_parse_numbers(text):
    tokens = list(TokenIter(text))
    assert tokens[0].type == Tokens.NUMBER
    assert tokens[0].value == text


@pytest.mark.parametrize("text", [
    "def", "concept", "as", "pre", "post"
])
def test_i_can_recognize_keywords(text):
    tokens = list(TokenIter(text))
    assert tokens[0].type == Tokens.KEYWORD