tabbyAPI/backends/exllamav3/grammar.py

from typing import List
import traceback

from exllamav3 import (
    Tokenizer,
    Filter,
    FormatronFilter,
)
from formatron.formatter import FormatterBuilder
from formatron.schemas import json_schema
from loguru import logger


class ExLlamaV3Grammar:
    """ExLlamaV3 class for various grammar filters/parsers."""

    filters: List[Filter]

    def __init__(self):
        self.filters = []

    def add_json_schema_filter(
        self,
        schema: dict,
        tokenizer: Tokenizer,
    ):
        """Adds an ExllamaV3 filter based on a JSON schema."""

        leading_character = "[" if schema.get("type") == "array" else "{"

        try:
            # Add fields required by formatron if not present
            if "$id" not in schema:
                schema["$id"] = "https://example.com/example.json"
            if "$schema" not in schema:
                schema["$schema"] = "http://json-schema.org/draft-07/schema#"

            # Validate schema and create formatter
            schema = json_schema.create_schema(schema)
        except Exception:
            traceback.print_exc()
            logger.error(
                "Skipping because the JSON schema couldn't be parsed. "
                "Please read the above error for more information."
            )
            return

        f = FormatterBuilder()
        f.append_line(f"{f.json(schema)}")
        self.filters.append(
            FormatronFilter(tokenizer, eos_after_completed=True, formatter_builder=f)
        )

        # Additional constraint to force leading character
        f = FormatterBuilder()
        f.append_line(leading_character)
        self.filters.append(FormatronFilter(tokenizer, formatter_builder=f))