Add option to force BOS for ppl test

2026-04-20 14:29:28 +00:00 · 2024-02-22 14:44:27 +01:00
parent 69fba75225
commit a19a2eccb4
1 changed files with 5 additions and 0 deletions
--- a/test_inference.py
+++ b/test_inference.py
@@ -41,6 +41,7 @@ parser.add_argument("-er", "--eval_rows", type = int, default = 128, help = "Num
 parser.add_argument("-el", "--eval_length", type = int, default = 2048, help = "Max no. tokens per sample")
 parser.add_argument("-et", "--eval_token", action = "store_true", help = "Evaluate perplexity on token-by-token inference using cache")
 parser.add_argument("-e8", "--eval_token_8bit", action = "store_true", help = "Evaluate perplexity on token-by-token inference using 8-bit cache")
+parser.add_argument("-eb", "--eval_bos", action = "store_true", help = "Add BOS token to every row in perplexity test (required by Gemma and maybe other models.)")
 parser.add_argument("-p", "--prompt", type = str, help = "Generate from prompt (basic sampling settings)")
 parser.add_argument("-pnb", "--prompt_no_bos", action = "store_true", help = "Don't add BOS token to prompt")
 parser.add_argument("-t", "--tokens", type = int, default = 128, help = "Max no. tokens")
@@ -257,6 +258,10 @@ if args.eval_dataset or args.standard_perplexity:
            eval_tokens = get_tokens(eval_rows, eval_length, eval_dataset, tokenizer)
            eval_len = [eval_tokens.shape[1]] * eval_tokens.shape[0]

+            if args.eval_bos:
+                boss = torch.full((eval_tokens.shape[0], 1), tokenizer.bos_token_id, dtype = torch.long)
+                eval_tokens = torch.cat((boss, eval_tokens[:, :-1]), dim = 1)
+
        logprob_sum = 0.0
        logprob_count = 0