evalplus
diff --git a/‎results/evalperf/COMBINED-RESULTS.json
+35-29 b/‎results/evalperf/COMBINED-RESULTS.json
+35-29
diff --git a/‎results/evalperf/Qwen--CodeQwen1.5-7B-Chat_vllm_temp_1.0_evalperf_results.brief.json
+1 b/‎results/evalperf/Qwen--CodeQwen1.5-7B-Chat_vllm_temp_1.0_evalperf_results.brief.json
+1
diff --git a/‎results/evalperf/Qwen--Qwen2.5-Coder-7B-Instruct_vllm_temp_1.0_evalperf_results.brief.json
-1 b/‎results/evalperf/Qwen--Qwen2.5-Coder-7B-Instruct_vllm_temp_1.0_evalperf_results.brief.json
-1
diff --git a/‎results/evalperf/meta-llama--Meta-Llama-3-8B-Instruct_vllm_temp_1.0_evalperf_results.brief.json
+1 b/‎results/evalperf/meta-llama--Meta-Llama-3-8B-Instruct_vllm_temp_1.0_evalperf_results.brief.json
+1
@@ -3,144 +3,150 @@
         "dps": 79.85512300275154,
         "dps_norm": 76.4398130083651,
         "pass@1": 77.63559322033899,
-        "win_rate": 0.49004524886877826
+        "win_rate": 0.4936570428696413
+    },
+    "Qwen--CodeQwen1.5-7B-Chat": {
+        "dps": 80.70604298474056,
+        "dps_norm": 77.70445772388321,
+        "pass@1": 74.11016949152543,
+        "win_rate": 0.3984565393988627
     },
     "mistralai--Codestral-22B-v0.1": {
         "dps": 82.68924330620962,
         "dps_norm": 79.07819827252048,
         "pass@1": 72.83898305084746,
-        "win_rate": 0.48872506504770163
+        "win_rate": 0.4920368818105616
     },
     "Qwen--Qwen2.5-14B-Instruct": {
         "dps": 82.48566826452165,
         "dps_norm": 77.66575182191508,
         "pass@1": 82.48305084745763,
-        "win_rate": 0.5291380008093889
+        "win_rate": 0.5283979631805719
     },
     "deepseek-ai--deepseek-coder-33b-instruct": {
         "dps": 82.65680460618937,
         "dps_norm": 77.67106700323255,
         "pass@1": 77.50847457627118,
-        "win_rate": 0.46629901960784315
+        "win_rate": 0.46857707509881424
     },
     "01-ai--Yi-Coder-9B-Chat": {
         "dps": 83.60305818801254,
         "dps_norm": 78.76801867108128,
         "pass@1": 78.80508474576271,
-        "win_rate": 0.4875316990701606
+        "win_rate": 0.4916189697465249
     },
     "google--gemma-2-27b-it": {
         "dps": 84.20223252621882,
         "dps_norm": 78.67511770954597,
         "pass@1": 80.23728813559322,
-        "win_rate": 0.5551975945017182
-    },
-    "Qwen--Qwen2.5-Coder-7B-Instruct": {
-        "dps": 79.81023172966313,
-        "dps_norm": 76.74937875060594,
-        "pass@1": 76.42372881355932,
-        "win_rate": 0.3791905151267375
+        "win_rate": 0.5566625155666252
     },
     "Qwen--Qwen2.5-32B-Instruct": {
         "dps": 83.54712283112897,
         "dps_norm": 78.3588319852899,
         "pass@1": 87.5677966101695,
-        "win_rate": 0.5474555735056543
+        "win_rate": 0.5515826494724502
     },
     "mistralai--Mistral-Nemo-Instruct-2407": {
         "dps": 81.98436677712466,
         "dps_norm": 77.61969110961331,
         "pass@1": 57.389830508474574,
-        "win_rate": 0.4432494279176201
+        "win_rate": 0.44836716681376876
     },
     "Qwen--Qwen2.5-72B-Instruct": {
         "dps": 84.69258296490358,
         "dps_norm": 79.00610315513151,
         "pass@1": 88.27966101694915,
-        "win_rate": 0.5433430111986728
+        "win_rate": 0.5473515248796148
     },
     "gpt-4o-mini-2024-07-18": {
         "dps": 84.19186096830988,
         "dps_norm": 79.21827803090933,
         "pass@1": 85.51694915254237,
-        "win_rate": 0.5626810095159288
+        "win_rate": 0.5631009615384616
     },
     "Qwen--Qwen2.5-7B-Instruct": {
         "dps": 84.68492179229716,
         "dps_norm": 79.33664874489173,
         "pass@1": 80.02542372881356,
-        "win_rate": 0.5323045267489712
+        "win_rate": 0.5342220453641067
     },
     "gemini-1.5-pro-002": {
         "dps": 76.26393608564656,
         "dps_norm": 75.16850711244093,
         "pass@1": 83.71186440677967,
-        "win_rate": 0.44697294976384716
+        "win_rate": 0.4499168744804655
     },
     "deepseek-ai--deepseek-coder-6.7b-instruct": {
         "dps": 83.55516548026816,
         "dps_norm": 78.20569308671841,
         "pass@1": 73.57627118644068,
-        "win_rate": 0.47451820128479655
+        "win_rate": 0.4788907284768212
     },
     "nvidia--Llama-3.1-Nemotron-70B-Instruct-HF": {
         "dps": 78.40270067725943,
         "dps_norm": 76.22281062678165,
         "pass@1": 61.83050847457627,
-        "win_rate": 0.4121043627031651
+        "win_rate": 0.4110099337748344
     },
     "ise-uiuc--Magicoder-S-DS-6.7B": {
         "dps": 83.62957240263601,
         "dps_norm": 78.58003556526222,
         "pass@1": 69.83898305084746,
-        "win_rate": 0.45699152542372884
+        "win_rate": 0.45927138763814984
     },
     "google--gemma-2-9b-it": {
         "dps": 82.35863751376931,
         "dps_norm": 78.14625766928611,
         "pass@1": 68.07627118644068,
-        "win_rate": 0.5287128712871287
+        "win_rate": 0.5286123032904149
     },
     "mistralai--Mistral-Large-Instruct-2407": {
         "dps": 85.58694758404829,
         "dps_norm": 80.65167529745199,
         "pass@1": 82.4322033898305,
-        "win_rate": 0.578808752025932
+        "win_rate": 0.5823852491173009
     },
     "deepseek-ai--DeepSeek-Coder-V2-Lite-Instruct": {
         "dps": 82.81873138697289,
         "dps_norm": 78.09379634032757,
         "pass@1": 79.04237288135593,
-        "win_rate": 0.5301230377598642
+        "win_rate": 0.5299548625359048
+    },
+    "meta-llama--Meta-Llama-3-8B-Instruct": {
+        "dps": 77.04079291937829,
+        "dps_norm": 75.1570617360002,
+        "pass@1": 43.69491525423729,
+        "win_rate": 0.4024024024024024
     },
     "deepseek-chat": {
         "dps": 86.84652683144942,
         "dps_norm": 79.08774817854689,
         "pass@1": 88.51694915254237,
-        "win_rate": 0.5940152801358234
+        "win_rate": 0.5948665297741274
     },
     "gpt-4o-2024-08-06": {
         "dps": 87.8465793074948,
         "dps_norm": 82.23308124778713,
         "pass@1": 86.65254237288136,
-        "win_rate": 0.6191666666666666
+        "win_rate": 0.6226795803066989
     },
     "meta-llama--Llama-3.1-70B-Instruct": {
         "dps": 80.40042339048047,
         "dps_norm": 77.29818188061222,
         "pass@1": 77.26271186440678,
-        "win_rate": 0.452760736196319
+        "win_rate": 0.45465346534653467
     },
     "mistralai--Mistral-Small-Instruct-2409": {
         "dps": 82.25625421641564,
         "dps_norm": 78.98044554401069,
         "pass@1": 69.51694915254237,
-        "win_rate": 0.47498931167165453
+        "win_rate": 0.4797436957420422
     },
     "meta-llama--Llama-3.1-8B-Instruct": {
         "dps": 80.93273308299496,
         "dps_norm": 76.57037397653662,
         "pass@1": 64.34745762711864,
-        "win_rate": 0.39338071968014215
+        "win_rate": 0.3991434689507495
     }
 }