DFKI-NLP
diff --git a/‎dataset/annotation/coxql_test_annotation1.json
+567 b/‎dataset/annotation/coxql_test_annotation1.json
+567
diff --git a/‎dataset/annotation/coxql_test_annotation.json renamed to ‎dataset/annotation/coxql_test_annotation2.json
+114-114 b/‎dataset/annotation/coxql_test_annotation.json renamed to ‎dataset/annotation/coxql_test_annotation2.json
+114-114
diff --git a/‎dataset/annotation/remove_golden_parse.py
-27 b/‎dataset/annotation/remove_golden_parse.py
-27
diff --git a/‎dataset/annotation/utils.py
+67 b/‎dataset/annotation/utils.py
+67
diff --git a/‎parsing/guided_decoding/results/pythia-2.8b-v0-20shots.json
+567-1 b/‎parsing/guided_decoding/results/pythia-2.8b-v0-20shots.json
+567-1
diff --git a/‎parsing/multi_prompt/results/CodeQwen1.5-7B-Chat.json
+567-1 b/‎parsing/multi_prompt/results/CodeQwen1.5-7B-Chat.json
+567-1
diff --git a/‎parsing/multi_prompt/results/Meta-Llama-3-70B.json
+567-1 b/‎parsing/multi_prompt/results/Meta-Llama-3-70B.json
+567-1
diff --git a/‎parsing/multi_prompt/results/Mistral-7B-v0.1.json
+567-1 b/‎parsing/multi_prompt/results/Mistral-7B-v0.1.json
+567-1
diff --git a/‎parsing/multi_prompt/results/falcon-rw-1b.json
+567-1 b/‎parsing/multi_prompt/results/falcon-rw-1b.json
+567-1
diff --git a/‎parsing/multi_prompt/results/sqlcoder-7b-2.json
+567-1 b/‎parsing/multi_prompt/results/sqlcoder-7b-2.json
+567-1
diff --git a/‎requirements.txt
+3-1 b/‎requirements.txt
+3-1
@@ -0,0 +1,67 @@
+import json
+import random
+from nltk import agreement
+
+
+def remove_labeled_annotations():
+    f = open(f"../coxql_test.json")
+    data = json.load(f)
+
+    texts = []
+    sqls = []
+
+    for i in data:
+        texts.append(i["text"])
+        sqls.append(i["sql"])
+
+    output = []
+    for i in range(len(texts)):
+        output.append({
+            "idx": i,
+            "text": texts[i],
+            "sql": ""
+        })
+
+    random.shuffle(output)
+
+    jsonFile = open("./coxql_test_annotation.json", "w")
+    jsonString = json.dumps(output, indent=2)
+    jsonFile.write(jsonString)
+    jsonFile.close()
+
+
+def get_annotation_with_order(data):
+    label = []
+    for i in range(len(data)):
+        for j in data:
+            if j["idx"] == i:
+                label.append(j['sql'])
+                break
+    return label
+
+
+def calculate_IAA():
+
+    f = open("./coxql_test_annotation1.json.json")
+    data = json.load(f)
+    rater1 = [i["sql"] for i in data]
+
+    f1 = open("./coxql_test_annotation2.json")
+    data1 = json.load(f1)
+
+    f2 = open("./coxql_test_annotation3.json")
+    data2 = json.load(f2)
+
+    rater2 = get_annotation_with_order(data1)
+    rater3 = get_annotation_with_order(data2)
+
+    task_data = ([[0, str(i), str(rater1[i])] for i in range(0, len(rater1))] +
+                 [[1, str(i), str(rater2[i])] for i in range(0, len(rater2))] +
+                 [[2, str(i), str(rater3[i])] for i in range(0, len(rater3))])
+
+    rating_task = agreement.AnnotationTask(data=task_data)
+
+    print("Kappa " + str(rating_task.kappa()))
+    print("Fleiss " + str(rating_task.multi_kappa()))
+    print("Alpha " + str(rating_task.alpha()))
+    print("Scotts " + str(rating_task.pi()))
@@ -2,6 +2,7 @@ accelerate==0.29.3
 auto_gptq==0.7.1
 bitsandbytes==0.41.1
 lark==1.1.2
+nltk==3.7.0
 numpy==1.22.4
 optimum==1.13.2
 pandas==1.4.3
@@ -10,4 +11,5 @@ scikit-learn==1.0.2
 sentence_transformers==2.2.2
 torch==2.1.0+cu121
 tqdm==4.66.1
-transformers==4.36.0
+transformers==4.36.0
+word2number==1.1