GitHub - KNU-BrainAI/Climate: DACON 기후기술분류 경진대회

Natural Language-based Climate Technology Classification Project by KNU-BrainAI

Pre-Processing

12 Train columns 중 4가지 '과제명', '요약문_한글키워드', '요약문_연구목표', 'label' 사용
Mecab Tokenizer를 통해 형태소 단위 분절 후 Nouns: 명사형태만 추출하는 방식을 최종 적용

Models

Single Models

Filename	Model	Pretrain Detail	Val Score	Test Score
Model1	BERT-base-Multilingual-cased	multi-lingual based	0.65	0.64
Model2	BERT-base-Multilingual-uncased	multi-lingual based	0.71	0.68
Model3	KLUE-BERT-base	Korean based	0.74	0.72
Model4	SKT/KoBERT	Korean based	0.67	0.67
Model5	RoBERTa-base	Only English based	0.59	0.57
Model6	KLUE-RoBERTa-base	Korean based	0.72	0.70
Model7	XLM-RoBERTa-base	Cross-lingual & multi-lingual based	0.63	0.61

not yet

|Model8|KoELECTRA-base|Fixed-Parameter|---|---|
|Model9|KLUE-RoBERTa-Large|Fixed-Parameter|---|---|
|Model10|TBD|Fixed-Parameter|---|---|

*uncased: it does not make a difference between english and English.

Hyperparameters (Fixed)

NUM_EPOCHS = 10
VALID_SPLIT = 0.2
MAX_LEN=96

optimizer = tf.keras.optimizers.Adam(3e-5)
loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
metric = tf.keras.metrics.SparseCategoricalAccuracy('accuracy')

Name		Name	Last commit message	Last commit date
Latest commit History 146 Commits
Examples		Examples
codes		codes
images		images
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Natural Language-based Climate Technology Classification Project by KNU-BrainAI

Pre-Processing

Models

Hyperparameters (Fixed)

About

Releases

Packages

Contributors 3

Languages

KNU-BrainAI/Climate

Folders and files

Latest commit

History

Repository files navigation

Natural Language-based Climate Technology Classification Project by KNU-BrainAI

Pre-Processing

Models

Hyperparameters (Fixed)

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages