Skip to content

Files

Latest commit

b542929 · Mar 19, 2024

History

History
This branch is 453 commits behind SmartFlowAI/EmoLLM:main.

datasets

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
Mar 3, 2024
Mar 10, 2024
Mar 10, 2024
Mar 3, 2024
Feb 23, 2024
Jan 26, 2024
Feb 23, 2024
Mar 19, 2024
Feb 28, 2024
Feb 28, 2024
Feb 27, 2024
Feb 27, 2024
Feb 24, 2024

README.md

EmoLLM数据集

  • 数据集按用处分为两种类型:GeneralRole-play
  • 数据按格式分为两种类型:QAConversation
  • 数据汇总:General(6个数据集);Role-play(3个数据集

数据集类型

  • General:通用数据集,包含心理学知识、心理咨询技术等通用内容
  • Role-play:角色扮演数据集,包含特定角色对话风格数据等内容

数据类型

  • QA:问答对
  • Conversation:多轮对话

数据集汇总

Category Dataset Type Total
General data Conversation 5600+
General data_pro Conversation 36500+
General multi_turn_dataset_1 Conversation 36,000+
General multi_turn_dataset_2 Conversation 27,000+
General single_turn_dataset_1 QA 14000+
General single_turn_dataset_2 QA 18300+
Role-play aiwei Conversation 4000+
Role-play SoulStar QA 11200+
Role-play tiangou Conversation 3900+
…… …… …… ……

数据集来源

General

  • 数据集 data 来自本项目
  • 数据集 data_pro 来自本项目
  • 数据集 multi_turn_dataset_1 来源 Smile
  • 数据集 multi_turn_dataset_2 来源 CPsyCounD
  • 数据集 single_turn_dataset_1 来自本项目
  • 数据集 single_turn_dataset_2 来自本项目

Role-play

  • 数据集 aiwei 来自本项目
  • 数据集 tiangou 来自本项目
  • 数据集 SoulStar 来源 SoulStar