《王者荣耀》多模态问答助手 【RAG】【AGENT】【RolePlay】【Deploy】【MultiModal】 #594
chg0901
started this conversation in
MultiModal
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
数据介绍
队友招募
这是一个和王者有关的多模态项目,
打算使用rag,和agent, roleplay,lmdeploy等技术,
欢迎感兴趣的大佬联系,利用这份数据,一起开发有趣的应用
招募要求
数据背景
《王者荣耀》是由腾讯游戏天美工作室群开发并运营在Android、IOS平台上的MOBA类国产手游,是目前中国最流行的智能手机游戏之一,王者荣耀中的玩法以竞技对战为主,玩家之间进行1V1、3V3、5V5等多种方式的PVP对战,在满足条件后可以参加游戏的排位赛等,还可以参加PVE的闯关模式,是属于推塔类型的游戏。
王者荣耀中英雄众多,主要分为五个分路和七个职业,每个英雄最多有十几款皮肤,很多皮肤除了和原皮海报不同,还有不同的故事和语音,因此王者荣耀的有关数据是很好的多模态数据。
HoK 多模态toy数据集
这个多模态数据集包括来自手机游戏《王者荣耀》的图像、文本和音频,这是中国最流行的智能手机游戏之一。
王者荣耀故事英雄与技能-toy.xlsx
包含每个英雄详细信息的主要文本数据。 作为一个玩具数据集,我只上传了4个英雄的数据“英雄Q版头像”、“英雄档案图片”和“英雄海报”是包含这些英雄的各种图像的文件夹。
英雄语音和对应台词
是包含每个英雄每种皮肤对应的语音(音频)和台词(文本)的文件夹。 (有些皮肤没有对应的声音,使用默认皮肤的声音和台词。)在线试听蔡文姬原皮语音
王者荣耀 蔡文姬原皮语音
各个英雄的默认皮肤
有一些数字,例如'116_阿轲__迷踪丽影'中的116和'142_安琪拉_东瞰扶胥选自广东通志.mp3'中的142。 这些数字与王者荣耀网站中的英雄索引有关,你可以忽略它,因为我提供了每个英雄的中文名。
我可能会考虑稍后上传更多数据。
简单的文件结构
数据集整理日志
更多详情,请查看王者荣耀问答助手[大模型实战营 结题项目][更新更多数据,计划采用RAG方法进行多模态检索搜索查询] - 知乎
HoK Text 数据集
数据介绍
目前,此文件夹中有两个 processed.jsonl 和 processed2.jsonl 数据集。
数据OriginalData_inChinese.xlsx是生成processed.jsonl和processed2.jsonl的原始数据,
处理代码为text_processing. py 和 text_processing3.py .
它们是 Xtuner 用于微调手机游戏《王者荣耀》英雄属性搜索的 LLM 模型的两个版本的文本数据。
如何使用
详细如何使用这两个数据集,请参考以下两个知乎链接
Beta Was this translation helpful? Give feedback.
All reactions