Dialog Corpus:助力中英文聊天机器人训练的语料库汇总
Dialog Corpus项目汇集了多种用于训练中英文聊天机器人的对话语料,包括电影对白、短信息、基本聊天语料等,为开发者提供丰富的资源。
Dialog Corpus是一个GitHub项目,收集了多种用于训练中英文聊天机器人的对话语料。这些语料包括中文电影对白、短信息、基本聊天语料等,涵盖了多种场景和话题。其中,一些语料库如The NUS SMS Corpus被认为是世界最大的公开短消息语料库。此外,项目还提供了自然语言处理相关数据集,包括问答、对话系统和目标导向对话系统等。这些数据集主要使用英文文本,但可以通过机器翻译转换为中文,供中文对话使用。项目地址:[Dialog Corpus](https://github.com/candlewill/Dialog_Corpus)。