AI 中的 Question-Answering 任务,如何将大段文本制作成训练数据呢?

查看 65|回复 2
作者:KevinQi   
在 Question-Answering 的训练任务中,训练任务通常是结构化的数据,大概是下文这种。
[td]Context[/td]
[td]Question[/td]
[td]Answer[/td]
[td]Answer-start[/td]
上下文
问题
回答
回答的开始字符位置
现在我有一大段或者很多纯文字数据,如何将这些制作成训练数据集呢?

训练, 上下文, 任务, 数据

TimePPT   
纯文本是指原始对话内容还是指纯的知识文档?
前者有角色就能分,后者要做文档 QA 抽取
KevinQi
OP
  
@TimePPT 谢谢,纯的知识文档,大多是 excel ,还有 pdf 。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部