本发明提供了基于强化学习的对话式导诊方法,包括:利用用户编码模块记录用户在t时刻的输入xt,并通过卷积神经网络学习到用户输入的编码ut;通过循环神经网络,基于编码ut及上一时刻系统的隐藏状态ht‑1,得到核心网络模块的输出ot及当前的隐藏状态ht,在分类预测模块,输出ot通过全连接的前向网络,输出分类评定ct;在提问策略模块,基于输出ot,通过全连接的前向网络得到预定义命名实体识NER类别上的概率分布qt,基于累计的NER记录表和提问模板,进行交互对话,在达到预定的T轮交互后,退出交互,并以最后一次ct的结果作为最终的科室推荐结果。本发明可及时调整系统状态,向用户提供可靠的科室推荐结果,并保存收集到用户关键信息,供下游应用调用。
声明:
“基于强化学习的对话式导诊方法、装置及存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)