用于使用机器学习模型的方法、系统和装置,包括编码在计算机存储介质上的计算机程序,所述机器学习模型已经通过强化学习被训练为选择内容项。其中一种所述方法包括:接收表征第一场境的第一数据,在所述第一场境中,可以在呈现环境中将第一内容项呈现给第一用户;以及将所述第一数据作为输入提供给长期参与机器学习模型,所述模型已经通过强化学习被训练为:接收多个输入,并且处理所述多个输入中的每个输入以生成每个输入的相应参与分值,所述相应参与分值表示如果在所述相应场境中呈现了所述相应内容项则在所述呈现环境中向所述相应用户呈现的未来内容项的所述相应用户进行的预测的、根据时间调节的总选择数。
声明:
“使用强化学习来选择内容项” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)