首页 资讯 财经 科技 汽车 房产 教育 关注 图片 数码 导购 手机版

DeepMind发布提高翻译质量的算法ReST

来源:鞭牛士 发布时间:2023-08-29 22:20:08


(相关资料图)

谷歌DeepMind于8月21日发布论文,提出一种使LLM与人类偏好对齐更简单的算法ReST(Reinforced Self-Training)。不同于RLHF(基于人类反馈的强化学习)使用人类反馈改进语言模型,ReST通过生成和使用离线数据进行训练,从而使得LLM与人类偏好保持一致。研究团队表示,虽然ReST可用于所有生成任务,但本文的重点是机器翻译。研究者在机器翻译任务上进行了实验,测试基准包括IWSLT 2014、WMT 2020和Web Domain。结果表明,ReST可以极大地提高翻译质量。

关键词:

责任编辑:FG003

上一篇: 莱亚(关于莱亚简述)

下一篇: 最后一页

2元女装批发

网站首页| 关于我们 | 联系我们| 合作伙伴 | 广告投放 | 招贤纳士| 增值服务| 使用条款 | 用户反馈

服务电话:180151838 QQ客服: 点击这里给我发送QQ消息  E-mail: 3 392 950@qq.com

声明: 迅捷汽车网部分文章来自互联网,如侵犯了您的版权请告之,我站将第一时间内删除 !
未经迅捷汽车网许可,禁止建立迅捷汽车网镜像,禁止抄袭迅捷汽车网数据。欢迎许可转载,注明出处!
Copyright©2010 - 2018 auto.xjche365.com All rights reserved 迅捷汽车网 版权所有 浙ICP备2022016517号-9
版权所有 抄袭必究