AI字幕慢半拍 【不知道大】家笑什么 新:方法!!让同传性能直逼离线翻译

2025-07-22 00:19:24      来源:晋城新闻网

本文第一作者是徐婷,是香港中文大学博士生,主要研究兴趣是大模型的后训练;通讯作者分别是黄志超和程善伯,来自字节跳动Seed团队。

你是否经历过这样的场景:观看一场激动人心的全球发布会,AI字幕却总是慢半拍,等你看到翻译,台上的梗已经冷掉了。

或者,在跨国视频会议上,机器翻译的质量时好时坏,前言不搭后语,让人啼笑皆非。

这就是同声传译(SimultaneousMachineTranslation,SiMT)领域一直以来的核心技术挑战:“质量-延迟”权衡问题(Quality-LatencyTrade-off)。

现在,这些问题迎来了新的解决方案。来自香港中文大学、字节跳动Seed和斯坦福大学的研究团队联手提出了一种面向同声传译的序贯策略优化框架(SequentialPolicyOptimizationforSimultaneousMachineTranslation,SeqPO-SiMT)。

该方法将同传任务巧妙地建模为序贯决策过程,通过优化完整的决策序列,显著提升了翻译质量,同时有效控制了延迟,其性能直逼、甚至在某些方面超越了同等大小的离线翻译模型。

论文标题:SeqPO-SiMT:SequentialPolicyOptimizationforSimultaneousMachineTranslation

研究背景

同声传译的核心在于机器需要动态地决定“继续听”(READ)还是“开始说”(WRITE)。这个决策直接影响最终的翻译效果。例如,当模型接收到英文单词“bark”时,它面临一个困境:如果立即翻译,可能会译为“狗叫”,但若后文出现“ofthetree”,则正确翻译应为“树皮”。

传统的同传方法,它每一步决策(是继续听,还是开始翻译)都是孤立的。它可能会因为眼前的“小利”(比如翻译出一个词)而牺牲掉全局的“大利”(整个句子的流畅度和准确性)。

核心方法

针对这一难点,该论文提出了SeqPO-SiMT框架。其核心思想是将同声传译任务建模为一个序贯决策问题,综合评估整个翻译流程的翻译质量和延迟,并对整个决策序贯进行端到端的优化。

该方法的主要特点是:它不再孤立地评估每一步决策的好坏,而是将一整句话的翻译过程(即一个完整的决策序贯)视为一个整体,更符合人类对同传的评估过程。

其中,λ是一个超参数,用于权衡质量与延迟的重要性。

实验结果与分析

为了验证方法的有效性,研究者们在多个公开的英汉互译测试集上进行了实验,并与多种现有的同传模型进行了对比。实验结果显示:在低延迟水平下,SeqPO-SiMT框架生成的译文质量相较于基线模型有明显提升。

本文将SeqPO-SiMT的实时同传结果与多个高性能模型的离线翻译结果进行对比。结果显示,SeqPO-SiMT的翻译质量不仅优于监督微调(SFT)的离线模型及LLaMA-3-8B,其表现甚至能媲美乃至超越Qwen-2.5-7B的离线翻译水平。这表明该方法在70亿参数(7B)规模上实现了业界顶尖(SoTA)的性能。

总结与讨论

总的来说,SeqPO-SiMT这项工作的主要贡献在于,为解决同声传译中的质量-延迟权衡问题提供了一个新的视角。它强调了对决策“序贯”进行整体优化的重要性。该研究提出的方法,对于需要进行实时、连续决策的自然语言处理任务具有一定的参考意义,并为未来开发更高效、更智能的同声传译系统提供了有价值的探索。

  钟自然出生于1962年8月,安徽桐城人,曾在原地质矿产部和原国土资源部工作多年,2014年任原国土资源部党组成员,中国地质调查局局长、党组书记。

责编:刘青虹编辑

在二手市场价格暴跌

  反观乌鲁木齐,偏居西北一隅的位置,为向西开放提供了便利。李瀚明指出,与乌鲁木齐类似的其实是哈萨克斯坦阿拉木图,两座城市都位于亚欧航路的中间点。利用空客A321XLR这样的远程窄体机,阿拉木图成功开航伦敦。在国内,乌鲁木齐是唯一一个用窄体机能直飞欧洲的航空枢纽。

宁波东方理工大学学费每学年万

  6月21日,中央纪委国家监委发布消息,自然资源部原党组成员,中国地质调查局原党组书记、局长钟自然被开除党籍,涉嫌受贿、故意泄露国家秘密犯罪问题移送检察机关依法审查起诉。

临江仙结局

  北京、上海、广州是3大全方位门户复合型功能的国际航空枢纽,成都、深圳、重庆、昆明、西安、乌鲁木齐、哈尔滨是7大区位门户复合型功能的国际航空枢纽。

美媒曝哈梅内伊正藏身地堡避险

  第一,台内务问题难解。近期“在野”党主导的台立法机构改革行动,造成“朝野”关系紧张、立法机构议事冲突频传;台行政机构提复议案让行政和立法冲突浮上台面,政党纷纷走上街头诉诸群众,政局动荡、人心不安。

镖人

  张先生说,因为网球人群的增多,网球运动关联经济也更加活跃。球衣、球袜、球包以及打球的各种装备和周边产品,包括网球训练课都在走俏。比赛数量的增加,更是提升了各地运动场馆的利用率。

仙逆

  世界经济论坛官网17日刊文称,中国已成为全球最大的电动汽车市场,中国车企生产的电动汽车占全球电动汽车总产量的一半以上。而在这一市场上,墨菲和其他分析师认为,美国车企当下很难抵挡中国自主品牌的实力。墨菲说,消费者现在对中国自主品牌的“忠诚度”很强,尤其是在美国对中国电动汽车征收超过100%的关税后,这种“忠诚度”可能会变得更加强烈。/p>

北大退学上清华男生回应占名额质疑

  最近两起企业补税事件引起市场关注。一是湖北枝江酒业股份有限公司被要求补税8500万元,因这笔税款被追溯至1994年,使得税务“倒查30年”成为舆论焦点。二是宁波博汇化工科技股份有限公司3月份收到当地税务要求补税5亿元的通知,最近企业宣布停产。上述两起事件,引起了一些企业人士的担忧。这些担忧包括是否存在全国性查税,不少企业担忧如果倒查多年需要补税,这对于经营困难的当下无疑是“雪上加霜”。跟多位省级、市级税务人士交流得知,目前并没有全国性查税部署。一些地方根据当地税收大数据风险提示等对个别企业查税,是日常工作,也是税务部门正常履职。毕竟税务部门主要负责税收、社会保险费和有关非税收入的征收管理,发现偷逃税、少缴税行为,理应依法制止,否则就是渎职。(第一财经)/p>

伊朗大使馆发布亮剑视频

  尽管中国并未采取集中清缴清欠税收等行动,但随着税收大数据广泛应用,网状、系统性税收风险分析取代了此前个人经验点对点分析,税收征管力度事实上在不断强化,税收征收率在不断提高。以前企业偷漏税可能不容易被发现,但近些年通过税收大数据,税务部门会收到企业风险提示,并跟企业确认,不少企业需要依法补缴税款。