<汇港通讯> 内媒消息,昨日阿里通义实验室开源R1-Omni模型,即业界首个将具有可验证奖励的强化学习(RLVR)应用於全能多模态大语言模型。研究人员利用RLVR对开源Omni模型HumanOmni-0.5B进行优化,在推理能力、情绪辨识准确度和泛化能力三个关键方面显著提高了其效能。 R1-Omni能够更清楚地理解视觉和听觉讯息如何促进情绪识别,能够明确地展示哪些模态讯息对特定情绪的判断起到了关键作用。 (CW)