您好,欢迎来到锐游网。
搜索
您的当前位置:首页近几年NLP比较promising的方法

近几年NLP比较promising的方法

来源:锐游网

Contrastive Learning

对比学习的想法是,把不同类别的样本在特征空间推开,而让相似的样本距离更近,从而获得更好的样本表示

NLP中一个非常经典的是danqi女神的SimCSE:

思想是构造正负样本对进行优化,在CV那边负样本非常容易构造,而NLP因为token的离散性并没有那么容易构造,而SimCSE发现仅仅使用dropout构造出的负样本就能达到很好的效果

对比学习是非常强大的无监督学习方法,一般来说负样本越多越好,MoCo引入了动量库的概念,SimCLR使用了多组样本对比,CLIP把对比学习引入到多模态,并在预测的时候使用prmopt来抽取特征,首次使用无监督方法预训练多模态模型,效果炸裂,开启了多模态预训练模型的时代

Prompt Learning

Prompt在这里的中文翻译是 提示

Prompt的思想是用上下文来提示模型预测输出,例如:

This is a [Mask] man,让模型来填空,

不同的prompt对模型性能的影响不小,比如现在的ChatGPT已经引流了Prompt Engineering的火热(?)

顺便提一下,也有一些工作用生成的Prompt来提高模型性能(魔改),对Prompt向量进行调整实际上就是fine-tune,暂时还没有真的有用的

Instruction Tuning

Instruction跟prompt有点相似,他们的区别就是,prompt是让模型做填空,而instruction tuning是让模型做选择题,一般来说选择题是要比填空更简单的(判别 vs. 生成)

例如:
What is the sentiment of this sentence?[Mask] A. happy,B. sad C. nervous

ChatGPT就使用了instruction tuning的方法

Chain-of-Thought

思维链的思想是把复杂的任务拆分成不同的小问,诱导模型一步一步推导出正确的回答,也就是一种in-context learning?

魔法句子:“Let’s do it step by step”,“so the anwser is”,使用这两句话就能让大模型的推导能力变强

所以说LLM就像女人一样,都是需要哄哄的嘛

In-Context Learning

最近突然流行一个词 - Emergent ability,中文意思是涌现能力,说的是模型大到一定程度后,会涌现出小模型不具备的能力,比如In-Context Learning,通过上下文学习的能力

比如few-shot?

Raki的猜测:LLM具有强大的上下文理解能力,通过人给出的prompt推断出更加准确的问题意义与表示,就像你告诉小孩,这是黑猫那是白猫,然后他就能分别出黑狗和白狗一样

RLHF (Reinforcement Learning from Human Feedback)

名震天下的ChatGPT的核心技术就是RLHF,据Open AI说GPT-4很大程度就是靠他取得大幅效果提升的,核心是通过人类的反馈对LLM生成的回答进行打分排序,让模型拥有生成更符合人们偏好的回答的倾向

分别献上GPT-3.5

GPT-4自己对这个问题的回答

Adversarial Training

最后提一嘴对抗训练Adversarial Training,是一种能使模型更加robust的训练trick,在NLP任务中,对抗训练的角色不再是为了防御基于梯度的恶意攻击,反而更多的是作为一种regularization,提高模型的泛化能力,属于现在竞赛刷榜基本操作

Fast Gradient Sign Method(FGSM)

经典且朴素的方法,对着梯度加扰动


Fast Gradient Method(FGM)

对梯度加上Scale,果然万物都不能太绝对

Projected Gradient Descent(PGD)

多走几步,会更好

一般来说竞赛中FGM看起来是最常用的,比较robust,其他复杂的对抗训练trick就不过多介绍了,我是大道至简的忠实信徒,就像GPT3,GPT4也只是使用了很simple的自回归模型一样。

Summarization

看起来promising的方向已经好像也做干了

我们的东西被顶级机构做完了?winner takes all!

现在NLP community的首要任务是寻找新的方向保住community?

转行了转行了(orz Open AI)

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- ryyc.cn 版权所有 湘ICP备2023022495号-3

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务