首先同意有的回答提到的,chatgpt之前学术界和工业界之间已经存在比较大的gap,学术界很多论文热衷于在开源数据集上实现新的sota,而工业界很多应用仍然还是以Bert的魔改版本为主来应用到NLP的各种业务中,虽然NLP各个细分任务都有新的工作出来,但也可以说Bert出来之后到chatgpt出现,NLP没有太大的实质进展。从工业界来说,对比cv,nlp的落地应用很尴尬,因为nlp提供的能力很难满足很多应用场景的需求,就比如说chatbot,端到端的学术研究很多,但是落地的一个没有,因为可控性太差,而且常识推理能力也比较弱,后处理兜底的工作量还不如用rule base。
另外企业非常关心成本问题,虽然使用bert finetune需要标的数据量,几千条也能做特定领域任务,但是几千条也是钱,而且再换个场景,还得继续标数据。prompt tuning出来后,few shot leaening开始有一些应用场景,但效果还难以满足很多业务需求,更多还是停留在研究领域。
ChatGPT的出现,使得NLP的能力直接提升了几个数量级,主要体现在几个维度:1.节省成本:输入几个示例,不需要要finetune,就能得到细分任务的可用结果;2.涌现出推理能力:我认为这个能力非常重要,也是chatgpt明显区别于以往chatbot的标志,它能做鸡兔同笼,能写代码,这种能力是之前很难想象的,就是chatbot居然开始会“思考”了;3.强大的上下文能力和语义理解能力,之前的chatbot聊几句就聊飞了,而chatgpt给你感觉一直在围绕你的所想在聊;4.多任务处理能力:以往的生成模型,可能写诗很厉害,但就不能写代码,可能创作现代文厉害,就不能创作古文。而chatgpt属于全能选手,能力覆盖领域远远超过了之前的模型。
以上,集这么多优点于一身的chatgpt,对NLP领域带来的不仅仅是细分领域任务的极大挑战,还有更重要的是,在大模型越发加剧学术界和工业界差距的同时,NLP领域应该如何面对这种变革,也对自身的研究思路进行变革,利用大模型的能力,更小的平替模型?显然这些还都不是答案,拥抱变化吧!NLP的大航海时代说不定才刚刚开始! |