NLP的基础理论创新已经十分困难了(此处指模型结构创新)。但是做NLP商业应用的朋友,恭喜你们,你的春天来了!
NLP落地到每一个应用场景,需要大量NLP工程师做性能调优,针对这个应用场景做一些适应性的调整。
众所周知,在基础理论上做创新十分困难。但是一项技术的商业化落地,机会还是很多的。我们未来将会处于数十年的技术展开期,NLP大模型的技术将会渗透到 教育培训、医疗保健咨询、法律顾问咨询、家庭教育咨询、心理问题咨询与疏导、智能客服等许多个领域。
为在这些细分领域,将技术性能调整优化到最优,行业将会需要大量的工程师、产品经理、商业化人员。NLP大模型技术将会深刻改造我们传统行业。
正如www(word wide web)是由Tim Berners-Lee蒂姆”·伯纳·李1989年提出的雏形,1990年他成功通过Internet实现了HTTP代理与服务器的第一次通讯。
但是通过www赚到最多钱的人,并不是Tim Berners-Lee。通过www赚到大钱的是杰夫·贝索斯(创立亚马逊电商),是马云(淘宝网),是扎克伯格(Facebook)。
通过www新技术赚钱最多的人,并不是第一个提出www的人,而是那些early-adopter(早期使用者),是那些成功将技术商业化的人,是那些成功将技术找到合适场景并不断调优的人。
你不必懂的如何在底层原理上做创新(不必懂的如何优化模型结构),你所最应该关注的是如何将技术更好解决商业世界的问题并创造能力。
诚然,中国并不是一个擅长提出原创性创新的国家。这些突破性的技术ChatGPT无一不是美国、英国、法国、德国、加拿大的团队率先提出的。但是这些技术中有不少在中国被充分利用和技术调优。
推荐系统不是中国人率先提出的吧?但是抖音、TikTok放到全球都是杀手级应用,风靡全球。还有小红书,在中国台湾最近不也是很多。
我们中国人的优势就是把已有的技术用到机智,去把各项技术做系统集成。
期待在ChatGPT时代,中国可以诞生新时代的TikTok、小红书、Shein。
<hr/>最下面那一部分是本人2023-05-10 17:01 倾倒的情绪垃圾。上面那一部分是我2023年6月13日18:19把整篇文章改“光明”以后的产物。
悲观者也许是对的,但是乐观者才拥有未来!
正如马斯克所说:
“我宁愿选择乐观 哪怕那是错的
I’d rather be optimistic and wrong
也不想选择悲观 即使那是对的
Than pessimistic and right
至少站在乐观的一边
At least or on that side
对未来一定要乐观
Be optimistic about the future
悲观没有任何意义
There’s no point in being pessimistic
只能给你带来更多的负能量
It’s just too negative
要知道 即使我们作为人类永远存在
Even if we just sort of existed as humans forever
但数亿年后 宇宙终将走向热寂
We still eventually be like the heat death of the universe
最终一切都会结束的
Eventually it’s gonna end
只是时间早晚的问题
It’s just a session of when
生命的意义就是去体验这一段旅程
So it really is all about the journey
所以去享受这个过程把
Enjoy the journey
我的目标是
My goal is like
去做对世界有用的事情
Try to do useful things
让未来变得激动人心
Make the future exciting
每天早上醒来
Waking up in the morning
都对新的一天充满期待
You look forward to the day
都能去畅想未来
Look forward to the future
未来我们将在太空中延续着人类文明
I think the future where we are spacefaring civilizaiton
在星际间遨游
And out there among the stars
这是多么令人兴奋的未来
This is very exciting ”
<hr/><hr/>下面这一部分是本人2023-05-10 17:01 倾倒的情绪垃圾。各位当做反面典型来批判吧。太丧了,完全就是个losser、个怨妇在抱怨。太逊了,引以为戒。
<hr/>把NLP丢进垃圾桶里去,已经没机会了。未来就是3-5家 OpenAI,谷歌,百度,商汤,字节这几家公司垄断,然后整个互联网二三线大厂调用这几家公司的API。
NLP已经没什么好研究了,NLP整个领域已经过了学术界研究的阶段,已经进入做产品、工业界落地的阶段。你还在学校搞研究,你很可笑哎!
你去读读InstructGPT这篇文章(ChatGPT原理这篇文章基本写清楚了)
Training language models to follow instructions with human feedback
https://arxiv.org/pdf/2203.02155.pdf
原理上ChatGPT没什么复杂的,从算法原理上说没什么创新。
之所以效果这么好,是因为人家OpenAI有一万块A100的GPU的设备做训练,人家有45TB的优质文本数据用于训练。
你在学术界,你做个啥?你做个屁啊!
要设备,哪个大学能出8个亿人民币给你买一万张GPU显卡,只为出两篇文章?
你知道ChatGPT训练一次,光电费就要460万美元吗?你们学校付的这笔钱吗?这仅仅是训练一次哦。
注意我上面说的这句话,“从算法原理和模型结构上来说”没什么创新!
啥意思啊?模型性能的提升,关键在于算力和数据,模型结构的优化,在其中起的作用已经进入瓶颈期了。
但是学术界的最多的时间都用在了优化和提出新的的模型结构。
所以,你回答我,你留在学术界搞NLP,还有没有意义?
当然没有意义了!
能去企业做点啥,就去做点啥吧。找找实习,才是你现阶段的重点!
与其和这帮“坏老头”在大学里瞎鼓捣,在大学里通过“手淫”来获得high的体验,你还不如快点找家IT公司,打打工,看看人家企业真正需要什么东西,记录点实战经验。也思考思考,我究竟研究什么有价值?我对什么感兴趣?我有能力解决什么问题?
然后你再去考虑这个硕士我是不是要继续读下去?读下去研究点啥,是真的对以后工作挣钱是有帮助的?
你得明白 NLP领域已经进入工业界主导的阶段了。人家财大气粗的巨头,要数据有数据,都是现成的;要设备,有的是。
以后NLP领域出论文也大概率被OpenAI、谷歌、百度这几家巨头掌握。
你要是真想研究NLP出成果,那就进入OpenAI、谷歌、百度里面工作,
离开这三五家垄断性巨头,谈NLP的学术创新。你简直搞笑!
把NLP研究丢进垃圾桶吧!
就你们学校这三瓜两枣,丢进大模型这个领域里,连个水花都打不出来来。
在学术界、大学里搞NLP这条路已经被封死。
你去问问在大厂里面工作的那些人,哪家公司需要你们学术界做出来的那些“自娱自乐”的“手淫”式创新?都是一堆臭狗屎,一帮教授在那里high的不得了。纯粹浪费博士生们的青春年华!
别自欺欺人了,醒醒,现在啥经济形式啊?整天搞这些假模假式的“伪创新”,“为赋新词,强说愁”,你们无不无聊?
好好学开发,趁现在开发还能有岗位,赶快去找工作。再晚几年,随着个Github Copiot和CodeX这些基于GPT-4的代码提示工具的发展,软件开发用工量将会越来越少。
硕士期间能实习就去实习 |