你认为下一个 AI 风口在何时?

[复制链接]
fhqitx 发表于 2023-9-7 09:00:09|来自:北京 | 显示全部楼层 |阅读模式
你认为下一个 AI 风口在何时?
全部回复5 显示全部楼层
九命黑猫 发表于 2023-9-7 09:00:50|来自:北京 | 显示全部楼层
如果要预测下一个AI风口来临的时间点,真的没人能预测得准。不过我们可以回顾过去几年AI行业的发展,来稍微帮助我们摸清下AI发展的脉络,当AI风口来到时,我们能成为春江里的鸭。

上次AI像今天这么火热,标志性的事件是2016年AlphaGo战胜李世石。像大众展示了深度学习的能力。从那以后,深度学习开始应用到各行各业,人脸识别,刷脸支付,满足了人们对便捷生活的需求。当然,深度神经网络其实在这之前的前几年就在业内发展得如火如荼了。

在深度学习在计算机视觉方面,有个比赛叫ImageNet ,在 2012 年的竞赛中,Hinton 团队的深度学习模型AlexNet在比赛中,直接比去年的错误率降低了一大截。而从那以后,深度学习模型在视觉方面能力开始爆发,从2015年开始就在ImageNet预测错误率方面做得比人类还低了,而2017年开始这个比赛就不再办了,因为错误率足够低了。




同时在2016年,谷歌推出了Google神经机器翻译系统,比起之前的翻译系统,这套端到端的翻译系统准确率有着大大提升,基本达到了翻译即可用的模型。同时也有很多端公司参与到端的翻译模型开发上来,例如国外的DeepL,国内的科大讯飞等,帮AI翻译的能力逐步提高。

我们从上面的例子可以看到,一个技术在走向大众,成为风口之前,一定是经过一段低调发展的技术积累过程。

现在火热的大模型也是如此。在2022年底开始火爆时,当时也引起AI业内震惊,但因为没有开放给公众使用,因此其能力未被公众所认知。后续业界逐渐对大模型的能力有了新的认知,发现能满足大家对AI创作的需求。因此大模型成为了最新风口。

综上所述,AI风口来临需要有两个因素:新技术架构,满足新的需求。

因此,如果要追求下一个风口,可以关注一些业内在看但还没出现新的爆炸性新闻的但挺多人关注的技术架构。例如Deepmind曾经提到过「强化学习的通往AGI的路」,那么你可以研究一下强化学习最新的进展,如果你是创业者,可以试试用新的技术架构做个产品。

不过就现在这个AI风口来说,机会还是很多的,因为还有很多需求依然没得到完全满足。现在大家都在做大模型,但其实大模型也有很多玩法。


  • 有的公司做大模型的基建,例如大模型需要的芯片,提供大模型需要的云服务架构,提供大模型快速部署服务
  • 有的公司研发大模型本身并创建开源社区,提供了 base model和fine-tune model给大家用,例如Meta的LLAMA
  • 有的公司既研发大模型,在把大模型开放给大家使用的同时,也把大模型融入自家的产品中,例如科大讯飞的星火认知大模型,在自家的产品,例如学习机,翻译机中,都开始应用以提升产品的易用性和功能性。


例如在科大讯飞8月15号的发布会上,讯飞就用上了自己研发的星火认知大模型来升级自家的翻译机产品。在介绍星火认知大模型是怎么帮助用户之前,容我先简单介绍下这个翻译机,好让读者有个总体认知。




对于多数人来说,把外语讲得像母语一样好的还是很少的。但无论是职场人士(例如做外贸的),还是经常跨国旅行的游客,和外国人交流还是经常有的事。讯飞双屏翻译机就是为这种场景而生的。这款产品有两个屏,一个是主屏一个是客屏,当双方面对面说话时,都可以从各自屏幕中看到对方所说内容的翻译。




当然,面对面交流时翻译也仅仅是它的使用场景之一。讯飞翻译机还能给生肉视频(也就是没字幕的外语视频)实时生成字幕,或者在你演讲时把翻译结果实时投屏,方便国内外来宾理解。





可以看到,在应用星火认知大模型前,科大讯飞在AI翻译领域已经积累了很多年了。

不过对于翻译机的目标用户,都有一个共同特点,就是外语水平待提高。因此,如果翻译机除了用来和外国人聊天时翻译,能不能也在平时自己独处时练口语用?这样才能帮助用户应付日常对话的同时,也帮助用户学习和进步。

我们在学习外语时,需要「听说读写」,而最薄弱一环就是「说」。既然现在大模型能力的对话能力这么好了,那么大模型能否充当口语陪练的角色呢?当然可以。这就是为啥在最新发布的讯飞翻译机中新增了【AI口语】功能,其背后就是讯飞星火认知大模型提供的AI能力支持。

通过AI口语功能,用户可以实现AI一对一类人口语对话,比外教还方便,毕竟外教也不是每时每刻都有空。通过讯飞学习机的AI口语功能,你可以随时随地和比外教更能聊5个AI教练在线练口语,英式美式、男声女声,不同风格任意切换,无限制连续对话随时畅聊,跟读练习还能评测发音。目前此功能覆盖了73个场景话题,从日常生活、旅游美食到求职面试、专业知识应有尽有。最重要的是,口语库还会持续更新,从而满足用户日益增长的学习需求。

从上面的介绍大家也感受到,使用翻译机可以充分提高我们在涉外环境中的沟通效率,而增加了大模型的科大讯飞翻译机更是如虎添翼,则可以在增加日常沟通效率的同时,也从根基上帮助用户进步,通过大模型的对话能力,协助用户日常进行口语练习,帮助用户更快的成长。

https://xg.zhihu.com/plugin/9fb8ffa8aa94a3e3c5bf484706844e72?BIZ=ECOMMERCE


看到这里,也许大家会感叹,原来大模型还可以这么玩,满足这种场景的需求啊!同时也会开始思考,大模型的能力还能应用在哪些方面,思考怎么利用大模型给自己的工作和生活提升效能。

因此,目前大模型这波AI风口依然还在,大家在思考下一波风口的同时,也不要忘记发掘这一波风口里还存在的机会。
帝国王子 发表于 2023-9-7 09:01:41|来自:北京 | 显示全部楼层
不论风口在何时,努力学习才可以克服焦虑。免费不求人,这里有一套整理好的 AIGC 教程,里面整理了 B站上优质精华的 AI 视频和教程,分享给大家,你点进去看一下自然明白其含金量:
AIGC来啦<hr/>自从这波 AI 浪潮席卷而来,就有很多圈内圈外的小伙伴在问我有关 AI 的问题,还接到过几个付费咨询,群里每天都在聊各种各样的 AI 话题,但其中很多问题都是日经问题。
这倒不是说大家伸手党,毕竟每个人的学术、技术背景不一样,职业需求也不一样,学习路线自然也因人而异。如同小马过河,我自然也回答不了大家所有的问题,给出最合适的路径。
但毫无疑问,AI 浪潮点燃了大家的焦虑和热情,所有人都不可避免地受到了影响。也就不奇怪为什么会有那么多知识星球甚至价格不菲的视频课了。但在我看来,目前很多付费视频的质量,其实还比不上 B站上免费的视频。
我虽然不反对知识付费,不过很多人在拿着别人的劳动成果卖钱,这就令人鄙弃了。最典型的例子就是 B站 UP 主「秋葉aaaki」制作的 Stable Diffusion 一键启动整合包,我已经看到有很多个小伙伴付费买了别人二改的整合包了。而原作者的态度如下:


「秋葉aaaki」在 B站被称作「赛博佛祖」,免费地提供了很多源码、教程,甚至对新手体验最好的一键启动整合工具。我觉得,Stable Diffusion 在国内的社区生态和推广,秋葉aaaki 大佬绝对有一席地位。
在 B站,这样的「赛博佛祖」「赛博菩萨」「炼丹仙人」还有很多,他们消耗了自己的时间精力,无私地贡献出了开源工具和教程。他们才是真正的传火者。
B站也因他们的存在而成为了「年轻人的学习社区」。我自己在想要系统了解、学习一个新内容时,也会选择先去 B站搜一下有没有相关视频。毕竟,在 B站,我可以找到第一时间的模型测评,技术论文的深度解读,详备完整的使用教程,眼前一黑的整活视频……
<hr/>开篇推荐的播单里,聚合了全站的精华内容,而且还在持续更新中。我们可以根据自己的情况和需求直接找到自己需要看的视频:








<hr/>我顺便从中推荐几个我觉得质量比较高的教程吧:
必刷知识科普

如果你还不知道什么是大语言模型,就从入门必刷开始看起吧:
BV1MY4y1R7EN:【渐构】万字科普GPT4为何会颠覆现有工作流;为何你要关注微软Copilot、文心一言等大模型
BV1Nm4y1z7AT:中文互联网的凋零,正在杀死中国人工智能的未来【为什么我们搞不出ChatGPT】
论文解读

如果你想了解更多的技术原理,你也可在 B站看到亚马逊首席科学家李沐博士的论文解读。
BV1vM4y1U7b5:GPT-4论文精读【论文精读·53】
Stable Diffusion AI 绘画

想安装 Stable Diffusion,认准秋葉aaaki,别花冤枉钱):
BV1iM4y1y7oA【AI绘画】Stable Diffusion整合包v4发布!全新加速 解压即用 防爆显存 三分钟入门AI绘画 ☆可更新 ☆训练 ☆汉化
想自己画出火爆全网的赛博 Coser,看看「勘云工造」的教程吧(火出圈的赛博德狗就是他们画的)


BV1rY4y1D7ZQ:小白也能看得懂的赛博COS教程!配置+炼丹+出图+原理全流程指南
Midjourney 保姆级使用教程

BV1p24y1h7CQ:Midjourney 注册教程教学(保姆级全系列课程合集)免下载,通俗易懂
打工人必备技能

当 AI 遇到 Office 三件套,打工人也要提高生产力!
BV1oj411G7QV:ChatGPT搭配闪击PPT三分钟生成PPT,你只需要输入一个标题
BV19Y411k7aR:ChatGPT帮你办公效率10倍速,Word、Excel、PPT都玩得转!【良数生】
<hr/>总之,我觉得,B站上的大佬们创作的视频的内容质量已经非常高了,再加上播单这样的聚合导航,相当于帮我们在海量的视频里,挑选组合出了一套教程。
大家可以根据自己感兴趣的话题进行学习,相信一定能找到适于自己的学习路径。
AI 浪潮已来,唯有学习可以克服迷茫和焦虑,唯有增长技能才会让我们适应 AI 时代的要求。有这样一套免费不求人的 AI 课程,是幸事,希望大家不要辜负创作者的热情,多看视频,多评论交流,多一键三连,鼓励他们继续创作更多更好的课程。
以上。
qq911 发表于 2023-9-7 09:02:20|来自:北京 | 显示全部楼层
就在现在。Stable Diffusion 和 ChatGPT 一出,连 Google 都非常紧张。
Stable Diffusion 和 ChatGPT 是对人类智力活动迄今为止最大的挑战,因为它不仅仅局限于生产劳动,而是侵入到了需要更多情感和创造力的领域。
当然了,Stable Diffusion 和 ChatGPT 的商业模式是什么,现在很多人还没有头绪,特别是 Stable Diffusion,而 ChatGPT 的商业模式很有可能是取代搜索引擎,成为下一代人类获取知识的最佳方式。
我觉得最有可能掀起暴风雨的,是 ChatGPT,也就是结合深度学习,自然语言处理,知识图谱等等技术的新一代聊天机器人。如果 ChatGPT 还达不到取代 Google 的地步,那么 10 年之内,下一代信息获取技术无论如何都会出现。如果届时 Google 和百度没有跟上,就会被时代淘汰。
hyc1200 发表于 2023-9-7 09:02:35|来自:北京 | 显示全部楼层
AI的真正爆发在于AI何时能像数据库和存储一样成为基础设施。
这意味着:
必须有足够好的基础设施和硬件实现算力民主
必须有足够好的开源数据集供学术届研究过,给小公司超车的机会
AI领域要有足够易用的产品和表达方式出现,Python + 编译目前看是最有机会的。
当然,还有一个很重要的点,AI必须在富矿领域找到应用场景。
个人认为接下来AI的机会会持续分化,短期内模型和数据的垄断无法避免。接下来的机会在于利用大模型的泛化能力找到切合的场景,以及AI基础设施,包括但不限于训练,Serving,存储,语言,编译器。。。
netwolf 发表于 2023-9-7 09:03:14|来自:北京 | 显示全部楼层
-----------------------2022-11的回答-----------------------
就在当下,transformer、自监督、clip、多模态、大模型、大超算,神经渲染,ai科学计算,数据计算。AI做元宇宙,AI做制造业,故事还在继续。
这生产力正在释放,你跟我说结束了?现在是深度学习的第二春,第一代深度学习技术风口已经没戏了,技术风口就在第二代深度学习。但是第一代深度学习技术的商业化还在进行,头部不行了,普惠了,尾部商业化还可以。头部都在烧钱做第二代深度学习技术,等待的就是第二代深度学习商业化。
-----------------------2023-1的回答---------------------------

故事在继续,这几天又有热点了,chatGPT刷屏,openAI yyds。本质上chatGPT也还是AIGC。最近的AIGC简直就是吃了伟brother的男人,夜夜笙歌,天天高潮迭起。1年前看的还是很对的,就因为找不到研究员了哈哈哈哈。
最近的风口当然在比如图像生成、视频生成、3d生成、文本生成这些领域。要说估计很多熟悉第一代深度学习的老人们还在没有缓过神,我个人也惊呼,学不过来了,AI知识爆炸。比如最近1年比较火热的:
框架和平台领域的:hugging face、colossal-ai、pytorch 2.0等,前2个公司商业化方面,都获得了比较好的资本市场表现
AIGC方面:dalle2、imagen、stable diffusion、diffusion系列、chapGPT,当然还有一堆数不过来的AIGC公司,比如midjourney、stability.ai,设计领域的alpaca,市场的jasper,代码的coplit。
就从商业模式上来讲,AIGC除了好玩,确实可以也已经产生了很多2b saas业务。
生成文本的,可以做市场营销,比如澜舟科技,还有写小说的,还有辅助写作的。在自媒体爆发,企业个人都寻求快速高质量写作的需求下,确实也还是有一定可能性。
生成图像的就最看好做设计了。2021年Canva完成2亿美元融资,估值达到400亿美元。Figma完成2亿美元E轮融资,估值达到100亿美元。设计这个看似小众的市场,2个公司估值加起来都3000多亿人民币了。这也是不小的规模了吧,回到题目:这就是风口啊
-----------------------2023-2的回答---------------------------
最近一个月chatGPT热出圈了,我记得去年的时候,这个问题的答案中,还有一个说5年内不会有了,机会过了,也就是看到这个信息,我很不爽,回答了一下,结果11月份chatGPT出来之后,这个风口直接飞出太阳系了。


在这里,我想重新讲讲这个风口:
第一.技术的人看到这个风口,是在3年前,大模型路径出现的时候
第二.行业内看到这个风口是在2022年,在dall、数字人、chatGPT这些能力之后
第三.圈外看到这个风口,预计是在2023~2025

讲讲这里面的机会:
第一:AI to C的机会,2023是元年,以往AI是面向城市管理者提供管理工具,面向企业提供效率,而面向C端的机会,非常少,市场也很小。
第二:AI云的机会,过去AI云虽然能力都构建好了,但是面向G端和B端的业务,数据敏感等问题,一直没有怎么成为主流,但是在这个风口下,会成为绝对主流。
第三:所有应用都值得重做一次
第四:当AI足够强大,我们需要的就不再是文本输入框了,甚至,我们不需要手机这样形态的产品(有点疯狂)。交互方式需要重大升级
这个称为风口的,可能是AI纪元,为什么这么称呼呢,因为在AI纪元中,AI全面碾压人类。AI也可能已经有了意识
AI已经有了意识!

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则