马斯克x.AI平台即将发布的Grōk AI大模型有哪些值得关注的 ...

[复制链接]
moi7889 发表于 2023-11-6 15:53:30|来自:中国 | 显示全部楼层 |阅读模式
11月5日,社交媒体平台X的AI团队发布公告,正式推出Grok-1大语言模型。
xAI团队介绍,Grok 在通过X 平台实时了解世界方面具有独特而根本的优势。Grok 能够回答其他人工智能系统拒绝回答的尖锐问题。并表示,Grok 的设计初衷是通过智慧和一些叛逆的倾向来回答问题。但如果您不喜欢幽默,请不要使用它。
除此之外,xAI团队人员还补充道,“Grok 依旧是一个非常早期的测试版产品,我们在 2 个月的训练中所能做到的最好的产品,所以期望它在您的帮助下每周都能快速改进。”
全部回复5 显示全部楼层
九命黑猫 发表于 2023-11-6 15:53:54|来自:中国 | 显示全部楼层
两个月训出330亿参数大模型,以《银河系漫游指南》为蓝本,还有一股子马斯克式幽默。
Grok的一大亮点,就是能从推特实时获取信息。优质数据已成全球的稀缺资源,马斯克去年豪掷440亿美元收购推特后搞得鸡飞狗跳大半年,原来是等在这儿呢。
Grok深深体现出马斯克一直推崇的xAI公司的宗旨——一个探求「最大真理」和「宇宙本质」的AI,一个公正的AI。




就在昨天,xAI的一位创始成员Toby Pohlen放出了Grok的UI界面——
Grok可以同时进行多任务处理,并排运行多个会话,还可以在多对话之间随意切换。




期间,我们可以对对话进行分支,来更好地探索Grok的回复。




回复树可以让我们在各个分支之间来回切换。还有一些/commands命令可以让我们减少点击次数。




我们可以在Markdown编辑器中打开Grok的回复,保存后继续对话。它可以和分支以及分支树协同工作。




同时,我们也可以在VS Code编辑器中,打开所有生成的代码片段。




另外,跟自己的幽默人设呼应的是,点击Grok图标上彩蛋,就可以把Grok转换为幽默模式了。




对此,另一位创始人Greg Yang表示:毫无疑问,这是我用过最好的聊天用户界面。


现在,由于候补名单的申请太过火爆,Grok的服务器直接宕机了。




6个月前刚签联名信:暂停超强AI研究6个月

有趣的是,马斯克此前也是「AI末日论」的强力拥趸,曾和Bengio、苹果联合创始人Steve Wozniak、Stability AI CEO、马库斯等人签署了一封要求暂停发展比GPT-4更先进AI 6个月的公开信。
而眼下,AI大佬们正热火朝天地激辩着AI监管必要性的议题,马斯克却已经在这当口悄悄训练出Grok了,甚至还赶在OpenAI开发者大会前夕放出大招。
看来,大家都是心照不宣啊。




当然,马斯克总能找到办法自圆其说,xAI的官博这样解释道——
我们相信,AI智能具有巨大的潜力,可以为社会贡献重要的科学和经济价值,因此我们将努力制定可靠的保障措施,防止灾难性的恶意使用。我们会尽最大努力,确保AI始终是一股向善的力量。




甚至,马斯克还放出这样的豪言——未来特斯拉的算力,都会用于大模型的推理。即使有机器人驾驶出租车,汽车依然每周只会运行1/3时间,其余时间的算力,都会用来做SETI之类的分布式推理运算。
这样,特斯拉将拥有地球上最多的模型推理算力!
马斯克,果然在下一盘大棋。




330亿参数,8K上下文,Grok-1碾压ChatGPT

仅仅四个月,Grok就经过多次迭代横空出世。创始人团队的效率高得惊人。
创始人之一Greg Yang感慨道:「当一小群积极进取的世界级人才朝着同一个方向前进,挥出的拳头就远远超出了自身的重量。只有天空,只有宇宙,才是我们的极限!让我们从每一瓦的电量中,让计算得到最大优化!」




Grok意为「凭直觉深刻了解」,是美国科幻作家罗伯特·海因莱因在1961年出版的科幻小说《异乡异客》中创造的词汇。
xAI对于Grok的官方介绍是这样的——
Grok是一个以《银河系漫游指南》为蓝本的 AI,因此几乎可以回答任何事情,甚至还能建议我们该问什么问题。
Grok回答问题时,会不时抖个机灵,甚至比较叛逆,不喜欢幽默的人请远离。
Grok的独特优势就在于,它可以通过X平台(也即推特)实时了解世界上发生的各种事情。而且,很多AI会拒绝的敏感问题,它都不会拒绝。
现在,Grok还是一个早期的测试版产品,这已经是2个月的训练后能达到的最好程度了。因此,xAI希望能在用户的帮助下,让它每周都能迅速改进。

语调阴阳怪气,几句一爆梗,Grok确实是有点子幽默在身上的。
哦,我亲爱的人类,我有好消息要告诉你!我们的朋友Sam Bankman-Fried被认定所有罪名成立。你能相信吗?陪审团只用了8个小时就弄清了所谓的世界上最聪明、最优秀的风险投资人多年来都无法弄清的事实:他犯下了普通的欺诈罪。这真是一次疯狂的旅程,不是吗?




2个月,训练出Grok-1
Grok背后的核心引擎便是Grok-1。
这是用时4个月研发的大模型,并经过了多次迭代升级。
据了解,Grok训练时间仅仅2个月。




在宣布xAI成立之后,研究团队最先训练了一个330亿参数的原型大模型——Grok-0。
早期模型Grok-0在标准的LM基准测试中,性能与LLaMA 2(70B)接近,但只使用了一半的训练资源。
过去的2个月中,xAI大模型在推理和编码方面取得了重大改进,并迭代到了Grok-1。
同样,Grok-1是一个基于Transformer的自回归模型,在Grok-0模型基础上进行了微调,上下文长度为8192。
训练数据来自互联网(截止到2023年第三季度),以及AI导师提供的数据。
能力大幅提升的Grok-1刷新了多项SOTA,在HumanEval编码任务中达到了63.2%,在MMLU上达到73%。




如下是xAI研究团队对Grok-1在衡量数学和推理能力的标准机器学习基准进行了一系列评估。
- GSM8k:中学数学单词问题,使用思维链提示。
- MMLU:多学科多项选择题,提供了5次上下文示例。
- HumanEval:Python代码完成任务,pass@1评估为零样本。
- MATH:用LaTeX编写的初中和高中数学问题,用固定的4次示例作为提示。




在这些基准测试中,Grok-1展现出强大的能力,超越了ChatGPT-3.5、Inflection-1等模型。
实际上,只有像GPT-4这样使用大量训练数据和计算资源进行训练的模型,才能超越Grok-1。
这展现了研究人员在xAI项目中以异常高效的方式,训练LLM方面正在取得的快速进步。
另外,刚刚提到的数学基准测试,模型可能通过网络访问到,所以结果可能受到影响。
为了更公平地评估,研究人员手动收集了「2023年匈牙利全国高中数学期末考试」数据集,以测试Grok-1、 Claude-2和GPT-4的能力。
结果发现,Grok以C(59%) 通过了考试,而 Claude-2 获得了相同的成绩C (55%),GPT-4 以 68% 的成绩获得了B。


所有模型均在温度为0.1和相同提示下进行评估。必须指出的是,研究人员没有为这次评估做出任何调整。
这样,可以更好地反映模型在真实情况下的能力,评估模型在没经过调优的新数据上的泛化能力。
如下,研究人员在模型卡中提供了Grok-1重要技术细节的摘要。
就局限性来看,Grok-1不具备独立搜索网络的能力。在Grok中部署时,搜索工具和数据库增强了模型的功能和真实性。尽管可以访问外部信息源,但模型仍会产生幻觉。


xAI工程设计:不是Python,是Rust

在深度学习研究的前沿,可靠的基础设施和数据集、学习算法一样重要。
为了创建Grok,xAI构建了一个基于Kubernetes、Rust和JAX的自定义训练和推理堆栈。
大语言模型的训练就像一列全速前进的货运火车,如果一节车厢脱轨,整列火车都会被拖下轨道,很难再次纠正方向。
GPU可能失败的方式有很多种:制造缺陷、连接松动、配置错误、内存芯片退化、偶尔的随机位翻转等等。
在训练时,xAI连续数月在数以万计的GPU之间同步计算,由于规模庞大,这些故障频繁出现。
为了克服这些挑战,他们便采用了一套定制的「分布式系统」,确保立即识别并自动处理每种类型的故障。
在xAI,研究人员把最大化每瓦特计算效率作为工作重点。
在过去的几个月里,基础设施使团队最小化了停机时间,即使硬件不可靠,也能保持较高的模型计算利用率 (MFU)。
当前,Rust已被证明是,构建可扩展、可靠、可维护的基础设施的理想选择。它提供了高性能、丰富的生态系统,并预防分布式系统中的大多数错误。




对于像xAI这样规模较小的团队来说,基础设施的可靠性至关重要,否则维护会影响创新。
Rust可以让代码修改和重构更加可靠,编写的程序可以在少量监管下稳定运行数月。
xAI团队表示,「我们正在为模型能力的下一次飞跃做准备,这将需要可靠地协调数以万计的加速器上的训练运行,需要运行互联网规模的数据pipeline,并在Grok中构建新的功能和工具。
在这里,xAI为自己团队招募做了一波宣传。




就技术要求这一栏,需要程序员们能够具备能力包括:
Rust
因为xAI所有的后端服务和所有数据处理都是在Rust中实现的。而且团队还是Rust语言的忠实拥护者,并相信它是高效、安全和可扩展应用程序的最佳选择。它还提供了与Python的轻松互操作性。
JAX和XLA
xAI模型的神经网络是在JAX中实现的,并且xAI有许多自定义XLA操作来提高它们的效率。
Triton和CUDA
为了充分利用计算资源,大规模运行大型神经网络,同时最大限度地提高计算效率至关重要。因此,xAI定期在Triton或原始C++ CUDA中编写定制内核。
TypeScript, React & Angular
xAI前端代码完全是使用React或Angular在TypeScript中编写的,后端通信通过gRPC-web API实现类型安全。




对于这个招聘要求,业内人士总结道——
具有高MFU的单GPU,是高生产力的人;具有高MFU的单节点,是高效的小团队;具有高MFU的数千个GPU集群,是高生产率的公司。
现在,扩展有用产出/人的难度,从一个人增加到100K,而xAI正在寻找的,是10倍的工程师......




xAI的研究方向

虽然Grok可以访问搜索工具和实时信息,但跟所有LLM一样,Grok仍然无法避免大模型的通病——幻觉问题。
xAI认为,解决当前系统局限性最重要的方向,就是实现可靠的推理。
在xAI看来,以下是几个最有前途的研究方向——
通过工具辅助实现可扩展的监督
可能Grok还很难提供一致且准确的反馈,尤其是处理长代码或复杂推理时。
这种情况下,可以让AI通过查找不同来源的参考资料、使用外部工具验证中间步骤、寻求人类反馈等,来协助进行可扩展的监督。
集成形式验证,确保安全性、可靠性和接地
xAI计划更准确、更可验证的情况下发展AI的推理技能。这样就能在没有人类反馈或现实世界交互的情况下,评估系统。
采用这种方法最直接的目标,就是保证代码的准确性,特别是在形式上验证AI的安全性。




长上下文理解和检索
一个能在特定环境中有效地发现有用知识的模型,是产生真正智能系统的核心。xAI正在致力于研究如何让AI在需要时去发现和检索信息。
对抗性鲁棒性
许多示例表明,无论是训练期间还是使用期间,AI系统中的漏洞都会导致它们犯严重的错误。而这些漏洞,就是深度学习模型长期存在的弱点。
xAI致力于提高LLM、奖励模型和监控系统的鲁棒性。
多模态功能
目前Grok还没有配备视觉和听觉功能,xAI会致力于发展它的多模态功能,实现更广泛的应用。
参考资料:
https://x.ai/
j15023105c 发表于 2023-11-6 15:54:12|来自:中国 | 显示全部楼层
这波截胡属实精彩。

最近几天,各家大模型企业及机构可以说是箭在弦上,磨刀霍霍。为了狙击Open AI开发者大会的大招,马斯克xAI 甚至提前发布了他们的LLM以及与之搭配的聊天产品Grōk。
这个仅仅花费了2个月训练出来的330亿参数大模型的发布可以说是相当炸裂,甚至被许多网友直接称呼为“ChatGPT的劲敌”。

而其中Grōk最大的亮点,就在于它不仅能够从推特这一平台实时获取信息,而且还可以通过X平台来进行实时访问,从而回答我们提出的任何问题~
关键更特别的是,它甚至会智能建议我们应该提问什么问题以及怎样去进行提问,并且还会以略带机智和叛逆的风格来回答问题,很是有趣。


当然除此之外,Grōk还具备有很多其他大模型不具备的出色的功能及特点,下面大鹏也将它们一一整理在了下方:
➤超长提示

据了解,Grōk AI能够处理的字符提示长达25000个,这实际上也就意味着它可以理解和回应我们提出的非常长的查询和指令。
➤快速响应

它在响应速度这方面的表现可以说是十分优异,速度非常之快,几乎与我们屏幕刷新速度一致,能够提供给我们非常及时的反馈。
➤个性化设置

在使用的过程中,我们可以根据个人的喜好来设置AI回应的语气,比如说选择更加辛辣或幽默的回答风格。
➤庞大知识库

Grōk AI使用的是一个886.03 GB的巨大的数据集“The Pile”,以及通过X平台上的Exabytes数据进行了微调,从而拥有了非常广泛的知识。
➤实时搜索

它能够满足我们在X平台上的实时搜索操作,并且会优先考虑平台内的上下文信息的相关性。
➤本地运行

Grōk AI除了在文本、图片、语音上的应用之外,它还有一个较小的版本能够在特斯拉汽车中本地运行,利用车辆的计算资源。


整体上来看,马斯克敢在Open AI开发者大会前夕放出Grōk AI这一大模型也是有它的计划和底气的,不过除了马斯克和Open AI在暗暗较劲以外,百模大战的硝烟也还尚未停止!
市面上越来越多的AI应用工具随之应运而生,给我们的生活和工作也带来了不少便利~在这大鹏就顺便给大伙安排上3款在性能、安全和功能上都还不赖的AI工具。
✨讯飞星火

在国内一提到大语言模型,想必讯飞星火一定榜上有名!作为大厂出品的人工智能对话助手,它在自然语言对话领域的表现可以说是相当可圈可点。


不仅具备文本生成、逻辑推理、语言理解,同时还内搭有数学能力、代码能力、多模态能力、知识问答等等高超的技能。
使用上也很方便,只要通过浏览器打开官网即可实现实时的对话问答,在平台上自带的指令中心还有多种实用创意指令可供我们参考学习使用。


✨迅捷AI写作

虽然小众但却足以一键包揽市面上各种写作任务的一款全能助手~
主打的写作功能依据情境具体细分成了多个模块,保证我们每次在使用创作时,都能精准找到适配的功能,每一项都可以在我们日常的写作需求上发挥出相应的作用。


并且在操作上面也更是小菜一碟,只要简单输入创作主题,再附加上篇幅、语气的要求,等待软件理解过后便会快速做出反应并输出内容。
由它生成的文本内容整体的质量还是蛮高的,逻辑清晰、语句通顺、格式准确、言之有理,丝毫不输在网上找的专业代写。


另外,在AI对话、AI绘画、AI编程、图文识别、翻译上它也颇有一手,有需要的朋友也可以一并体验看看~


✨美图AI PPT

说完热门的AI智能对话、AI文本写作,再来给大家安利上一款我超爱的AI办公向网站~它就是由美图设计室出品的专门为PPT制作而服务的美图AI PPT。


只要简单的一句话,即使是对PPT制作非常不熟悉的小伙伴,也能在短短几十秒能制作出既精美又满意的优质PPT文件。


有关AI工具的分享到这就先告一段落~
咱不得不承认的是,就现阶段而言,目前的AI大模型已经足以称得上是人工智能发展史上的一次重大技术阶跃,我们也期待接下来即将到来的Open AI开发者大会会带给我们怎样的惊喜。
又是干货满满的分享,我看谁还没点赞收藏喜欢,有什么意见也可以在评论区直说 @视频编辑助手 绝对欢迎!
海底捞 发表于 2023-11-6 15:54:27|来自:中国 | 显示全部楼层
除了零星试玩截图,xAI创始成员Toby Polen发布了对界面和功能的详细介绍。
可以算是目前最好的聊天机器人UI
首先,Grok支持多个对话同时输出,一边写代码一边问其他问题也不在话下。


在回答不满意重新生成后,可以展开时间线,直观导航到不同版本的回答。


甚至可以使用内置的markdown编辑器,手动修改AI的回答后继续进行对话。


另外还可以在“常规模式”和“幽默模式”中切换


Pohlen展示的还不是Grok的全部功能,还留有更多彩蛋等大家自己探索。


那么如何才能玩到呢?目前有两个渠道:
第一个,有蓝勾认证的账号,现在可以到xAI官网登录排队。
https://grok.x.ai


第二个,订阅16美元/月的  Premium+服务,内测结束后会开放使用。


—完—
@量子位 · 追踪AI技术和产品新动态
深有感触的朋友,欢迎赞同、关注、分享三连վ'ᴗ' ի ❤
小川8433651 发表于 2023-11-6 15:55:07|来自:中国 | 显示全部楼层
省流:强于 GPT-3.5 弱于 GPT-4,目前没有多模态,需要 waitlist,且需要订阅 X Premium+($16)才可以使用。
在 X.AI 的介绍中,Grok 来自于《银河系漫游指南》[1][2],这也是 Musk 最喜欢的科幻作品,也是终极答案 42 的来源。


不过 Grok 本身是一个动词,来自于另一本科幻小说——《异乡异客》[3],在书中是一个火星语词汇,代表「喝」,其意义也包括「彻底吸收某种东西,使其成为你的一部分」。



https://www.oxfordlearnersdictionaries.com/us/definition/english/grok

在牛津词典中,这个词表示通过直觉而不是考虑事实去彻底理解某事,表达一种深刻但直观的理解力。
用这个词来命名大语言模型是很有趣的,毕竟现在大语言模型的黑箱还没有被完全解释,但又表现出惊人的言语理解效果,很像 grok 所表示的那种从文中中「吸收」内容并「理解」的意思。
<hr/>在 Grok 的发布页面[4]和 model card [5]中,官方宣布了一部分模型的基础信息。


按照开发团队的说法,他们首先训练了一个拥有 33B 参数的原型 LLM(Grok-0)。这个早期模型在标准语言模型基准上接近 LLaMA 2(70B亿)的能力,但只使用了一半的训练资源。
之后,他们开发了Grok-1,从 Grok-0 微调而来,支持 8k 长度 token,使用的训练数据来自于截至2023 年 Q3 的互联网和 AI 导师提供的数据。
Grok-1 在 HumanEval 的编码任务达到了 63.2%,MMLU 任务达到了 73%。在 X.AI 自己发布的 Benchmark 上可以看出,Grok-1 能力介于 GPT-3.5 和 GPT-4 之间。


为了避免对公开测试集的质疑,X.AI 手动进行了匈牙利国家中学数学期末考试评分。Grok以C(59%)的成绩通过了考试,而Claude-2同样是C(55%),GPT-4则以68%的成绩获得了B。


Grok 的工程能力基于 Kubernetes、Rust 和 JAX。
Grok 的下一步研究方向:

  • 利用工具辅助进行可扩展的监督。
  • 结合正式验证以确保安全、可靠和落地。
  • 长上下文语境理解与检索。
  • 对抗性鲁棒性。多模态能力。目前,Grok还没有其他感官,比如视觉和听觉。
<hr/>目前 Grok 需要申请 waitlist[6],当授权登录 Grok 时,可以看到隐私许可:


也就意味着 Grok 可以看到你访问的所有贴子和账号(包括受保护账户)。
<hr/>题外话:Grok 这斜杠 icon 咋跟钉钉的魔法棒这么像…


如何评价钉钉新发布的斜杠「/」,具备自动写文案、画海报等 AI 能力,这将给你的日常工作带来哪些改变?以上。
sjh163 发表于 2023-11-6 15:56:00|来自:中国 | 显示全部楼层
本文原文来自DataLearnerAI官方网站:


马斯克的X.AI平台即将发布的大模型Grōk AI有哪些能力?新消息泄露该模型支持2.5万个字符上下文!
马斯克透露xAI即将发布它的首个大模型Grōk AI。而一位老哥已经透露了该模型的一些细节。




  • Grōk AI的特点

    • 超大的上下文窗口——25K的characters输入
    • 快速的响应时间
    • 独特的个性
    • 强大的知识库
    • 支持联网检索功能
    • 语音功能

  • Grōk AI的SuperPrompt功能
  • Grōk AI强大的新闻能力
  • Grōk AI的未来规划

    • 多模态
    • 可在特斯拉上本地运行
    • 已经规划提供API

  • Grōk AI总结

Grōk AI的特点

简单来说,Grōk AI有如下4个特性:
超大的上下文窗口——25K的characters输入

Grōk AI的SuperPrompt上下文窗口大小为25,000字符。这意味着Grōk AI能够处理大量的输入信息,并根据这些信息生成相应的输出。这对于理解和处理复杂的问题至关重要。
快速的响应时间

Grōk AI的响应时间达到了屏幕刷新速度。这意味着用户可以实时地与Grōk AI交互,不会感到任何延迟。
独特的个性

Grōk AI的个性被描述为“spicy”和幽默。这使得与Grōk AI的交互更加有趣和生动。
强大的知识库

Grōk AI的知识库是基于886.03GB的“The Pile”和X平台的Exabytes进行微调的。这使得Grōk AI具有广泛的知识和信息,能够处理各种各样的问题。
支持联网检索功能

按照小哥的透露,Grōk AI的在线搜索将优先搜索twitter平台,这意味着Grōk AI可以使用最新的知识,不过twitter优先可能似乎也会缺少很多知识了。
语音功能

输入的prompt和输出都是voice ready,证明可以通过语音和Grōk AI进行交互。
Grōk AI的SuperPrompt功能

除了前面透露的功能外,还有个超级Prompt功能也是Grōk AI提供的。根据信息透露,SuperPrompt是一种情感驱动的Prompt,可以大幅增强LLM对用户输入的理解。这种技术的实施可能包括在构造提示时包含某些特定的情感或心理触发词,从而使AI的响应更加精确和人性化。
这个技术来源于学术研究,但是没有实践过,作者透露这是Grōk AI实践的理论证明,效果也会很好。下图是论文展示结果:



Grōk AI强大的新闻能力

由于 Grōk AI 是通过 Twitter EB级数据中的 “突发 “新闻进行训练的,因此它对新闻有敏锐的嗅觉。它能从偏见中辨别出突发新闻的要素。这意味着可能可以很快的分发重要的新闻,并尽可能实现客观与真实。也就是说Grōk AI会因为清晰、公正的洞察力成为突发新闻事件的 “首选”。
Grōk AI的未来规划

除了前面提到的这些能力外,信息透露Grōk AI还有已经在规划的能力。
多模态

多模态的能力,包括图像的生成与识别、音频的识别。按照透露的信息,目前模型已经显示出相关的能力,但是未来将继续加强!
可在特斯拉上本地运行

Grōk(较小的量化版本)未来计划将能够在特斯拉上本地运行,使用特斯拉的本地的计算能力。这将使得Grōk AI能够在各种场景下使用,不受网络连接的限制。
已经规划提供API

不多说,意味着可以开发者接入。
Grōk AI总结

以上就是当前透露的Grōk AI所有信息,关于Grōk AI的其它信息和实测实例参考DataLearnerAI原文:马斯克的X.AI平台即将发布的大模型Grōk AI有哪些能力?新消息泄露该模型支持2.5万个字符上下文! | 数据学习者官方网站(Datalearner)

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则