wmm 发表于 2023-10-8 03:15:42

NLP算法岗--秋招被虐经历

说明:本文欢迎转载,请注明作者、出处与原文链接。
简历背景:
1个腾讯实习,4个比赛、2个项目,1篇CCF-A二作、1篇CCF-C一作
秋招总结:
腾讯、字节offer,华为正在泡池子


[*]字节 技术中台一面 7.18
算法题:删除倒数第N个链表
面试题:
为什么要用尖括号标记实体,尖括号在BERT词表中么,最好用unuse1字符
fasttext和word2vec的区别
xgboost和adaboost、GBDT、随机森林,随机森林如何采样
怎么解决人工漏标、错标,NER的损失函数,关系抽取为什么用这个模型,有调研其它模型么

2. 字节 技术中台二面7.22 gg
手撕 编辑距离
xgboost如何分裂,公式,树的生成
逻辑回归推导
交叉熵
softmax

字节电商 8.5 一面
逻辑回归求导、均方误差和交叉熵的区别
防止欠拟合、过拟合、梯度爆炸的方式
BERT结构、transformer中feed forward的作用
self-attention的形式,为什么要除以根号d_k
算法题:手撕kmeans,链表反转、扑克牌随机分3堆,大小王在同一堆的概率
图最短路径算法

8.9 字节电商二面
比赛:为什么使用注意力机制、介绍multi sample dropout
注意力机制为什么不用多头
矩阵相加和点乘
SPU海量数据查重
softmax
手撕代码:前k个相似整数、最长不重复子串

8.18 字节电商三面
比赛
实习项目
手撕代码:堆排序、组成某个值的硬币种数(回溯)、不相邻子序列最大和

8.24 意向书

2. 华为消费者BG 一面 7.19
算法题:LeetCode 739 每日温度
决策树算法有哪些:ID3、C4.5、CART
TF-IDF特征
BERT mask策略,分别的作用
多模态建模思路
上线部署时延要求,模型剪枝、模型蒸馏
transformer与LSTM相比,优势在哪
boosting算法的优缺点

华为二面 7.26
实习项目
为什么要finetune
知识图谱技术路线,信息抽取综述

华为三面 9.8
问的问题跟HR差不多

7.23 提前批 pdd 笔试挂
8.14 二战 笔试挂 = =

7.27 阿里 投递
上海 本地生活 知识图谱 一面 8.3:

[*]实习项目,fusion层,下一步如何优化,如何处理长文本,
[*]语言模型,word2vec,具体流程,损失函数,优化算法(hierarchical softmax、negative sampling)
[*]逻辑回归损失函数为什么取log
[*]模型评估,F1、ROC-AUC
[*]kmeans聚类,向量距离不适合用欧氏距离衡量,如何变换
[*]CRF损失,实体识别有尝试其他算法么,关系抽取阈值有选择么
8.14 网易有道 投
8.28 网易有道 人工智能部门(翻译、写作) 一面
介绍中文人机对话技术评测比赛,别的队伍的优点
介绍试题生成项目
介绍BERT、attention公式,为什么除以根号dk
介绍AAAI的论文,负责哪部分
手撕算法:最小k个数、移掉k位数字

8.30 网易有道 人工智能部门 二面
正则化有哪些
深度神经网络为什么不使用sigmoid或tanh激活函数,什么情况下可以使用
self-attention时间复杂度
手撕:循环递增数组查找、self-attention实现

9.2 网易有道 人工智能部门 三面
给你一个项目,项目描述为:**********,描述下你的技术路线

8.14 百度 NLP部门 简历挂
8.25 百度 知识图谱部门 捞
8.30百度 知识图谱部门 一面
实习
vggnet的resnet的区别,densenet
transformer在哪些地方体现了共享和并行
比赛
项目
is 和 ==区别
re match 和 search
range返回的是什么
python内存管理、浅拷贝和深拷贝
如何拼接字符串最高效
手撕:二叉树层序遍历、连续子数组乘积最大

8.31 百度 知识图谱部门 二面
实习
比赛
docker原理
手撕:LRU
场景题:给定一个文章,如何识别出所有观点(一个句子),如何识别出核心观点,如何识别出提出者

9.1 百度 知识图谱部门 三面
实习项目背景、难点分析
给定一个文本,如何抽取aspect、opinion、sentiment
反问:部门规模、氛围、交流,管理

9.2 百度 知识图谱部门 四面
比赛负责什么,每个人的分工
情感识别的建模思路
知识图谱:项目背景,有考虑意图识别么,实体消歧,为什么用pipeline、不用joint
如果现在考虑的话该怎么提升模型性能
CRF和HMM的区别,HMM解决哪三个问题
CRF基于条件分布建模是什么意思,什么条件
维特比思路,解决HMM的什么问题
词向量发展历史:one-hot、NNLM、word2vec、glove(推导公式)、fasttext、ELMO、CoVE(不了解)、GPT、BERT、ERNIE(清华的不了解)、ERNIE 2.0、bert-wwm、roberta、xlnet

8.23 快手 投递
8.31 快手一面 搜索推荐业务部
聚类数目如何确定
ResNet主要解决什么问题
梯度消失解决方法
BN公式、交叉熵公式
transformer用的是哪种normalization,为什么不用BN
手撕:加权编辑距离

如果你正在寻找一个能够提高自己NLP算法技能的平台,那么牛客网是你不可错过的选择。牛客网作为一个集IT技术学习、面试准备和求职服务于一体的在线教育平台,提供了丰富的NLP算法学习资源,能够满足不同层次的学习者的需求。
首先,牛客网的NLP算法课程覆盖了从基础入门到深入学习的各个阶段,无论你是初学者还是有一定经验的专业人士,都可以在这里找到适合自己的课程。这些课程涵盖了自然语言处理的基础知识、常用算法和应用场景等,能够帮助你建立完整的NLP算法知识框架,并能够在实际应用中得到验证。
其次,牛客网的刷题页面提供了大量的NLP算法编程题目,这些题目不仅考察了你的编程技能,更是要求你具备解决实际问题的能力和对自然语言处理领域的深入理解。这些题目涵盖了基本的字符串操作、文本分类、命名实体识别等多个方向,能够帮助你在实际应用中提高自己的编程能力和解决问题的能力。
此外,牛客网还提供了优秀的交互式编程环境和实时评测系统,让你可以随时随地测试和调试自己的代码,以达到更高的编程水平。

http://pic4.zhimg.com/v2-1e9582f27b5e54d941e97ac487fa9f97_r.jpg
牛客网-找工作神奇丨笔试题库丨面试经验丨实习招聘内推丨求职就业一站解决-牛客网

defect 发表于 2023-10-8 03:16:17

你这面的感觉挺广挺难的啊,为什么我遇到的面试难度比你小了好多[捂脸]

lkmtxjt 发表于 2023-10-8 03:16:42

运气问题

听梦 发表于 2023-10-8 03:17:38

太强啦!!!

zknet 发表于 2023-10-8 03:17:58

请教一下简历要求(论文实习等)和腾讯面经

dxking 发表于 2023-10-8 03:18:21

童鞋我们是不是在BDCI上见过哈哈哈

qaz8888 发表于 2023-10-8 03:18:41

ERNIE不是百度的嘛[思考]

bjc4845 发表于 2023-10-8 03:19:28

好卷

peeperp 发表于 2023-10-8 03:20:22

你这很强啊兄弟,有实习,有论文,编程功底也ok,拿了几个offer已经

z2587 发表于 2023-10-8 03:20:52

清华也出过一个叫ernie的模型,用知识图嵌入增强bert
页: [1] 2 3
查看完整版本: NLP算法岗--秋招被虐经历