一、我的经历
说说我的经历,在 C++ 和 Java 之间我经历了这么几个阶段:
- 大学浅尝辄止地学过一段时间 Java,后来放弃开始学 C/C++;
- 本科毕业到硕士学的都是 C++;
- 工作以后非 C++ 开发不做,先做 C++ 客户端开发,再转 C++ 服务器开发;
- 后来机遇巧合去了携程旅行网做 Java 开发;
- 前年离开携程,与人合伙创业,做技术负责人,大部分核心系统用 Java 开发,只有其中一个系统用 C++ 开发;
- 离开创业团队,拿到了阿里的 P7 offer(Java 开发岗位,未去)
- 拿了饿了么 C++ 开发岗位的 offer(做公司定制的数据研发),也未去。
- 目前在某独角兽公司。
二、选 C++ 还是选 Java?
作为过来人,我的建议是:
如果你是学生或有大把空余时间,那建议你把 C++ 学好,C++ 被称为程序员的九阳神功是有一定的道理的,并不是说 C++ 有多难学,而是 C++ 技术栈的学习讲究的是其背后的一系列操作系统原理,你把 C++ 学好了,就意味着你把这些背后的原理学好了,你之后再学其他任何语言和机制都轻松很多;
如果你急着找工作,或者对编程没多大兴趣,只是为了糊口饭吃,那么你可以优先选 Java,甚至 Java 的八股文面经背一背,如果运气不错的话,也能找到一份不错的工作。
三、C++ 该怎么学?
C/C++ 这门语言与其他高级语言不同,它是离操作系统较近的语言。所以学好 C/C++ 体系的技术栈必须结合操作系统的运行机制来学习,通俗地说,就是你必须掌握操作系统层面的几大基础知识,他们是汇编、编译链接与运行时体系、狭义的操作系统原理、多线程、网络编程,只有这样学习,你才能学的懂、学的通透、学以致用。咱们学习 C++ 不是为了理论研究,而是付诸实践,投入生产是吧。
用一张图来概括一下 C++ 技术栈吧:
3.1 学好 C++ 语言包括 C++11/14/17 常用语法
C++ 面试关于语法部分一般会问以下一些问题,当然这些问题也是 C++ 开发必备:
- 在有继承关系的父子类中,构建和析构一个子类对象时,父子构造函数和析构函数的执行顺序分别是怎样的?
- 在有继承关系的类体系中,父类的构造函数和析构函数一定要申明为 virtual 吗?如果不申明为 virtual 会怎样?
- 什么是 C++ 多态?C++ 多态的实现原理是什么?
- 什么是虚函数?虚函数的实现原理是什么?
- 什么是虚表?虚表的内存结构布局如何?虚表的第一项(或第二项)是什么?
- 菱形继承(类 D 同时继承 B 和 C,B 和 C 又继承自 A)体系下,虚表在各个类中的布局如何?如果类B和类C同时有一个成员变了 m,m 如何在 D 对象的内存地址上分布的?是否会相互覆盖?
部分同学对以上问题总是搞不清楚,但是又不知道如何学习,于是从网上找各种文章来学习,造成这块的知识非常零碎,无法构成体系,其实这与其在网上花费大量时间,不如系统地看一下侯捷老师翻译的《深度探索 C++ 对象模型》一书。 这本书专注于 C++ 面向对象程序设计的底层机制,包括结构式语意、临时性对象的生成、封装、继承,以及虚拟——虚拟函数和虚拟继承。这本书让你知道:一旦你能够了解底层实现模型,你的程序代码将获得多么大的效率。对于 C++ 底层机制感兴趣的读者,这是一本让你大呼过瘾的绝妙好书。
统一的类成员初始化语法与 std::initializer_list<T>
- 注解标签(attributes)
- final/override/=default/=delete 语法
- auto 关键字
- Range-based 循环语法
- 结构化绑定
- stl 容器新增的实用方法
- std::thread
- 线程局部存储 thread_local
- 线程同步原语 std::mutex、std::condition_variable 等
- 原子操作类
- 智能指针类
- std::bind/std::function
C++11/14 网上的资料已经很多了,C++17 的资料不多,重头戏还是 C++11 引入的各种实用特性,这就给读者推荐一些我读过的不错的书籍:
- 《深入理解 C++11:C++11 新特性解析与应用》
- 《深入应用 C++11:代码优化与工程级应用》
- 《C++17 完全指南》
- 《Cpp 17 in Detail》
3.2 进一步提高 C++
当你学习好了 C++ 语言本身,你可以学习一下 C++ 的一些常见惯用法和高性能编码实践,这里我推荐一本经典书籍叫《提高 C++ 性能的编程技术》,这本书详细讨论了临时对象、内存管理、继承、虚函数、内联、引用计数以及 stl 等一切有可能提升 C++ 效率的细节内容。最终,该书将c++性能提升的各种终极利器,完美地呈现在读者的面前!最关键的是,这本书非常薄,但是书中介绍的每个专题都是实战中常用的技术,强烈推荐。
3.3 C++ 工程实践
在掌握了 C++ 常用语法和语言背后的实现机制和常用惯用法后,我强烈推荐另外两本书,一本是 《C++ API 设计》 和《大规模 C++ 程序设计》,前者从细粒度地教你在实际开发中如何设计 C++ API 接口,后者告诉你大型 C++ 程序小到单个 .h/cpp 文件如何编写,大到大型 C++ 项目如何组织的最佳实践。这两本书都是工程实践的图书,书中的技术可以实实在在地用于一线开发。
3.4 与 C/C++ 相关的必知必会知识
第一个基础知识是汇编。
我们学习汇编不是一定要用汇编来写代码,就像我们学习 C/C++ 也不一定单纯为了面试和找工作。
对于 C/C++ 的同学来说,汇编是建议一定要掌握的,只有这样,你才能在书写 C++ 代码的时候,清楚地知道你的每一行C++代码背后对应着什么样的机器指令,if/for/while 等基本程序结构如何实现的,函数的返回值如何返回的,为什么整型变量的数学运算不是原子的,最终你知道如何书写代码才能做到效率最高。掌握了汇编,你可以明白,在 C++ 中,一个栈对象从构造到析构,其整个生命周期里,开发者的代码、编译器和操作系统分别做了什么。
掌握了汇编,你可以理解函数调用是如何实现的,你可以理解函数的几种调用方法,为什么printf这样的函数其调用方式不能是 __stdcall,而必须是 __cdecl。掌握了汇编,你就能明白为什么一个类对象增加一个方法不会增加其实际占的内存空间。推荐的书籍是王爽老师的《汇编(第三版)》 和韩宏老师的《老码识途 从机器码到框架的系统观逆向修炼之路》 。
第二个基础知识是编译、链接与运行时体系知识。
作为一个开发者,要清楚地知道我们写的 C/C++ 程序是如何通过预处理、编译与链接等步骤最终变成可执行的二进制文件,操作系统如何识别一个文件为可执行文件,一个可执行文件包含什么内容,执行时如何加载到进程的地址空间,程序的每一个变量和数据位于进程地址空间的什么位置,如何引用到。一个进程的地址空间有些什么内容,各段地址分布着什么内容,为什么读写空指针或者野指针会有内存问题。一个进程如何装在各个 so 或 dll 文件的,这些文件被加载到进程地址空间的什么位置,如何被执行,数据如何被交换。
第三个基础知识是狭义的操作系统原理。这里加上“狭义”二字是因为从广义上来讲,以上所说的内容都是操作系统原理的范畴。狭义的操作系统原理这里包括操作系统如何管理进程与线程,虚拟内存与物理内存之间的对应关系,何为内存映射文件,进程之间如何通信等等。
这两者推荐的书单:《程序员的自我修养》和 《Windows 核心编程》,尤其是《程序员的自我修养》,搞 C++ 开发不看此书,读尽 C++ 语言书也枉然!
第四个基础知识是多线程知识。
严格来说,这点已经包括在第三点之中了,我之所以将其单独列出来,是因为多线程编程是我们做应用服务最常用的技术之一。最近面试过几个学历非常好的同学,对于一个进程中如果某个线程因为内存问题而退出,是否会导致整个进程退出的问题答不好,实在不应该。多线程知识其实不难学,立足于理解与实践而不是应付面试,可以学的很好。无论是 Windows 还是 Linux 操作系统,操作系统提供的线程同步对象就那么几种,Windows 常用的有临界区(关键端)、Event、互斥体、信号量等,Linux 有互斥体、信号量、读写锁、条件变量,这些知识点学过则会,不学则不会。这些线程同步原语花上几天就能搞得清楚,大多数同学不是学不会,而是不愿意学,但是偏偏喜欢在简历上写上自己熟悉多线程编程。面试的时候,被问到条件变量的虚假唤醒机制都说不清楚,非要说自己用过条件变量。这是一些同学犯的很低级的错误,如果真用过条件变量,如果不知道虚假唤醒机制,那一定写的代码是不对的。市场上目前没有任何一本图书对以上知识形成体系的介绍,当然,我的本书填补了这一空缺,你将从本书中获得从进程与线程的关系,再到常用的线程同步原语的区别与使用场景,再到线程池以及基于生产者消费者模型的消息队列,以及对协程思想介绍的相关知识。
掌握了常见的多线程同步原语之后,接下来可以找一些带多线程的项目去学习一下,不管是否带 UI 的都行。我推荐的一种方式是,使用 gdb 或者 Visual Studio 调试器将你需要学习的多线程程序中断下来,在多线程面板,看看这个进程一共有多少个正在运行的线程,分析每个线程的作用,然后研究下这些线程在何时何地创建的,为什么需要创建新的线程。尝试爱过几个人,面对爱情你会诚实很多;尝试研究几个多线程项目,面对多线程你会熟练许多。
推荐的书单 《C++ 服务器开发精髓》。
第五个是网络编程,直白地说就是 Socket 编程。操作系统层面提供的 API 会在相当长的时间内保持接口不变,一旦学成,终生受用。理解和掌握常用的基础 socket API 不仅可以最大化地去定制各种网络通信框架,更不用说使用市面上流行的网络通信库了,最重要的是,它会是你排查各种网络疑难杂症坚实的技术保障。操作系统层面提供的网络模型就那么几种,无论像 Java/Go/Python 等语言如何封装,作为技术的源头,我们有什么理由不去掌握它呢?推荐的书单 《TCP/IP 网络编程》和《Linux 高性能服务器编程》 。
以上是基于 C++ 技术栈来说,并没有包括算法与数据结构、数据库等方面的基本功。总而言之,学习 C++ 不能只盯着 C++ 语法本身,还要熟悉 C++ 技术栈背后的一系列操作系统原理。
最后给大家分享一个c/c++ linux后端服务器开发的完整学习路线(来自零声教育课程大纲,对标腾讯T8技术栈)
零声教育 第12代 Linux C/C++后台架构开发 成长体系课程 - v1.5
C/C++Linux服务器开发/后台架构师【零声教育】-学习视频教程-腾讯课堂
一、精进基石
1.数据结构与算法
- 随处可见的红黑树
- 磁盘存储链式的B树与B+树
- 海量数据去重的Hash与BloomFilter,bitmap
2.设计模式
3.c++新特性
- stl容器,智能指针,正则表达式
- 新特性的线程,协程,原子操作,lamda表达式
4.Linux工程管理
- Makefile/cmake/configure
- 分布式版本控制git
- Linux系统运行时参数命令
部分试听视频:
5种红黑树的用途,从应用到内核场景的优缺点
redis、布隆过滤器、分布式一致性hash中hash的妙用
二、高性能网络设计
1.网络编程
- 网络IO与select,poll,epoll
- reactor的原理与实现
- http/https服务器的实现
- websocket协议与服务器实现
2.网络原理
- 服务器百万并发实现
- redis,memcached,nginx网络组件
- Posix API与网络协议栈
- UDP的可靠传输协议QUIC
3.协程框架NtyCo的实现
4.用户态协议栈NtyTcp的实现
- 用户态协议栈设计实现
- tcp/ip定时器与滑动窗口
- 手把手设计实现epoll
5.高性能异步io机制io_uring
- 与epoll媲美的io_uring
- io_uring的使用场景
部分试听视频:
100行代码,实现网络协议栈,准备好linux环境
全网最详细epoll讲解,6种epoll的设计,让你吊打面试官
三、基础组件设计
1.池式组件
- 手写线程池与性能分析
- 内存池的实现与场景分析
- 异步请求池的实现
- mysql连接池的实现
2.高性能组件
- 原子操作CAS与锁实现
- 无锁消息队列实现RingBuffer
- 定时器方案红黑树,时间轮,最小堆
- 手写死锁检测组件
- 手写内存泄漏检测组件
- 手把手实现分布式锁
3.开源组件
- Libevent/Libev框架实战的那些坑
- 异步日志方案log4cpp
- 应用层协议设计ProtoBuf/Thrift
部分试听视频:
高并发场景下,三种锁方案:互斥锁,自旋锁,原子操作的优缺点
红黑树、最小堆、时间轮、跳表多种方式实现定时器
四、中间件开发
1.redis
- redis相关命令详解及其原理
- redis协议与异步方式
- 存储原理与数据模型
- 主从同步与对象模型
2.MySQL
- SQL语句,索引,视图,存储过程,触发器
- MySQL索引原理以及SQL优化
- MySQL事务原理分析
- MySQL缓存策略
3.Kafka
4.gRPC
- gRPC的内部组件关联
- 基于http2的gRPC通信协议
5.nginx
- nginx反向代理与系统参数配置conf原理
- nginx过滤器模块实现
- nginx Handler模块实现
五、开源框架
1.skynet
- skynet设计原理
- sky net网络层封装以及lua/c接口编程
- sky net重要组件以及手撕游戏项目
2.分布式API网关
- 高性能web网关Openresty
- Kong动态负载均衡与服务发现
3.DPDK
- DPDK环境与testpmd/I3fwd/skeletion
- DPDK的用户态协议栈
- 千万级流量并发的dns处理
- 高性能数据处理框架vpp
- DPDK的虚拟交换机框架OVS
4.高性能计算CUDA
- gpu并行计算cuda的开发流程
- 音视频编解码中的并行计算
六、云原生
1.Docker
- Docker风光下的内核功能
- Docker容器管理与镜像操作
- Docker网络管理
- Docker云与容器编排
2.Kubernetes
- K8S环境搭建
- Pod与Service的用法
- K8S集群管理
- K8S二次开发与K8S API
七、性能分析
1.性能与测试工具
- 测试框架gtest以及内存泄漏检测
- 性能工具与性能分析
- 火焰图的生成原理与构建方式
2.观测技术bpf与ebpf
3.内核源码机制
- 进程调度机制
- 内核内存管理运行机制
- 网卡nic与网络协议栈的关系
- 文件系统组件
八、分布式架构
1.RocksDB
- 不一样的kv存储RocksDB的使用场景
- RocksDB的特殊操作
2.云原生分布式数据库TiDB
- TiDB存储引擎的原理
- TiDB集群方案与Replication的原理
3.分布式服务
- 内核级支持的分布式存储Ceph
- 注册服务中心Etcd
九、项目实战
1.图床共享云存储
- fastdfs架构分析和配置
- fastdfs存储原理
- 分布式fastdfs存储集群部署
- 高负载nginx/fastcgi
- 文件传输和接口设计
- 产品上云公网发布/测试用例
2.微服务即时通讯
- IM即时通讯项目框架分析和部署
- IM消息服务器/文件传输服务器
- 消息服务器/路由服务器
- 数据库代理服务器设计
- 文件服务器和docker部署
- 产品上云公网发布/公网测试上线
|