生成一个C++对象的成本

最近两年C用得多了，C++有些生疏，又常常用Python，或者阅读些Java的代码，感觉C的开发者们由于C语言在软件工程上的先天缺陷，导致开发效率不高，所以决定拿出C++来看看用用，准备把libevent封装出一个类ACE的C++实现，首先来复读下C++对象模型吧。要了解new一个object的成本，最主要的就是知道，编译器会给对象分配多少内存，知道C++的对象模型无疑就了解这一点了。

如果要研究C++的对象模型，大家潜意识都想知道的是，C++比C好在哪里？又比C差在哪里？

我们主要就是想从C++的对象模型里找到后一个答案。前一个答案在软件工程中是毫无疑义的，面向对象的优越性要比C语言里一堆数据结构+和一堆可能与它们相关的函数，可读性、可用性好很好，对开发大型软件工程，需要几百人开发一个项目来说，C++好太多了。看看JAVA或者python程序员们，他们为什么可以一直站在巨人的肩膀上，想完成任何一个功能都超级方便的调用大师们以前写好的package/API，借用各种设计模式，应用级别程序员们可以非常EASY的使用复杂的设计，一些只有高级C程序员才能掌握的东东。当然，JAVA的很多特性也导致不适应核心服务器的开发，比如它的垃圾回收机制。

OK，闲话少叙，在看对象模型前，先看几个C++与C语言的典型不同之处。

自然是类的定义了，最大的改变就是类把数据结构与方法捆到一起了，可读性上提升巨大。对成员变量和成员方法，有5种类型：static member, nonstatic member, static function, nonstatic function, virtual function.
继承，这里很有许多细节了，核心解决问题就是动态绑定，也就是virtual关键字。virtual出现的唯一原因就是为了解决继承机制，否则struct里引入方法就足够了，class出现就是为了这。virtual关键字解决了子类实例和父类实例的一些特殊关系，考虑以下场景：软件工程中，很喜欢每个模块专注于自己的事，尽量忽略与自己无关的实现，这样，很可能会用一个父类指针，该指针太可能指向多种不同的子类了，但是现在，使用这个抽象父类指针的模块不想关注细节，当它调用对象的某个方法时，到底是调用父类的方法还是子类的方法呢？动态绑定这个特性就是，开发者可以决定这一点，当你用virtual关键字申明父类方法时，如果子类重定义了该方法，如果这个指针实际指向的是某子类对象，那么调用的方法一定是该子类方法的实现。举个例子吧，就像什么析构函数总喜欢写成virtual？这个例子应该容易说明virtual的玩法。一段简单的代码：

#include <iostream>  
using namespace std;  
  
  
class Father  
{  
public:  
    int m_fMember;  
    Father(){m_fMember=1;}  
    ~Father(){cout<<m_fMember<<endl;}  
};  
  
  
class Child : public Father{  
public:  
    int m_cMember;  
    Child(){m_cMember=2;}  
    ~Child(){cout<<m_cMember<<endl;}  
};  
  
  
int main(int argc, char** argv)  
{  
    Father* pObj1 = new Child();  
    delete pObj1;  
    Child* pObj2 = new Child();  
    delete pObj2;     
    return 0;  
}

这段代码的结果是1 2 1，啥意思呢？就是说，如果不用virtual函数，是没有执行期绑定一说的，比如pObj1这个指针，其实它是Child对象，但是在释放时，~~Child()方法并没有被调用，仅调用了~~Father方法。为什么呢？因为没有用virtual，就是编译期绑定，当你在编译时gcc/g++只知道pObj1是个Father对象，所以在delete时就去调用Father的析构了。而如果定义成virtual ~Father时，结果就是一定会析构Child，这就是为什么析构函数都要用virtual，因为没人知道会不会有子类继承，否则一旦继承，发生这样的事，析构函数里万一释放了些资源，比如SOCKET，比如memory，那就是资源泄露了。

那么以上，C++对象模型是怎么做到的呢？画张象征性的图吧。先定义一个类，再看看它的内存布局：

class Father  
{  
public:  
    int m_fMember;  
    static int m_sMember;  
    static void testSFunc(){}  
    void testFunc(){}  
    virtual void testVFunc(){}  
    Father(){m_fMember=1;}  
    virtual ~Father(){cout<<m_fMember<<endl;}  
};

我们生成一个Father对象，看看它的的内存布局是啥样的（同志们，这只是近似存储布局图，没有把编译和运行的差别放上去，下篇再讲这个）：

这里大家明白了吧？即使一个Child对象在编译时被赋为Father类型，但是实际调用时，virtual方法会被单独的拎出来，在vtbl中指向实际的实现，所以，该对象在delete时会调用Child的析构函数，而如果你像上面例子那样，析构方法不使用virtual，将会用到上图中的最后一个指针，指向类成员函数里，这样就不是执行期绑定了。

剩下的static成员（还有所有的正常成员函数），都是与对象实例无关的内存布局。这样，其实如果不使用virtual，C++比之C并没有增加成本，尽可放心使用。