且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《算法设计手册》杂题3道

更新时间:2022-08-12 16:59:10

最近找工作的事告一段落,发一些之前整理但未发表的文章。鉴于各个公司一般要求将所做笔试题和面试题保密,并要求在试卷上签署了相关协议,因此本人不会在后续博文中提及并分析,见谅。

 

1.归纳法找递归函数的输出(原书P16~17,1.3.4节)

归纳并证明下面函数的输出:

《算法设计手册》杂题3道
int increment(int y) {

  if (y==0)

    return 1;
  if(y%2 == 1)

    return 2*increment(y/2);
  else

    return y+1;
}
《算法设计手册》杂题3道

解答:

  事实上increment(y)=y+1。

  证明:

(1)(归纳法)y=0时输出1。

(2)

y为偶数时,输出y+1;

y为奇数时,不妨令y=2m+1,那么2*increment((2m+1)/2) = 2*increment(m)。由于m<y且increment(m)=m+1 (归纳假设),那么输出为2*(m+1) = y+1。

得证。

 

2.动态数组的时间复杂度(原书P67,3.1.1节)

用下面的方式实现动态数组:首先分配大小为1的连续空间,当需要填入第2个元素时,分配大小为2个连续空间,把原来的1个元素复制进新空间,再把新元素填入,销毁原空间;依次类推,动态数组的容量变化过程为1->2->4->8->...。当数组中一共有n个元素时,一共被复制了几次?

解答:

为简化分析,n此时是2的幂且刚好把数组填满。可以看出,其中1/2的元素没有被复制过,另外1/2在上次扩展时复制了一次。即,上次扩展时复制了n*(1/2)个元素。一共扩展了logn次,因此复制的总次数为:


《算法设计手册》杂题3道

其中2^logn = n。由极限知识可知,当n→∞时,和为2n。因此n个元素的复制次数不超过2n次,保持了O(n)的时间复杂度。

附注:

  Nginx封装的数据结构ngx_array_t就是一种动态数组,采用了类似的内存分配策略。

 

3.最小堆第k小的元素与给定x的大小关系:kth>=x是否成立?(原书P116~117,4.3.2节)

对一个数组实现的n个元素的最小堆和给定的实数x,判断堆中第k小元素是否大于等于x?(0<k<n)要求算法最坏时间复杂度为O(k)。(提示:没必要找出第k小元素的具体值)

解答:

  最直接的两种解法:从堆中选取最小元素k次,时间复杂度O(klogn);检查堆中前k层所有元素,时间复杂度O(n,2^k)。这两种解法都不符合时间复杂度的要求。

  实际上是从根开始遍历所有值小于x的结点:

《算法设计手册》杂题3道
//第一次调用时,i=1,count=k
int heap_compare(heap *h,int i,int count,int x)
{
    if((count<=0)||(i>h->size))
        return count;
    if(h->h[i]<x) {
        count = heap_compare(h,LEFT(i),count-1,x);
        count = heap_compare(h,RIGHT(i),count,x);
    }
    return count;
}
《算法设计手册》杂题3道

  如果根大于等于x,那么其余所有元素都不可能小于x,第k小的元素必然大于等于x。这时返回值为k>0。(若k=1,那么第1小的元素就是根,结果不变)

  如果根小于x,需要对根的两个后继进行遍历。如果你没有看明白这段程序的含义,下面以几个例子来帮助理解这个函数在递归调用时发生了什么。假定k=3,x=3,即判断第3小的元素是否大于等于3。简单起见,结点以下标代替,根为1(与原书一致)。

  实例1:第k小的元素大于等于x。

《算法设计手册》杂题3道

  实例2:第k小的元素大于等于x。原图交换顺序。

《算法设计手册》杂题3道

  实例3:第k小的元素小于x。

《算法设计手册》杂题3道

 

  从上面三个例子可以看出:

  每找到一个小于x的元素都会消耗一个count,如果消耗完了k个,表示至少前k个都小于x。那么第k个必然小于x,后面不必再进行查找,返回值为0。

  反之,如果遍历所有小于k的元素时未消耗完k个count,表示小于x的元素不足k个,那么第k个必然大于等于x,返回值为正值。

  原代码中令人迷惑的地方在于count的使用,理清上面的两个关系就好理解了。虽然看上去这个函数对于一个结点的两个后继的处理地位不同,但实际上没有影响。

  至于时间复杂度,由于我们只遍历了所有小于x的结点以及它们的后继,而且遍历时不超过k个(用完k个就return 0),因此大约是3k个结点,时间复杂度只有O(k),符合要求。

  这道题曾在Amazon的面试中出现。

  ***上有一个变形:判断n元最大堆中第k大的元素是否大于给定的数x,处理方法类似。




本文转自五岳博客园博客,原文链接:http://www.cnblogs.com/wuyuegb2312/p/3257408.html,如需转载请自行联系原作者