编程之美读书笔记

Published: 10 Jan 2014 Category: 理论及算法

2.1求二进制数中1的个数

解法一：将数除以2至0，余数为1的次数数

解法二：使用位运算：将该数与0x01与运算，然后左移1位。与运算结果为1的次数。位操作和除、余操作相比效率更高。

解法三：让算法的复杂度只和1有关，原理是v&(v-1)后的结果即为将v二进制数的为1的最低位消除。

解法四：使用分治判断法判断一个数的1的位数，但是根据程序的书写最多可能要判断255此才可以，因此此方法不太好。

解法五：使用分治判断不好，那可以使用hash将二进制数(key)映射到1的个数(value)，只要前期将hash表建好即可。这种方法是使用空间换时间，若二进制位数较少如八位，这个是很好的算法，但是若位数很多如32位，这个方法就不好了。

拓展问题：两个二进制整数A、B，他们有多少位是不同的？

答：异或操作，结果然后计算1的个数。

2.2 不要被阶乘吓到

2.3寻找水王

一个ID发的帖子超过了所有帖子总数量的一般，如何找到这个ID。

解法一：对所有帖子的ID排序，然后找到中间的那一个ID即可。需要排序，时间复杂度：O(N*lgN)

解法二：每次删掉两个不同的ID，最后剩下的就是要找的ID。只需要遍历一遍，O(N)即可。

代码也很巧妙，遍历ID列表，找到一个ID作为candidate，设置一个time来保存这个ID出现的次数。继续遍历，如果新的ID和这个ID相同，time加以。如果不同，time-1（这个行为就是删掉两个不同的ID）。如果time为0，选择新的candidate。

扩展问题：有三个发帖很多的ID，每个人的发帖数目超过了全部的1/4，如何快速找到这3个ID？

同理，每次删掉四个不同的ID，最后剩下3个ID即可。

很多问题都可以用这种思想解决：考虑如何把一个问题转换成规模较小的若干问题。分治、递推和贪心都是这样的思路。转化过程中，小的问题跟原问题本质上一致。如这个问题，我们保证了问题的解在小问题中仍然具有和原问题相同的性质：水王的ID在ID列表中的数量超过一半。

2.4 1的数目

2.5 寻找最大的K个数

解法一：使用排序算法，时间复杂度为O(N*lgN)。或者使用选择排序或者交换排序只排序前N个，可以将时间复杂度降至O(N*K)

解法二：使用快速排序。快速排序思想：每一步将待排数据分为两组，其中一组都比另一组的任何数都大。可以通过这个思想，将数组S根据快速排序的一步分为Sa和Sb。若Sa数量小于K，则Sa和从Sb中选择的Top K-|Sa|的元素就是要找的。如果Sa的元素数量大于K，则从Sa中返回最大的K个元素。平均的时间复杂度为O(N).注：编程之美上写的平均复杂度为O(n*lgK)是错误的，解释：July博客

解法三：寻找TOP-K最大的数，构建具有K个元素的最小堆存储这最大的K个数。遍历这N个数，和最小堆存储的TOP-k个数比较（只需要比较根节点）。未完成：代码实现

解法四：使用计数排序的思想。加上N个数都是正整数且范围不大，假设为[0,MAX)。则创建一个数组count[MAX]。遍历数组统计出每个数出现的次数（count[i]表示i出现的次数）。这样遍历数组count就能找到TOP-K的数了。若不能保证所有元素都是正整数，且取值范围不大。我们仍可以使用这种思想：将N个数最大的书max和最小的数min分为M块，扫描所有元素统计每个区域的个数，就可以知道第K大的元素在哪个区间，然后在对这个小区间分块处理。

基数排序：

遍历输入数据A[n]，统计元素i出现的次数c[i]。

对count[i]进行处理，循环c[i]=c[i]+c[i-1]，c数组里面的元素现在代表的是小于或等于i的数量。

再一次遍历A[n]，B[c language="[A[n"][/c]]]=A][n]，同时c[A[n]]--;

2.6 精确表达浮点数

对于一个有限小数如0.34或者一个无限小数如3.3333....即0.3(3)，如何用一个分数精确的表达。

当我们获得了一个分数表示小数，这个分数可能需要约分，约分的方法是将A/B简化为(A/Gcd(A,B))/(B/Gcd(A,B))。其中Gcd为求A和B的最大公约数，具体方法见2.7下一节。

如何将一个小数转化为分数呢，一般一个数可能包括整数和小数，我们这里不考虑整数，因为整数可以在用分数表示小数以后直接乘以分母加上分子即可。

现在我们只考虑有限小数0.a1a2a3...an和无限小数0.a1a2..an(b1b2..bm)

对于有限小数，没有啥好说的，直接转为0.a1a2a3...an/(10^n) ——公式一。

对于一个无限小数X=0.a1a2a3..an(b1b2..bm)，可以写为X=0.a1a2...an+0.(b1b2..bm)(10^-n)；令Y=0.(b1b2..bm),则(10^m)Y=b1b2..bm+Y,则Y=b1b2..bm/(10^m -1)；所以X=a1a2..an/(10^n)+(b1b2..bn/(10^m -1))(10^n)=(a1a2..an(10^m -1)+b1b2..bm)/((10^n)(10^m -1)) ——公式二

对于所有的小数，都可以带入这两个公式，然后约分即可。

2.7 最大公约数问题

解法一：辗转相除法：Gcd(x,y)=Gcd(y,x%y).原理：最大公约数g可以整除x和y，x=ga,y=gb.x%y=x-(gbc)

解法二：辗转相减法:Gcd(x,y)=Gcd(x,x-y)

解法三：分析公约数特点：1.如果y=ky1,x=kx1，则f(x,y)=kf(x1,y1) 2.如果x=px1，且p为素数，并且y%p!=0。则f(x,y)=f(x1,y);

使用素数2，若x，y均为偶数，f(x,y)=2*f(x/2,y/2).

若x为偶数，y为奇数，f(x,y)=f(x/2,y)=f(x>>1,y). 同理y为偶数，x为奇数。

若x,y都为奇数，f(x,y)=f(x-y,y)

时间复杂度为O(lg(max(x,y)))

2.8 寻找符合条件的整数

给定一个正整数N，求一个最小的正整数M(M>1)，使得NM的十进制表示形式里面只含有1或者0.

直接解法：从2开始枚举M的取值，直至找到符合条件的M。这个方法耗费极大的时间，完全不靠谱。

因为题目是对NM进行的限定，因此我们可以遍历NM。将上面的问题转化为：求最小的X，X只含有0或者1，而且X可以被N整除。X/N就是我们要找的M。

这样的话，我们只要遍历X的取值：1，10，11，100，101，110，111......如果我们最后得到的X为k位，时间复杂度为O(2^k)

有没有更好的方法？我们发现以下规律：当计算X=10^k+Y是否可以被N整除时，其时Y能否被N整除已经计算过了，那如果我们使用这个信息，是否可以减少操作。

改进的方法思想：

1.记录Y(k位)除以N的余数，当我们要计算10^k+Y是否可以被N整除时，只需要计算10^k%N+Y%N除以N的余数是否为0即可。（如果仅使用这个思想，那么时间复杂度仍然是O(2^k)）

2.加入Y1和Y2的除以N的余数相同，那么10^k+Y1和10^k+Y2的被N整除的余数也相同。那么，将K位的所有Y分为最多N-1个子空间（可能出现的余数），对于每个字空间可能有多个Y，我们只计算最小的Y即可。其他的余数都相同。

算法实现：https://github.com/shinepengwei/Gallery/blob/master/findANum.cpp

对于任意的N，一定存在M使得NM的乘积的十进制表示只有0和1么？感觉应该木有吧- -没想出来证明方法。

2.9

2.10寻找数组中的最大值和最小值

对于一个数组，求出他的最大值和最小值需要多少次比较

对于这个问题，可以分别求最大值和最小值，需要2n次比较。

如果先对数组处理，将2i和2i+1位置上的数比较，令2i数大于2i+1的数，这样寻找最大的数只需要在2i的位置上找，最小的数只需要在2i+1位置上找，比较次数缩减为0.5n+0.5n+0.5n=1.5n

使用这个方法会破坏原数组，为了不破坏原数组，可以对于每一次2i和2i+1位置数的比较结果直接和最大值、最小值比较，就可以不破坏原数组，比较次数也可以为1.5n。

思考：首先对数组进行分了两类，第一类的每个数都比另一类的其中一个大，因此最大数一定在第一类。以此类推，是否可以在对其中一类分成两类，只查找其中一类呢？比较次数为0.5n+0.25n+0.25n（每一类中再分两类）+0.25n+0.25n=1.5n（四个分组，只需要比较其中两个分组，一个分组中找最大值，一个分组中找最小值）。为什么第一次分组减少了0.5n的比较次数，第二次就没有没有减少。原因是第一次分组以后，我们只需要对其中一组进行一个操作（找最大值、找最小值），所以再次分组没有用了。

如果使用分治法，将数组分成两组，每组里面找到最大值和最小值，然后分别比较两个最大值和最小值即可。f(n)=2*f(n/2)+2 => f(n)=1.5n-2 比较次数没有减少。

分治法为何没有用？或者说分治法什么时候有用，什么时候没用？需要思考！。

拓展问题：如果需要找到N个数组第二大数，需要比较多少次？是否可以使用类似的分治法思想降低比较次数。

2.11 寻找最近点对

给定平面上N个点的坐标，找出距离最近的两个点。

解法一：计算两两的距离，额，时间复杂度为O(n^2)

解法二：将N个点根据x坐标排序，然后使用分治法，将N个点根据x坐标M分为Left和Right集合，分别计算他们里面的最近点对，最短距离假设为Mindis(Left)和Mindis(Right)，同时，最近的点对可能分别出现在Left和Right集合。那么，我们要计算横坐标属于[M-mindis,M+mindis]的点之间的距离。对于任意一个区域内的点，我们只要计算按Y坐标轴排列的7个紧挨着它的点的距离即可。（证明过程略）。

所以，时间复杂度为F(N)=2*F(N/2)+O(N).所以他的时间复杂度为O(nlgN)

2.11 拓展问题：给定一个数组arr[0,...N-1]，要求求出相邻两个数的最大差值。相邻指数值相邻，即X和Y，如果不存在数组的其他元素属于[X,Y],则X、Y相邻。

编程之美指出可以用求最近点对的思想来做这个，即分治。

我觉得也可以直接对数组排序，然后O(n)时间去找到最大差值，时间复杂度都为O(N*lgN)

更好的方法：抽屉原理：则个数组的最大差值一定不小于(arr.max-arr.min)/N.证明略，反证法，比较好证。

将[arr.max,arr.min]分为N个桶，arr的每个元素都在某一个桶里面，每个桶都有一个最大元素和一个最小元素（可能相同，也可能没有）。O(N)

最大差值一定就是其中一个桶的最大值和下一个桶（存在最小值）的最小值.O(N)

最终，时间复杂度为O(N)，空间复杂度为O(N)。

2.12快速找到满足条件的两个数

能否快速找出一个数组的两个数字，使其之和等于给定的值。假设一定存在一组符合要求的解。

解法一：穷举，任意取出两个数，计算之和是否是给定的值。

解法二：对于每个数组元素arr[i]，都查找sum-arr[i]是否在数组中，如果直接遍历查找，时间复杂度为O(N^2)，和穷举原理相同。查找一个数组可以通过两种方法加快查找速度：1.先对数组排序，然后O(lgN)时间使用二分法查找。2.使用hash表只需要O(1)时间即可查找。使用这两种方法加快查找时间，总共的时间复杂度分别为O(NlgN)和O(N)。使用方法2，需要增加O(N)的存储空间。

解法三：在解法二中，我们使用了先排序O(NlgN)，在对每个arr[i]二分查找Sum-arr[i]，时间复杂度为O(NlgN)+O(NlgN)。对于第二步，可以有更好的更好的方法。排序后，数组的第一个元素最小，最后一个元素最大。可以使用两个标识P1，P2分别从数组头和数组尾向中间遍历。如果两个标识指向的元素之和大于SUM，P2向前走一步。如果元素之和小于SUM，P1向后走一步。这样就可以将查找过程时间复杂度减少到O(N)

经验：给定一个数组，返回两个下标（比如查找两个元素或者查找一个子数组），可以考虑先排序，然后使用两个变量反向遍历。同时，遍历的方向是不变的，从而保证了便利算法的时间复杂度为O(N)。

拓展问题：

1.将两个数字改为三个数字，或者任意数字，怎么办。

三个的话可以先把arr[i]拿出来，然后再在剩下的里面按照找两个数的方法查找SUM-arr[i]，时间复杂度为O(N)O(NlgN)。任一个数字？背包问题？没想出来。

如果完全相等的一对数字找不到，能否找出最接近的解？在使用两个标识反向遍历的时候，每一个计算出的SUM(P1,P2)比较和以前的SUM(P1,P2)与Sum差的绝对值，发现更接近的就记录下来，当两个标识相同时，结束，记录下来的就是最接近的解。当然，也可以吧两个标识存下来。

2.13 子数组的最大乘积

给定一个长度为N的整数数组，只允许用乘法，不允许用除法，计算任意（N-1）个数的组合中乘积最大的一组。

解法一：找出可能的所有N-1的组合，然后计算结果并比较，找到最大的。时间复杂度为P(N^2)。

解法二：时间换空间。N-1个元素的子数组的乘积p[i]可表示为s[i-1]*t[i+1]。即前I-1个元素的成绩乘上从i+1到最后的元素的乘积。而计算s[i]和t[i]只需要从头到尾和从尾到头遍历一遍，时间复杂度为O(n)，空间复杂度为o（N）.

解法三：直接根据N个数字相乘的结果来获得N-1个数的组合中成绩最大的。

假设P表示N个元素的乘积：

如果P=0，则数组肯定包括0，假设去掉一个0以后，其他N-1个元素的成绩为Q。如果Q为0，则数组中存在两个0，n-1的数的成绩只能为0；如果Q>0,则返回Q；如果Q<0，则选择任意一个负数去掉，N-1个数的最大值也只能为0.

如果P>0，则选择一个绝对值最小的正数去掉。如果没有正数，那就去掉绝对值最大的负数。

如果P<0，则根据负负得正原理，去掉一个绝对值最小的负数。

这样，我们只需要O(n)时间计算数组乘积，然后在用O(n)时间去掉某个数。

解法四：使用解法三可能会导致溢出，因此可以只保存正数、负数和0的个数。

2.14 数组的子数组之和的最大值

一个数组，求子数组（连续）的最大值。

解法一：穷举法，O(n^3)或者优化到o（N^2）

解法二：分治法。将A[0...n-1]分为A[0,...n/2-1]和A[n/2,n]，分别求出这两段数组各自的最大子数组和，则原数组的最大子数组之和有三种情况：1.与前一数组相同。2.与后一数组相同。3.跨越了两个数组。对于第三种情况，可以遍历两个数组，计算以A[n/2-1]结尾的最大子数组之和、以A[n/2]开始的最大子数组之和，这一步时间复杂度为O(N)。最后找到三种情况的最大值即可。所以时间复杂度F(N)=2F(N/2)+O(N),所以F(N)=O(N*lgN)

解法三：使用动态规划思想，当已经知道了a[0,...i]的最大子数组之和，现在如何计算a[0,...i+1]的最大子数组之和呢？如果以a[i+1]结尾的子数组之和大于a[0..i]的最大子数组之和，则更新。如何计算以a[i+1]结尾的子数组之和呢？如果使用O(n)时间遍历肯定是可以的，但是有没有更好的方法？我们可以保存a[0,..i]以a[i]结尾的最大子数组之和，当a[i+1]出现时，如果a[i]结尾的最大子数组之和大于0，则a[i+1]结尾的最大子数组之和肯定为a[i]结尾的最大子数组之和加上a[i+1]，否则，a[i+1]是以a[i+1]结尾的最大子数组之和。然后比较更新这个a[i+1]结尾的最大子数组之和和a[0,...i]中最大的子数组之和。

算法结构：从头朝后遍历，记录当前0到i的子数组之和的最大值MaxAll以及以a[i]结尾的最大子数组之和MaxLast。对于每个i，如果对于i-1的Maxlast大于0，则MaxLast=MaxtLast+a[i]，否则maxLast=a[i]。然后比较Maxlast和MaxAll，若MaxLast>MaxALL，则更新MaxAll。

伪代码如下：

int maxAll=a[0];

int maxLast=a[0];

for(int i=0;i<n;i++){

if maxLast>0 :maxLast+=maxLst;

else : maxLast=a[i];

if maxLast>maxAll : maxAll=maxLast;

}

return maxAll;

注：解法3和编程之美中的思路是相同的，只不过它的是从后向前，我的从前向后，我认为我的思路更清晰易懂。

2.15 子数组之和的最大值(二维)

和2.14不同在于，这里是一个二维数组，希望找一个子二维数组使其元素之和最大。（矩形区域）

这个和一维相似，只不过变成了二维。类比一维，可以使用枚举法，在枚举法中也可以对算法进行优化。

我觉得比较好的方法是将二维转化为一维，然后类比一维的方法。先选定Y坐标y1到y2(选择一个小的作为Y轴,min（N,M）)，然后把A[i][y1...y2]的所有元素相加，获得了一维数组，然后使用一维的方法。时间复杂度为O(NMmin(N,M)).

2.16求数组中最长的递增子序列

求一个一维数组中最长的递增子序列的长度，子序列不需要相邻。

解法一：使用动态规划。假设目标数组的第i个元素参与到的最长递增子序列（即a[i]为这个最长递增子序列的最后一位）为LIS(i).

我们已经知道了前i个LIS(i)，要计算LIS(i+1),LIS(i+1)=max{1,Lis(k)+1}，其中a[i+1]>a[k]，且k<i。

时间复杂度为O(n^2)

解法二：

使用解法一算法，假设输入为1，-1，2，-3，4，-5，6，-7，我们考虑执行过程。我们发现，LIS[i+1]只要在LIS[0,i]中找到最大的LIS[k]，且a[k]<a[i+1]，则LIS[i+1]=LIS[k]+1;不需要考虑比LIS[k]小的LIS了。

因此，我们可以通过这个对这个算法进行优化。使用MaxV[s]记录长度为s的最长子序列的最后一个元素（最大值）的最小值，如果a[i+1]大于这个最小值，则LIS[i]>=s+1。

综上所述，每次计算LIS[i+1]时，从目前最长的最长子序列s=MaxL开始，用a[i+1]和MaxV[s]比较，如果假设a[i+1]>MaxV[s]，则Lis[i+1]=s+1，同时更新MaxV[s+1];否则，s--;

这个解法时间复杂度编程之美上说的是O（N^2），更确切的应该是O(NMaxL)。但是MaxL最大可能是n，而且时间复杂度根据输入，所以表面是O(N^2)，其实一般MaxL<N，这个算法是比解法一好的。

解法三：在解法二中在搜索MaxV[s]时是遍历法，所以要O(MaxL)。如果使用二分法呢，就是O(lgMax).这样就将时间复杂度变成了O(NlgN)

2.17 数组循环移位

将含有N个元素的数组右移K位。

解法一：每次右移一位，循环K次。时间复杂度为O(N*K)

解法二：我们要考虑全面，K是否可能大于N。若K大于N，我们可以只循环K%N次，这样时间复杂度为O(N^2)。

解法三：三步交换法。如将abcd1234右移3位，结果为234abcd1.第一步：逆序排列abcd1:1dcba234。第二步：逆序排列234：1dcba432.第三步全部逆序：234abcd1

2.18 数组分割

将元素个数为2N的数组，分割为两个长度为N的数组（不要求在原数组连续），并且两数组之和最接近？

编程之美中给的结果只求除了两数组之和是多少，并没有求出如何分割元素。

解法如下：将任务分为2N步，第k步求出前k个元素中任意i个元素之和。在第k+1步中，根据前k步的结果和a[k]更新任意i个元素之和。不需要计算超过n的i。

2.19 区间重合判断

给定原区间x,y和N个无序目标区间[x1,y1],[x2,y2],....[xn,yn],判断原区间是否包含在目标区间。

解法一：我首先想到的是将目标区间处理成一个或多个不相交的大区间，然后去判断原区间是否在这几个大区间之内。步骤：1.对目标区间根据x排序。2.将目标区间合并为M个大区间。3.查找原区间是否包含在某一个大区间内，可以使用二分法查找。时间复杂度为O(NlgN)+O(N)+O(lgN)

解法二：（编程之美上的解法一）因为解法一可能需要将目标区间处理为多个不相交的大区间，不优雅。而编程之美上的一个方法是将目标区间投影到原区间上，看最后是否将所有的原区间覆盖。编程之美上说这个方法的时间复杂度为O(N^2)，我没看懂。。。

解法三：我的想法：可以先对目标数组根据X排序，然后去对原区间压缩，而不会造成切割，最后去判断是否原区间被全部压缩掉。时间复杂度：O(NlgN)+O(N)，也没有额外的空间，这个应该是更好的方法。

扩展问题：如何处理二维空间覆盖问题？

判断一个原矩形在二维空间是否被其他多个目标矩形覆盖，可以对X轴和Y轴分别进行一维区间重合判断。（有没有更好的方法？路上思考下）

3.9 重建二叉树

根据前序遍历和中序遍历重建二叉树。

前序遍历的第一个节点是根节点，然后找到中须遍历的这个节点，中须遍历数组中这个节点的前面的序列就是根节点的左子树，后面的节点序列就是根节点的右子树，递归。

再注：看到了拓展问题2，明白了这些判断的意义和价值。如果前序遍历和中须遍历给的不合理，这些判断可以判断出来。

扩展问题：

1.如果根据字母不能确定节点，即有些节点的字母可能相同的。该题会出现什么情况？

答：重构出来的二叉树肯定不唯一。可以将所有的可能的情况都找出来。思想相同，更复杂些。

2.如何判断给定的前序遍历和中序遍历的结果是合理的？

能否根据算法构造出一个对应的二叉树。如前序：acb，中序bac，就没有办法构造出二叉树。

3.如果知道前序和后序遍历的结果，能重构二叉树么？

不能！当一个节点只有左子树或右子树（一个子树）时，无法分辨出来是左还是右子树。

二叉树的遍历

前序遍历：

PreTraverse(Node p){

if(p==NULL) return;

  printf(p->value);

if(p->left!=NULL){

   PreTraverse(p->left);

}

if(p->right!=NULL){

   PreTraverse(p->right)

}

}

中序遍历：

MidTraverse(Node *p){

if(p==NULL) return;

if(p->left!=NULL){

MidTraverse(p->left);

}

  printf(p->value);

if(p->right!=NULL){

MidTraverse(p->right)

}

}

中序遍历不使用递归版本一（只用栈存储遍历状态）

MidTraverse(Node *p){

   if(p==NULL) return;

stack<Node *> Nstack;

Nstack.push(p);

while(!Nstack.isEmpty()){

tmpPtr=Nstack.getTop();

   //如果tmpPtr==NULL，说明上一次访问的是一个右子树为NULL的节点

   while(tmpPtr!=NULL) Nstack.push(tmpPtr->left);tmpPtr=tmpPtr->left;//向左走到尽头最后会将一个NULL指针放在stack的顶端

   Nstack.pop();//将NULL指针去掉

   if(!Nstack.isEmpty()){

      tmpPtr=Nstack.pop();

    printf(tmpPtr->value);

       Nstack.push(tmp_Ptr->right);//如果右指针指向NULL，也将其放入stack的顶端，以标识

   }

}

}

中序遍历不使用递归版本二，这个更好理解

MidTraverse(Node *T){

Node *p=T;

stack<Node> Nstack;

while(p||!Nstack.isEmpty()){

if(p!=Null){

Nstack.push(p);

p=p->left;

}else{

p=Nstack.pop();

printf(p->value);

p=p->right;

}

后序遍历：

AfterTraverse(Node *p){

if(p==NULL) return;

if(p->left!=NULL){

AfterTraverse(p->left);

}

printf(p->value);

if(p->right!=NULL){

AfterTraverse(p->right)

}

3.10分层遍历二叉树

问题1：给定一颗二叉树，分层遍历该二叉树。

使用队列，输出这个节点的同时将他的左右子节点存入队列，先进先出。同时想法子标识一层的结束用于分行。

问题2：打印二叉树某层次节点（从左到右），根节点为0层。

可使用递归，int printNodeAtLevel(Node *root,int level),若level>0，则递归调用root的左右子节点，并将level-1,当level=0时左右边界条件输出并返回。

拓展问题：如果从下到上访问，咋搞？

使用栈，先访问右节点，在访问左节点，先进后出。打印出来即可。

对 2013年9月5日 1:40:21 的修改出现冲突：

2.1求二进制数中1的个数

解法一：将数除以2至0，余数为1的次数数

解法二：使用位运算：将该数与0x01与运算，然后左移1位。与运算结果为1的次数。位操作和除、余操作相比效率更高。

解法三：让算法的复杂度只和1有关，原理是v&(v-1)后的结果即为将v二进制数的为1的最低位消除。

解法四：使用分治判断法判断一个数的1的位数，但是根据程序的书写最多可能要判断255此才可以，因此此方法不太好。

拓展问题：两个二进制整数A、B，他们有多少位是不同的？

答：异或操作，结果然后计算1的个数。

2.2 不要被阶乘吓到

2.3寻找水王

一个ID发的帖子超过了所有帖子总数量的一般，如何找到这个ID。

解法一：对所有帖子的ID排序，然后找到中间的那一个ID即可。需要排序，时间复杂度：O(N*lgN)

解法二：每次删掉两个不同的ID，最后剩下的就是要找的ID。只需要遍历一遍，O(N)即可。

扩展问题：有三个发帖很多的ID，每个人的发帖数目超过了全部的1/4，如何快速找到这3个ID？

同理，每次删掉四个不同的ID，最后剩下3个ID即可。

2.4 1的数目

2.5 寻找最大的K个数

解法一：使用排序算法，时间复杂度为O(N*lgN)。或者使用选择排序或者交换排序只排序前N个，可以将事件负责度降至O(N*K)

基数排序：

遍历输入数据A[n]，统计元素i出现的次数c[i]。

对count[i]进行处理，循环c[i]=c[i]+c[i-1]，c数组里面的元素现在代表的是小于或等于i的数量。

再一次遍历A[n]，B[c language="[A[n"][/c]]]=A][n]，同时c[A[n]]--;

2.6 精确表达浮点数

对于一个有限小数如0.34或者一个无限小数如3.3333....即0.3(3)，如何用一个分数精确的表达。

现在我们只考虑有限小数0.a1a2a3...an和无限小数0.a1a2..an(b1b2..bm)

对于有限小数，没有啥好说的，直接转为0.a1a2a3...an/(10^n) ——公式一。

对于所有的小数，都可以带入这两个公式，然后约分即可。

2.7 最大公约数问题

解法一：辗转相除法：Gcd(x,y)=Gcd(y,x%y).原理：最大公约数g可以整除x和y，x=ga,y=gb.x%y=x-(gbc)

解法二：辗转相减法:Gcd(x,y)=Gcd(x,x-y)

解法三：分析公约数特点：1.如果y=ky1,x=kx1，则f(x,y)=kf(x1,y1) 2.如果x=px1，且p为素数，并且y%p!=0。则f(x,y)=f(x1,y);

使用素数2，若x，y均为偶数，f(x,y)=2*f(x/2,y/2).

若x为偶数，y为奇数，f(x,y)=f(x/2,y)=f(x>>1,y). 同理y为偶数，x为奇数。

若x,y都为奇数，f(x,y)=f(x-y,y)

时间复杂度为O(lg(max(x,y)))

2.8 寻找符合条件的整数

给定一个正整数N，求一个最小的正整数M(M>1)，使得NM的十进制表示形式里面只含有1或者0.

直接解法：从2开始枚举M的取值，直至找到符合条件的M。这个方法耗费极大的时间，完全不靠谱。

因为题目是对NM进行的限定，因此我们可以遍历NM。将上面的问题转化为：求最小的X，X只含有0或者1，而且X可以被N整除。X/N就是我们要找的M。

对于任意的N，一定存在M使得NM的乘积的十进制表示只有0和1么？感觉应该木有吧- -没想出来证明方法。

2.9

2.10寻找数组中的最大值和最小值

对于一个数组，求出他的最大值和最小值需要多少次比较

对于这个问题，可以分别求最大值和最小值，需要2n次比较。

分治法为何没有用？或者说分治法什么时候有用，什么时候没用？需要思考！。

拓展问题：如果需要找到N个数组第二大数，需要比较多少次？是否可以使用类似的分治法思想降低比较次数。

2.11 寻找最近点对

给定平面上N个点的坐标，找出距离最近的两个点。

解法一：计算两两的距离，额，时间复杂度为O(n^2)

所以，时间复杂度为F(N)=2*F(N/2)+O(N).所以他的时间复杂度为O(nlgN)

编程之美指出可以用求最近点对的思想来做这个，即分治。

我觉得也可以直接对数组排序，然后O(n)时间去找到最大差值，时间复杂度都为O(N*lgN)

更好的方法：抽屉原理：则个数组的最大差值一定不小于(arr.max-arr.min)/N.证明略，反证法，比较好证。

将[arr.max,arr.min]分为N个桶，arr的每个元素都在某一个桶里面，每个桶都有一个最大元素和一个最小元素（可能相同，也可能没有）。O(N)

最大差值一定就是其中一个桶的最大值和下一个桶（存在最小值）的最小值.O(N)

最终，时间复杂度为O(N)，空间复杂度为O(N)。

2.12快速找到满足条件的两个数

能否快速找出一个数组的两个数字，使其之和等于给定的值。假设一定存在一组符合要求的解。

解法一：穷举，任意取出两个数，计算之和是否是给定的值。

拓展问题：

1.将两个数字改为三个数字，或者任意数字，怎么办。

三个的话可以先把arr[i]拿出来，然后再在剩下的里面按照找两个数的方法查找SUM-arr[i]，时间复杂度为O(N)O(NlgN)。任一个数字？背包问题？没想出来。

2.13 子数组的最大乘积

给定一个长度为N的整数数组，只允许用乘法，不允许用除法，计算任意（N-1）个数的组合中乘积最大的一组。

解法一：找出可能的所有N-1的组合，然后计算结果并比较，找到最大的。时间复杂度为P(N^2)。

解法三：直接根据N个数字相乘的结果来获得N-1个数的组合中成绩最大的。

假设P表示N个元素的乘积：

如果P>0，则选择一个绝对值最小的正数去掉。如果没有正数，那就去掉绝对值最大的负数。

如果P<0，则根据负负得正原理，去掉一个绝对值最小的负数。

这样，我们只需要O(n)时间计算数组乘积，然后在用O(n)时间去掉某个数。

解法四：使用解法三可能会导致溢出，因此可以只保存正数、负数和0的个数。

2.14 数组的子数组之和的最大值

一个数组，求子数组（连续）的最大值。

解法一：穷举法，O(n^3)或者优化到o（N^2）

伪代码如下：

int maxAll=a[0];

int maxLast=a[0];

for(int i=0;i<n;i++){

if maxLast>0 :maxLast+=maxLst;

else : maxLast=a[i];

if maxLast>maxAll : maxAll=maxLast;

}

return maxAll;

注：解法3和编程之美中的思路是相同的，只不过它的是从后向前，我的从前向后，我认为我的思路更清晰易懂。

2.15 子数组之和的最大值(二维)

和2.14不同在于，这里是一个二维数组，希望找一个子二维数组使其元素之和最大。（矩形区域）

这个和一维相似，只不过变成了二维。类比一维，可以使用枚举法，在枚举法中也可以对算法进行优化。

2.16求数组中最长的递增子序列

求一个一维数组中最长的递增子序列的长度，子序列不需要相邻。

解法一：使用动态规划。假设目标数组的第i个元素参与到的最长递增子序列（即a[i]为这个最长递增子序列的最后一位）为LIS(i).

我们已经知道了前i个LIS(i)，要计算LIS(i+1),LIS(i+1)=max{1,Lis(k)+1}，其中a[i+1]>a[k]，且k<i。

时间复杂度为O(n^2)

解法二：

综上所述，每次计算LIS[i+1]时，从目前最长的最长子序列s=MaxL开始，用a[i+1]和MaxV[s]比较，如果假设a[i+1]>MaxV[s]，则Lis[i+1]=s+1，同时更新MaxV[s+1];否则，s--;

解法三：在解法二中在搜索MaxV[s]时是遍历法，所以要O(MaxL)。如果使用二分法呢，就是O(lgMax).这样就将时间复杂度变成了O(NlgN)

2.17 数组循环移位

将含有N个元素的数组右移K位。

解法一：每次右移一位，循环K次。时间复杂度为O(N*K)

解法二：我们要考虑全面，K是否可能大于N。若K大于N，我们可以只循环K%N次，这样时间复杂度为O(N^2)。

解法三：三步交换法。如将abcd1234右移3位，结果为234abcd1.第一步：逆序排列abcd1:1dcba234。第二步：逆序排列234：1dcba432.第三步全部逆序：234abcd1

2.18 数组分割

将元素个数为2N的数组，分割为两个长度为N的数组（不要求在原数组连续），并且两数组之和最接近？

编程之美中给的结果只求除了两数组之和是多少，并没有求出如何分割元素。

解法如下：将任务分为2N步，第k步求出前k个元素中任意i个元素之和。在第k+1步中，根据前k步的结果和a[k]更新任意i个元素之和。不需要计算超过n的i。

2.19 区间重合判断

给定原区间x,y和N个无序目标区间[x1,y1],[x2,y2],....[xn,yn],判断原区间是否包含在目标区间。

扩展问题：如何处理二维空间覆盖问题？

判断一个原矩形在二维空间是否被其他多个目标矩形覆盖，可以对X轴和Y轴分别进行一维区间重合判断。（有没有更好的方法？路上思考下）

3.1 字符串移位包含的问题

给定两个字符串s1和s2，要求判断s2是否能够被s1做循环移位得到的字符串包含。

char *strstr(char *s1,char *s2)函数可以判断s2是否包含的在s1中，并返回s1中包含的s2的指针，否则返回NULL。

解法一：对s1移位，每次移位一次然后判断是否包含了s2.效率很低。

解法二：将S1扩展两倍，在s1后面再加上s1，如原本的s1=“abcd”,扩展后的s1=“abcdabcd”，然后判断s2是否包含在扩展后的s1中。

我的想法：其实可以不申请多的空间，只要不使用strstr函数，每次从s1[i]开始，判断s[i]开始的strlen(s2)个字符是否和s2相同，判断期间j=i+x,每次j++,判断s1[j]是否等于s2[x],如果j>=n，令j=j%n;

3.2电话号码对应英语单词

电话号码盘一般可以用于输入字母。如2表示a/b/c，3表示d/e/f。对于一个号码，可以依次输出其代表的字母组合。

其实这个问题就是对一棵树进行遍历，把每个从根节点到叶子节点的路径都输出来。

可以使用直接循环法，使用answer[]记录每位号码对应的字母，把answer的所有结果输出即可。但是因为电话号码的长度不确定，因此文章中给出了一个更优雅的循环方法。当然也可以使用递归的方法。

这个问题可以扩展为如何输出n位数（M进制）的所有可能的数。

3.3计算字符串的相似度

对于两个字符串，希望判断其相似度。操作方法：1.修改一个字符。2.增加一个字符。3.删除一个字符。定义两个字符串的距离为一个字符串变成另一个操作的次数，相似度为1/（距离）。

思想是将这个问题转化成规模较小的问题，如果两个字符串A[1..N]和B[1..N]，第一个字符相同，那么只需要计算A[2..N]和B[2...N]的距离。如果第一个字符不相同，那就进行一部操作后，分三种情况，1.计算A[2...N]和B[1...N]的距离（A删掉一个字符，或者B添加一个字符）。2.计算A[1...N]和B[2...N]的距离（A添加一个字符或者B删掉一个字符）。3.计算A[2...N]和B[2...N]的距离（把A和B的当前字符改成相同）。递归就可以写出来一个程序。

在递归过程中，如果因为有些子问题是可能重复的，可以将这些子问题的结果存储下来，下次使用时不用计算直接查询。

3.4 从无头的单链表中删除节点。

删掉这个节点的下一个节点，然后把下一个节点的内容复制到这个节点。

3.6 变成判断两个链表是否相交。

如h1:a1->...->b1->b2和链表H2:c1->...->b1->b2相较于b1.只判断是否相交，假设不带环。

解法1：直接判断一个链表的每个节点是否包含在另一个连接。时间复杂度很大。

解法2：使用hash表存储H1链表的节点，判断h2链表中的节点在hash表中是否存在。

解法3：可以将H1的最后的节点指向h2头结点，然后从h2开始向后遍历，看看是否会回到h2头结点。

解法4：最简单的方法，获得H1和H2尾节点，判断他们是否相同。

3.7 队列中取最大值操作问题

假设有一个队列，设计一个数据结构和算法，使在队列上去最大值的操作时间复杂度尽可能降低。

解法一：使用传统队列，每次取最大值都遍历队列所有元素。

解法二：使用最大堆维护队列中的元素。同时元素中添加一个成员，指向队列中的下一个元素。取最大值操作只需要O(1)，出入队操作是一个最大堆操作需要O(lgN)。

编程之美上的解法3是错误的，它使用了一个最大值序列保存最大值逻辑，但对于6，5，4这个序列，他构造的最大值序列中只存储6这一个值，一旦6 pop出去，就无法在进行最大值操作。

更新：对于栈来说，使用一个栈来保存他的最大值是正确的，因为栈具有先进后出的特性。如6，5，4序列，只需要存储6，因为如果6pop出去，5和4肯定已经pop出去了，只需要记录下在6之前的序列中的最大值即可。

更好的方法是使用一个最大堆来保存最大值逻辑。

使用最大堆作为辅助数据结构有缺点，就是存入和取出操作都是O(lgN)。

不过文中还有一个用两个栈实现一个队列的思想，不错。设栈A和B，入队时都将元素存如栈B，出队时将将栈A的元素弹出，如果栈A中没有元素，那么将栈B的元素依次弹出并放入栈A。

3.8 求二叉树节点的最大距离。

假设二叉树的边是双向的，定义距离为两个节点之间边的个数。

其实这个过程就是寻找一个节点，这个节点左子树深度和右子树深度之和（以这个节点为跟的并且最大距离经过这个节点的节点最大距离）最大。

假设一个节点的左子树和右子树的深度都已经知道了，那么这个节点的深度，已经经过这个节点的最大距离都可以知道。

递归可以实现以上过程。

分析递归问题，编程之美给了三点经验：

1.弄清楚递归的顺序。递归视实现中假设后续调用已经完成，在此基础上实现自身的逻辑。

2.分析递规体的逻辑，即知道了子问题，如何计算这个问题。

3.弄清楚递归退出的边界，也就是说哪些地方要写return。

3.9 重建二叉树

根据前序遍历和中序遍历重建二叉树。

再注：看到了拓展问题2，明白了这些判断的意义和价值。如果前序遍历和中须遍历给的不合理，这些判断可以判断出来。

扩展问题：

1.如果根据字母不能确定节点，即有些节点的字幕可能相同的。该题会出现什么情况？

答：重构出来的二叉树肯定不唯一。可以将所有的可能的情况都找出来。思想相同，更复杂些。

2.如何判断给定的前序遍历和中序遍历的结果是合理的？

能否根据算法构造出一个对应的二叉树。如前序：acb，中序bac，就没有办法构造出二叉树。

3.如果知道前序和后序遍历的结果，能重构二叉树么？

不能！当一个节点只有左子树或右子树（一个子树）时，无法分辨出来是左还是右子树。

二叉树的遍历

前序遍历：

PreTraverse(Node p){

stack<Node> Nstack;

while(p||!Nstack.isEmpty()){

if(p!=Null){

Nstack.push(p);

p=p->left;

}else{

p=Nstack.pop();

printf(p->value);

p=p->right;

}

后序遍历：

AfterTraverse(Node *p){

if(p==NULL) return;

if(p->left!=NULL){

AfterTraverse(p->left);

}

printf(p->value);

if(p->right!=NULL){

AfterTraverse(p->right)

}

3.10分层遍历二叉树

问题1：给定一颗二叉树，分层遍历该二叉树。

使用队列，输出这个节点的同时将他的左右子节点存入队列，先进先出。同时想法子标识一层的结束用于分行。

问题2：打印二叉树某层次节点（从左到右），根节点为0层。

可使用递归，int printNodeAtLevel(Node *root,int level),若level>0，则递归调用root的左右子节点，并将level-1,当level=0时左右边界条件输出并返回。

拓展问题：如果从下到上访问，咋搞？

使用栈，先访问右节点，在访问左节点，先进后出。打印出来即可。

编程之美读书笔记

About me

最新文章

标签

Links

编程之美 读书笔记

About me

最新文章

标签

Links

编程之美读书笔记