1.图算法包含三种计数,其中将图问题表示为有向无环图的估值问题的是()。C
A、自举
B、缩图法
C、时间前向处理
D、连通分量
2.半外存算法是假设()。B
A、边放在内存中,顶点在外面
B、顶点放在内存中,边在外面
C、顶点和边都放在内存当中
D、顶点和边都不在内存当中
3.图的连通性算法可扩增为求图G最小生成树(MST)的算法。()正确
4.在求最小生成树时,压缩后图中某条边的权值等于该边代表的所有边的权值最大值。()X
7.1
1.MapReduce是由()开发的分布式编程模型。B
A、Microsoft
B、Google
C、Tencent
D、AlibabaGroup
2.在实现MapReduce程序时,需要注意的事项不包括()。C
A、避免创建对象
B、避免缓冲
C、避免通信
D、避免Mapper和Reducer间的全局变量传递
3.MapReduce的执行框架处理的内容包括()。ABCD
A、调度
B、数据分布
C、将中间数据进行聚集、排序或洗牌
D、进行错误处理
4.理想的可扩展性有()。BC
A、数据加倍,运行时间减半
B、数据加倍,运行时间加倍
C、资源加倍,运行时间减半
D、资源加倍,运行时间加倍
5.Map()和Reduce()两个函数不能够并行运行。()X
7.2
1.在版本1的字数统计中,在Map里使用了一个数组H,其作用是为每一个出现的单词作()。B
A、序列
B、基数
C、集合
7.3
1.大部分时候reducer不能用作combiner。()正确
2.combiner的运行次数可能有多次。正确
7.4
1.关于单词共现矩阵的计算,说法正确的是()。ACD
A、计算文本集合中词的共现矩阵
B、词的个数如果为N,输出为M*N的矩阵
C、是一种测量语义距离的方法
D、语义距离可用于许多语言处理任务
2.用单词共现矩阵解决大规模计数问题的基本方法是()。AC
A、Mapper生成部分计数
B、Reducer生成部分计数
C、Reducer聚合部分计数
D、Mapper聚合部分计数
3.“条纹法”的优点有()。
A、易于实现
B、对key-value对的排序和洗牌少得多
C、潜在对象更大
D、能更好地利用combiner
4.在“词对法”中,每个mapper处理一个句子。()正确
5.“词对法”的缺点是不易实现,排序和洗牌代价高。()X
6.f(B|A)词对法必须确定所有a被传递到同一个combiner。()X
8.1
1.在repartitionjoin的改进中,说法错误的是()。A
A、Map函数的输出键作为连接键
B、Map函数的输出键变化为连接键和表名的组合。
C、Partition函数中Hashcode仅从组合键的连接键计算
D、Grouping函数仅根据连接键分组纪录