搜题
网友您好,请在下方输入框内输入要搜索的题目:
搜题
题目内容 (请给出正确答案)
提问人:网友aidingy 发布时间:2022-01-07
[主观题]

关于“非结构化数据(文档)的查找与搜索”问题,参考下图,回答下列问题。注意每份文档可能包含数千数万的词汇。 若要在n个全文文档中(n可能很大)查找有无某个关键词的文档,为提高检索效率,最好的做法是_____。

A、直接用给定关键词来匹配每一份文档中的每一个词汇。若该文档存在匹配成功的词汇,则输出该文档;否则,不输出该文档

B、对这n个文档,首先建立一个“关键词”索引表,该索引表记录着“关键词”及包含该关键词的“文档编号”。在此基础上,用给定关键词来匹配索引表中的关键词。如果匹配成功,则输出索引表中相对应的文档编号;否则,则输出信息“没有含该关键词的文档”

C、对这n个文档,首先建立一个“关键词”索引表,该索引表记录着“关键词”及包含该关键词的“文档编号”,并按关键词进行字母序的排序。在此基础上,用给定关键词来匹配索引表中的关键词。如果匹配成功,则输出索引表中相对应的文档编号,否则,则输出信息“没有含该关键词的文档”

D、选项(B)(C)比选项(A)的做法好,但选项(B)(C)没有效率上的差别

简答题官方参考答案 (由简答题聘请的专业题库老师提供的解答)
  抱歉!暂无答案,正在努力更新中……
更多“关于“非结构化数据(文档)的查找与搜索”问题,参考下图,回答下列问题。注意每份文档可能包含数千数万的词汇。 若要在n个全文文档中(n可能很大)查找有无某个关键词的文档,为提高检索效率,最好的做法是_…”相关的问题
第1题

什么是非遗传毒性致癌物?如何分类?

点击查看答案
第2题
以下关于非正常户的表述,正确的有()。

A. 税务机关应在非正常户认定的次月,在办税场所或者广播、电视、报纸、期刊、网络等媒体上公告非正常户

B. 对没有欠税且没有未缴销发票的纳税人,认定为非正常户超过两年的,税务机关可以注销其税务登记证件。

C. 对非正常户纳税人的法定代表人或经营者申报办理新的税务登记的,税务机关核发临时税务登记证及副本,限量供应发票。

D. 税务机关发现纳税人的法定代表人或经营者在异地为非正常户的法定代表人或经营者的,应通知其回原税务机关办理相关涉税事宜。纳税人的法定代表人或经营者在原税务机关办结相关涉税事宜后,方可申报转办正式的税务登记。

点击查看答案
第3题
非均匀加宽
点击查看答案
第4题
外排序是需要使用硬盘等外部存储设备进行大数据集合排序的过程或算法,其中一种策略是“排序-归并”,如下图所示。仔细理解该图所表达的基本思想,回答问题。 关于“排序-归并”算法,下列说法不正确的是_____。

A、“排序-归并”算法是一个两阶段完成排序的算法,第一个阶段称为子集合排序,第二个阶段称为归并排序

B、“排序-归并”算法是在这样环境下应用的算法:待排序数据元素数目大于或远大于内存中可装入数据元素数目

C、“排序-归并”算法可以对任意大规模的数据集合进行排序;“排序-归并”算法是通过多次读写磁盘完成大规模数据集合的排序工作的

D、上述说法有不正确的

点击查看答案
第5题

下列三个算法是关于“大规模数据集合中查找有无某些元素”问题的算法:针对一个“学生”数据表,如下示意,找出“成绩”为某一分数的所有学生。【算法A1】 Start of algorithm A1 Step 1. 从数据表的第1条记录开始,直到其最后一条记录为止,读取每一条记录,做Step 2。 Step 2. 对每一条记录,判断成绩是否等于给定的分数:如果是,则输出;如果不是,则不输出。 End of algorithm A1 【算法A2】 Start of algorithm A2 Step 1. 从数据表的第1条记录开始,直到其最后一条记录为止,读取每一条记录,做Step 2和Step 3。 Step 2. 对每一条记录,判断成绩是否等于给定的分数:如果等于,则输出;如果不等于,则不输出。 Step 3. 判断该条记录的成绩是否小于给定的分数:如果不是,则继续;否则,退出循环,算法结束。 End of algorithm A2 【算法A3】 Start of algorithm A3 Step 1. 假设数据表的最大记录数是n,待查询区间的起始记录位置Start为1,终止记录位置Finish为n; Step 2. 计算中间记录位置I = (Start+Finish)/2,读取第I条记录。 Step 3. 判断第I条记录的成绩与给定查找分数: (3.1)如果是小于关系,则调整Finish = I-1;如果Start >Finish则结束,否则继续做Step 2; (3.2)如果是大于关系,则调整Start = I+1;如果Start>Finish则结束,否则继续做Step 2; (3.3)如果是等于关系,则输出,继续读取I周围所有的成绩与给定查找条件相等的记录并输出,直到所有相等记录查询输出完毕则算法结束。 End of algorithm A3 关于算法A1, A2, A3的快慢问题,下列说法正确的是_____。

A、算法A1快于算法A2, 算法A2快于算法A3

B、算法A2快于算法A1, 算法A2快于算法A3

C、算法A3快于算法A2, 算法A2快于算法A1

D、算法A1快于算法A3, 算法A3快于算法A2

点击查看答案
第6题
外排序是需要使用硬盘等外部存储设备进行大数据集合排序的过程或算法,其中一种策略是“排序-归并”,如下图所示。仔细理解该图所表达的基本思想,回答问题。 参见图示。如果:内存块数为 ,待排序元素集合所占用磁盘块数 ,采用排序-归并算法进行升序排序,下列说法正确的是_____。

A、算法以磁盘块读写次数衡量的时间复杂性为

B、算法以磁盘块读写次数衡量的时间复杂性为

C、算法以磁盘块读写次数衡量的时间复杂性为

D、算法以磁盘块读写次数衡量的时间复杂性为

点击查看答案
第7题
关于“非结构化数据(文档)的查找与搜索”问题,参考下图,回答下列问题。注意每份文档可能包含数千数万的词汇。 上图给出了一种“自动获取文档关键词”的方法,关于该方法的表述,最好的是_____。

A、文档中出现次数最多的词汇必定是关键词

B、文档中去掉标点符号后,出现次数最多的词汇必定是关键词

C、文档中去掉标点符号和一些辅助词汇, 出现次数最多的词汇必定是关键词

D、文档中去掉标点符号和一些辅助词汇, 出现次数最多且次数达到一定数值的词汇必定是关键词

点击查看答案
第8题

下列三种算法是经常应用的内排序算法:插入排序、选择排序和冒泡排序。阅读下列算法,回答问题。 INSERTION-SORT(A) 1. for i=2 to N 2. { key = A[i] ; 3. j =i-1; 4. While (j>0 and A[j]>key) do 5. { A[j+1]=A[j]; 6. j=j-1; } 7. A[j+1]=key; 8. } SELECTION-SORT(A) 1. for i=1 to N-1 2. { k=i; 3. for j=i+1 to N 4. { if A[j] <a[k] then k="j;" } 5. if> i then 6. { 7. temp =A[k]; 8. A[k]=A[i]; 9. A[i]=temp; 10. } 11. } BUBBLE-SORT(A) 1. for i=1 to N-1 2. { haschange=false; 3. for j=1 to N-i 4. { if A[j]>A[j+1] then 5. { temp =A[j]; 6. A[j]=A[j+1]; 7. A[j]=temp; 8. haschange=true; 9. } 10. } 11. if (haschange ==false) then break; 12. } 阅读BUBBLE-SORT算法,已知N=20,下列说法正确的是_____。

A、第5轮次,是将第1个元素至第15个元素之间的元素,相邻者进行比较

B、第4轮次,是将第1个元素至第20个元素之间的元素,相邻者进行比较

C、第8轮次,是将第20个元素至第12个元素之间的元素,相邻者进行比较

D、第11轮次,是将第20个元素至第1个元素之间的元素,相邻者进行比较

点击查看答案
第9题

外排序是需要使用硬盘等外部存储设备进行大数据集合排序的过程或算法,其中一种策略是“排序-归并”,如下图所示。仔细理解该图所表达的基本思想,回答问题。参见图示。如果:内存块数为,每块可装载个元素,待排序元素集合所占用磁盘块数,采用排序-归并算法进行升序排序,下列说法正确的是_____。

A、算法以磁盘块读写次数衡量的时间复杂性为

B、算法以磁盘块读写次数衡量的时间复杂性为

C、算法以磁盘块读写次数衡量的时间复杂性为

D、算法以磁盘块读写次数衡量的时间复杂性为

点击查看答案
重要提示: 请勿将账号共享给其他人使用,违者账号将被封禁!
查看《购买须知》>>>
重置密码
账号:
旧密码:
新密码:
确认密码:
确认修改
购买搜题卡查看答案
购买前请仔细阅读《购买须知》
请选择支付方式
微信支付
支付宝支付
点击支付即表示你同意并接受《服务协议》《购买须知》
立即支付
搜题卡使用说明

1. 搜题次数扣减规则:

功能 扣减规则
基础费
(查看答案)
加收费
(AI功能)
文字搜题、查看答案 1/每题 0/每次
语音搜题、查看答案 1/每题 2/每次
单题拍照识别、查看答案 1/每题 2/每次
整页拍照识别、查看答案 1/每题 5/每次

备注:网站、APP、小程序均支持文字搜题、查看答案;语音搜题、单题拍照识别、整页拍照识别仅APP、小程序支持。

2. 使用语音搜索、拍照搜索等AI功能需安装APP(或打开微信小程序)。

3. 搜题卡过期将作废,不支持退款,请在有效期内使用完毕。

请使用微信扫码支付(元)

订单号:

遇到问题请联系在线客服

请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系在线客服
恭喜您,购买搜题卡成功 系统为您生成的账号密码如下:
重要提示:请勿将账号共享给其他人使用,违者账号将被封禁。
发送账号到微信 保存账号查看答案
怕账号密码记不住?建议关注微信公众号绑定微信,开通微信扫码登录功能
警告:系统检测到您的账号存在安全风险

为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!

- 微信扫码关注简答题 -
警告:系统检测到您的账号存在安全风险
抱歉,您的账号因涉嫌违反简答题购买须知被冻结。您可在“简答题”微信公众号中的“官网服务”-“账号解封申请”申请解封,或联系客服
- 微信扫码关注简答题 -
请用微信扫码测试
欢迎分享答案

为鼓励登录用户提交答案,简答题每个月将会抽取一批参与作答的用户给予奖励,具体奖励活动请关注官方微信公众号:简答题

简答题官方微信公众号

简答题
下载APP
关注公众号
TOP