客服联系方式

当前位置:首页 » 论文摘要 » 正文

免费论文摘要:散布式索引本领的接洽与实行

10749 人参与  2022年01月30日 21:37  分类 : 论文摘要  评论

跟着互联网络的兴盛,全文字笔迹检验索仍旧变成人们定位和获守信息的要害本领,经过Google、百度等互联网络探求引擎,人们不妨简单的从不计其数的互联网络消息中探求本人须要的消息。索引动作消息检索体例的要害构成局部,不妨为赶快灵验的消息检索供给扶助。但是跟着消息量的连接延长,保守的索引本领仍旧不许满意洪量消息情况下探求引擎索引消息的需要。为了实行高效的索引,怎样运用散布式保存与计划本领普及索引算法的功夫和空间功效已变成一个新的接洽热门。正文对现有鉴于Map/Reduce 散布式索引计划举行了接洽和领会,对准那些算法生存的外存题目和I/O 功效题目,提出了一种矫正的鉴于Map/Reduce 散布式索引计划。算法运用Map/Reduce 框架的二次排序(second sort)功效对倒陈设表举行排序,简略倒陈设表输入进程前缓存排序的办法,缩小了潜伏的外存溢出题目。同声沿用更为紧凑的倒陈设表表白办法来普及Map/Reduce 计划进程的数据传输功效。并经过试验对当时间和空间上的灵验性举行了考证。其余,正文对散布式探求情况下索引数据分片和增量革新题目举行了接洽。在领会已有散布式探求体例中索引建立和保护计划的普通上,提出了一种新的鉴于非构造化数据库的倒排索引建立本领。该本领运用BigTable 可扩充的数据保存模子来表白全文倒排索引中倒陈设表的构造。把倒排索引数据寄存于非构造化数据库之上,以此实行索引数据的散布式查问和增量保护。结果经过试验领会考证了计划的灵验性。正文还对准国度高科技普通前提平台项手段须要,贯串正文前方提出的散布式索引算法,安排并实行了面向高科技类中心消息的笔直探求体例。该体例实行了高科技类网页消息的抓取的赶快索引功效,不妨为平台派别的高科技资源检索供给高效的消息检索效劳。在舆论的结果对全文实质举行了归纳,并提出了犯得着进一步接洽的几何题目。

来源:半壳优胜育转载请保留出处和链接!

本文链接:http://www.87cpy.com/200542.html

云彩店APP下载
云彩店APP下载

本站部分内容来源网络如有侵权请联系删除

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

站内导航

足球简报

篮球简报

云彩店邀请码54967

    云彩店app|云彩店邀请码|云彩店下载|半壳|优胜

NBA | CBA | 中超 | 亚冠 | 英超 | 德甲 | 西甲 | 法甲 | 意甲 | 欧冠 | 欧洲杯 | 冬奥会 | 残奥会 | 世界杯 | 比赛直播 |

Copyright 半壳优胜体育 Rights Reserved.