中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的第43次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2018年12月,中國(guó)網(wǎng)民規(guī)模達(dá)8.29億,全年新增網(wǎng)民5653萬,用戶數(shù)量呈現(xiàn)不斷增長(zhǎng)態(tài)勢(shì)?;ヂ?lián)網(wǎng)迎來大數(shù)據(jù)時(shí)代,搜索引擎也遇到了不小的挑戰(zhàn)。中心化的搜索到當(dāng)今已難以發(fā)展,同時(shí),以IPSE為代表的分布式搜索應(yīng)運(yùn)而生。IPSE目前已登陸全球最大的Dapp生態(tài)平臺(tái)DappReview,在未來,會(huì)逐步實(shí)現(xiàn)代碼開源,具有巨大的發(fā)展?jié)摿Α?/p>
中心化搜索的痛點(diǎn)
如今信息技術(shù)領(lǐng)域已經(jīng)進(jìn)入大數(shù)據(jù)、云計(jì)算時(shí)代,互聯(lián)網(wǎng)技術(shù)創(chuàng)新不斷突破,搜索引擎作為網(wǎng)絡(luò)信息的入口和第一大互聯(lián)網(wǎng)應(yīng)用工具,也將發(fā)生改變。而目前搜索引擎技術(shù)發(fā)展相對(duì)落后,分布式搜索引擎技術(shù)方案相對(duì)較少,大部分傳統(tǒng)搜索引擎采用中心化體系結(jié)構(gòu)。而中心化體系結(jié)構(gòu)有以下幾個(gè)缺點(diǎn),首先是系統(tǒng)可靠性差,中心化體系結(jié)構(gòu)算力有限,不能應(yīng)對(duì)大量的數(shù)據(jù)和訊息;其次是系統(tǒng)可拓展性不足,不能應(yīng)對(duì)逐漸復(fù)雜的數(shù)據(jù)處理需求。同時(shí),搜索引擎的用戶規(guī)模仍在不斷擴(kuò)張,甚至超過了通訊工具的覆蓋率。
IPSE正是要解決這種痛點(diǎn),發(fā)揮分布式搜索引擎最佳的性能,擁有更好的可靠性和可擴(kuò)展性,它將分布式技術(shù)融入搜素引擎,指引出分布式搜索引擎的發(fā)展方向。
什么才是未來?
在IPSE的分布式搜索模式下,互聯(lián)網(wǎng)上所有的信息都應(yīng)該在分布式的對(duì)等網(wǎng)絡(luò)上,進(jìn)行唯一的、永久的并且可以按照內(nèi)容來查找。分布式搜索引擎采用分布式計(jì)算技術(shù)架構(gòu),讓整個(gè)集群中的每臺(tái)計(jì)算機(jī)進(jìn)行協(xié)作,來完成爬行、索引和搜索功能。分布式搜索引擎不僅解決了傳統(tǒng)搜索引擎面對(duì)的一些問題,如海量數(shù)據(jù)的信息處理低下問題、索引和搜索效率低下問題,而且具有更佳的安全性能,更強(qiáng)的容錯(cuò)性,更高的效率,更加方便維護(hù),使它的服務(wù)越來越完善。
分布式搜索利用分布式技術(shù),使得多臺(tái)計(jì)算機(jī)串聯(lián)起來,能夠擁有更大的存儲(chǔ)、計(jì)算能力,部署成本也會(huì)更低,無疑對(duì)高校、企業(yè)等研究機(jī)構(gòu)提供了更為廣闊的研究平臺(tái)和發(fā)展空間,也為知識(shí)產(chǎn)權(quán)保護(hù)提供了新的途徑??旖?、高效的信息處理更滿足了社會(huì)大眾的知識(shí)獲取需要,會(huì)創(chuàng)造巨大的社會(huì)價(jià)值。
分布式搜索的技術(shù)保證
在分布式計(jì)算領(lǐng)域,分布式搜索應(yīng)用了分布式計(jì)算框架Hadoop,它具有低成本、高效性、高容錯(cuò)性、高可靠性、高擴(kuò)展性等優(yōu)點(diǎn),能夠讓開發(fā)者輕松對(duì)其進(jìn)行架構(gòu)和使用,在Hadoop上來開發(fā)和運(yùn)行應(yīng)用程序來對(duì)海量的數(shù)據(jù)進(jìn)行處理,為分布式引擎IPSE提供很好的技術(shù)支撐。
目前,IPSE主要采用基于P2P的分布式搜索引擎。P2P系統(tǒng)一般采用非中心化的拓?fù)浣Y(jié)構(gòu),并通過分布式散列表(DHT)技術(shù)來對(duì)網(wǎng)絡(luò)進(jìn)行組織。DHT是由廣域網(wǎng)范圍中的大量節(jié)點(diǎn)共同進(jìn)行維護(hù)的巨大散列表,它采用分布式散列計(jì)算法解決結(jié)構(gòu)化的分布式存儲(chǔ)問題,通過分布式散列表,對(duì)文件能夠進(jìn)行精確匹配查找,保證網(wǎng)絡(luò)中的文件經(jīng)過有限的跳數(shù)一定能夠被找到。
由此可見,基于分布式的搜索引擎將會(huì)是未來搜索引擎的主要發(fā)展方向,也是互聯(lián)網(wǎng)領(lǐng)域中的熱點(diǎn)研究問題。隨著搜索引擎的商業(yè)化,未來的分布式搜索引擎也將不斷地取得發(fā)展,一個(gè)新的搜索時(shí)代正在到來。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個(gè)月發(fā)不出工資
- 柔宇科技被曝已6個(gè)月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動(dòng)未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場(chǎng)定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。