提起城市中熟悉的醫(yī)院,相信大家會脫口而出一連串諸如“某某三院”、“某軍某院”、“幾零幾醫(yī)院”等一系列名字。我們很容易發(fā)現(xiàn),其實(shí)我們所熟悉的醫(yī)院名字基本都是俗稱、簡稱。除去這些,還有些全國知名醫(yī)院的俗稱幾乎讓人摸不著頭腦:例如因?yàn)榉宽斒羌t色所以被稱為“紅房子醫(yī)院”的復(fù)旦大學(xué)婦產(chǎn)科醫(yī)院和一直用著曾用名“南京皮研所”的中國醫(yī)學(xué)科學(xué)院皮膚病醫(yī)院。
有時(shí)仔細(xì)想想,會發(fā)現(xiàn)很多時(shí)候我們只知道這些醫(yī)院的俗稱、簡稱,而不知道他們的全名。對于那些跨省就醫(yī)的人來說,更是很難分辨信息。而被這些復(fù)雜名稱弄糊涂的,不僅僅有普通人,還有搜索引擎。
此前百度已經(jīng)對超過21000家公立醫(yī)院實(shí)行了品牌保護(hù)。在百度中搜索這些公立醫(yī)院的全稱時(shí),搜索結(jié)果的第一位是這些公立醫(yī)院的官方網(wǎng)站。百度希望以此來保證搜索用戶可以準(zhǔn)確地找到自己想找的公立醫(yī)院。
但問題很快出現(xiàn)了:在搜索公立醫(yī)院時(shí),很多用戶不知道這些醫(yī)院的全稱,或者習(xí)慣性地使用民間稱呼去搜索,導(dǎo)致有可能無法準(zhǔn)確找到自己真正想要就醫(yī)的醫(yī)院官網(wǎng)。
如何確保用戶在不搜索全稱的情況下也能準(zhǔn)確搜索到自己想找的公立醫(yī)院?百度必須盡可能全面地統(tǒng)計(jì)不同公立醫(yī)院的簡稱、俗稱。在沒有現(xiàn)成統(tǒng)計(jì)數(shù)據(jù)的情況下,百度開始嘗試“集思廣益”。先是百度內(nèi)部員工開始收集提交自己所知道的醫(yī)院俗稱,接下來又號召身邊的親戚朋友收集信息。
來自全國的公立醫(yī)院資料被陸陸續(xù)續(xù)地匯總起來。但很快百度又發(fā)現(xiàn),很多用戶會從自己理解角度去“創(chuàng)造”出一些搜索關(guān)鍵詞,光靠百度自己的力量,很難實(shí)現(xiàn)對于這些關(guān)鍵詞的全面覆蓋。于是百度干脆發(fā)動了群眾的力量,對外公開收集信息,并在雙微上打開溝通窗口。得來的信息,也要根據(jù)衛(wèi)健委的名單反復(fù)核驗(yàn),甚至去實(shí)地走訪。
目前,百度已經(jīng)為超過3萬家公立醫(yī)院、14.5萬個(gè)詞條(包括全稱詞、簡稱詞、俗稱詞、變體詞)提供保護(hù),覆蓋率高達(dá)99%。
這一場“名稱之戰(zhàn)”,才剛剛吹響戰(zhàn)歌。
公立機(jī)構(gòu)官網(wǎng)保護(hù):以權(quán)威之名
實(shí)際上,除了公立醫(yī)院之外,學(xué)校、景點(diǎn)、政府機(jī)關(guān)等公立機(jī)構(gòu)都會面對類似的問題。百度“公立機(jī)構(gòu)官網(wǎng)保護(hù)計(jì)劃”正是為解決這些問題而生。通過該計(jì)劃,網(wǎng)民在百度搜索政府機(jī)關(guān)、事業(yè)單位等公立機(jī)構(gòu)時(shí),百度將優(yōu)先展示經(jīng)過認(rèn)證的公立機(jī)構(gòu)官網(wǎng)或相關(guān)信息,并對搜索結(jié)果標(biāo)注官方認(rèn)證標(biāo)識。
截至目前,百度“公立機(jī)構(gòu)官網(wǎng)保護(hù)計(jì)劃”已引入超過10萬家公立機(jī)構(gòu)官網(wǎng),涉及700萬個(gè)搜索詞,覆蓋了政府機(jī)關(guān)、事業(yè)單位、醫(yī)院、殯儀館、學(xué)校、博物館、景區(qū)等公立機(jī)構(gòu),未來覆蓋范疇還將持續(xù)增加。
為什么執(zhí)著于做公立機(jī)構(gòu)的官網(wǎng)保護(hù)?如果把搜索引擎比作一個(gè)碼頭,聚集來的人們有著不同的目的地。有人想要知道某一座城市的天氣,有人想要知道某一位明星的信息。但最“古老”同時(shí)又需求量極大的目的地,一定是“尋址需求”,幫助用戶找到權(quán)威官方網(wǎng)站發(fā)布的內(nèi)容或正確的地址。換句話說,就是為用戶提供權(quán)威信息,保證能讓他們搭乘上安全的船只,去往正確的方向。
但“保證權(quán)威”這件事并沒有想象中那么簡單。搜索引擎的應(yīng)用率越高、用戶量越大,人與計(jì)算機(jī)之間思維模式的差異就愈發(fā)凸顯。對于人類來說,建立在自己常識累積之上,可以對信息的正確與否進(jìn)行一個(gè)基本的判斷。但對于計(jì)算機(jī)來說,所有信息都是0和1的字符,同時(shí)也很難通過交互徹底理解搜索者的意圖。計(jì)算機(jī)本身沒有辨別權(quán)威的能力,那么人類是否能夠按照計(jì)算機(jī)的思維邏輯,建立出一套識別體系來?
答案是確定的。
為了保證搜索的權(quán)威性,百度多年來摸索出了一套適合自己的“權(quán)威性AI系統(tǒng)”,通過“基礎(chǔ)數(shù)據(jù)+搜索策略+前端展現(xiàn)”等手段,來保證公立機(jī)構(gòu)官網(wǎng)的優(yōu)先呈現(xiàn)。
首先,作為搜索引擎,百度的爬蟲系統(tǒng)和日志系統(tǒng)會盡可能地窮盡網(wǎng)絡(luò)上的海量信息數(shù)據(jù),包括從網(wǎng)站的標(biāo)題、內(nèi)容、圖片、音視頻到網(wǎng)頁間的鏈接指向關(guān)系等,并通過人工智能、大數(shù)據(jù)等手段,進(jìn)一步分析各類數(shù)據(jù)中內(nèi)外部之間的關(guān)聯(lián)信息。
其次,在數(shù)據(jù)之上,百度通過自研的各種策略,進(jìn)一步過濾清洗數(shù)據(jù),降低互聯(lián)網(wǎng)中不良數(shù)據(jù)對各類搜索效果的影響,同時(shí)進(jìn)一步建立圍繞官網(wǎng)識別和排序的自動化策略,當(dāng)用戶發(fā)起搜索需求時(shí),百度會將相關(guān)官網(wǎng)的信息優(yōu)先展現(xiàn)出來。
舉例來講,當(dāng)用戶搜索“蘋果手機(jī)電池維修”時(shí),更傾向于瀏覽蘋果官網(wǎng)中的內(nèi)容,而不是和關(guān)鍵詞匹配度更高的內(nèi)容。從人類思維的角度來看,多半是因?yàn)槿藗兤毡檎J(rèn)為在官方渠道修理手機(jī)更加安全保險(xiǎn)。當(dāng)百度通過數(shù)據(jù)識別到這種特殊情況,就會制定出專門的策略,讓官網(wǎng)內(nèi)容優(yōu)先顯示,以更好地滿足用戶需求。
最后,在前端展現(xiàn)上,百度通過對公立機(jī)構(gòu)官網(wǎng)增加“官網(wǎng)”標(biāo)志、優(yōu)先展示等方式,來讓用戶更放心地點(diǎn)擊進(jìn)入官網(wǎng)。
由此我們可以清晰地看到百度在增強(qiáng)搜索權(quán)威性時(shí)采取的邏輯:通過豐富的用戶行為累積,結(jié)合強(qiáng)大的數(shù)據(jù)分析能力,把人的經(jīng)驗(yàn)轉(zhuǎn)換成計(jì)算機(jī)的智能行為準(zhǔn)則。也就是說在建立權(quán)威性AI系統(tǒng)的過程中,龐大的數(shù)據(jù)累積、強(qiáng)大的數(shù)據(jù)分析能力和AI構(gòu)建能力都是缺一不可的。
全民參與“名稱之戰(zhàn)”
但技術(shù)并非萬無一失,“權(quán)威性AI系統(tǒng)”也會遇上難題。
比較明顯的例子,是前文提到的用戶搜索習(xí)慣問題,不同地域的人們有著對本地機(jī)構(gòu)豐富的俗稱、簡稱,光靠百度自己的能力很難把這些關(guān)鍵詞統(tǒng)統(tǒng)收錄起來。
另外一個(gè)難點(diǎn),存在于各種公立機(jī)構(gòu)官網(wǎng)本身的的不規(guī)范性。很多公立機(jī)構(gòu)在建站時(shí)完全依靠外包系統(tǒng),自身又缺乏互聯(lián)網(wǎng)方面的常識。有時(shí)會出現(xiàn)頻繁變更域名,又不在原來域名基礎(chǔ)上做定向跳轉(zhuǎn)的情況。這樣一來,即使是AI系統(tǒng)也很難識別出域名變化,無法進(jìn)一步幫助官網(wǎng)進(jìn)行保護(hù)。
更別說封禁IP和Robots聲明這樣的問題了——個(gè)別官網(wǎng)本身不允許搜索引擎進(jìn)行抓取和收錄,或是封禁了搜索的IP。對于百度這樣的搜索引擎來說,不論是官網(wǎng)網(wǎng)址本身還是官網(wǎng)里面的內(nèi)容,都無法呈現(xiàn)給用戶。
在重重困難面前,百度仍然在借助技術(shù)手段,不斷優(yōu)化基礎(chǔ)數(shù)據(jù)和搜索策略、前端展現(xiàn)等環(huán)節(jié),盡力提升搜索體驗(yàn)。因?yàn)椴徽撍阉饕鎻腜C進(jìn)化到移動端,還是像今天這樣打開語音交互的入口,用戶對于權(quán)威信息的需求是從未改變的,這也是“名稱之戰(zhàn)”最需要獲得的戰(zhàn)果。
但顯然,想要獲得這一戰(zhàn)果,僅憑改善技術(shù)是不足夠的。百度也開始尋求一種新的方式,來引入更多社會公眾的力量。百度“公立機(jī)構(gòu)官網(wǎng)保護(hù)共建平臺”誕生了。
當(dāng)你搜索的公立機(jī)構(gòu)官網(wǎng)不在百度保護(hù)之列,可以登陸“百度公立機(jī)構(gòu)官網(wǎng)保護(hù)共建平臺”進(jìn)行反饋和數(shù)據(jù)提交,經(jīng)百度審核通過后,該公立機(jī)構(gòu)官網(wǎng)即可在搜索結(jié)果中給予官網(wǎng)認(rèn)證、置頂和廣告避讓。
這場全民參與的“名稱之戰(zhàn)”,顯然比僅憑一己之力來得效率高?!肮C(jī)構(gòu)官網(wǎng)保護(hù)共建平臺”上線僅一個(gè)月,就收到了來自600多位用戶提交的748個(gè)網(wǎng)站數(shù)據(jù),覆蓋了1674個(gè)不同搜索名稱。經(jīng)審核后,最終上線了662個(gè)有效官網(wǎng),包含1249個(gè)“常用名稱”。
世界,與科技一起進(jìn)化
隨著科技互聯(lián)網(wǎng)的普及,科技產(chǎn)品與人們的生活已經(jīng)連接的非常的緊密。對于用戶來說,科技產(chǎn)品讓他們獲得了豐富的信息和便利的服務(wù),在未來還會關(guān)系到他們的出行、教育、金融、政務(wù)等等。在這樣的全面覆蓋之下,即使是一個(gè)小小的保護(hù)用戶權(quán)益的舉措,也能為整個(gè)社會帶來巨大的價(jià)值。
除了百度自己在加強(qiáng)搜索引擎的權(quán)威性以外,我們也能看到很多企業(yè)在做著相同的努力:智能音箱正在加入越來越多的障礙人士友好功能、AI技術(shù)可以幫助人們識別出聽障人士的手語、大量級的互聯(lián)網(wǎng)平臺開始向公益事業(yè)輸送流量……優(yōu)化自己的業(yè)務(wù),也間接改變了世界的模樣。
但是從百度公立機(jī)構(gòu)官網(wǎng)保護(hù)計(jì)劃的案例中,我們也有了新的發(fā)現(xiàn)。科技互聯(lián)網(wǎng)產(chǎn)品本身擁有強(qiáng)大的連接性,也正因如此,僅僅憑借科技企業(yè)本身,不能完全實(shí)現(xiàn)對用戶權(quán)益的保護(hù)。
相信類似的問題絕不僅僅發(fā)生在搜索引擎中??萍颊诎颜麄€(gè)世界以一種不可想象的方式捏合在一起,為了讓這種組合更加安全和牢靠,僅僅依靠科技產(chǎn)業(yè)自己的努力是不夠的。被組合在一起的每一份子,都有去參與和改變的責(zé)任。
整個(gè)世界的滾滾向前,也就在每一份子的微小改變中被推動著。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 生成式AI云上創(chuàng)新,“全棧聯(lián)動”將成關(guān)鍵詞?
- 大模型進(jìn)化論:AI產(chǎn)業(yè)落地將卷向何方?
- 2024年劇集氪金力大盤點(diǎn)
- “共創(chuàng)”、“造梗”成頂流,傳統(tǒng)品牌緣何要花式出圈?
- 人形機(jī)器人瘋狂進(jìn)廠打工!銀河通用、智元、樂聚機(jī)器人怕是都瘋了
- 因?yàn)樗投Y電商!2025微信、抖音、淘寶又撕破了臉
- 中國手機(jī)市場成績單:華為增長最快,蘋果跌幅最大
- 原以為微軟、亞馬遜、阿里云云計(jì)算大局已定!沒想到有這四大變數(shù)
- 崖州灣之旅:看見海與智能,聯(lián)想到了未來
- 榮耀換帥,一艘AI巨輪的舵手更替會帶來什么?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。