筆者在上一個章節(jié)中,給大家初步的講解了一下,站內(nèi)搜索的前端和后端人工干預(yù)的一些邏輯與頁面呈現(xiàn)。那么,接下來就順著這條敘事主干,帶領(lǐng)大家更加深入地了解一下:站內(nèi)搜索接下來需要明白的雜七雜八和主干。
?站內(nèi)搜索邏輯的基本組成:怎么被搜到以及怎么排序靠前?
怎么描述呢?
對商家而言,商品怎么才能被搜索到解決的是有無問題,而怎么排序靠前被消費者看到解決的是溫飽問題。透過這兩個問題我們來好好聊一聊搜索的兩大要素:索引和排序。
索引
搜索其實是依靠爬蟲來提取信息的。
什么是爬蟲?說的簡單點就像是幫你搬運信息到倉庫的小哥,爬蟲只負(fù)責(zé)幫你收集信息,且會給你存放在倉庫里,分門別類安排的整整齊齊。然后,你這個老板只需要查看這些信息就好了。
那么,相比互聯(lián)網(wǎng)的廣域搜索比如百度 和谷歌。電商網(wǎng)站的搜索就顯得簡單和閉塞多了,所有的商品都存在一個庫里,你的爬蟲甚至都不需要每天無時不刻的勞作,只需要每天跑一次就夠了。所以,一個商品能否被搜索抓取到是能否展現(xiàn)給用戶的必要條件。
索引指的就是:被爬蟲抓取到并整理好的商品庫。
索引分為全量索引和增量索引兩部分。
全量索引為全站商品的一次更新,所有的商品變化包括上下架,名稱屬性標(biāo)簽庫存信息等的變化通過全量索引進行更新;增量索引為實時更新(也不一定是實時更新,可能是按照整點規(guī)則進行更新)更新的內(nèi)容主要是商品的部分屬性。
下圖是我一同事為了宣講做的ppt? 不是本人原創(chuàng),直接截圖復(fù)用了。
那么商品的哪些信息會被納入索引呢?
——商品名稱、銷售地區(qū)、庫存量、商品屬性(尺碼顏色款式等)、商品掛靠的類目名稱、商品編號、商品的標(biāo)簽信息和價格等。
除了以上的一些固有信息外,商品的數(shù)據(jù)信息,比如:銷量、評價、曝光點擊等數(shù)據(jù)也會被納入索引,用來介入接下來的排序步驟,計算排序得分。我們舉個簡單的例子,比如:我早上上架了一款蘋果耳機。但是,我的商品標(biāo)題和屬性里都沒有對這個款耳機的英文 AirPods的描述。
那么,用戶在搜索AirPods時,是否會搜索到這款產(chǎn)品呢。顯然是無法搜索到的,因為搜索是針對文本信息的精確匹配,此時解決辦法有兩個。
- 是給AirPods和蘋果耳機配置同義詞。
- 在商品標(biāo)題屬性或者標(biāo)簽上給商品加上AirPods關(guān)鍵詞。這樣改產(chǎn)品才會被搜索到。
以上即當(dāng)商品的標(biāo)題,屬性,類目,標(biāo)簽,描述等屬于索引范圍的文本信息都不包含用戶輸入的關(guān)鍵詞以及系統(tǒng)中的同義詞時,這款產(chǎn)品是無法被搜索引擎搜索到的,當(dāng)然也無法呈現(xiàn)給用戶。
那么,各位對索引的概念是否有了直觀的認(rèn)識?沒有也不要緊,我肯定不會講第二遍。
排序
能不能被搜索到的問題解決了,接下來就是商家們最關(guān)心的問題,就是:怎樣讓自己的商品在搜索中讓更多的用戶看到?
這個就涉及到搜索的排序算法了。每家電商的搜索排序都是按照自己的算法邏輯進行的。排序的算法邏輯也是各有千秋和特色。排序算法應(yīng)該是站內(nèi)搜索里面各大電商的核心機密。
但是,排序的因子就不那么機密了,基本上你想得到的就這么些。只是各家在各個因子上的權(quán)重不一樣,計算方式也不一樣。
我們先來列舉一下這些因子有哪些:銷量(淘寶用成交筆數(shù))、點擊、收藏、加購、好評率、商品質(zhì)量分(商品信息的完善和準(zhǔn)確程度)、用戶行為偏好(用以做千人千面?zhèn)€性化)、店鋪評分等信息。
我這里倒是有一些 排序算法的公式,但是還是算了,我看了也頭疼,大家只要知道影響排序算法因子就行,知道哪些因子起了決定性作用就ok。
下圖為我為自家公司在初期版本上的排序因子,看看能得出什么結(jié)論?現(xiàn)在很多淘寶商家削尖了腦袋想一探這個排序算法的究竟,其實大可不必,電商千千萬,搜索一條路。對于產(chǎn)品和運營而言,只要知道哪些是直接能夠提升銷售和轉(zhuǎn)化就夠了。
其實排序分為兩個主要的階段,一個是大范圍的排序(類目排序),一個是商品范圍的排序。
什么意思呢?首先,用戶在輸入一個關(guān)鍵詞后,大概率是一個物品詞或者品牌詞,用戶在電商網(wǎng)站使用搜索,95%的概率是要尋找想要購買的商品。此時,我們需要給到他們在這些商品的集合。我們稱之為列表或者類目或者叫分類。
大家在電商app首頁的底部 一般會看到這個模塊,這個項目我將在后面的章節(jié)中給大家更加深入的講解。如下圖所示(紅框部分就是分類)):也就是說先要定位用戶想要尋找的商品在哪個分類中。只有找到這個商品的集合類目,然后再該類目中進行商品的排序,這才是排序的兩步走戰(zhàn)略——第一步,類目預(yù)測;第二步,商品排序。
目前類目預(yù)測主要是兩種方式互為補充:人工和機器算法。
人工也就是我上一章中提到的人工后臺干預(yù)。機器類目預(yù)測目前主要的方式有:類目文本+商品量集群算法;貝葉斯預(yù)測算法;中心詞類目預(yù)測算法。這幾種算法各有優(yōu)劣,我將會在之后的搜索算法章節(jié)進行詳細(xì)介紹。
好了,總結(jié)一下本章:第一步是解決有無問題,第二步是解決溫飽問題。要先能被搜索到才能被更多用戶看到。以上內(nèi)容不代表絕對準(zhǔn)確,有個人的觀點在里面,謹(jǐn)慎采納!
預(yù)告下一章內(nèi)容:
- 站內(nèi)搜索的物料基礎(chǔ):目錄與商品描述
- 站內(nèi)搜索運營的邏輯與數(shù)據(jù)指標(biāo)