由于金融危機(jī)影響,極大的推動了搜索引擎市場,都說今年是搜索引擎年。垂直搜索的概念一度被抄的很火。對于新舊交替,不少垂直引擎已經(jīng)掛了,現(xiàn)在已經(jīng)到了2009年下半年。讓我們現(xiàn)在來看看這些傳說中的垂直搜索引擎的發(fā)展情況。我們對于衡量一個垂直搜索引擎的好壞根據(jù)以往用戶需求整理主要有以下幾個標(biāo)準(zhǔn)。
A.數(shù)據(jù)的更新頻率
顧名思義,就是爬蟲從目標(biāo)網(wǎng)站上爬取數(shù)據(jù)的頻率。
B.所在行業(yè)信息數(shù)量是否全面
信息來源是廣泛,針對行業(yè)是否深入及專注。
C.查詢信息速度
查詢速度的衡量是針對搜索后搜索結(jié)果的速度,獲取目的信息時間。
D.信息抽取完整率和準(zhǔn)確率
此項(xiàng)指標(biāo)的重要度不言而喻。信息的準(zhǔn)確率和完整率直接關(guān)系到整個搜索引擎搜索結(jié)果的質(zhì)量。
經(jīng)過發(fā)展現(xiàn)有垂直搜索爬蟲分為2種基本模式。
一、定向爬蟲獲取信息,配上手工或者自動的模版進(jìn)行信息匹配,將信息進(jìn)行格式化分析存儲。
優(yōu)勢:基于模版的信息提取技術(shù),能提供更加精準(zhǔn)的信息以及垃圾信息比較少。比如價格,房屋面積,時間,職位,公司名等等。
劣勢:目標(biāo)網(wǎng)站難以大面積覆蓋,因?yàn)榛谀0嫫ヅ涞男畔⑻崛〖夹g(shù),需要人工的參與配置模版,欲要大面積覆蓋各個目標(biāo)網(wǎng)站,需要大量的人力成本,同樣維護(hù)模板也需要很大的人力成本。
二、語義爬蟲全網(wǎng)爬取,爬蟲根據(jù)語義識別,自動進(jìn)行信息格式化分析,并存儲。
優(yōu)勢:
1、全網(wǎng)非定向抓取目標(biāo)網(wǎng)站,有效的保證信息數(shù)量。
2、不需要人工參與定制和維護(hù)模板,有效的保證了自身的人力和維護(hù)成本。
劣勢:
相對于第一種模板匹配,根據(jù)語義來進(jìn)行數(shù)據(jù)抓取,準(zhǔn)確率略有下降、垃圾信息及重復(fù)信息比較多。
下面通過A。數(shù)據(jù)的更新頻率B.信息全面性C.獲取信息速度D。信息抽取完整率和準(zhǔn)確率E.產(chǎn)品易用性,5個方面進(jìn)行橫向測評。
并從各個行業(yè)中挑選了幾個比較有代表性的垂直搜索引擎,進(jìn)行分別測評。
名稱:紡織搜索
網(wǎng)址:
綜合評價:網(wǎng)盛旗下網(wǎng)站,目前擁有的還是比較專業(yè)的紡織產(chǎn)品數(shù)據(jù)庫,以官方介紹內(nèi)含全球 80,000多個紡織站點(diǎn)和110,000余條產(chǎn)品信息,內(nèi)容涵蓋商業(yè)機(jī)會、國際求購、紡織配額、新聞中心、政策法規(guī)等紡織行業(yè)的方面信息比較全面,不過搜索的產(chǎn)品等信息等等是集成他B2B的頁面,想要快速獲取信息內(nèi)容方面有點(diǎn)難度,更像是B2B的站內(nèi)搜索。
綜合評價:★★★
名稱:亨者電子商務(wù)搜索引擎
網(wǎng)址:
測試總評:此搜索引擎關(guān)注3年多了,在商業(yè)信息搜索類還算是個佼佼者,信息全面,信息更新頻率還算高,但是經(jīng)過幾次改版顯得有點(diǎn)浮躁了,首頁馬上像B2B網(wǎng)站了。經(jīng)過測試發(fā)現(xiàn),除大城市之外,一些中小城市的信息量并不能讓人滿意。對于信息的準(zhǔn)確度來說,做的還是非常不錯的。很實(shí)用的工具。搜索速度很快。
綜合評價:★★★★
名稱:一呼百應(yīng)
網(wǎng)址:
綜合評價:從信息上看數(shù)據(jù)提取的準(zhǔn)確率是相當(dāng)高的。而且結(jié)合產(chǎn)品、供求信息、商鋪、新聞等多種類型的信息。對用戶來說是非常方便的??梢哉f一呼百應(yīng)在商業(yè)搜索及B2B這方面做的是很不錯的。對于商鋪是一個非常不錯的功能,極大的方便了用戶對于電子商務(wù)信息的推廣。
綜合評價:★★★★
名稱:職友集
網(wǎng)址:
綜合評價:職友集專注于職業(yè)搜索。經(jīng)過幾次改版之后。也是有著相當(dāng)大的進(jìn)步。但從數(shù)據(jù)更新頻率上分析更新速度挺快。筆者試用中發(fā)現(xiàn),信息處理方面還是不錯的,比較全面。相信可以滿足大部分用戶的需求。
綜合評價:★★★
名稱:搜商網(wǎng)
網(wǎng)址:
綜合評價:搜商網(wǎng)從信息搜索效率和準(zhǔn)確率是相當(dāng)高的。搜集整理的企業(yè)信息、供求信息、專業(yè)知識、商務(wù)知識、金融知識等等信息比較全面,值得稱道的是有符合搜索的內(nèi)容的第一條立即呈現(xiàn)給用戶,這個是其他搜素引擎無法比擬。對用戶來說是非常方便的。數(shù)據(jù)的更新頻率方面,基本上能保持實(shí)時更新。用戶也可以發(fā)布商務(wù)信息,對用戶來說搜索和發(fā)布極為方便,初具第三代搜索引擎模式,有著非常高的商業(yè)價值。
綜合評價:★★★★★
名稱:去哪兒
網(wǎng)址:
綜合評價:去哪兒在機(jī)票搜索上是比較具有代表性的一家垂直搜索引擎。實(shí)時搜索72家網(wǎng)站,可以看出它采用的的是定向抓取。搜索結(jié)果也是相當(dāng)精準(zhǔn)的。對此筆者的適用還是相當(dāng)?shù)臐M意的。同樣去哪兒的結(jié)果過濾功能也是非常方便的。
綜合評價:★★★★
本篇文章只是對現(xiàn)有的比較專注垂直搜索引擎做了綜合的評比,下一篇筆者將對垂直搜索引擎的商業(yè)模式、品牌價值、營銷理念和市場進(jìn)行深入分析和討論。歡迎大家繼續(xù)關(guān)注。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!