當(dāng)前位置:首頁 >  站長 >  搜索優(yōu)化 >  正文

兔子寶貝:曝光百度搜索抓取MP3文件最新方法

 2011-01-07 10:19  來源:   我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

我很高興不斷更新自己文章,一直觀察互聯(lián)網(wǎng)技術(shù)。平常,把觀察的結(jié)果記錄成文字,與大家共享。最近由于學(xué)習(xí)需要,開始研究百度抓取MP3文件。兔子寶貝的進(jìn)步,學(xué)習(xí)都少不了新生力網(wǎng)絡(luò)營銷團(tuán)隊(duì)給我的幫助與關(guān)心。經(jīng)過解剖MP3文件,下面,兔子寶貝把解剖的結(jié)果形成文字《兔子寶貝:曝光百度搜索抓取MP3文件最新方法》,希望對大家有所幫助。特別是對那些做音樂網(wǎng)站的朋友有幫助。研究百度搜索技術(shù)是如何實(shí)現(xiàn)抓取MP3格式文件。關(guān)于是如何提高M(jìn)P3其他問題,兔子寶貝會在以后的文章中寫出來。今天只研究是如何抓取MP3文件的。同時,兔子寶貝提醒的是此篇文章,只代表個人觀點(diǎn),文明評論,請勿唾罵,拋磚引玉。

為了整個過程順利,兔子寶貝以示例做分析。

觀察這個“MP3”文件夾中只含有一個文件“比我幸福.MP3”。還顯示了文件的大小,類型修改日期。這里要確定一個問題,這個文件夾中只有這一個文件。下面我們再觀察他的屬性內(nèi)容。如下圖所示:

剛才我們講了,只有一個文件,為什么能顯示出藝術(shù)家、唱片標(biāo)題等相關(guān)信息呢?注意,只是有一個文字,為什么包含這么多信息呢?這就是百度搜索抓取MP3格式文件關(guān)鍵所在。

兔子寶貝大概講講MP3格式文件。MP3文件不光包括我們所聽到的音頻文件(常說的音樂)還有更多的唱片、歌黃信息。MP3格式文件大體分為三部分:TAG_V2(ID3V2),F(xiàn)rame,,TAG_V1(ID3V1) 。其中TAG_V2(ID3V2)記錄了作者,作曲,專輯等信息。Frame記錄了音樂文件的實(shí)體部分。TAG_V1(ID3V1)記錄作者,作曲,專輯等信息,長度為128BYTE。關(guān)于這些是怎么寫的,什么格式,怎么定義,兔子寶貝在這里不再呈述。

為了說明兔子寶貝分析的真實(shí)性,脫去MP3格式文件“外套”,分析具體內(nèi)容,以十六進(jìn)制數(shù)據(jù)呈現(xiàn)。如下圖所示。

因此,一個完整的mp3文件也就完整的包含了作者,作曲,專輯等信息。這進(jìn)一步方便百度搜索引擎去抓取MP3文件,更好的讓我們搜索。我們搜索音樂,就是去比對MP3某個特定的字節(jié),實(shí)現(xiàn)匹配。返回給用戶的正確的音樂。兔子寶貝就要友情提示一下做音樂網(wǎng)站的網(wǎng)友,在做網(wǎng)站優(yōu)化的同時,不要忘記對MP3格式文件內(nèi)部內(nèi)容進(jìn)行優(yōu)化,例如,是否寫入了作者,作曲,專輯等信息。這是百度抓MP3最重要的依據(jù)。百度抓取音樂不是依靠文件名和網(wǎng)頁匹配。就是直接識別MP3文件的內(nèi)部內(nèi)容,至于怎么寫進(jìn)MP3內(nèi)部內(nèi)容,兔子寶貝有時間再介紹,這里只討論“百度搜索抓取MP3文件”。至此,當(dāng)然,這也給一些做垃圾站提供了便利。當(dāng)然,任何一件事,有利有弊。

兔子寶貝繼續(xù)觀察互聯(lián)網(wǎng)搜索引擎,以后,我會寫出更多的相關(guān)的文章,接下來,兔子寶貝會寫文章,揭密百度搜索抓取圖片的奧密,希望大家支持兔子寶貝。兔子寶貝揭密百度抓取圖片是系列文章。同時,兔子寶貝申明一下,我的分析文章只代表個人觀點(diǎn),不做為任何依據(jù)。文明評論,請勿唾罵。希望各位朋友關(guān)注我的博客,提出各種意見。原文地址: (原創(chuàng)文章,A5首發(fā),歡迎轉(zhuǎn)載,保留版權(quán)!)

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

熱門排行

信息推薦