原創(chuàng)一直是大問(wèn)題,往大了說(shuō),互聯(lián)網(wǎng)生態(tài)環(huán)境日趨惡劣,采集偽原創(chuàng)低質(zhì)量?jī)?nèi)容泛濫,嚴(yán)重?cái)D占了優(yōu)質(zhì)原創(chuàng)資源的生存空間。導(dǎo)致互聯(lián)網(wǎng)資源整體質(zhì)量大幅下降,網(wǎng)民受損、優(yōu)質(zhì)站長(zhǎng)受損、搜索引擎亦受損。往小了說(shuō),很多站長(zhǎng)一直在進(jìn)行原創(chuàng)建設(shè),而得不到應(yīng)有的保護(hù)。如何加大對(duì)站點(diǎn)原創(chuàng)的保護(hù)以及如何衡量原創(chuàng)是否能滿足用戶需求是一個(gè)艱巨的任務(wù)。為此,百度一直在進(jìn)行原創(chuàng)保護(hù)和展現(xiàn)建設(shè),因?yàn)檫@是用戶的需求,盡管進(jìn)展緩慢,但客觀看來(lái),確實(shí)有很大的進(jìn)步。那么百度是如何保護(hù)原創(chuàng)的?下面談?wù)劙俣仍瓌?chuàng)那點(diǎn)事。
本文網(wǎng)站內(nèi)容主要分為以下五個(gè)大點(diǎn):
一、百度談原創(chuàng)項(xiàng)目那點(diǎn)事;
二、百度原創(chuàng)保護(hù)的進(jìn)展;
三、站長(zhǎng)對(duì)于原創(chuàng)保護(hù)的錯(cuò)誤認(rèn)知;
四、用戶對(duì)于原創(chuàng)的態(tài)度;
五、對(duì)于大型網(wǎng)站說(shuō)保護(hù)(bǎo hù)原創(chuàng)更名副其實(shí),對(duì)小站,說(shuō)保護(hù)高質(zhì)量(Mass)內(nèi)容更好。
一、百度談原創(chuàng)項(xiàng)目那點(diǎn)事
1、搜索引擎為什么要重視原創(chuàng)
采集泛濫化
來(lái)自百度的一項(xiàng)調(diào)查顯示,超過(guò)80%的新聞和資訊等都在被人工轉(zhuǎn)載或機(jī)器采集,從傳統(tǒng)媒體的報(bào)紙到娛樂(lè)網(wǎng)站花邊消息、從游戲攻略到產(chǎn)品評(píng)測(cè),甚至高校圖書館發(fā)的催還通知都有站點(diǎn)在做機(jī)器采集。可以說(shuō),優(yōu)質(zhì)原創(chuàng)內(nèi)容是被包圍在采集的汪洋大海中之一粟,搜索引擎在海中淘粟,是既艱難又具有挑戰(zhàn)性的事情。
提高搜索用戶體驗(yàn)
數(shù)字化降低了傳播成本,工具化降低了采集成本,機(jī)器采集行為混淆內(nèi)容來(lái)源降低內(nèi)容質(zhì)量。采集過(guò)程中,出于無(wú)意或有意,導(dǎo)致采集網(wǎng)頁(yè)內(nèi)容殘缺不全,格式錯(cuò)亂或附加垃圾等問(wèn)題層出不窮,這已經(jīng)嚴(yán)重影響了搜索結(jié)果的質(zhì)量和用戶體驗(yàn)。搜索引擎重視(value)原創(chuàng)的根本原因是為了提高用戶體驗(yàn),這里講的原創(chuàng)為優(yōu)質(zhì)原創(chuàng)內(nèi)容。
鼓勵(lì)原創(chuàng)作者和文章
轉(zhuǎn)載和采集,分流了優(yōu)質(zhì)原創(chuàng)站點(diǎn)的流量(單位:立方米每秒),不再具屬原創(chuàng)作者的名稱,會(huì)直接影響到優(yōu)質(zhì)原創(chuàng)站長(zhǎng)和作者的收益。
常熟百度推廣每天有超過(guò)1億人次在百度查找信息,企業(yè)在百度注冊(cè)與產(chǎn)品相關(guān)的關(guān)鍵詞后,就會(huì)被主動(dòng)查找這些產(chǎn)品的潛在客戶找到。長(zhǎng)期看會(huì)影響原創(chuàng)者的積極性,不利于創(chuàng)新,不利于新的優(yōu)質(zhì)內(nèi)容產(chǎn)生。鼓勵(lì)優(yōu)質(zhì)原創(chuàng),鼓勵(lì)創(chuàng)新,給予原創(chuàng)站點(diǎn)和作者合理的流量,從而促進(jìn)互聯(lián)網(wǎng)內(nèi)容的繁榮,理應(yīng)是搜索引擎(Engine)的一個(gè)重要任務(wù)。
2、采集很狡詐,識(shí)別原創(chuàng)很艱難
采集冒充原創(chuàng),篡改關(guān)鍵信息
當(dāng)前,大量的網(wǎng)站批量采集原創(chuàng)內(nèi)容后,用人工或機(jī)器的方法,篡改作者、發(fā)布時(shí)間和來(lái)源等關(guān)鍵信息,冒充原創(chuàng)。此類冒充原創(chuàng)是需要搜索引擎識(shí)別出來(lái)予以適當(dāng)調(diào)整的。
內(nèi)容生成器,制造偽原創(chuàng)
利用自動(dòng)文章生成器等工具, ;獨(dú)創(chuàng) ;一篇文章,然后安一個(gè)吸引眼球的title,現(xiàn)在的成本也低得很,而且一定具有獨(dú)創(chuàng)性。然而,原創(chuàng)是要具有社會(huì)共識(shí)價(jià)值(value)的,而不是胡亂制造一篇根本不通的垃圾就能算做有價(jià)值的優(yōu)質(zhì)原創(chuàng)內(nèi)容。內(nèi)容雖然獨(dú)特,但是不具社會(huì)共識(shí)價(jià)值,此類偽原創(chuàng)是搜索引擎需要重點(diǎn)識(shí)別出來(lái)并予以打擊的。
網(wǎng)頁(yè)差異化,結(jié)構(gòu)化信息提取困難
不同的站點(diǎn)結(jié)構(gòu)化差異比較大,html標(biāo)簽的含義和分布也不同,因此提取關(guān)鍵信息如標(biāo)題、作者和時(shí)間的難易程度差別也比較大。做到既提得全,又提得準(zhǔn),還要最及時(shí),在當(dāng)前的中文互聯(lián)網(wǎng)規(guī)模(Scale)下實(shí)屬不易,這部分(bù fèn)將需要搜索引擎與站長(zhǎng)配合好才會(huì)更順暢的運(yùn)行,站長(zhǎng)們?nèi)绻酶逦慕Y(jié)構(gòu)告知搜索引擎網(wǎng)頁(yè)的布局,將使搜索引擎高效地提取原創(chuàng)相關(guān)的信息。
3、百度識(shí)別原創(chuàng)之路如何走?
成立原創(chuàng)項(xiàng)目組,打持久戰(zhàn)
面對(duì)挑戰(zhàn),為了提高搜索引擎(Engine)用戶體驗(yàn)、為了使優(yōu)質(zhì)原創(chuàng)者原創(chuàng)網(wǎng)站得到應(yīng)有的收益、為了推動(dòng)中文互聯(lián)網(wǎng)的前進(jìn),我們抽調(diào)大量人員組成原創(chuàng)項(xiàng)目組:技術(shù)(Technology)、產(chǎn)品、運(yùn)營(yíng)、法務(wù)等等,這不是臨時(shí)組織不是1個(gè)月2個(gè)月的項(xiàng)目,我們做好了打持久戰(zhàn)的準(zhǔn)備。
原創(chuàng)識(shí)別 ;起源 ;算法
互聯(lián)網(wǎng)動(dòng)輒上百億、上千億的網(wǎng)頁(yè),從中挖掘原創(chuàng)內(nèi)容,可以說(shuō)是大海撈針,千頭萬(wàn)緒。我們的原創(chuàng)識(shí)別系統(tǒng),在百度大數(shù)據(jù)的云計(jì)算平臺(tái)上開展,能夠快速實(shí)現(xiàn)對(duì)全部中文互聯(lián)網(wǎng)網(wǎng)頁(yè)的重復(fù)聚合和鏈接指向關(guān)系分析。首先,通過(guò)內(nèi)容相似程度來(lái)聚合采集和原創(chuàng),將相似網(wǎng)頁(yè)聚合在一起作為原創(chuàng)識(shí)別的候選集合;其次,對(duì)原創(chuàng)候選集合,通過(guò)作者、發(fā)布時(shí)間、鏈接指向、用戶評(píng)論、作者和站點(diǎn)的歷史原創(chuàng)情況、轉(zhuǎn)發(fā)軌跡等上百種因素來(lái)識(shí)別判斷出原創(chuàng)網(wǎng)頁(yè);最后,通過(guò)價(jià)值分析系統(tǒng)判斷該原創(chuàng)內(nèi)容的價(jià)值高低進(jìn)而適當(dāng)?shù)闹笇?dǎo)最終排序。
目前,通過(guò)我們的實(shí)驗(yàn)以及真實(shí)線上數(shù)據(jù), ;起源 ;算法已經(jīng)取得了一定的進(jìn)展,在新聞、資訊等領(lǐng)域解決了絕大部分問(wèn)題。當(dāng)然,其他領(lǐng)域還有更多的原創(chuàng)問(wèn)題等待 ;起源 ;去解決,我們堅(jiān)定的走著。
原創(chuàng)星火計(jì)劃
我們一直致力于原創(chuàng)內(nèi)容的識(shí)別和排序算法調(diào)整,但在當(dāng)前互聯(lián)網(wǎng)環(huán)境下,快速識(shí)別原創(chuàng)解決(jiě jué)原創(chuàng)問(wèn)題確實(shí)面臨著很大的挑戰(zhàn),計(jì)算數(shù)據(jù)規(guī)模龐大,面對(duì)的采集(collect)方式層出不窮,不同站點(diǎn)的建站方式和模版差異巨大,內(nèi)容提取復(fù)雜等等問(wèn)題。這些因素都會(huì)影響原創(chuàng)算法識(shí)別,甚至導(dǎo)致判斷出錯(cuò)。這時(shí)候就需要百度和站長(zhǎng)共同努力來(lái)維護(hù)互聯(lián)網(wǎng)的生態(tài)環(huán)境,站長(zhǎng)原創(chuàng)內(nèi)容,搜索引擎通過(guò)一定的判斷后優(yōu)待原創(chuàng)內(nèi)容,共同推進(jìn)生態(tài)的改善,鼓勵(lì)原創(chuàng),這就是 ;原創(chuàng)星火計(jì)劃 ;旨在快速解決當(dāng)前面臨的嚴(yán)重問(wèn)題。另外,站長(zhǎng)對(duì)原創(chuàng)內(nèi)容的,將應(yīng)用于 ;起源 ;算法,進(jìn)而幫助百度發(fā)現(xiàn)算法的不足,不斷改進(jìn),用更加智能的識(shí)別算法自動(dòng)識(shí)別原創(chuàng)內(nèi)容。
二、百度原創(chuàng)保護(hù)的進(jìn)展
原創(chuàng)星火計(jì)劃一期和起源算法出來(lái)都有段時(shí)間了,目前主要覆蓋的都是一些大型的新聞?lì)愓军c(diǎn),目前,原創(chuàng)星火計(jì)劃取得了初步的效果,一期對(duì)部分重點(diǎn)原創(chuàng)新聞?wù)军c(diǎn)的原創(chuàng)內(nèi)容在百度搜索結(jié)果中給予了原創(chuàng)標(biāo)記、作者展示等等,并且在排序及流量上也取得了合理的提升。百度LEE也表示原創(chuàng)起源算法,也讓這些優(yōu)質(zhì)的網(wǎng)站有了一個(gè)比較好的收益。
1、原創(chuàng)星火計(jì)劃上線前后的同期流量對(duì)比顯示,原創(chuàng)url流量增長(zhǎng)明顯。
2、原創(chuàng)星火計(jì)劃上線后一段時(shí)間內(nèi)原創(chuàng)url流量增長(zhǎng)明顯并逐漸趨于平穩(wěn)。
這個(gè)是一個(gè)小范圍的數(shù)據(jù),我們?cè)趤?lái)宏觀的看看。2013年,中國(guó)低質(zhì)網(wǎng)站泛濫,在低質(zhì)網(wǎng)站中采集及作弊站點(diǎn)泛濫兩種共占比高達(dá)80%。惡劣采集站占到40%之多,采集站、作弊站點(diǎn)、垃圾無(wú)價(jià)值站點(diǎn)在整個(gè)互聯(lián)網(wǎng)資源環(huán)境中的比例越來(lái)越高,且有主導(dǎo)趨勢(shì),優(yōu)質(zhì)資源的空間在不斷減小。優(yōu)質(zhì)站長(zhǎng)受損,原創(chuàng)內(nèi)容受到很大的阻礙。年,作弊站和采集站占比35%所遏制,采集站下降了16%,百度對(duì)于原創(chuàng)的宣傳保護(hù)起到了很大的效果,然而無(wú)價(jià)值站點(diǎn)越來(lái)越多,在一定程度上也是 ;原創(chuàng) ;惹的禍,后面細(xì)說(shuō)。
(2013低質(zhì)網(wǎng)站分布情況)
(低質(zhì)網(wǎng)站分布情況)
三、站長(zhǎng)對(duì)于原創(chuàng)保護(hù)的錯(cuò)誤認(rèn)知
1、原創(chuàng)內(nèi)容不等于高質(zhì)量?jī)?nèi)容
網(wǎng)頁(yè)主體內(nèi)容是網(wǎng)頁(yè)的價(jià)值所在,百度主要從以下角度評(píng)價(jià)網(wǎng)頁(yè)內(nèi)容質(zhì)量:內(nèi)容制作(Make)成本高低;內(nèi)容是否有效、完整豐富;是否原創(chuàng);信息是否真實(shí)有效;是否權(quán)威或投入較多專業(yè)的知識(shí)和經(jīng)驗(yàn);是否存在作弊行為。對(duì)于頁(yè)面的主體內(nèi)容價(jià)值,原創(chuàng)二字并沒(méi)有怎么突出。
什么內(nèi)容算質(zhì)量高?內(nèi)容質(zhì)量高:內(nèi)容質(zhì)量好的網(wǎng)頁(yè),花費(fèi)了較多時(shí)間和精力編輯,傾注了大量經(jīng)驗(yàn)和專業(yè)知識(shí),內(nèi)容清晰、有效、完整且豐富。例如:專業(yè)醫(yī)療網(wǎng)站發(fā)布的內(nèi)容豐富的醫(yī)療專題頁(yè)面、資深工程師發(fā)布的完整解決某個(gè)技術(shù)問(wèn)題的專業(yè)文章、專業(yè)B2C網(wǎng)站上,完整有效的商品購(gòu)買頁(yè)、權(quán)威新聞?wù)驹瓌?chuàng)或經(jīng)過(guò)編輯整理的熱點(diǎn)新聞報(bào)道、經(jīng)過(guò)網(wǎng)友認(rèn)真編輯,內(nèi)容豐富的百科詞條。
而對(duì)內(nèi)容質(zhì)量(Mass)高的定義壓根都沒(méi)有原創(chuàng)這個(gè)標(biāo)準(zhǔn)。原創(chuàng)只是一個(gè)高質(zhì)量?jī)?nèi)容的簡(jiǎn)單說(shuō)法,或者說(shuō)是高質(zhì)量?jī)?nèi)容的更好一個(gè)層次。你的內(nèi)容質(zhì)量高又是原創(chuàng)那當(dāng)然最好,但反過(guò)來(lái)就比較尷尬了,是原創(chuàng)但質(zhì)量低,這是百度保護(hù)原創(chuàng)以來(lái)很多站長(zhǎng)出現(xiàn)的一個(gè)問(wèn)題,整天搗鼓原創(chuàng),認(rèn)為原創(chuàng)內(nèi)容等于高質(zhì)量?jī)?nèi)容,殊不知站點(diǎn)原創(chuàng)度在提升,但站點(diǎn)價(jià)值(value)卻在下降(descend)。
前面也說(shuō)了無(wú)價(jià)值站點(diǎn)越來(lái)越多,這其中不乏站長(zhǎng)對(duì)于原創(chuàng)內(nèi)容的錯(cuò)誤認(rèn)識(shí),因?yàn)椴皇敲恳粋€(gè)人都能原創(chuàng)出高質(zhì)量的內(nèi)容。常熟百度推廣是百度國(guó)內(nèi)首創(chuàng)的一種按效果付費(fèi)的網(wǎng)絡(luò)推廣方式,簡(jiǎn)單便捷的網(wǎng)頁(yè)操作即可給企業(yè)帶來(lái)大量潛在客戶,有效提升企業(yè)知名度及銷售額。原創(chuàng)二字只是高質(zhì)量網(wǎng)頁(yè)內(nèi)容的一個(gè)非必須特征,能在一定程度上反應(yīng)網(wǎng)頁(yè)內(nèi)容的稀缺度,但原創(chuàng)并非一定稀缺,原創(chuàng)更不能代表高質(zhì)量的內(nèi)容的所有特性,這些一定要理解。
2、原創(chuàng)內(nèi)容不等于收錄
網(wǎng)站更新的內(nèi)容是原創(chuàng)的就一定收錄,這種認(rèn)識(shí)其實(shí)是錯(cuò)誤的,而且非常錯(cuò)誤??傆泻芏嗳吮г刮业脑瓌?chuàng)文章怎么不收錄?也有的抱怨為什么別人復(fù)制我的就收錄了?第一個(gè)問(wèn)題其實(shí)很簡(jiǎn)單,為什么要收錄你的?你自己寫的這個(gè)老掉牙的東西,排版混亂、還要加載半天,讀完都知道說(shuō)的什么,這樣的原創(chuàng)對(duì)搜索引擎對(duì)用戶有什么價(jià)值?沒(méi)有解決(jiě jué)認(rèn)為問(wèn)題,只是在那自我陶醉,感覺(jué)自己文采多好。而且這跟你整體網(wǎng)站的權(quán)值,結(jié)構(gòu)(Structure),歷史表現(xiàn),內(nèi)外鏈等都有關(guān)。
第二個(gè)問(wèn)題為什么別人復(fù)制我的就收錄了?就是別人把你的內(nèi)容放到自己網(wǎng)頁(yè)后,這個(gè)網(wǎng)頁(yè)比你那個(gè)網(wǎng)頁(yè)多了一些你沒(méi)有的,也就是增加了附加價(jià)值,可能他的網(wǎng)站信譽(yù)度比你高,可能結(jié)構(gòu)比較好,可能沒(méi)那么多彈窗,可能用戶可讀性更強(qiáng)等等。內(nèi)容質(zhì)量高不高不由原創(chuàng)決定,搜索引擎收不收錄那就更不是原創(chuàng)決定,至于百度為什么不收錄你的網(wǎng)站,需要從多方面去思考,而不僅僅看是否原創(chuàng)。要真要說(shuō)原創(chuàng)二字與收錄的關(guān)系,那我只能說(shuō)原創(chuàng)的可能重復(fù)度低,僅此而已,但這不是百度收錄你的理由。
3、原創(chuàng)內(nèi)容不等于排名
不管是百度搜索質(zhì)量白皮書對(duì)網(wǎng)頁(yè)的內(nèi)容質(zhì)量、網(wǎng)頁(yè)瀏覽體驗(yàn)、可訪問(wèn)性進(jìn)行衡量,然后排序;還是百度搜索研發(fā)部在談互聯(lián)網(wǎng)頁(yè)面價(jià)值時(shí)指出的受眾群大小、頁(yè)面稀缺程度、頁(yè)面質(zhì)量高低、頁(yè)面時(shí)效性四個(gè)排序標(biāo)準(zhǔn);或者是站長(zhǎng)圈里談到的頁(yè)面基礎(chǔ)得分、站內(nèi)得分、站外得分、用戶得分這四個(gè)網(wǎng)頁(yè)的綜合排名得分因素。我們可以發(fā)現(xiàn)頁(yè)面內(nèi)容質(zhì)量一直只是眾多百度網(wǎng)頁(yè)排名因素中的一個(gè),而原創(chuàng)又只是頁(yè)面內(nèi)容質(zhì)量構(gòu)成的一小部分。
經(jīng)常會(huì)聽到有人說(shuō), ;我的原創(chuàng)文章怎么沒(méi)有排名? ;、 ;為什么我堅(jiān)持原創(chuàng),排名卻不好 ;。事實(shí)上很多人都有這個(gè)問(wèn)題時(shí)候我也有。做好優(yōu)質(zhì)原創(chuàng)內(nèi)容確實(shí)是一個(gè)提高網(wǎng)站排名持續(xù)有效的方法,但這只是一個(gè)方法,哪怕是你一直持續(xù)更新優(yōu)質(zhì)原創(chuàng),也只是說(shuō)理論上排名會(huì)好起來(lái),沒(méi)有哪一個(gè)搜索引擎曾公告:只要你有優(yōu)質(zhì)原創(chuàng)內(nèi)容,我就給你好排名。影響排名的因素非常多,盡管內(nèi)容是做網(wǎng)站的重中之重,但你不能保證你的網(wǎng)站不會(huì)有其他因素影響你的排名,比如結(jié)構(gòu),比如加載速度,甚至被黑。
網(wǎng)站原創(chuàng)這一個(gè)價(jià)值大放異彩不一定就能在頁(yè)面排序大戰(zhàn)中脫穎而出,需要綜合各方面因素,我想這一點(diǎn)大家都明白。況且我剛剛一直假設(shè)的是優(yōu)質(zhì)原創(chuàng),持續(xù)的高質(zhì)量?jī)?nèi)容,如果僅僅只是你認(rèn)為的原創(chuàng),按照上面說(shuō)的原創(chuàng)內(nèi)容不等于高質(zhì)量?jī)?nèi)容,是不是更加悲劇了呢?
4、百度直接識(shí)別發(fā)布時(shí)間確定原創(chuàng)不就行了嗎?
很多人可能說(shuō):識(shí)別原創(chuàng)還不容易,看誰(shuí)先發(fā)布(Bustling)的,識(shí)別發(fā)布時(shí)間不就行了嗎?百度就是照顧大網(wǎng)站,識(shí)別原創(chuàng)都是假的。
常熟做網(wǎng)站不僅僅是提供域名注冊(cè)、空間租用、網(wǎng)站開發(fā)、網(wǎng)站建設(shè)與網(wǎng)絡(luò)營(yíng)銷策劃相關(guān)的企業(yè)組織。只要關(guān)于網(wǎng)絡(luò)方面的問(wèn)題,可以提供給用戶解決問(wèn)題的,都可以成為網(wǎng)絡(luò)公司。我只能說(shuō),你把原創(chuàng)識(shí)別判斷想得太容易了。百度Lee也說(shuō)過(guò),發(fā)布時(shí)間實(shí)際上早就已經(jīng)識(shí)別,單純靠發(fā)布時(shí)間是無(wú)法判斷原創(chuàng)性的。
前面說(shuō)了百度原創(chuàng)識(shí)別(distinguish)系統(tǒng)在百度大數(shù)據(jù)(Data Mining)的云計(jì)算平臺(tái)上開展,首先,通過(guò)內(nèi)容相似程度來(lái)聚合采集和原創(chuàng),將相似網(wǎng)頁(yè)聚合在一起作為原創(chuàng)識(shí)別的候選集合;其次,對(duì)原創(chuàng)候選集合,通過(guò)作者、發(fā)布時(shí)間、鏈接指向、用戶評(píng)論、作者和站點(diǎn)的歷史原創(chuàng)情況、轉(zhuǎn)發(fā)軌跡等上百種因素來(lái)識(shí)別判斷出原創(chuàng)網(wǎng)頁(yè)。發(fā)布時(shí)間時(shí)間僅僅是這上百種因素中的一個(gè),想直接通過(guò)識(shí)別發(fā)布時(shí)間確定原創(chuàng),你想得太容易了。
互聯(lián)網(wǎng)動(dòng)輒(dòng zhé)上百億、上千億的網(wǎng)頁(yè),從中挖掘原創(chuàng)內(nèi)容,可以說(shuō)是大海撈針,而且識(shí)別原創(chuàng)過(guò)程非常復(fù)雜,更是難上加難。百度確實(shí)一直致力于原創(chuàng)建設(shè),不是為你,而是為了百度自己。但解決原創(chuàng)問(wèn)題確實(shí)面臨著很大的挑戰(zhàn),計(jì)算數(shù)據(jù)規(guī)模龐大,面對(duì)的采集方式層出不窮,不同站點(diǎn)的建站方式和模版差異巨大,內(nèi)容提取復(fù)雜等等問(wèn)題都會(huì)影響原創(chuàng)算法識(shí)別,甚至導(dǎo)致判斷出錯(cuò)。所以才會(huì)出現(xiàn)很多原創(chuàng)假象,這也是沒(méi)辦法的,對(duì)原創(chuàng)的保護(hù)確實(shí)是一個(gè)非常艱巨的問(wèn)題,谷歌研究原創(chuàng)這么多年,依舊是勉勉強(qiáng)強(qiáng),原創(chuàng)保護(hù)仍是個(gè)長(zhǎng)久問(wèn)題。
說(shuō)完站長(zhǎng)對(duì)于原創(chuàng)的認(rèn)識(shí),再說(shuō)說(shuō)用戶的態(tài)度,都是我們?cè)跔?zhēng)論原創(chuàng)沒(méi)有想過(guò)是創(chuàng)給誰(shuí)看的呢?還不是給我們的用戶看,那他們是怎么想的呢?
四、用戶對(duì)于原創(chuàng)的態(tài)度
說(shuō)一句不怎么好聽的話,現(xiàn)在的大部分(bù fèn)網(wǎng)站,包括加入百度星火原創(chuàng)計(jì)劃的網(wǎng)站多少是純?cè)瓌?chuàng)呢?大多都是由原創(chuàng)、投稿、編輯、精華文章轉(zhuǎn)載等組成,也不都是原創(chuàng)。相反要說(shuō)純?cè)瓌?chuàng),我看它們還不如一些苦哈哈的小站站長(zhǎng),每天辛辛苦苦在那搞創(chuàng)作。但為什么用戶要看他的不看你的?
用戶在乎什么?用戶在看內(nèi)容時(shí)會(huì)在乎原創(chuàng)嗎,還是你覺(jué)得用戶在乎?用戶在乎的應(yīng)該是內(nèi)容對(duì)他有沒(méi)有價(jià)值?有用沒(méi)有用?而不是誰(shuí)提供的這個(gè)內(nèi)容,這個(gè)世界上的人最關(guān)心的都是自己,用戶找內(nèi)容最關(guān)心的同樣是內(nèi)容給自己帶來(lái)的利益,至于原創(chuàng)者是誰(shuí)恐怕只有原作者最關(guān)心。
你需要查一個(gè)東西,你去找網(wǎng)站內(nèi)容,找到了,而且你非常滿意,這就夠了。至于這個(gè)內(nèi)容是不是原創(chuàng),你會(huì)在意嗎?我不會(huì),我會(huì)覺(jué)得這個(gè)網(wǎng)站不錯(cuò),內(nèi)容非常好,收藏一下,下次繼續(xù)來(lái)。有時(shí)候看到了原作者以及某些文章的原文出處,我也不會(huì)再去點(diǎn),因?yàn)檫@里已經(jīng)滿足我的需求了,而且這里的速度、排版、結(jié)構(gòu)都很好,我何必去找原內(nèi)容。用戶是懶的,沒(méi)人整天在那找作者,他們找的是有價(jià)值內(nèi)容,這就是為什么現(xiàn)在越牛的網(wǎng)站越不吝嗇留原創(chuàng)地址,因?yàn)榧热辉髡咴诤?,他留就是了,反正他和他的用戶都不在乎?br>
所以說(shuō)整天爭(zhēng)原創(chuàng)有什么意義了呢,是你的原創(chuàng)用戶就得看?用戶不是在找原創(chuàng),他是在找有價(jià)值能解決他現(xiàn)在問(wèn)題的內(nèi)容。打個(gè)比方,一個(gè)用戶在找關(guān)于京東上市的信息,結(jié)果在新浪新聞?wù)业搅?,非常好,但文章下面寫著?nèi)容來(lái)自京東論壇,這個(gè)用戶會(huì)不會(huì)說(shuō):我X,不是原創(chuàng),原來(lái)是來(lái)自京東的,垃圾,再也不看新浪新聞了?我想不會(huì),作為用戶,只要有價(jià)值,原創(chuàng)who care?
五、對(duì)于大型網(wǎng)站說(shuō)保護(hù)原創(chuàng)更名副其實(shí),對(duì)小站,說(shuō)保護(hù)高質(zhì)量?jī)?nèi)容更好
在我看來(lái),對(duì)于大型網(wǎng)站說(shuō)保護(hù)原創(chuàng)更名副其實(shí),對(duì)小站說(shuō)保護(hù)高質(zhì)量?jī)?nèi)容更好,為什么這么說(shuō),因?yàn)榘俣葟?qiáng)調(diào)原創(chuàng)是要具有社會(huì)共識(shí)價(jià)值的,而不是胡亂制造(zhì zào)一篇根本不通的垃圾就能算做有價(jià)值的優(yōu)質(zhì)原創(chuàng)內(nèi)容。對(duì)于大型網(wǎng)站,百度知根知底,信譽(yù)度高權(quán)威,用戶群體大,歷史表現(xiàn)好,所以大多原創(chuàng)展現(xiàn),原創(chuàng)起源算法都發(fā)生在大型網(wǎng)站上,因?yàn)榧夹g(shù)跟不上,所以部分網(wǎng)站會(huì)提前保護(hù),就像加入星火原創(chuàng)計(jì)劃的都是大型網(wǎng)站,因?yàn)榭尚哦雀撸晒β矢摺?br> 而對(duì)于小型網(wǎng)站,我覺(jué)得更多的是鼓勵(lì)站長(zhǎng)創(chuàng)建優(yōu)質(zhì)的內(nèi)容,因?yàn)橄胍槐Wo(hù),首先就必須有優(yōu)質(zhì)的內(nèi)容做支撐,不然何談百度需要的原創(chuàng)。細(xì)心的朋友在前面可能發(fā)現(xiàn),百度每次提到原創(chuàng)都會(huì)加上低質(zhì)、高質(zhì)量等詞,比如 ;原創(chuàng)高質(zhì)量?jī)?nèi)容 ;、 ;偽原創(chuàng)低質(zhì)量?jī)?nèi)容 ;、 ;高質(zhì)原創(chuàng) ;等。為什么每次說(shuō)原創(chuàng)都要帶上這些詞?因?yàn)榘俣纫才抡`導(dǎo)站長(zhǎng),也怕站長(zhǎng)像前面說(shuō)的只看到原創(chuàng)二字。這不是百度的目的,百度重視保護(hù)原創(chuàng)的根本原因是為了提高(improve)用戶體驗(yàn),原創(chuàng)不是目的,希望小站創(chuàng)建優(yōu)質(zhì)內(nèi)容才是目的,所以百度講的原創(chuàng)也一直是優(yōu)質(zhì)原創(chuàng)內(nèi)容。
鼓勵(lì)小站原創(chuàng),保護(hù)網(wǎng)站原創(chuàng)到不如說(shuō)是保護(hù)高質(zhì)量網(wǎng)站內(nèi)容,杜絕垃圾采集內(nèi)容,這么說(shuō)可能更好,因?yàn)楦哔|(zhì)量?jī)?nèi)容還有個(gè)譜,但是原創(chuàng)以及原創(chuàng)判斷真的是一個(gè)沒(méi)譜的事。
寫在最后
原創(chuàng)保護(hù)肯定會(huì)是百度一個(gè)長(zhǎng)期的計(jì)劃,不可能一步到位,所以站長(zhǎng)(webmaster)們一定要心態(tài)擺正,不要整天盲目原創(chuàng)+抱怨,用戶真正要的不是原創(chuàng),要的是有價(jià)值的內(nèi)容,百度也只是借保護(hù)原創(chuàng)來(lái)提升互聯(lián)網(wǎng)高質(zhì)量?jī)?nèi)容,原創(chuàng)只是一個(gè)措施,不是結(jié)果,不是最終的目的,百度保護(hù)原創(chuàng)是為了維持互聯(lián)網(wǎng)生態(tài)、鼓勵(lì)站長(zhǎng)。站長(zhǎng)們做原創(chuàng)是為了能給用戶有價(jià)值獨(dú)特的內(nèi)容,這些才是結(jié)果。
這其中就有一個(gè)偽原創(chuàng)的問(wèn)題,很多站長(zhǎng)不屑,認(rèn)為這是抄襲。其實(shí)從用戶的需求出發(fā),挖掘?qū)τ谟脩粲袃r(jià)值的內(nèi)容是很多人都在做的,而且會(huì)經(jīng)常挖掘別人的優(yōu)質(zhì)內(nèi)容,這個(gè)東西對(duì)我的用戶很有價(jià)值,為什么不用?別人用了你就不用了,那這個(gè)互聯(lián)網(wǎng)的資源對(duì)你來(lái)說(shuō)恐怕沒(méi)多少了。你可以稱之為偽原創(chuàng),可以稱之為整合,也可以叫它重新包裝,但這不是抄襲,不是直接引用別人的就完事了,重點(diǎn)要比別人做得更好,更具有競(jìng)爭(zhēng)性。成功借用別人的成果不是讓你抄襲,而是放大它的優(yōu)點(diǎn),彌補(bǔ)它的缺點(diǎn),結(jié)合自己的優(yōu)勢(shì),讓內(nèi)容更加完整更有價(jià)值。如果只是長(zhǎng)期挪用別人的內(nèi)容,做得還沒(méi)有別人好,這才叫做抄襲。
對(duì)于站長(zhǎng)而言,不要太多的考慮什么原創(chuàng)不原創(chuàng),只需要根據(jù)用戶需求給他們有價(jià)值的內(nèi)容就行了,原創(chuàng)不能說(shuō)明什么,原創(chuàng)不一定就好。就拿百度來(lái)說(shuō),百度知道、百度百科、百度文庫(kù)、百度網(wǎng)盤等有多少是原創(chuàng)的內(nèi)容?很多都不是原創(chuàng),那為什么流量會(huì)那么高呢?因?yàn)檫@些平臺(tái)的這些內(nèi)容滿足了用戶的需求。在內(nèi)容建設(shè)的時(shí)候,內(nèi)容質(zhì)量度和可讀性都是網(wǎng)站運(yùn)營(yíng)的關(guān)鍵(解釋:比喻事物的重要組成部分)因素,不要一味的在那琢磨所謂的原創(chuàng)而忽視了用戶,忽視了內(nèi)容本身的質(zhì)量。用戶體驗(yàn)是未來(lái)的發(fā)展方向,搜索引擎要滿足的是用戶,網(wǎng)站要滿足的也是用戶,所以只要網(wǎng)站內(nèi)容能持續(xù)滿足用戶需求,獲得用戶青睞,網(wǎng)站在搜索引擎那的展現(xiàn)也不會(huì)有什么太大問(wèn)題。保不保護(hù)也沒(méi)多大關(guān)系。