劉小姐是北京一傳媒集團(tuán)老總的秘書(shū)。她工作的一項(xiàng)內(nèi)容是驗(yàn)收員工的培訓(xùn)心得,但隨之而來(lái)的網(wǎng)上搜索讓她不勝其苦。
她說(shuō),“每次都有上百篇文章交上來(lái),老總要求每篇都在網(wǎng)上搜索一下,看看是不是抄襲的。有時(shí)候,老板自己也親自搜。”上個(gè)月,她查出兩份學(xué)習(xí)心得是一字不改抄襲來(lái)的,老板很生氣,當(dāng)即開(kāi)除了這兩個(gè)經(jīng)營(yíng)部門(mén)的人。
劉小姐覺(jué)得,對(duì)每篇文章都上網(wǎng)搜索,工作量比較大。而且,遇到剪刀加漿糊式的抄襲,也不好判斷人家是不是抄的,總不能把每段都拆開(kāi)去搜。她希望能有個(gè)軟件來(lái)自動(dòng)完成這個(gè)工作,“這樣,得罪人的事兒,就不用我來(lái)干了。”她從新聞上看到大學(xué)開(kāi)始使用“反抄襲”軟件檢測(cè)學(xué)生論文時(shí),很感興趣,也去網(wǎng)上注冊(cè)想要使用這個(gè)系統(tǒng),但至今未獲授權(quán)。
與劉小姐一樣想找個(gè)“反抄襲”軟件的,還有出版社的編輯嚴(yán)燕。她主要編輯文學(xué)類(lèi)小說(shuō),“抄名著還好發(fā)現(xiàn),但有些抄襲對(duì)象不是有名作品,我也不可能都看過(guò),不好發(fā)現(xiàn),一旦出版之后會(huì)很被動(dòng)。”她也希望有個(gè)“反抄襲”軟件幫她篩一下書(shū)稿,減輕一下工作量。
目前,國(guó)內(nèi)的反抄襲軟件主要有兩套:一套是由中國(guó)學(xué)術(shù)期刊電子雜志社與清華同方知網(wǎng)共同研制的學(xué)術(shù)不端行為檢測(cè)系統(tǒng),另一套是武漢大學(xué)副教授沈陽(yáng)研發(fā)的ROST反剽竊系統(tǒng)軟件。這兩套軟件都只對(duì)高等院校和科研單位進(jìn)行檢測(cè)服務(wù),而且免費(fèi),但并不對(duì)公眾開(kāi)放。
但記者在淘寶網(wǎng)上發(fā)現(xiàn),用這兩種系統(tǒng)提供檢測(cè)服務(wù)的店鋪為數(shù)不少,而且大多生意不壞。在開(kāi)發(fā)這兩家系統(tǒng)還都免費(fèi)的時(shí)候,已經(jīng)有人從中賺取了“第一桶金”。
“反抄襲”軟件:一天注冊(cè)用戶(hù)6000個(gè)
今年年初,全國(guó)各大高等院校使用“反抄襲”軟件檢測(cè)畢業(yè)論文的新聞見(jiàn)諸報(bào)端,,“反抄襲”軟件隨后一直處在輿論的風(fēng)口浪尖之上。“現(xiàn)在幾乎天天都有人來(lái)找我們,要求授權(quán)他們使用‘學(xué)術(shù)不端行為檢測(cè)系統(tǒng)’。”中國(guó)知網(wǎng)科研誠(chéng)信管理系統(tǒng)研究中心主任孫雄勇告訴中國(guó)青年報(bào)記者,“每天大量用戶(hù)注冊(cè)申請(qǐng)使用,年初最高峰時(shí),一天注冊(cè)了6000個(gè)用戶(hù)。”
孫雄勇說(shuō),雖然每天都有大量注冊(cè),但目前開(kāi)放授權(quán)的,基本都是學(xué)術(shù)科研領(lǐng)域——機(jī)構(gòu)用戶(hù)和研究生導(dǎo)師,并且要簽保密協(xié)議。因?yàn)閾?dān)心一旦開(kāi)放給個(gè)人用戶(hù)之后,會(huì)產(chǎn)生不可預(yù)料的后果。
這個(gè)“學(xué)術(shù)不端行為檢測(cè)系統(tǒng)”,是世界首個(gè)用全文文獻(xiàn)為比對(duì)資源檢測(cè)抄襲行為的軟件系統(tǒng),由中國(guó)學(xué)術(shù)期刊電子雜志社與同方知網(wǎng)公司聯(lián)合研發(fā)。其耗時(shí)3年,2008年12月底研制成功,2009年3月研究生院開(kāi)始使用。據(jù)孫雄勇介紹,到6月底,已有3000家期刊編輯部和360多家高校的研究生院在使用,基本上覆蓋了全國(guó)重點(diǎn)院校。
雖然用戶(hù)很多,但基本都是免費(fèi)使用。因?yàn)檫@樣的用戶(hù),都是知網(wǎng)的論文供應(yīng)商。知網(wǎng)的主營(yíng)業(yè)務(wù)是數(shù)字出版,主要是通過(guò)合法渠道收集論文,再把這些論文整合后打包賣(mài)出去,但近年收稿質(zhì)量開(kāi)始下降,“用戶(hù)經(jīng)常投訴論文庫(kù)中有重復(fù),編輯部也為此頭疼。所以要求公司開(kāi)發(fā)一套系統(tǒng)來(lái)檢測(cè)。”孫雄勇說(shuō)。
該系統(tǒng)的技術(shù)核心使用了“自適應(yīng)多階指紋特征檢測(cè)技術(shù)”,能夠防止抄襲中的一些方法,比如替換一些詞句、顛倒順序、重組段落等等。“指紋”是這篇文章的信息特征,簡(jiǎn)單的手段改變不了這些特征。每一次檢測(cè),待檢文章首先按照篇章、段落、句子等層級(jí)分層處理,然后創(chuàng)建指紋,而比對(duì)資源庫(kù)中的比對(duì)文獻(xiàn),也采取同樣技術(shù)創(chuàng)建指紋索引,根據(jù)其重合處的比例,判斷該論文是否存在抄襲行為。目前,這個(gè)系統(tǒng)用做比對(duì)的資源庫(kù),是有6000萬(wàn)條學(xué)術(shù)文獻(xiàn)的數(shù)據(jù)庫(kù)及上百億網(wǎng)頁(yè)的網(wǎng)絡(luò)資源庫(kù)。
反抄襲需求五花八門(mén)
目前,上述系統(tǒng)每天增加的用戶(hù),主要是企業(yè)的科研機(jī)構(gòu)和各類(lèi)科研院所。從用戶(hù)反饋看,孫雄勇覺(jué)得效果挺好,“基本都是要求增加比對(duì)范圍。”
“有個(gè)知名出版社試用時(shí)檢測(cè)了兩部準(zhǔn)備出版的書(shū),一部60萬(wàn)字,一部80萬(wàn)字。其中一部檢測(cè)出,作者大量發(fā)表過(guò)的文章充斥其間。而編輯約稿時(shí)明確要求,不能使用發(fā)過(guò)的文章。”
“還有來(lái)檢測(cè)公務(wù)員出國(guó)考察報(bào)告的,一次,檢測(cè)出了兩篇考察德國(guó)和澳大利亞經(jīng)濟(jì)運(yùn)行模式的報(bào)告,都是抄的。”
今年3月,給各高校研究生院做培訓(xùn)的時(shí)候,有一知名大學(xué)的老師提出,應(yīng)該開(kāi)發(fā)跨語(yǔ)言檢測(cè)系統(tǒng),“有些作者不參考中文材料,而是直接拿英文文章翻譯成中文屬上自己名字。”孫雄勇說(shuō),目前正在開(kāi)發(fā)跨語(yǔ)言的檢測(cè)系統(tǒng),已經(jīng)接近完成,可以有效解決此類(lèi)問(wèn)題。
還有各種需求找到知網(wǎng)的,都要使用這套“學(xué)術(shù)不端行為檢測(cè)系統(tǒng)”。包括,有的單位人事處要查職稱(chēng)論文的,也有導(dǎo)師想查學(xué)生作業(yè)的,還有要查征文是否為抄襲的。目前,各種行業(yè)的這類(lèi)需求都非常多。
期間,也有各種聲音在質(zhì)疑這套系統(tǒng)——除了在校等待畢業(yè)學(xué)生的很多抱怨外,也有專(zhuān)家質(zhì)疑這套系統(tǒng)治標(biāo)不治本。有觀點(diǎn)稱(chēng),每年研究生畢業(yè)好幾萬(wàn)人,不可能每篇文章都有新觀點(diǎn)。
孫雄勇也認(rèn)同這樣的判斷。但他認(rèn)為,是大家誤解了這套系統(tǒng)的目的——不是檢測(cè)創(chuàng)新,只是防止抄襲。沒(méi)有新觀點(diǎn)和文章抄襲別人文章是有很大區(qū)別的。
“這套系統(tǒng)的定位應(yīng)該是學(xué)術(shù)成果的驗(yàn)收輔助工具。”孫雄勇表示,他們最近曾經(jīng)幫助科技部做過(guò)一次重點(diǎn)科研項(xiàng)目的論文檢測(cè),“結(jié)果就很好,只有個(gè)別文章有部分雷同,相關(guān)專(zhuān)家只需要比對(duì)這些部分就可以了。”
檢測(cè)不可能永遠(yuǎn)免費(fèi)
反抄襲系統(tǒng)無(wú)論多優(yōu)越,可以反剽竊,但是反不了代寫(xiě)。在這兩家反抄襲系統(tǒng)推出之后,網(wǎng)上代寫(xiě)論文的標(biāo)價(jià)應(yīng)聲而漲,而且都聲稱(chēng)可以通過(guò)反抄襲軟件的測(cè)試。
“不能相信他們說(shuō)的。”在一個(gè)代寫(xiě)論文的廣告帖中,一網(wǎng)友留言說(shuō),“收到論文之后,最好到淘寶找個(gè)檢測(cè)論文店鋪看看能不能通過(guò)。”而在這個(gè)帖子之前,有兩個(gè)跟貼詢(xún)問(wèn),是否真能通過(guò)反抄襲檢測(cè)。
截至目前,上述系統(tǒng)已經(jīng)累計(jì)檢測(cè)了20萬(wàn)篇次。由于每天檢測(cè)數(shù)量比較多,服務(wù)器的運(yùn)算壓力很大。以后是不是還要免費(fèi)提供檢測(cè),孫雄勇說(shuō),雖然公司目前沒(méi)有具體的收費(fèi)計(jì)劃,但也不可能永遠(yuǎn)免費(fèi)下去。
而更廣泛的檢測(cè)抄襲,跨越“學(xué)術(shù)不端”到非學(xué)術(shù)領(lǐng)域,孫雄勇表示,只要擴(kuò)大比對(duì)庫(kù)就可以實(shí)現(xiàn),在技術(shù)上沒(méi)障礙,“但是否把這個(gè)需要當(dāng)作市場(chǎng)來(lái)開(kāi)發(fā),公司目前還沒(méi)計(jì)劃。”
據(jù)悉,目前國(guó)外也有類(lèi)似的檢測(cè)系統(tǒng),早已廣泛應(yīng)用于多所高校及科研機(jī)構(gòu)。最受歡迎的是反抄襲服務(wù)公司Turnitin.com,能夠?qū)W(xué)生的論文與網(wǎng)上所有內(nèi)容以及該公司的論文數(shù)據(jù)庫(kù)進(jìn)行比較,從而發(fā)現(xiàn)問(wèn)題。目前Turnitin.com的客戶(hù)遍及世界51個(gè)國(guó)家和地區(qū)。包括劍橋和牛津等世界名校在內(nèi)的英國(guó)700所公立大學(xué),幾乎都已同反抄襲服務(wù)公司簽約要求提供這項(xiàng)服務(wù)。據(jù)數(shù)據(jù)顯示,Turnitin到目前已阻止了世界范圍內(nèi)將近600萬(wàn)的學(xué)生和教育者的剽竊行為。而在這個(gè)網(wǎng)站上進(jìn)行檢測(cè)并不免費(fèi),他們是向用戶(hù)收費(fèi)的,使用的學(xué)校要交數(shù)千到數(shù)萬(wàn)美元不等的服務(wù)費(fèi)。
而以此前估算,國(guó)內(nèi)提供同類(lèi)服務(wù)的系統(tǒng)也有相應(yīng)的贏利空間,而且國(guó)內(nèi)還有大量非學(xué)術(shù)和科研用戶(hù)等待著他們能使用的反抄襲軟件。(編輯:王小凡)
進(jìn)入論壇>>聲明:IT商業(yè)新聞網(wǎng)登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其描述。文章內(nèi)容僅供參考。新聞咨詢(xún):(010)68023640.推薦閱讀
婁勤儉:工信部正在推動(dòng)龍芯產(chǎn)業(yè)鏈整合
婁勤儉說(shuō),我國(guó)“核高基”科技重大專(zhuān)項(xiàng)已經(jīng)提出,芯片的設(shè)計(jì)要和硬件相結(jié)合,同時(shí)和計(jì)算機(jī)整機(jī)本身相結(jié)合,同時(shí)還要考慮它的應(yīng)用范圍,哪些方面能夠應(yīng)用,這方面有統(tǒng)一的考慮。 7月8日凌晨消息,工業(yè)和信息化部副部長(zhǎng)>>>詳細(xì)閱讀
本文標(biāo)題:各式各樣剽竊刺激“反抄襲”軟件市場(chǎng)?
地址:http://www.sdlzkt.com/a/xie/20111230/202419.html