首頁 > 精品范文 > 個性化推薦系統(tǒng)
時間:2022-05-27 12:54:20
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇個性化推薦系統(tǒng)范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。
關鍵詞:個性化推薦;推薦技術;關聯(lián)規(guī)則;協(xié)同過濾
隨著信息技術和互聯(lián)網(wǎng)的迅速發(fā)展,人們逐漸從信息匱乏時代進入了信息過載時代。這個時代,對于信息生產(chǎn)者而言,如何讓自己生產(chǎn)的信息脫穎而出,收到廣大用戶的關注是一件很困難的事情。對于用戶而言,信息量的增大加重了找到感興趣信息的負擔,從而降低了信息的使用效率。推薦系統(tǒng)正是在這一環(huán)境中誕生的,它是根據(jù)用戶的信息需求、興趣等,將用戶感興趣的信息、產(chǎn)品等推薦給用戶的個性化信息推薦系統(tǒng)。
1 推薦系統(tǒng)概念、組成要素
目前被廣泛接受的推薦系統(tǒng)的概念和定義是Resnick和Varian在1997年給出的:“它是利用電子商務網(wǎng)站向客戶提供商品信息和建議,幫助用戶決定應該購買什么產(chǎn)品,模擬銷售人員幫助客戶完成購買過程”。個性化推薦系統(tǒng)主要由三個要素組成,分別是:候選對象、用戶、推薦算法。推薦系統(tǒng)把用戶模型中興趣需求信息和推薦對象模型中的特征信息匹配,同時使用相應的推薦算法進行計算篩選,找到用戶可能感興趣的推薦對象,然后推薦給用戶。
2 推薦技術
推薦算法是整個推薦系統(tǒng)中核心的部分,在很大程度上決定了推薦系統(tǒng)的質(zhì)量。目前主要的推薦技術基本包括以下幾種:基于關聯(lián)規(guī)則的推薦技術,基于內(nèi)容的推薦技術,協(xié)同過濾推薦技術和混合推薦技術。
2.1 基于關聯(lián)規(guī)則的推薦技術
關聯(lián)規(guī)則是數(shù)據(jù)中所蘊含的一類重要規(guī)律,對關聯(lián)規(guī)則進行挖掘是數(shù)據(jù)挖掘中的一項根本任務,關聯(lián)規(guī)則挖掘就是從數(shù)據(jù)項目中找出所有的并發(fā)關系,這種關系也稱為關聯(lián)。關聯(lián)規(guī)則挖掘的經(jīng)典應用就是購物籃數(shù)據(jù)分析,目的是找出顧客在商場(或普通店鋪)所選購商品之間的關聯(lián)。
關聯(lián)規(guī)則可以這樣表述。設I={i1,i2,…,in}為所有項的集合,事務T表示事務集合。數(shù)據(jù)庫D為事務數(shù)據(jù)庫。關聯(lián)規(guī)則形如XY的蘊含式,其中X、Y均為項目集,并且X、Y沒有交集。關聯(lián)規(guī)則的強度可以用支持度和置信度表示。支持度為同時包含X、Y 項集的事務在數(shù)據(jù)庫D中的百分比。置信度為包含X的事務同時也包含Y在數(shù)據(jù)庫D中的百分比。目前已有大量文獻提出關聯(lián)規(guī)則挖掘算法,在眾多算法中,最著名的是Apriori 算法。
Apriori算法是由Agrawal等人在1994年提出來的,是一種最有影響的挖掘布爾關聯(lián)規(guī)則頻繁項集的算法。該算法分兩步進行:第一步,生成所有繁瑣項目集,繁瑣項目集是支持度高于最小支持度的項目集;第二步,從繁瑣項目集中生成所有可信的關聯(lián)規(guī)則,可信關聯(lián)規(guī)則是置信度大于最小置信度的規(guī)則。
基于關聯(lián)規(guī)則的推薦技術其優(yōu)點是:簡單直接,領域通用性強,規(guī)則的挖掘可以離線進行,可以保證推薦算法的實時性要求。其缺點是:存在著嚴重的"冷啟動"問題,新加入的項目由于缺少相關的用戶數(shù)據(jù),難以被系統(tǒng)中的規(guī)則發(fā)現(xiàn),從而得不到推薦,并且隨著系統(tǒng)項目數(shù)量的不斷增加,規(guī)則也會呈出相應的增長趨勢,使得規(guī)則的管理成本相應升高,降低了系統(tǒng)的運行效率。
2.2 基于內(nèi)容的推薦技術
基于內(nèi)容的推薦算法重要的是建立項目特征屬性庫,系統(tǒng)通過用戶已關注項目的特征屬性值,來掌握目標用戶興趣點,依據(jù)用戶興趣點與待推薦項目屬性值的匹配程度進行推薦。用戶興趣點的產(chǎn)生依賴于系統(tǒng)所采用的機器學習算法,如基于向量的表示、文本挖掘、判別樹、神經(jīng)網(wǎng)絡等技術?;趦?nèi)容的推薦結(jié)果直觀易理解,不需要過多的領域知識,但是需要有足夠數(shù)據(jù)構(gòu)造分類器,一些例如稀疏問題、新用戶問題和復雜屬性等問題不易處理。
2.3 協(xié)同過濾推薦技術
基于協(xié)同過濾推薦技術是當前主流的,應用最為廣泛的一種推薦技術。該推薦技術可以分為兩種,一種是基于用戶的協(xié)同過濾推薦技術;另一種是基于項目的協(xié)同過濾推薦技術,這兩種協(xié)同過濾推薦技術的不同之處在于兩者針對的對象不同?;谟脩舻膮f(xié)同過濾推薦技術是給用戶推薦和他有共同興趣的用戶喜歡的物品;基于項目的協(xié)同過濾推薦技術是給用戶推薦和他之前喜歡的物品相似的物品。
2.3.1 基于用戶的協(xié)同過濾推薦技術
基于用戶的協(xié)同過濾技術是推薦系統(tǒng)中最古老的算法。該算法在1992年被提出,并應用于郵件過濾系統(tǒng),1994年被GroupLens應用于新聞過濾。該算法主要包括兩個步驟:第一步,找到和目標用戶興趣相似的用戶集合;第二步,找到這個集合中用戶喜歡的,且目標用戶還沒有聽說過的物品,將該物品推薦給目標用戶。
2.3.2 基于項目的協(xié)同過濾推薦技術
基于項目的協(xié)同過濾技術是基于這樣一個假設:用戶更傾向于選擇與用戶喜歡的項目相近的項目。該推薦過程分為兩個步驟,第一,計算物品之間的相似度;第二,根據(jù)物品的相似度和用戶的歷史行為為用戶生成推薦列表。
2.4 混合推薦技術
目前,推薦技術已經(jīng)發(fā)展出了很多種,但每種推薦技術都在不同程度上存在各自的缺點,每種推薦技術在針對特定的用戶或者項目時才能發(fā)揮出自己的優(yōu)勢。因此人們提出了混合推薦來互補推薦技術各自的不足,已達到一個理想的推薦效果。在大部分的混合推薦技術研究當中,是將基于內(nèi)容的推薦技術和基于協(xié)同過濾技術相結(jié)合。相對于使用單一途徑算法的推薦技術,基于混合推薦技術往往表現(xiàn)出更高的推薦精度和更好的推薦質(zhì)量。
3 推薦系統(tǒng)的應用
自推薦系統(tǒng)誕生近20年的時間里,推薦系統(tǒng)的應用領域迅速擴展。從電子商務、音樂視頻網(wǎng)站,到作為互聯(lián)網(wǎng)經(jīng)濟支柱的在線廣告和新穎的在線應用推薦,到處都有推薦系統(tǒng)的身影。下面簡單介紹個性化推薦系統(tǒng)的應用以及該領域較成功的網(wǎng)站。
3.1 電子商務
電子商務網(wǎng)站是個性化推薦系統(tǒng)的一大應用領域。著名的電子商務網(wǎng)站亞馬遜是個性化推薦系統(tǒng)的積極應用者和推廣者,被讀寫網(wǎng)稱為“推薦系統(tǒng)之王”。亞馬遜的推薦系統(tǒng)深入到了各類產(chǎn)品中,其中最主要的應用有個性化商品推薦列表和相關商品的推薦列表。
3.2 電影和視頻網(wǎng)站
在電影和視頻網(wǎng)站中,個性化推薦系統(tǒng)能夠幫助用戶在大量視頻信息中找到令他們滿意的視頻。該領域較成功的一家公司就是Netflix。Netflix在2006年開始舉辦著名的Netflix Prize推薦系統(tǒng)比賽。該比賽對推薦系統(tǒng)的發(fā)展起到了重要的推動作用。
3.3 個性化音樂網(wǎng)絡電臺
個性化推薦的成功應用需要具備兩個條件。第一是存在信息過載的問題,第二是用戶大部分時候沒有明確的需求。在這兩個條件下,個性化網(wǎng)絡電臺無疑是最合適的個性化推薦產(chǎn)品。目前國際上著名的有Pandora和Last.fm,國內(nèi)的代表則是豆瓣電臺。
3.4 個性化閱讀
閱讀文章是很多互聯(lián)網(wǎng)用戶每天都會做的事情。目前互聯(lián)網(wǎng)上的個性化閱讀工具很多,國際知名的有Google Reader,國內(nèi)有鮮果網(wǎng)等。同時,隨著移動設備的流行,移動設備上針對個性化閱讀的應用也很多,其中具有代表性的有Zite和Flipboard。
[參考文獻]
[1]Resnick P.Varian HR Recommender systems[外文期刊].1997(03).
[2]許海玲.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學報,2009.20(2):350.362.
[3]王國霞,劉賀平.個性化推薦系統(tǒng)綜述[J].計算機工程與應用,2012,48(7).
[4]劉興濤,石冰,解英文.挖掘關聯(lián)規(guī)則中Apriori算法的一種改進[J]. 山東大學學報,2008,43(11):67-71.
[5]胡斌.基于高階潛在語義分析的音樂推薦系統(tǒng)的研究,碩士論文.北京工業(yè)大學計算機學院,2009.
[6]Schafer JB,Konstan J,Riedl J.Recommender systems in e-commerce[M].On Electronic Commerce,1999.P367-461.
[7]Deshpande M,Karypis G.Item-based top-N recommendation algorithms[J].ACM TransInformation Systems,22(1):143-177,2004.
智能Web時代的到來意味著大數(shù)據(jù)分析在各個行業(yè)的運用成為必然趨勢,推薦系統(tǒng)作為典型的智能Web應用,通過對用戶行為數(shù)據(jù)的積累和分析,將傳統(tǒng)用戶的搜索行為轉(zhuǎn)化為推送行為,從而實現(xiàn)原始電商到智能電商的轉(zhuǎn)變。本文以智能Web時代為引,就旅游電商推薦系統(tǒng)的基本實現(xiàn)方法和思路展開了討論和分析。
【關鍵詞】智能Web 個性化旅游電商
1 智能Web時代的到來
當我們?nèi)ビ啿偷臅r候,飯店訂餐系統(tǒng)引用了我們公開的健康調(diào)查數(shù)據(jù),從而為我們搭配適宜的綠色飲食;當我們與陌生人在線聊天時,對話內(nèi)容得到通訊軟件后臺的事實核查,保證交流內(nèi)容的真實和安全(如facebook);當我們在線購書時,電商平臺能夠根據(jù)用戶購物行為的相似度判斷來給出最合理的推薦(如亞馬遜)。這一系列的發(fā)生與正在發(fā)生的案例為我們詮釋了一個時代的到來,智能Web時代。
所謂智能,是指能夠不斷通過大數(shù)據(jù)分析抽象出普遍規(guī)則,進而替代窮舉的一種高效機器學習方式。拓展開講,一款智能Web應用要首先具備大數(shù)據(jù)能力,或者叫內(nèi)容聚合,這是機器學習的基礎條件;然后需要具備參考結(jié)構(gòu),參考結(jié)構(gòu)為原始大數(shù)據(jù)提供了科學的解釋和展示形式,它為原始數(shù)據(jù)的分析和展現(xiàn)提供了重要的助力;最后還要具備合理的算法,算法為從數(shù)據(jù)轉(zhuǎn)變?yōu)樾畔⑻峁┝丝尚械姆椒?,并將信息抽象為引導用戶交互的?guī)則,這三大要素構(gòu)成了智能Web應用的充要條件。
2 旅游電商推薦系統(tǒng)研究與設計
作為一類典型的智能Web應用,推薦系統(tǒng)因為谷歌的廣告和亞馬遜的商品推薦等形式為人們所熟知,它的出現(xiàn)為當下信息過載的大環(huán)境帶來了良好的解決方案。通過對用戶行為數(shù)據(jù)的積累和分析,將傳統(tǒng)用戶的搜索行為轉(zhuǎn)化為推送行為,從而實現(xiàn)原始電商到智能電商的轉(zhuǎn)變。
旅游電商對推薦系統(tǒng)的認識度和重視度目前還處于比較初級的狀態(tài),遠不如消費品電商平臺,這也反映出了旅游電商企業(yè)對大數(shù)據(jù)的分析處理意識與主流消費品電商的差距。我們認為,實現(xiàn)高效用的旅游電商推薦系統(tǒng),需要在精準度和展現(xiàn)形式兩方面進行深入研究,第一是要對旅游產(chǎn)品進行精確建模,只有精確建模才能在推薦計算中獲得準確的結(jié)果。第二是推薦引擎的科學選擇,常見的推薦系統(tǒng)引擎分為兩類,協(xié)同過濾推薦和基于內(nèi)容分析的推薦。協(xié)同過濾推薦是基于用戶的行為數(shù)據(jù)積累做出推薦,例如基于相似用戶的推薦和基于相似條目的推薦。基于內(nèi)容分析的推薦則需要考量用戶之間、條目之間和用戶與條目內(nèi)容之間的相似度。其中,相似度算法是不同推薦引擎的核心,我們通過如下常用代碼片段來說明相似度的計算方法。
由代碼1可知,事實上相似度計算的方法是多樣化的,需要根據(jù)實際的問題進行相似度算法的選擇,目前大量的實驗表明,基于歐氏距離的相似度算法效果相對較好。
在大數(shù)據(jù)的精確分析基礎上,再將推薦結(jié)果以服務而非廣告的展示形式推送到旅游電商的各個營銷環(huán)節(jié),必將會極大的推動產(chǎn)品購買的轉(zhuǎn)化率。
3 旅游電商推薦系統(tǒng)展望
在智能Web時代,隨著人們對信息和服務的智能化要求,推薦系統(tǒng)必定會在旅游電商營銷環(huán)節(jié)占據(jù)愈加重要的地位,同時,單一的旅游產(chǎn)品推薦將會無法滿足用戶的需求,旅游推薦系統(tǒng)的衍生形態(tài)將會慢慢發(fā)展起來,推薦系統(tǒng)的內(nèi)容和展示方式也都將會呈現(xiàn)出多元化和個性化的趨勢。作為旅游電商的從業(yè)者,必須清楚的認識到推薦系統(tǒng)、大數(shù)據(jù)分析、智能Web等要素對旅游電商發(fā)展的推動作用,并隨勢而動,才能在互聯(lián)網(wǎng)+的時代獲得市場和用戶的青睞。
參考文獻
[1]吳婷,熊前興,賀曦春.基于用戶特征和用戶興趣變化的協(xié)同過濾推薦[J].電腦知識與技術,2008,4(7).
[2]王國霞,劉賀平.個性化推薦系統(tǒng)綜述[J].計算機工程與應用,2012,48(7).
[3]張娜.電子商務環(huán)境下的個性化信息推薦服務及應用研究[D].合肥工業(yè)大學,2007.
[4]許海玲.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學報,2009,20(2).
[5]王巧榮,趙海燕,曹健.個性化服務中的用戶建模技術[J].小型微型計算機系統(tǒng),2011,32(1).
作者簡介
嚴杰(1981-),男,浙江省衢州市人。碩士學位?,F(xiàn)為浙江旅游職業(yè)學院講師。研究方向為Web開發(fā)和電子商務。
【關鍵詞】特征提取技術個性化網(wǎng)頁推薦系統(tǒng)應用
個性化網(wǎng)頁推薦系統(tǒng),對現(xiàn)代電子商務的發(fā)展具有重要的實用價值和商業(yè)價值。將特征提取技術廣泛的應用在個性化網(wǎng)頁推薦系統(tǒng)中,對于操作系統(tǒng)應用網(wǎng)絡系統(tǒng)和數(shù)據(jù)挖掘技術對客戶進行商品推薦,實現(xiàn)了銷售再次合作,有效的防止了客戶的流響。
一、個性化網(wǎng)頁推薦系統(tǒng)
近年來,隨著網(wǎng)絡在世界范圍內(nèi)的普及應用,民眾對網(wǎng)頁的瀏覽已在世界范圍內(nèi)風靡。個性化網(wǎng)頁推薦改變了用戶單一被動接受信息的模式,搜索引擎功能的運用實施也比以往的只有搜索與用戶匹配的關鍵詞完成上,占有更大優(yōu)勢。個性化網(wǎng)頁推薦的應用,擴大了網(wǎng)頁推薦引擎的搜索范圍,能為用戶提供更多他們感興趣的網(wǎng)頁。個性化網(wǎng)頁中,關鍵詞的概括更具概括性。
個性化網(wǎng)頁推薦體系的服務器端,由特征提取對其負責文本進行分類預處理,通過對候選網(wǎng)頁進行推薦和進一步篩選,最后再與客戶端實現(xiàn)數(shù)據(jù)的交互傳輸。
二、特征提取技術
特征提取技術,即可以通過提取用戶閱讀的網(wǎng)頁內(nèi)容,挖掘出用戶感興趣的內(nèi)容。在個性化網(wǎng)頁推薦系統(tǒng)中的應用,通過關聯(lián)規(guī)則篩選出了符合條件的搜索內(nèi)容,避免了搜索過程中出現(xiàn)的無法搜索項。推薦網(wǎng)頁鏈接由網(wǎng)頁推薦系統(tǒng)對用戶程序自動捕獲閱讀網(wǎng)頁事件,并通過客戶端在瀏覽器窗口右側(cè)。以當前網(wǎng)頁為中心,將興趣分支供用戶觀賞。
特征提取技術應用在網(wǎng)頁推薦系統(tǒng)中,能使Web通過網(wǎng)絡用戶注冊數(shù)據(jù)的了解用戶基本情況,偏好及瀏覽行為中累積的原始空間維數(shù),對于用戶潛在的興趣愛好及未來商家的可實用性和可操作性進行綜合評判。
由于網(wǎng)頁推薦系統(tǒng)顯示的終端數(shù)據(jù)五花八門,從原理上來說,就承載了太多數(shù)據(jù)的無效空間,利用“指紋”特征,能更有效,更有針對性的挖掘出有用的信息,而且節(jié)省了時間和用戶就此付出的費用。網(wǎng)頁推薦系統(tǒng)研究中,就將特征提取技術作為通信領域的劃時代變革。
由于網(wǎng)頁數(shù)據(jù)的無結(jié)構(gòu)化特點,在對一些文本進行預處理時,原始空間特征你的系統(tǒng)維數(shù),無論怎樣來說都需要特征壓縮文件對其維數(shù)進行壓縮工作.網(wǎng)頁的特征提取技術,在這一時段的應用中就發(fā)揮了不可超越的力量。
三、個性化網(wǎng)頁推薦系統(tǒng)設計與應用
因為個性化網(wǎng)頁推薦系統(tǒng)是多步驟系統(tǒng)性處理數(shù)據(jù),對于提高其系統(tǒng)的實時性和處理空間維數(shù)的能效來說,可以費時較長的步驟利用系統(tǒng)服務器的閑置時間進行處理或?qū)⒉糠纸Y(jié)果存儲于數(shù)據(jù)庫中。
特征提取技術在個性化網(wǎng)頁推薦系統(tǒng)中的設計使用原理:商家經(jīng)由Web處理和識別用戶;通過特征提取技術,讀取系統(tǒng)數(shù)據(jù)庫數(shù)據(jù)并經(jīng)由用戶反過來信息以后,再次將數(shù)據(jù)庫數(shù)據(jù)傳輸給用戶;再次由系統(tǒng)自動組件,通過用戶反饋回來的信息挖掘并推薦處理再次數(shù)據(jù);對于數(shù)據(jù)結(jié)果,網(wǎng)頁系統(tǒng)會對原始空間維數(shù)進行預處理,將部分耗時較長的數(shù)據(jù)自動在系統(tǒng)閑時處理,部分用于存入LOG中;個性化網(wǎng)頁推薦系統(tǒng)就以存儲讀取數(shù)據(jù),最后對網(wǎng)頁做出推薦結(jié)果。中間的各個環(huán)節(jié),都需要用戶意見的及時反饋,最終處理的結(jié)果就是個性化網(wǎng)頁推薦系統(tǒng)將高效正確的信息顯示給用戶。這樣就完成了,特征提取技術在個性化網(wǎng)頁推薦中的運用。
個性化網(wǎng)頁推薦系統(tǒng)中,廣泛應用特征提取技術,不但有利于降低空間系統(tǒng)維數(shù),更有利于對用戶所需要的信息進行價值憑升,對于原始空間中存在的無價值信息,特征提取會做出及時的反饋并根據(jù)自身評定,做出簡單取舍。
特征提取技術的進步,能有效提升計算量,在中文標識記的文本特性中,提取的精確度,直接程度上有利于個性網(wǎng)頁推薦使用中,達到用戶的滿意度,提升他的內(nèi)在營運價值,將網(wǎng)頁瀏覽和獲取信息量,真正成為商業(yè)用途中高效能的使用工具。
四、總結(jié)
特征提取技術在個性化網(wǎng)頁推薦系統(tǒng)中的應用,對于網(wǎng)絡交易平臺的實現(xiàn)和節(jié)省用戶使用網(wǎng)絡的費用和時間,同時對于促進網(wǎng)絡商務交流合作具有極大的創(chuàng)新意義。利用網(wǎng)頁推薦技術助企業(yè)分析從網(wǎng)上獲取有效數(shù)據(jù),實現(xiàn)他們的動態(tài)科技創(chuàng)新發(fā)展,具有很大意味的企業(yè)調(diào)整營銷策略。
參考文獻
[1]于洪波.網(wǎng)頁特征提取技術研究[J].山東理工大學學報(自然科學版). 2011,3
[關鍵詞] 電子商務 體育營銷 個性化推薦系統(tǒng)
近年來,電子商務的快速發(fā)展極大地改變了傳統(tǒng)的貿(mào)易模式,為企業(yè)和消費者提供了一個相互交流的便捷平臺。本文旨在提出一個適合于體育營銷的個性化推薦模式,以期使電子商務能廣泛、高效地為發(fā)展體育事業(yè)服務。
一、國內(nèi)電子商務個性化推薦系統(tǒng)的現(xiàn)狀
目前個性化推薦已開始在國內(nèi)電子商務領域初現(xiàn)端倪,PC零售業(yè)的巨頭――Dell公司正是通過提供個性化推薦在電子商務活動中獲得了巨大的成功。然而,在電子商務推薦系統(tǒng)的應用方面,國內(nèi)電子商務網(wǎng)站與國外網(wǎng)站相比差距還較大,主要表現(xiàn)在:
1.缺乏個性化的推薦: 由于很多推薦籠統(tǒng)地粗放地面向所有用戶,而非個性化的推薦,其結(jié)果與每一用戶的特殊興趣并不相符合,這是我國電子商務推薦系統(tǒng)最主要的缺陷。
2.推薦的自動化程度低: 大多數(shù)的推薦功能都需要用戶經(jīng)過一段時間與計算機進行交互,輸入自己感興趣的信息,然后才能得到結(jié)果。并且,系統(tǒng)不能保存用戶每次輸入的信息??傮w來說,所有的推薦策略都基本上停留在查找這一層次上,不能實現(xiàn)自動推薦。
3.推薦的持久性程度低: 目前大多數(shù)的推薦策略都是建立在當前用戶會話的基礎上,不能利用用戶以前的會話信息,因而推薦的持久性程度非常低。這也是國內(nèi)推薦系統(tǒng)的不足之處。
4.推薦策略單一: 大多數(shù)推薦系統(tǒng)所用的推薦策略基本上就是分類瀏覽和基于內(nèi)容的檢索,缺乏多種推薦策略的結(jié)合使用,尤其缺少個性化與非個性化推薦策略的混合使用。
產(chǎn)生以上問題的主要原因,首先是消費者對電子商務不信任的社會心理還比較普遍,不愿提供真實的個人信息。其次,是現(xiàn)實生活中電子商務個性化推薦不到位,管理制度不完善,無法達到消費者要求的水平,建立提供電子商務個性化推薦的網(wǎng)絡系統(tǒng)的技術也欠發(fā)達。
二、電子商務個性化推薦系統(tǒng)及其分類
電子商務個性化推薦系統(tǒng)(Personalized Recommendation Systems for E -Commerce)的正式定義由Resnick & Varian在1997年給出:“電子商務個性化推薦系統(tǒng)是利用電子商務網(wǎng)站向用戶提品信息和相關建議,幫助用戶決定購買什么產(chǎn)品,通過模擬銷售人員幫助用戶完成購物過程的系統(tǒng)”。這個定義現(xiàn)在已被廣泛引用,推薦系統(tǒng)的使用者是用戶(電子商務活動中的用戶)(user),推薦的對象是項目(item)。項目是推薦系統(tǒng)提供給用戶的產(chǎn)品或推薦,也即最終的推薦內(nèi)容。
根據(jù)推薦對象的特點,目前存在的推薦系統(tǒng)可以大致分為兩類:一類是以網(wǎng)頁為主要推薦對象的推薦系統(tǒng),它主要采用Web數(shù)據(jù)挖掘,尤其是使用Web日志挖掘的方法來分析用戶的興趣,向用戶推薦符合其興趣愛好的網(wǎng)頁鏈接。另一類推薦系統(tǒng)的推薦對象主要是產(chǎn)品,這種系統(tǒng)主要在電子商務網(wǎng)絡購物環(huán)境中使用,幫助用戶找出他真正想要的產(chǎn)品。
三、電子商務個性化推薦系統(tǒng)模塊
1.輸入模塊(Input):主要負責對用戶信息的收集和更新。輸入來源按時間劃分,可分為用戶當前行為輸入和用戶訪問過程中的歷史行為輸入;也可以分為個人輸入和群體輸入兩部分。輸入形式主要包括:用戶注冊信息輸入、隱式瀏覽輸入、關鍵字輸入、編輯推薦輸入、用戶購買歷史輸入等等。
2.推薦方法模塊(Recommendation method)是整個推薦系統(tǒng)的核心部分,它直接決定著推薦系統(tǒng)的性能優(yōu)劣。推薦方法模塊是以推薦技術和推薦算法為技術支撐。
3.輸出模塊(Output)負責將推薦結(jié)果輸出給用戶。輸出形式主要包括相關產(chǎn)品輸出、個體評分輸出、相關推薦輸出等。
四、電子商務個性化推薦系統(tǒng)的體系結(jié)構(gòu)
與傳統(tǒng)的網(wǎng)站系統(tǒng)相比,個性化的電子商務系統(tǒng)有一個很大不同之處:個性化的電子商務網(wǎng)站一般都沒有靜態(tài)頁面,這是由HTTP協(xié)議的“無狀態(tài)性”所決定的。瀏覽器與Web推薦器之間的一個交互過程如圖1所示。
從上圖可見,客戶機瀏覽器與Web推薦器之間采用TCP連接,并且該連接狀態(tài)在此次連接過程中尚能保持。但是,Web推薦器在發(fā)送給客戶機應答信息后,便“遺忘”了此次交互,無論Web推薦器和客戶端瀏覽器都不會記憶上一次連接的狀態(tài)。目前,解決這個問題的方法一般有兩種:
1.使用Cookie。Cookie是存儲在Web客戶端機器上的一個小文本文件。Web推薦器端的處理程序可以創(chuàng)建一個Cookie,然后讓推薦器把該信息發(fā)送給客戶端的瀏覽器。瀏覽器收到信息后即把數(shù)據(jù)存儲在客戶端的硬盤上。以后,當該客戶再次訪問該站點時,推薦器的處理程序向客戶機的瀏覽器請求該Cookie。 通過Cookie,可以使推薦器端的處理程序具有交互性。
2.采用全動態(tài)的頁面?!叭珓討B(tài)”是指在獲取用戶的身份信息后,在用戶訪問的每一個頁面中都寫入系統(tǒng)分配給顧客的一個唯一標識,當用戶向推薦器提交推薦請求時,這個標識也一起傳送到了推薦器。這樣,推薦器端的處理程序可以從這個標識中獲取用戶的身份信息。采用這種方式,不同的用戶擁有不同的標識,不同的顧客也就有了一套不同的頁面。這些頁面只可能通過處理程序來動態(tài)生成。
因此,一個個性化的電子商務系統(tǒng)一般是沒有靜態(tài)頁面的。綜上所述,一個個性化電子商務網(wǎng)站的基本結(jié)構(gòu)如圖2所示。
五、個性化處理單元的設計
1.個性化處理部分:這是個性化處理單元中一個很重要的部分,它與接口部分協(xié)作,完成了個性化網(wǎng)頁的生成工作。個性化處理部分一個大致的工作流程如下:(1)確認用戶身份,以便對不同的用戶提供不同的推薦。如果由于輸入錯誤或其他一些原因,用戶可能無法通過身份認證,對此系統(tǒng)可以有不同的處理方式。(2)獲取用戶配置信息。用戶在通過認證后,系統(tǒng)將從后臺數(shù)據(jù)庫中獲得用戶配置信息,如用戶的興趣、愛好等等。根據(jù)系統(tǒng)的不同,需要的用戶配置信息也會有所不同。(3)生成動態(tài)頁面。匹配中心根據(jù)用戶的配置信息,與相應的數(shù)據(jù)庫進行交互,動態(tài)生成頁面。 最后通過連接管理模塊將結(jié)果頁面發(fā)送給Web推薦器,最終由推薦器將頁面返回給發(fā)送請求的用戶。
2.管理部分;其工作是在后臺管理整個系統(tǒng)的運行,對于一個個性化系統(tǒng)來說,管理部分還有一些特殊的地方:(1)管理工作的內(nèi)容比較繁雜。管理工作有的是直接為訪問網(wǎng)站的用戶推薦的,有的是為網(wǎng)站后臺應用服務的。(2)進行管理工作的人員也比較復雜。在一個個性化的系統(tǒng)中,高級決策人員、銷售人員、網(wǎng)頁維護人員等都可以進行相應的管理工作。正因為如此,管理部分成為個性化系統(tǒng)中一個不可缺少的部分。管理部分共有內(nèi)容管理模塊、規(guī)則管理模塊、后臺管理模塊三大塊,每個模塊的功能都不相同。
3.接口部分:這一部分包括接入管理模塊和數(shù)據(jù)庫接口兩部分。個性化處理單元處于Web推薦器與后臺數(shù)據(jù)庫之間,它通過接口部分與Web推薦器和數(shù)據(jù)庫連接。因此,接口部分在 Web推薦器、個性化處理單元和數(shù)據(jù)庫間起到了一個“橋梁”的作用。(1)接入管理模塊。接入管理模塊的主要功能是接收Web推薦器發(fā)送的請求信息,并將產(chǎn)生的結(jié)果頁面返回Web推薦器。根據(jù)Web推薦器中HTP網(wǎng)關的不同,接入管理模塊可以是一個外部的應用程序,或者是一個連接入推薦器的模塊。(2)數(shù)據(jù)庫接口。數(shù)據(jù)庫的接口大致可以分為兩類:通用接口和專用接口。通用接口,如ODBC, JDBC等,可以連接到多種數(shù)據(jù)庫。專用接口只能對應于某種專用的數(shù)據(jù)庫。但通用接口在速度方面不如專用接口。根據(jù)網(wǎng)站規(guī)模的不同、經(jīng)營項目的不同、硬件設備的不同,庫接口都會有所不同,這需要具體問題具體分析。
六、結(jié)束語
電子商務網(wǎng)站為終端客戶和分銷商等商業(yè)個體提供商業(yè)信息交流的平臺,如何對系統(tǒng)留下的大量冗余的商業(yè)數(shù)據(jù)再利用是一個具有挑戰(zhàn)性的問題。隨著數(shù)據(jù)挖掘技術的成熟,尤其是Web挖掘技術的產(chǎn)生,如何提供電子商務網(wǎng)站個性化推薦越來越受企業(yè)關注,也是保障企業(yè)生存發(fā)展的重要因素之一。
參考文獻:
[1]余力:電子商務個性化――理論、方法與應用.清華大學出版社,(2006)
【關鍵詞】網(wǎng)絡數(shù)據(jù)挖掘;個性化電子商務;推薦系統(tǒng)
【中圖分類號】C37【文獻標識碼】A【文章編號】1672-5158(2013)07-0109-01
引言
在信息化全方位發(fā)展的今天,電子商務之所以能在世界范圍內(nèi)迅速發(fā)展,其優(yōu)勢在于方便、快捷、成本低、受限少。然而,電子商務也同樣存在一些必須解決的問題,就是用戶和商家之間的互選問題,即用戶對所需產(chǎn)品的挑選和商家對用戶所需的了解。通過網(wǎng)絡數(shù)據(jù)挖掘與電子商務的恰當結(jié)合,就可以很好的解決這一問題,對電子商務的發(fā)展起到了很大的幫助。
1 網(wǎng)絡數(shù)據(jù)挖掘
1.1 網(wǎng)絡概述
在社會生活中存在著關乎人們工作和生活的各種各樣的系統(tǒng),通過對其本質(zhì)進行分析,可以得到一個抽象的包含眾多節(jié)點和連接節(jié)點的邊的網(wǎng)絡。網(wǎng)絡是復雜系統(tǒng)的研究工具,為復雜系統(tǒng)的研究提供了新的模式和思想方法。
1.2 網(wǎng)絡數(shù)據(jù)挖掘推薦算法
1.2.1 基于二部分圖網(wǎng)絡結(jié)構(gòu)的推薦算法
因為系統(tǒng)的主體都是用節(jié)點來表示的,但是網(wǎng)絡中的節(jié)點可以是一個類型,也可以不是一個類型。節(jié)點的連接關系用矩陣表示,這類節(jié)點屬于單模式網(wǎng)絡;節(jié)點不是一種的類型,不同類型的節(jié)點之間才能連接的網(wǎng)絡稱為二部分網(wǎng)絡。
運用二部分圖結(jié)構(gòu)的算法,把推薦的系統(tǒng)中項目節(jié)點看作是具備一定的,能夠分配出去的資源,同時可以把資源分配給其他看好的商品項目。
1.2.2 基于用戶關聯(lián)網(wǎng)絡的推薦算法
之所以可以將網(wǎng)絡思想引入推薦算法,是因為電子商務系統(tǒng)中的用戶與商品及用戶與用于之間具有關聯(lián)性,這種基于網(wǎng)絡的商務系統(tǒng)具有非常強大的適應性。主要思想就是:首先,建立用戶選擇的商品與評價信息之間的關聯(lián)圖,以權值計量。然后,在已形成的關聯(lián)圖中,按某商品的全部使用記錄,把該商品推薦給其它相關權值較大的用戶。
2 個性化電子商務推薦系統(tǒng)
2.1 個性化電子商務推薦系統(tǒng)的內(nèi)容
電子商務是指有商務能力的實體,通過現(xiàn)代的電子技術來進行商務活動的過程。特別是現(xiàn)階段,電子商務所表現(xiàn)出的優(yōu)勢越來越明顯?,F(xiàn)有的個性化推薦系統(tǒng)在主動為用戶提供所需的信息或服務的基礎上,更能同時滿足為企業(yè)謀利益的要求,能為企業(yè)大力發(fā)展?jié)撛谟脩?,也就是可以通過個性化推薦系統(tǒng)實現(xiàn)雙向推薦。
2.2 推薦系統(tǒng)的主要研究內(nèi)容
2.2.1 信息的獲取以及模型建立
隨著因特網(wǎng)在全球的迅速發(fā)展,在準確獲取用戶信息的基礎上,包括用戶瀏覽行為等內(nèi)容在內(nèi)的交互式用戶信息獲取方式成為發(fā)展的趨勢,這就要求在獲取用戶信息時,要對信息提前進行分類。
模型建立和更新的數(shù)據(jù)來源于不同途徑得到的用戶信息數(shù)據(jù),并與其數(shù)量和質(zhì)量密切相關,通過數(shù)據(jù)清理和轉(zhuǎn)換篩選出適用于建模的數(shù)據(jù)?,F(xiàn)階段常見的建模技術有:關聯(lián)規(guī)則挖掘、基于內(nèi)容的過濾、聚類算法等。
2.2.2 推薦算法設計的有關研究
推薦算法有實時、準確、高效的特點,現(xiàn)在使用的主要算法都具有不同的適用領域,由于電子商務系統(tǒng)的使用率日漸增多,用戶數(shù)據(jù)庫的內(nèi)容也越來越多,因此必須要在保證算法準確性的基礎上,同時對其實時性進一步研究。盡管新的設計正在不斷被推出,但都有一定的片面性,所以,想要得到較理想的推薦算法還需要進一步的研究。
2.2.3 評價推薦系統(tǒng)存在的問題
由于推薦系統(tǒng)的應用領域較多,并且不同的推薦系統(tǒng)的評價目的各異,另外,現(xiàn)在的評價指標大多只注重評價系統(tǒng)的單一特征,想對目前的推薦系統(tǒng)進行客觀的評價還是比較困難的?,F(xiàn)在常用的六種準確度評價指標有:預測準確度、排序準確度、半衰期效用指標、距離標準化指標、預測打分關聯(lián)、分類準確度。
2.2.4 一些應用方面的問題
研究推薦系統(tǒng)的目的就是使其能夠在不同的領域中取得應用,雖然推薦系統(tǒng)已經(jīng)取得很好的應用效果,但其發(fā)展空間還是非常巨大的,如發(fā)展企業(yè)需要的潛力用戶、拓寬推薦系統(tǒng)應用領域等。
3 數(shù)據(jù)挖掘與個性化推薦系統(tǒng)
電子商務系統(tǒng)中的信息量非常巨大,并且保持與日俱增的趨勢,數(shù)據(jù)挖掘技術可以讓這些蘊含著非常有用的規(guī)則和模式的數(shù)據(jù)得到很好的運用,從而更好的提供個性化服務。
3.1 聚類分析技術
聚類就是把數(shù)據(jù)在無指導的情況下通過非預先設定方式進行分組劃分,這些數(shù)據(jù)之所以具有潛在性是因為它們都是在劃分過程中自動生成的。利用這種技術得到的數(shù)據(jù)更有關注意義,更適合于分析使用。在個性化推薦系統(tǒng)中,通過聚類技術將客戶按照不同的特征劃分成不同的部分,這就使得搜索工作的效率大大提高。
3.2 關聯(lián)規(guī)則技術
關聯(lián)規(guī)則就是在數(shù)量龐大的數(shù)據(jù)中找出項集中的有用規(guī)則,以其高效的性能和伸縮性而成為是一個很熱門的數(shù)據(jù)挖掘技術。但關聯(lián)規(guī)則也有它的不足之處,就是參數(shù)閾值設置時會影響規(guī)模的效率。
關聯(lián)規(guī)則中有兩個很重要的概念,即置信度和支持度。以商品銷售為例,關聯(lián)規(guī)則生成步驟如下:第一步,從所有銷售產(chǎn)品中找到全部的繁項集,這也是關聯(lián)規(guī)則挖掘的核心和熱點所在。第二步,生成關聯(lián)規(guī)則,在頻繁項目集中找到同時符合最小置信度和最小支持度的關聯(lián)規(guī)則。
3.3 協(xié)同過濾技術
協(xié)同過濾是現(xiàn)階段使用頻率最多、效果最好、最受歡迎的一項技術。該技術主要是針對用戶,通過搜索目標用戶得到用戶的行為偏好同時做出商品評價。通常所說的協(xié)同過濾技術主要指基于用戶的協(xié)同過濾技術,隨著對該技術的不斷研究和發(fā)展,基于商品項目的協(xié)同過濾技術也得到了不斷的提高。
3.3.1 基于用戶的協(xié)同過濾技術
該技術的研究對象主要是用戶,并且在現(xiàn)實生活中的使用率較高。即通過假設,把對某一商品具有相似評價的用戶列為相似用戶,并由此推斷歸結(jié)到一起的相似用戶對其他商品也會有相似的評價。
基于用戶的協(xié)同過濾算法實施步驟:(1)獲取用戶信息,即利用用戶—項目矩陣描述用戶所獲得的商品的信息,這是用戶信息獲取步驟中最主要的內(nèi)容;(2)相似性的計算以及相似用戶集的產(chǎn)生,就是通過相似性計算得到與目標用戶相似的用戶群,得到符合相似用戶數(shù)的一定數(shù)量的相似用戶;(3)生成推薦結(jié)果,是在相似用戶集的基礎上,根據(jù)推薦方法生成推薦結(jié)果。
3.3.2 基于項目的協(xié)同過濾技術
基于項目的協(xié)同過濾技術的研究對象主要是商品項目。該技術就是用相似性計算,得到用戶評價的商品項目與目標項目的相似值。利用它們之間的共性,預測用戶對目標項目的評價值,通過這樣的方式來獲得同類商品信息。
結(jié)束語
電子商務推薦系統(tǒng)的應用領域非常之廣,特別是將網(wǎng)絡數(shù)據(jù)挖掘技術與其相結(jié)合,更好的符合了電子商務領域的用戶所需。本文系統(tǒng)地闡述了網(wǎng)絡數(shù)據(jù)挖掘和個性化商務系統(tǒng)以及他們之間的結(jié)合,探討了網(wǎng)絡技術在個性化商務系統(tǒng)中的應用。在今后的工作過程中,還應加強對基于網(wǎng)絡數(shù)據(jù)挖掘的個性化電子商務推薦系統(tǒng)的深入研究,以切實提升系統(tǒng)運行的安全性與可靠性。
參考文獻
[1] 張遠程,康永勝.基于swarm平臺和社交網(wǎng)絡的電子商務個性化推薦系統(tǒng)仿真模型的理論構(gòu)建[J].計算機光盤軟件與應用,2012,(21):124-125
關鍵詞:數(shù)據(jù)挖掘;關聯(lián)規(guī)則;聚類;個性化推薦;圖書館
中圖分類號:TP391文獻標識碼:A文章編號:1009-3044(2009)31-pppp-0c
The Application Research of Association Rules and Affairs Grouping Technique in Library Individualized Recommendation System
ZHANG Ting1, YAO Wan-hui2
(1.International Business School, Anhui University, Hefei 230011, China; 2.Education Department, Hefei University, Hefei 230601, China)
Abstract: This paper puts forward the correlation algorithm which is based on affairs grouping technique by the analysis of classical Apriori algorithm’s mining process .Readers are clustered by profession, grade, borrowing amount and other characteristics. Then, correlation analysis is made on each group. The bookrecommendation quality of this algorithm is better than the classical Apriori algorithm.
Key words: data mining, Association rules, Clustering, individualized recommendation, Library
上世紀80年代以前圖書借閱主要依賴卡片進行人工檢索、登記。隨著信息技術和網(wǎng)絡技術的發(fā)展,80年代圖書館迎來革命性的技術――圖書館自動化信息管理技術。該技術以計算機和自動化集成管理系統(tǒng)為平臺輔助圖書館工作人員處理采購、編目、流通、檢索等業(yè)務。90年代后期,以數(shù)據(jù)挖掘技術為基礎的數(shù)字圖書館技術得到了較快發(fā)展,數(shù)字圖書館管理系統(tǒng)能夠主動分析讀者、圖書及流通歷史記錄,找出其中隱藏的關系和規(guī)律,根據(jù)不同的讀者特點提供相應的服務。個性化推薦系統(tǒng)是其中的一個重要分支,它將已借圖書列表作為形式參數(shù),規(guī)則作為函數(shù),得到推薦圖書列表。
推薦算法是個性化推薦系統(tǒng)中的核心部分,它在很大程度上決定了推薦系統(tǒng)性能。目前,主要的推薦算法包括:協(xié)同過濾推薦、基于內(nèi)容推薦、基于關聯(lián)規(guī)則推薦等。本文探討基于關聯(lián)規(guī)則推薦(Association Rule-based Recommendation)算法及應用。
1 關聯(lián)規(guī)則挖掘算法介紹
1.1 基本概念
設I={I1,I2,……,Im}是項的集合;設與任務相關的數(shù)據(jù)D={T1,T2,……,Tn}是數(shù)據(jù)庫事務的集合,其中每個事務T是項的集合,使得T?哿I,每個事務T有一個事務標識符TID;設A是一個項集,A?哿T。關聯(lián)規(guī)則是形如A=>B的蘊涵式,其中A?奐I, B?奐I,并且A∩B=?I。有如下定義:
1) 包含A和B(即包含A∪B)的事務在事務數(shù)據(jù)庫D中的百分比稱為規(guī)則A=>B在D中的支持度,support(A=>B)=P(A∪B)。
2) 事務數(shù)據(jù)庫D中包含A的事務同時也包含B的百分比稱為規(guī)則A=>B在D中的置信度,confidence(A=>B)=P(B|A)。
3) 如果項集A的相對支持度計數(shù)滿足預定義的最小支持度閾值(min_support),則A是頻繁項集(Frequent Itemsets)。
4) 數(shù)據(jù)庫事務集D在I上滿足最小支持度和最小置信度(min_confidence)的關聯(lián)規(guī)則稱為強關聯(lián)規(guī)則。
關聯(lián)規(guī)則挖掘過程由兩步構(gòu)成:
1) 找出所有的頻繁項集:通過用戶給定的最小支持度,尋找所有頻繁項集,即滿足支持度不小于min_support的所有項目子集。
2) 由頻繁項集產(chǎn)生強關聯(lián)規(guī)則:通過用戶給定的最小置信度,檢查每個頻繁項集。在其中找到置信度不小于min_confidence的關聯(lián)規(guī)則,將這些規(guī)則輸出。
1.2 經(jīng)典Apriori算法
經(jīng)典Apriori算法是R.Agrawal和R.Srikant于1994年提出的為布爾關聯(lián)規(guī)則挖掘頻繁項集的原創(chuàng)性算法。
Apriori使用逐層搜索的迭代方法,即k項集用于發(fā)現(xiàn)(k+1)項集。首先,通過掃描事務數(shù)據(jù)庫,累計每個項的計數(shù),搜集滿足最小支持度的項,找出頻繁1項集的集合,該集合記作L1。然后,L1用于找頻繁2項集的集合L2,L2用于找L3,如此下去,直到不能在找到頻繁k項集Lk。每個Li的生成都需要一次事務數(shù)據(jù)庫完全掃描。
2 基于聚類的事務集分組技術
2.1 算法性能分析
Apriori算法在具體應用領域內(nèi)存在很多的問題,其中最為典型的是事務數(shù)據(jù)不均衡。在圖書個性化推薦系統(tǒng)中,試圖尋找圖書之間的關聯(lián)規(guī)則,即尋找滿足最小支持度的圖書頻繁項集,再由頻繁項集和最小置信度生成關聯(lián)規(guī)則。而生成頻繁項集所依賴的圖書借閱事務數(shù)據(jù)庫D中的借閱事務是不均衡的,有如下表現(xiàn):
1) 專業(yè)圖書一般被本專業(yè)內(nèi)讀者借閱,而非專業(yè)圖書(如:文藝、小說等)為所有專業(yè)的讀者共享。專業(yè)圖書的借閱記錄相對整個借閱記錄的比例很低,導致專業(yè)圖書的支持度偏低,而大量的非專業(yè)圖書的支持度卻很高。在實驗中表現(xiàn)為置信度很高的規(guī)則因不滿足最小支持度閾值而丟失,專業(yè)圖書推薦質(zhì)量下降。
2) 各專業(yè)的人數(shù)差異很大,在統(tǒng)一的最小支持度閾值情況下,即使min_sup的值很小,對人數(shù)少的專業(yè),規(guī)則生成數(shù)量仍然很少,推薦系統(tǒng)對此類專業(yè)不公正。
在上述的背景下,試圖通過降低最小支持度閾值的方法解決問題是不科學的。雖然降低最小支持度閾值會增加規(guī)則數(shù)量,減少有價值規(guī)則的丟失,但是,這會導致運算量的大幅度攀升,而且專業(yè)圖書推薦質(zhì)量并不能夠得到明顯的提高。
[關鍵詞]電子商務個性化信息服務個性化推薦系統(tǒng)
一、個性化信息服務
隨著網(wǎng)絡技術的不斷發(fā)展和電子商務的盛行,個性化信息服務成為了各商家在激烈的競爭中立于不敗之地的重要法寶。DELL公司的成功,就證實了個性化信息服務的重要性。個性化信息服務是指互聯(lián)網(wǎng)絡使用者可以按照自己的目的和需求,在某種特定的網(wǎng)絡功能和服務方式中,自己設定網(wǎng)上信息的來源方式、表現(xiàn)形式、特定網(wǎng)上功能以及其他的網(wǎng)上服務方式等,以達到最為快捷地獲取自己所需的網(wǎng)上信息服務內(nèi)容的目的,強調(diào)“以用戶為中心”盡可能的滿足用戶的需求。個性化信息服務應用于電子商務中,通過捕獲用戶的興趣來提高商品的銷售量。
二、個性化信息服務的主要特點
1.以用戶為中心,以滿足用戶個性化的價值追求為目標。個性化信息服務應主動為用戶選擇最需要的資源與服務,根據(jù)用戶需求的變化,動態(tài)的改變所提供的信息,讓用戶得到個性化的服務。它以滿足特定用戶的特定需求為主旨,以給用戶提供最快捷、最方便、最易用的服務為目標,它是“以用戶為中心”的服務,可以是以用戶的信息需求為依據(jù),面向用戶開展的一切服務性活動,也可以是針對特定需求向用戶提供特定信息的有計劃、有目的的活動,服務的基礎就是用戶的信息需求。
2.具備智能化信息分析與處理功能。個性化信息服務中的智能化信息分析與處理功能一方面表現(xiàn)在系統(tǒng)的主動性推薦和協(xié)同推薦上,另一方面表現(xiàn)在對用戶綜合行為的挖掘中。主動推薦是指主動采集并跟蹤用戶瀏覽的信息,從用戶日常檢索瀏覽中主動學習用戶的興趣,推理并預測用戶需求,及時處理推薦信息;協(xié)同推薦是指根據(jù)不同用戶的相同點或相似性進行信息推薦,使需求相同的用戶之間共享查詢結(jié)果。用戶綜合行為的挖掘是針對用戶所有可能被記錄下來的行為進行數(shù)據(jù)挖掘,實現(xiàn)資源的深層挖掘并提供有效的服務。
3.推薦精確、系統(tǒng)的知識。個性化信息服務通過過濾、屏蔽無關無用的冗余信息,推薦精確、有效、真正具有針對性的信息,:能自動地、智能地將大量的數(shù)據(jù)轉(zhuǎn)換為具有規(guī)律性、系統(tǒng)性的知識,形成具有內(nèi)在關聯(lián)的信息鏈和知識鏈,并以易于理解的模式推薦給用戶。
4.主動性、高效性、靈活性。個性化信息服務采用“push”技術,其主動性主要是指服務不需要用戶及時請求而主動地將數(shù)據(jù)傳給用戶,與傳統(tǒng)的瀏覽器的“pull”技術的被動服務形成鮮明的對比;高效性主要是指可在網(wǎng)絡空閑時啟動,能夠有效的利用網(wǎng)絡帶寬,比較適合傳送大量的多媒體信息;靈活性主要體現(xiàn)在用戶能夠完全根據(jù)自己的方便和需要,靈活地設置連接時間,通過E-mail、對話框、音頻、視頻等方式獲取網(wǎng)上特定信息資源。
5.允許用戶充分表達個性化需求。個性化信息服務系統(tǒng)不僅提供友好的界面,而且方便用戶交互、描述自己的需求、反饋對服務結(jié)果的評價等。
三、個性化信息服務研究的基本問題
個性化信息服務研究的基本問題包括個性化的具體應用:個性化應用分為資源的個性化入口和過濾/排序;用戶信息需求定義文件的表示與創(chuàng)建:用戶信息需求或興趣的描述和存儲;協(xié)同過濾與單獨過濾:針對一個或一組用戶對信息文檔根據(jù)文件進行的相關度排序;系統(tǒng)的體系結(jié)構(gòu):用戶信息需求定義文件放在服務器還是客戶計算機上,或者處于二者之間的服務器上;個性化系統(tǒng)的評估:包括信息需求定義文件的收斂分析和信息需求定義文件是否反映用戶的實際興趣分析。這些問題也是設計一個具體的應用必須要明確的問題,而且它們之間是互相關聯(lián)、互相制約的。
四、個性化信息推薦系統(tǒng)
推薦系統(tǒng)是一種在特定類型數(shù)據(jù)庫中進行知識發(fā)現(xiàn)的應用技術,使用多種數(shù)據(jù)分析技術為用戶更好的服務,向用戶主動、及時、準確地提供所需信息,并能根據(jù)用戶對推薦內(nèi)容的反饋進一步改進推薦結(jié)果。不僅要對用戶提出的要求提供最貼切的信息服務,還要能依據(jù)個體個性特征,主動收集個體可能感興趣的信息,甚至預測個體可能的個性發(fā)展,提前收集相應的信息,最后以個性化方式顯示給個體。是實現(xiàn)個性化信息服務的關鍵。
1.個性化信息推薦系統(tǒng)的關鍵技術。個性化信息服務推薦系統(tǒng)是實現(xiàn)個性化信息服務的主要途徑,主要是通過信息過濾和協(xié)同過濾等技術將用戶需要的信息推薦給用戶的。其關鍵技術有:
(1)內(nèi)容過濾技術:試圖跟蹤和把握用戶的潛在信息需求,比較資源和用戶描述文件,對動態(tài)信息流進行過濾,盡量屏蔽無用信息,向用戶主動提供信息資源列表,從而提高用戶獲取信息的效率。
(2)協(xié)同過濾技術:利用用戶的訪問信息,通過用戶群的相似性進行內(nèi)容推薦,不依賴于內(nèi)容僅依賴于用戶之間的相互推薦,避免了內(nèi)容過濾的不足,保證信息推薦的質(zhì)量。
(3)聚類分析技術:對數(shù)據(jù)對象進行分類,把一組數(shù)據(jù)對象分到不同簇中,簇是一組數(shù)據(jù)對象的集合,使簇內(nèi)各對象間具有較高的相似度,而不同組的對象差別較大。
2.個性化信息推薦系統(tǒng)的基本要求。個性化信息服務是為用戶打造量身訂制的服務,是為了更好的滿足用戶的需求。個性化信息服務推薦系統(tǒng)應該滿足個性化、主動性、新穎性、準確性的基本要求。
(1)個性化:根據(jù)不同用戶的不同背景、不同需求,為不同用戶提供不同的信息,存在一定程度的個性差異。
(2)主動性:系統(tǒng)主動根據(jù)用戶的信息需求向用戶提供信息,實現(xiàn)“信息找人”的過程,而不是“人找信息”。
(3)新穎性:系統(tǒng)向用戶提供的信息是用戶以往所不具有的,未曾訪問的卻又是需要的。
(4)準確性:在相同或相近的信息資源中,對兩個不同用戶的相似要求返回不同的信息結(jié)果,以滿足不同用戶的不同需求。
3.個性化信息推薦系統(tǒng)體系結(jié)構(gòu)。目前,個性化信息推薦系統(tǒng)總的來說可以分為基于規(guī)則的和基于過濾的兩種推薦系統(tǒng)。基于關聯(lián)規(guī)則的個性化信息服務,主要針對特定的站點組織結(jié)構(gòu),采用最大向前訪問路徑輔助內(nèi)容事務方法。制定一系列規(guī)則并利用這些規(guī)則為特定用戶提供服務。利用規(guī)則來推薦信息依賴于規(guī)則的質(zhì)量和數(shù)量,基于規(guī)則的技術缺點是隨著規(guī)則的數(shù)量增多,系統(tǒng)將變得越來難以管理。基于過濾的個性化推薦服務分為基于內(nèi)容過濾的推薦服務和基于協(xié)同過濾的推薦服務。基于內(nèi)容過濾是通過比較資源和用戶信息描述文件,推薦與用戶興趣相似的資源?;趨f(xié)同過濾的推薦系統(tǒng)則是利用用戶群的訪問信息,通過用戶群之間的相似性進行內(nèi)容推薦。
結(jié)合以上兩類系統(tǒng),為了能夠為用戶主動提供所需信息,個性化信息服務推薦系統(tǒng)一般需要通過用戶接口模塊、需求信息模塊、信息檢索模塊、用戶分析模塊、信息過濾模塊、信息推送模塊6個功能模塊來實現(xiàn)。
(1)用戶接口模塊:是用戶與系統(tǒng)之間的接口。負責處理用戶初次輸入的用戶信息,并將它存儲在用戶信息庫中;接收用戶輸入的認證信息,與用戶信息庫中的個人認證信息比較,完成用戶身份認證;處理用戶的檢索需求;將用戶輸入的興趣、愛好信息及用戶對于推薦信息的評價提交給需求分析模塊,接收信息推送模塊送來的信息,最終將其提交給用戶。
(2)需求分析模塊:是對用戶接口模塊送來的用戶初始興趣信息進行分析,建立用戶模型,并根據(jù)用戶反饋修改用戶模型。
(3)信息檢索模塊:是接收用戶接口模塊處理過的用戶檢索需求,檢索本地數(shù)據(jù)庫和網(wǎng)絡數(shù)據(jù)庫,并將檢索結(jié)果送到信息過濾模塊,并將其存儲到本地信息庫中。
(4)用戶分析模塊:是負責比較該用戶模型與其它用戶模型之間的相似度,找出有相同或相似興趣的其他用戶,相互推薦信息,實現(xiàn)信息資源共享。
(5)信息過濾模塊:是根據(jù)用戶模型對信息檢索模塊返回的檢索結(jié)果進行過濾并將過濾的結(jié)果送到信息推薦模塊;此外,如果用戶分析模塊找到了具有相同或相似興趣的用戶,信息過濾模塊也將這些用戶的個性化信息傳送到信息推薦模塊。
(6)信息推薦模塊:是負責實現(xiàn)主動信息服務,根據(jù)用戶信息庫中對于信息推送的時間、數(shù)量等設置,將經(jīng)過信息過濾模塊過濾的信息推送到用戶接口模塊。
五、結(jié)束語
傳統(tǒng)的定題服務所具有的主動性是有限的,從根本上講仍是“用戶找信息”,而個性化信息服務是依托網(wǎng)絡環(huán)境的,可以在較高程度上改變信息與用戶的關系,能夠滿足網(wǎng)絡環(huán)境下真正實現(xiàn)“信息找用戶”。個性化信息服務以其交互性好、不受時間地域的限制、針對性強、資源豐富等優(yōu)點,將成為電子商務發(fā)展的方向。
參考文獻:
[1]曾春:信息過濾的概念表示與算法研究[D].北京:清華大學,2003