欧美色欧美亚洲高清在线观看,国产特黄特色a级在线视频,国产一区视频一区欧美,亚洲成a 人在线观看中文

  1. <ul id="fwlom"></ul>

    <object id="fwlom"></object>

    <span id="fwlom"></span><dfn id="fwlom"></dfn>

      <object id="fwlom"></object>

      淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用教育論文

      時間:2019-05-15 10:43:46下載本文作者:會員上傳
      簡介:寫寫幫文庫小編為你整理了多篇相關(guān)的《淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用教育論文》,但愿對你工作學(xué)習(xí)有幫助,當(dāng)然你在寫寫幫文庫還可以找到更多《淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用教育論文》。

      第一篇:淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用教育論文

      關(guān)鍵詞:數(shù)據(jù)挖掘 高校教學(xué) 教育信息化

      摘要:數(shù)據(jù)挖掘技術(shù)目前在商業(yè)、金融業(yè)等方面都得到了廣泛的應(yīng)用,而在教育領(lǐng)域應(yīng)用較少。本文通過時數(shù)據(jù)挖掘在高校教學(xué)中的應(yīng)用分析,認為數(shù)據(jù)挖掘技術(shù)可以幫助教學(xué)人員合理安排教學(xué)工作,協(xié)助輔導(dǎo)員對學(xué)生的管理,對提高學(xué)校的教學(xué)管理水平起到指導(dǎo)作用。

      1引言

      隨著12世紀(jì)信息化時代的到來,整個社會的信息總量呈幾何級數(shù)迅速增長,人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,積累的數(shù)據(jù)越來越多,但缺乏挖掘數(shù)據(jù)中隱藏知識的手段,導(dǎo)致了“數(shù)據(jù)爆炸但知識貧乏”的現(xiàn)象。隨著數(shù)據(jù)庫技術(shù)的成熟和數(shù)據(jù)應(yīng)用的普及,在過去的若干年中,人們積累了大量的數(shù)據(jù)資料,但數(shù)據(jù)庫中隱藏豐富的知識及有價值信息遠遠沒有得到充分地發(fā)掘和利用,隨著數(shù)據(jù)量以指數(shù)速度激增,人們渴求從數(shù)據(jù)汪洋中出現(xiàn)一個去粗存精、去偽存真的技術(shù),越來越希望系統(tǒng)能夠提供更高層次的數(shù)據(jù)分析功能,從中找出規(guī)律和模式,幫助決策者發(fā)現(xiàn)數(shù)據(jù)間重要但被忽略的因素,從而更好地支持決策或科研工作。正是為了滿足這種要求,從數(shù)據(jù)庫中發(fā)現(xiàn)知識(KDD)及其核心技術(shù)—數(shù)據(jù)挖掘技術(shù)應(yīng)運而生。

      2數(shù)據(jù)挖掘介紹

      2.1概念及其特點

      數(shù)據(jù)挖掘(DtaaMniing)是指從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的,人們事先不知道的但又潛在有用的信息和知識的過程,提取的知識表示為概念、規(guī)則、模式等。根據(jù)數(shù)據(jù)挖掘的目標(biāo),采用人工智能、集合論、統(tǒng)計學(xué)等方法,應(yīng)用相應(yīng)的數(shù)據(jù)挖掘算法,分析數(shù)據(jù)并通過可視化工具表述所獲得的模式或規(guī)則。

      數(shù)據(jù)挖掘有以下特點:(1)能發(fā)現(xiàn)反映系統(tǒng)局部特征和規(guī)律的模型;(2)自動趨勢預(yù)測,能發(fā)現(xiàn)“新”的知識;(3)比較容易獲得很多規(guī)則,并能及時更新。數(shù)據(jù)挖掘方法具有開放性思維方法,它可以及時借鑒和引用模型法的很多成果,比如神經(jīng)網(wǎng)絡(luò)、粗糙集、樸素貝葉斯算法等方法都已被利用在數(shù)據(jù)挖掘方法中。

      2.2數(shù)據(jù)挖掘目的及其過程

      2.2.1目的數(shù)據(jù)挖掘期望發(fā)現(xiàn)的知識有如下幾類:(1)反映同類事物共同性質(zhì)的泛化知識;(2)反映一事物和其他事物之間依賴或關(guān)聯(lián)的關(guān)聯(lián)型知識;(3)分類、聚類知識,是反映同類事物共同性質(zhì)的特征型知識和不同事物之間的差異型知識;(4)根據(jù)歷史和當(dāng)前的數(shù)據(jù)推測未來的預(yù)測型知識。

      2.2.2挖掘的過程

      挖掘過程是從大型庫中挖掘未知的、有效的、可實用的信息,并使用這些信息做出決策。通??梢苑譃闇?zhǔn)備、數(shù)據(jù)挖掘、評價階段以及運用階段等四個階段。

      (1)數(shù)據(jù)準(zhǔn)備階段。數(shù)據(jù)準(zhǔn)備階段是消除數(shù)據(jù)噪聲和與挖掘主題明顯無關(guān)的數(shù)據(jù),完成對數(shù)據(jù)的篩選、變換和預(yù)處理。經(jīng)處理過的數(shù)據(jù)一般存儲在數(shù)據(jù)倉庫中。數(shù)據(jù)準(zhǔn)備是否做得充分將影響到數(shù)據(jù)挖掘的效率和準(zhǔn)確度以及最終模式的有效性。包括:①數(shù)據(jù)的選擇:選擇相關(guān)的數(shù)據(jù);②數(shù)據(jù)的預(yù)處理:消除噪音、冗余數(shù)據(jù);③數(shù)據(jù)的推測:推算缺失數(shù)據(jù);④數(shù)據(jù)的轉(zhuǎn)化:離散值數(shù)據(jù)與連續(xù)值數(shù)據(jù)之間的相互轉(zhuǎn)換、數(shù)據(jù)值的分組分類、數(shù)據(jù)項之間的計算組合等;⑤數(shù)據(jù)的縮減:減少數(shù)據(jù)量。

      (2)挖掘階段。該階段是數(shù)據(jù)挖掘的核心步驟,也是技術(shù)難點所在。根據(jù)數(shù)據(jù)挖掘的目標(biāo),采用人工智能、集合論、統(tǒng)計學(xué)等方法,應(yīng)用相應(yīng)的數(shù)據(jù)挖掘算法,分析數(shù)據(jù)并通過可視化工具表述所獲得的模式或規(guī)則。

      (3)評價階段。在數(shù)據(jù)挖掘中得到的模式可能是沒有實際意義或沒有使用價值的,也有可能不能準(zhǔn)確反映數(shù)據(jù)的真實意義,因此需要評估,確定有效的、有用的模式。評估可以根據(jù)用戶多年的經(jīng)驗,有些模式也可以直接用數(shù)據(jù)來檢驗其準(zhǔn)確性。如何將挖掘出的有用知識清楚易懂地提供給教育和管理工作者也是一項非常重要的工作,選擇合適的可視化工具,將結(jié)果以關(guān)系表或用量化特征規(guī)則表示給用戶。

      (4)運用階段。用戶理解的、并被認為是符合實際和有價值的模式形成了知識。同時還要對知識進行一致性檢查,解決與以前得到的知識互相沖突、矛盾的地方,使知識得到鞏固。運用知識有兩種方法:一種是只需看知識本身所描述的關(guān)系或結(jié)果,就可以對決策提供支持;另一種是要求運用知識對新的數(shù)據(jù)進行分析,由此可能產(chǎn)生新的問題,而需要對知識作進一步的優(yōu)化。

      2.2.3數(shù)據(jù)挖掘的方法

      在數(shù)據(jù)挖掘算法的理論基礎(chǔ)上,數(shù)據(jù)挖掘中的常用方法有:①生物學(xué)方法,包括人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等;②信息論方法包括決策樹等;③集合論方法包括約略集、模糊集、最鄰近技術(shù)等;④統(tǒng)計學(xué)方法;⑤可視化技術(shù)等方法。數(shù)據(jù)挖掘的各類算法包括預(yù)測模型、關(guān)聯(lián)規(guī)則挖掘算法、分類規(guī)則挖掘算法、序列模式分析算法、聚類分析算法、WEB數(shù)據(jù)挖掘等。

      3數(shù)據(jù)挖掘在高等學(xué)校教學(xué)中的應(yīng)用

      3.1學(xué)生的基本信息

      利用數(shù)據(jù)挖掘技術(shù),比如可以對學(xué)生訪問情況進行分析,跟蹤、了解學(xué)生出勤情況。還可對學(xué)生年齡等個人情況進行分析,了解學(xué)生的組成、結(jié)構(gòu),為合理地安排課程設(shè)置提供依據(jù)。通過對學(xué)生考試情況的分析,并結(jié)合出勤情況,可作為考查學(xué)生學(xué)習(xí)的情況,為合理地評估學(xué)生綜合素質(zhì)提供依。對于挖掘出來的規(guī)則信息可以利用可視化技術(shù),以圖表或曲線等形式提供給教師,以使教師能充分利用學(xué)生的問題資源,從而提高教學(xué)質(zhì)量。另外,數(shù)據(jù)挖掘可以應(yīng)用于網(wǎng)上的考試系統(tǒng),對考生情況和他取得的成績進行挖掘,以幫助教師在以后的教學(xué)中更好地讓學(xué)生掌握知識。

      3.2學(xué)生的學(xué)習(xí)特征

      學(xué)生特征包括兩個方面:一是學(xué)習(xí)準(zhǔn)備,一是學(xué)習(xí)風(fēng)格。學(xué)習(xí)準(zhǔn)備包括初始能力和一般特征兩個方面。學(xué)生的初始能力是指學(xué)生在學(xué)習(xí)某一特定的課程內(nèi)容時,已經(jīng)具備的有關(guān)知識與技能的基礎(chǔ),以及他們對這些學(xué)習(xí)內(nèi)容的認識和態(tài)度。學(xué)生的一般特征則是指在學(xué)習(xí)過程中影響學(xué)生的心理、生理和社會的特點,包括年齡、性別、年級、認知成熟度、智力才能、學(xué)習(xí)動機、個人對學(xué)習(xí)的期望、生活經(jīng)驗、文化、社會、經(jīng)濟等背景因素。學(xué)生的學(xué)習(xí)風(fēng)格與學(xué)習(xí)活動有著密切的關(guān)系。對學(xué)生感知不同事物、并對不同事物做出反應(yīng)這兩方面產(chǎn)生影響的所有心理特征構(gòu)成了學(xué)習(xí)風(fēng)格。

      利用數(shù)據(jù)挖掘功能分析學(xué)生特征,并在此基礎(chǔ)上組織學(xué)習(xí)內(nèi)容、闡明學(xué)習(xí)目標(biāo)、確定教學(xué)策略、選擇教學(xué)媒體,為學(xué)生創(chuàng)造出一個適合其內(nèi)部條件的外部學(xué)習(xí)環(huán)境,使有效學(xué)習(xí)發(fā)生在每個學(xué)生的身上。

      3.3預(yù)測學(xué)生和教師行為發(fā)生

      管理信息系統(tǒng)中記錄著有關(guān)學(xué)生與教師在教學(xué)中發(fā)生的各種教學(xué)事故以及典型教學(xué)事例等教學(xué)運行信息,利用數(shù)據(jù)挖掘的關(guān)聯(lián)分析與演變分析等功能,尋找?guī)熒鞣N行為活動之間的內(nèi)在聯(lián)系。如“當(dāng)存在A,B時可以推出’C,這樣的規(guī)則,即當(dāng)有A行為和B行為發(fā)生時,還會有C行為。在教學(xué)過程中,如果發(fā)現(xiàn)學(xué)生或教師已有A,B行為時,馬上可以分析其產(chǎn)生C行為的可能性,及時制定策略促進或制止C行為的發(fā)生。

      3.4合理設(shè)置課程

      在學(xué)校,學(xué)生的課程學(xué)習(xí)是循序漸進的,而且課程之間有一定的關(guān)聯(lián)與前后順序關(guān)系。在學(xué)一門較高級課程之前必須先修一些先行課程,如果先行課程沒有學(xué)好,勢必會影響后續(xù)課程的學(xué)習(xí)。另外,同一年級學(xué)習(xí)同一課程的不同班級,由于授課教師、班級文化的不同,班內(nèi)學(xué)生的總體成績相差有時會很大。利用學(xué)校教學(xué)數(shù)據(jù)庫中存放的歷屆學(xué)生各門學(xué)科的考試成績,結(jié)合數(shù)據(jù)挖掘的關(guān)聯(lián)分析與時間序列分析等相關(guān)功能,就能從這些海量數(shù)據(jù)中挖掘出有用的信息,幫助分析這些數(shù)據(jù)之間的相關(guān)性、回歸性等性質(zhì),得出一些具有價值的規(guī)則和信息,最終找到影響學(xué)生成績的原因。在此基礎(chǔ)上,對課程設(shè)置做出合理安排。

      3.5評價學(xué)生學(xué)習(xí)情況

      學(xué)習(xí)評價是教育工作者的重要職責(zé)之一。評定學(xué)生的學(xué)習(xí)行為,既對學(xué)生起到信息反饋和激發(fā)學(xué)習(xí)動機的作用,又是檢查課程計劃、教學(xué)程序以至教學(xué)目的的手段,也是考查學(xué)生個別差異,便于因材施教的途徑。

      特別是對成績管理數(shù)據(jù)庫進行挖掘,其數(shù)據(jù)來源于成績管理數(shù)據(jù)庫,挖掘的任務(wù)就是從用戶指定的數(shù)據(jù)庫中以不同的角度或不同的層次上采掘出一系列的統(tǒng)計結(jié)果,如分布情況、關(guān)系,對比、顯著性檢驗等,采掘結(jié)果用交叉表,特征規(guī)則,關(guān)聯(lián)規(guī)則,統(tǒng)計的曲線、圖表等表示,所以采用統(tǒng)計分析方法具有簡單、方便、直觀等優(yōu)點,最為合適。

      因此對學(xué)生學(xué)習(xí)行為和綜合素質(zhì)進行評價,一般采用模糊論中的模糊綜合評判及模糊聚類的方法,對評價結(jié)果采用了對定性和定量指標(biāo)加權(quán)平均算出綜合素質(zhì)評價得分并排名的方法,而且由于學(xué)生綜合素質(zhì)的評價指標(biāo)是動態(tài)變化的,往往選用動態(tài)聚類法對評判結(jié)果進行動態(tài)聚類分析。

      3.6評價教學(xué)質(zhì)里

      教學(xué)評價是根據(jù)教育目標(biāo)的要求,按一定的規(guī)則對教學(xué)效果做出描述和確定,是教學(xué)各環(huán)節(jié)中必不可少的一環(huán)。教學(xué)評價可以通過校園網(wǎng)收集學(xué)生對任課教師所講授、輔導(dǎo)課程的意見、評價。有關(guān)學(xué)生座談意見、學(xué)生打分評價、平時各項教學(xué)檢查、相應(yīng)課程期末考試班級成績匯總等都是教學(xué)評價的內(nèi)容,把這些數(shù)據(jù)要作為教師教授相應(yīng)課程的檔案數(shù)據(jù)全部存人數(shù)據(jù)庫。

      利用數(shù)據(jù)挖掘?qū)?shù)據(jù)庫中有關(guān)教學(xué)的各項評價進行分析處理,可以確定教師的教學(xué)內(nèi)容的范圍和深度是否合適;選擇的教學(xué)媒體是否適合所選的教學(xué)內(nèi)容和教學(xué)對象;講解的時間是否恰到好處;教學(xué)策略是否得當(dāng)?shù)?。從而可以及時的將挖掘出的規(guī)則信息反饋給教師,以期更好地提高其教學(xué)水平,更好地服務(wù)于學(xué)生。

      4結(jié)束語

      總之,隨著信息量的急劇增長和對信息提取的更高要求,現(xiàn)在我們很難再依照傳統(tǒng)方法在海量數(shù)據(jù)中尋找決策的依據(jù),這就必須借助數(shù)據(jù)挖掘去發(fā)掘數(shù)據(jù)中隱藏的規(guī)律或模式,為決策提供更有效的支持。雖然數(shù)據(jù)挖掘作為一種工具,它永遠也不能替代教師的地位,但是它可以為教師的決策提供科學(xué)的依據(jù)。數(shù)據(jù)挖掘技術(shù)本身就是人們大量實踐的結(jié)晶,它為建立傳統(tǒng)教學(xué)中很難獲取或不可能獲取的模型提供了捷徑。

      第二篇:數(shù)據(jù)挖掘在培訓(xùn)管理中的應(yīng)用論文

      1、引言

      對很多培養(yǎng)機構(gòu)而言,目前急需解決的問題主要有:如何根據(jù)不同成員需求設(shè)置合理的課程、如何通過教學(xué)方式提高成員學(xué)習(xí)積極性、如何提高成員培訓(xùn)效果、如何通過考核檢驗成員學(xué)習(xí)成果等,都是培養(yǎng)機構(gòu)發(fā)展過程中必須面對的問題。隨著我國信息化進程的加快,一些培養(yǎng)機構(gòu)也開始進行信息化建設(shè),通過信息系統(tǒng)對培訓(xùn)相關(guān)事宜進行管理。但目前在針對培養(yǎng)機構(gòu)的信息系統(tǒng)中,所實現(xiàn)的功能和模塊是進行簡單的查詢、統(tǒng)計。在了解培訓(xùn)評估效果時,目前的信息系統(tǒng)中,學(xué)員通過系統(tǒng)對不同課程的教師進行打分,系統(tǒng)自對進行匯總、統(tǒng)計,得出教師評價。但這種匯總、統(tǒng)計是最簡單的,對教師評價也缺乏全面性和深度。

      2、數(shù)據(jù)挖掘在培訓(xùn)管理系統(tǒng)中的應(yīng)用

      大數(shù)據(jù)時代下,數(shù)據(jù)信息呈現(xiàn)出海量特點。如何從海量、不完全的信息中尋找到真正有用的信息,是大數(shù)據(jù)時代中重要的問題。由此便利用到數(shù)據(jù)挖掘,顧名思義,數(shù)據(jù)挖掘就是從眾多數(shù)據(jù)信息中尋找到有用、有價值的信息。大數(shù)據(jù)時代下,教育行業(yè)中,信息量也是海量的,要想提高教學(xué)質(zhì)量就需要運用數(shù)據(jù)挖掘找尋到有用的教育信息,并運用到實際教學(xué)中。信息系統(tǒng)通過一段實際應(yīng)用后,里面存儲了大量數(shù)據(jù),相應(yīng)的,學(xué)習(xí)管理系統(tǒng)也是如此,里面蘊含了大量數(shù)據(jù)信息。如在線課程等功能中藏有大量師生應(yīng)用過程中的數(shù)據(jù)資料。如圖1為數(shù)據(jù)挖掘在培訓(xùn)管理中的流程圖。

      2.1初步探索

      培訓(xùn)管理系統(tǒng)中一般具有數(shù)據(jù)統(tǒng)計功能,將相關(guān)事宜進行統(tǒng)計。如網(wǎng)絡(luò)課程開展過程中,數(shù)據(jù)挖掘在培訓(xùn)管理系統(tǒng)中的應(yīng)用文/張宏亮在大數(shù)據(jù)時代,如何使用現(xiàn)有的數(shù)據(jù)對學(xué)員進行培訓(xùn)管理,從而提高培訓(xùn)效率是當(dāng)前培訓(xùn)管理中所面臨的問題。本文分析了數(shù)據(jù)挖掘在培訓(xùn)管理中的應(yīng)用主要表現(xiàn)在初步探索、數(shù)據(jù)預(yù)處理以及數(shù)據(jù)挖掘過程。其中數(shù)據(jù)預(yù)處理和數(shù)據(jù)挖掘是培訓(xùn)系統(tǒng)的核心功能。

      2.2數(shù)據(jù)預(yù)期處理

      數(shù)據(jù)預(yù)處理時,原始數(shù)據(jù)庫會發(fā)生轉(zhuǎn)變,以適應(yīng)數(shù)據(jù)挖掘、數(shù)據(jù)挖掘算法等的要求。在處理結(jié)構(gòu)化的數(shù)據(jù)時,數(shù)據(jù)預(yù)處理需要完成兩項任務(wù),即消除數(shù)據(jù)缺陷現(xiàn)象的存在和為數(shù)據(jù)挖掘奠定良好基礎(chǔ)。數(shù)據(jù)處理是對現(xiàn)有的數(shù)據(jù)進行前期處理,方便后期數(shù)據(jù)挖掘。如圖2為培訓(xùn)管理系統(tǒng)中數(shù)據(jù)預(yù)處理模塊。

      2.3數(shù)據(jù)挖掘

      WangJ開發(fā)了一個將數(shù)據(jù)挖掘技術(shù)與基于模擬的培訓(xùn)相結(jié)合的混合框架,以提高培訓(xùn)評估的有效性。以信仰為基礎(chǔ)的學(xué)習(xí)概念,用于從知識/技能水平和信心水平的兩個維度來評估學(xué)員的學(xué)習(xí)成果。數(shù)據(jù)挖掘技術(shù)用于分析受訓(xùn)人員的個人資料和基于模擬的培訓(xùn)產(chǎn)生的數(shù)據(jù),以評估學(xué)員的表現(xiàn)和學(xué)習(xí)行為。提出的方法論以臺灣基于模擬的步兵射擊訓(xùn)練的實例為例。結(jié)果表明,提出的方法可以準(zhǔn)確地評估學(xué)員的表現(xiàn)和學(xué)習(xí)行為,并且可以發(fā)現(xiàn)潛在的知識來提高學(xué)員的學(xué)習(xí)成果。BodeaCN使用數(shù)據(jù)挖掘技術(shù)進行了培訓(xùn)學(xué)習(xí)管理,用于分析參加在線兩年制碩士學(xué)位課程項目管理的學(xué)生的表現(xiàn)。系統(tǒng)數(shù)據(jù)來源是收集學(xué)生意見的調(diào)查數(shù)據(jù),學(xué)生記錄的操作數(shù)據(jù)和電子學(xué)習(xí)的平臺記錄的學(xué)生活動數(shù)據(jù)。

      3、總結(jié)

      目前培訓(xùn)機構(gòu)在進行教學(xué)評估時,所選擇的指標(biāo)都是參考其他機構(gòu)的,并沒有真正從自身實際出發(fā)進行評估,因此教學(xué)評估時存在諸多問題。其中最明顯的兩個問題是:第一教學(xué)評估方式單一化嚴(yán)重,只以數(shù)字評估為主;第二評估時容易受各種主觀因素影響。

      參考文獻

      [1]菅志剛,金旭.數(shù)據(jù)挖掘中數(shù)據(jù)預(yù)處理的研究與實現(xiàn)[J].計算機應(yīng)用研究,2004,21(07):117-118.[2]王全旺,趙兵川.數(shù)據(jù)挖掘技術(shù)在Moodle課程管理系統(tǒng)中的應(yīng)用研究[J].電化教育研究,2011(11):69-73.[3]陳怡薇.數(shù)據(jù)挖掘技術(shù):教育培訓(xùn)管理新手段[J].石油化工管理干部學(xué)院學(xué)報,2014(04):49-52.[4]肖明,陳嘉勇,栗文超.數(shù)據(jù)挖掘在學(xué)習(xí)管理系統(tǒng)中應(yīng)用的研究進展綜述[J].現(xiàn)代教育技術(shù),2010,20(09):127-133.

      第三篇:數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中如何應(yīng)用畢業(yè)論文.

      數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中如何應(yīng)用

      根據(jù)波特的影響企業(yè)的利益相關(guān)者理論,企業(yè)有五個利益相關(guān)者,分別是客戶、競爭對手、供應(yīng)商、分銷商和政府等其他利益相關(guān)者。其中,最重要的利益相關(guān)者就是客戶。現(xiàn)代企業(yè)的競爭優(yōu)勢不僅體現(xiàn)在產(chǎn)品上,還體現(xiàn)在市場上,誰能獲得更大的市場份額,誰就能在競爭中占據(jù)優(yōu)勢和主動。而對市場份額的爭奪實質(zhì)上是對客戶的爭奪,因此,企業(yè)必須完成從“產(chǎn)品”導(dǎo)向向“客戶”導(dǎo)向的轉(zhuǎn)變,對企業(yè)與客戶發(fā)生的各種關(guān)系進行管理。進行有效的客戶關(guān)系管理,就要通過有效的途徑,從儲存大量客戶信息的數(shù)據(jù)倉庫中經(jīng)過深層分析,獲得有利于商業(yè)運作,提高企業(yè)市場競爭力的有效信息。而實現(xiàn)這些有效性的關(guān)鍵技術(shù)支持就是數(shù)據(jù)挖掘,即從海量數(shù)據(jù)中挖掘出更有價值的潛在信息。正是有了數(shù)據(jù)挖掘技術(shù)的支持,才使得客戶關(guān)系管理的理念和目標(biāo)得以實現(xiàn),滿足現(xiàn)代電子商務(wù)時代的需求和挑戰(zhàn)。

      一、客戶關(guān)系管理(CRM CRM是一種旨在改善企業(yè)與客戶之間關(guān)系的新型管理方法。它是企業(yè)通過富有意義的交流和溝通,理解并影響客戶行為,最終實現(xiàn)提高客戶獲取、客戶保留、客戶忠誠和客戶創(chuàng)利的目的。它包括的主要內(nèi)容有客戶識別、客戶關(guān)系的建立、客戶保持、客戶流失控制和客戶挽留。通過客戶關(guān)系管理能夠提高企業(yè)銷售收入,改善企業(yè)的服務(wù),提高客戶滿意度,同時能提高員工的生產(chǎn)能力。

      二、數(shù)據(jù)挖掘(DM 數(shù)據(jù)挖掘(Data Mining,簡稱DM,簡單的講就是從大量數(shù)據(jù)中挖掘或抽取出知識。數(shù)據(jù)挖掘概念的定義描述有若干版本。一個通用的定義是從大量的、不

      完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中提取人們感興趣的知識,這些知識是隱諱的、事先未知的、潛在有用的信息。

      常用的數(shù)據(jù)挖掘方法有:(1關(guān)聯(lián)分析。即從給定的數(shù)據(jù)集中發(fā)現(xiàn)頻繁出現(xiàn)的項集模式知識。例如,某商場通過關(guān)聯(lián)分析,可以找出若干個客戶在本商場購買商品時,哪些商品被購置率較高,進而可以發(fā)現(xiàn)數(shù)據(jù)庫中不同商品的聯(lián)系,進而反映客戶的購

      買習(xí)慣。(2序列模式分析。它與關(guān)聯(lián)分析相似,其目的也是為了控制挖掘出的數(shù)據(jù)間的聯(lián)系。但序列模式分析的側(cè)重點在于分析數(shù)據(jù)間的前后(因果關(guān)系。例如,可以通過分析客戶在購買A商品后,必定(或大部分情況下隨著購買B商品,來發(fā)現(xiàn)客戶潛在的購買模式。(3分類分析。是找出一組能夠描述數(shù)據(jù)集合典型特征的模型,以便能夠分類識別未知數(shù)據(jù)的歸屬或類別。例如,銀行可以根據(jù)客戶的債務(wù)水平、收入水平和工作情況,可對給定用戶進行信用風(fēng)險分析。(4聚類分析。是從給定的數(shù)據(jù)集中搜索數(shù)據(jù)對象之間所存在的有價值聯(lián)系。在商業(yè)上,聚類可以通過顧客數(shù)據(jù)將顧客信息分組,并對顧客的購買模式進行描述,找出他們的特征,制定針對性的營銷方案。(5孤立點分析。孤立點是數(shù)據(jù)庫中與數(shù)據(jù)的一般模式不一致的數(shù)據(jù)對象,它可能是收集數(shù)據(jù)的設(shè)備出現(xiàn)故障、人為輸入時的輸入錯誤等。孤立點分析就是專門挖掘這些特殊信息的方法。例如,銀行可以利用孤立點分析發(fā)現(xiàn)信用卡詐騙,電信部門可以利用孤立點分析發(fā)現(xiàn)電話盜用等。

      三、數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用 1.進行客戶分類

      客戶分類是將大量的客戶分成不同的類別,在每一類別里的客戶具有相似的屬性,而不同類別里的客戶的屬性不同。數(shù)據(jù)挖掘可以幫助企業(yè)進行客戶分類, 針對不同類別的客戶,提供個性化的服務(wù)來提高客戶的滿意度,提高現(xiàn)有客戶的價值。細致而可行的客戶分類對企業(yè)的經(jīng)營策略有很大益處。例如,保險公司在長期的保險服務(wù)中,積累了很多的數(shù)據(jù)信息,包括對客戶的服務(wù)歷史、對客戶的銷售歷史和收入,以及客戶的人口統(tǒng)計學(xué)資料和生活方式等。保險公司必須將這些眾多的信息資源綜合起來,以便在數(shù)據(jù)庫里建立起一個完整的客戶背景。在客戶背景信息中,大批客戶可能在保險種類、保險年份和保險金額上具有極高的相似性,因而形成了具有共性的客戶群體。經(jīng)過數(shù)據(jù)挖掘的聚類分析,可以發(fā)現(xiàn)他們的共性,掌握他們的保險理念,提供有針對性的服務(wù),提高保險公司的綜合服務(wù)水平,并可以降低業(yè)務(wù)服務(wù)成本,取得更高的收益。

      2.進行客戶識別和保留

      (1在CRM中,首先應(yīng)識別潛在客戶,然后將他們轉(zhuǎn)化為客戶

      這時可以采用DM中的分類方法。首先是通過對數(shù)據(jù)庫中各數(shù)據(jù)進行分析,從而建立一個描述已知數(shù)據(jù)集類別或概念的模型,然后對每一個測試樣本,用其已知的類別與學(xué)習(xí)所獲模型的預(yù)測類別做比較,如果一個學(xué)習(xí)所獲模型的準(zhǔn)確率經(jīng)測試被認可,就可以用這個模型對未來對象進行分類。例如,圖書發(fā)行公司利用顧客郵件地址數(shù)據(jù)庫,給潛在顧客發(fā)送用于促銷的新書宣傳冊。該數(shù)據(jù)庫內(nèi)容有客戶情況的描述,包括年齡、收入、職業(yè)、閱讀偏好、訂購習(xí)慣、購書資金、計劃等屬性的描述,顧客被分類為“是”或“否”會成為購買書籍的顧客。當(dāng)新顧客的信息被輸入到數(shù)據(jù)庫中時,就對該新顧客的購買傾向進行分類,以決定是否給該顧客發(fā)送相應(yīng)書籍的宣傳手冊。

      (2在客戶保留中的應(yīng)用

      客戶識別是獲取新客戶的過程,而客戶保留則是留住老顧客、防止客戶流失 的過程。對企業(yè)來說,獲取一個新顧客的成本要比保留一個老顧客的成本高。在保留客戶的過程中,非常重要的一個工作就是要找出顧客流失的原因。例如,某專科學(xué)校的招生人數(shù)在逐漸減少,那么就要找出減少的原因,經(jīng)過廣泛的搜集信息,發(fā)現(xiàn)原因在于本學(xué)校對技能培訓(xùn)不夠重視,學(xué)生只能學(xué)到書本知識,沒有實際的技能,在就業(yè)市場上找工作很難。針對這種情況,學(xué)校應(yīng)果斷的抽取資金,購買先進的、有針對性的實驗實訓(xùn)設(shè)備,同時修改教學(xué)計劃,加大實驗實訓(xùn)課時和考核力度,培訓(xùn)相關(guān)專業(yè)的教師。

      (3對客戶忠誠度進行分析

      客戶的忠誠意味著客戶不斷地購買公司的產(chǎn)品或服務(wù)。數(shù)據(jù)挖掘在客戶忠誠度分析中主要是對客戶持久性、牢固性和穩(wěn)定性進行分析。比如大型超市通過會員的消費信息,如最近一次消費、消費頻率、消費金額三個指標(biāo)對數(shù)據(jù)進行分析,可以預(yù)測出顧客忠誠度的變化,據(jù)此對價格、商品的種類以及銷售策略加以調(diào)整和更新,以便留住老顧客,吸引新顧客

      (4對客戶盈利能力分析和預(yù)測

      對于一個企業(yè)而言,如果不知道客戶的價值,就很難做出合適的市場策略。不同的客戶對于企業(yè)而言,其價值是不同的。研究表明,一個企業(yè)的80%的利潤是由只占客戶總數(shù)的20%的客戶創(chuàng)造的,這部分客戶就是有價值的優(yōu)質(zhì)客戶。為了弄清誰才是有價值的客戶,就需要按照客戶的創(chuàng)利能力來劃分客戶,進而改進客戶關(guān)系管理。數(shù)據(jù)挖掘技術(shù)可以用來分析和預(yù)測不同市場活動情況下客戶盈利能力的變化,幫助企業(yè)制定合適的市場策略。商業(yè)銀行一般會利用數(shù)據(jù)挖掘技術(shù)對客戶的資料進行分析,找出對提高企業(yè)盈利能力最重要的客戶,進而進行針對性的服務(wù)和營銷。

      (5交叉銷售和增量銷售

      交叉銷售是促使客戶購買尚未使用的產(chǎn)品和服務(wù)的營銷手段,目的是可以拓寬企業(yè)和客戶間的關(guān)系。增量銷售是促使客戶將現(xiàn)有產(chǎn)品和服務(wù)升級的銷售活動,目的在于增強企業(yè)和客戶的關(guān)系。這兩種銷售都是建立在雙贏的基礎(chǔ)上的,客戶因得到更多更好符合其需求的服務(wù)而獲益,公司也因銷售增長而獲益。數(shù)據(jù)挖掘可以采用關(guān)聯(lián)性模型或預(yù)測性模型來預(yù)測什么時間會發(fā)生什么事件,判斷哪些客戶對交叉銷售和增量銷售很有意向,以達到交叉銷售和增量銷售的目的。例如,保險公司的交叉營銷策略:保險公司對已經(jīng)購買某險種的客戶推薦其它保險產(chǎn)品和服務(wù)。這種策略成功的關(guān)鍵是要確保推銷的保險險種是用戶所感興趣的,否則會造成用戶的反感。

      四、客戶關(guān)系管理應(yīng)用數(shù)據(jù)挖掘的步驟 1.需求分析

      只有確定需求,才有分析和預(yù)測的目標(biāo),然后才能提取數(shù)據(jù)、選擇方法,因此,需求分析是數(shù)據(jù)挖掘的基礎(chǔ)條件。數(shù)據(jù)挖掘的實施過程也是圍繞著這個目標(biāo)進行的。在確定用戶的需求后,應(yīng)該明確所要解決的問題屬于哪種應(yīng)用類型,是屬于關(guān)聯(lián)分析、分類、聚類及預(yù)測,還是其他應(yīng)用。應(yīng)對現(xiàn)有資源如已有的歷史數(shù)據(jù)進行評估,確定

      是否能夠通過數(shù)據(jù)挖掘技術(shù)來解決用戶的需求,然后將進一步確定數(shù)據(jù)挖掘的目標(biāo)和制定數(shù)據(jù)挖掘的計劃。2.建立數(shù)據(jù)庫

      這是數(shù)據(jù)挖掘中非常重要也非常復(fù)雜的一步。首先,要進行數(shù)據(jù)收集和集成,其次,要對數(shù)據(jù)進行描述和整合。數(shù)據(jù)主要有四個方面的來源:客戶信息、客戶行為、生產(chǎn)系統(tǒng)和其他相關(guān)數(shù)據(jù)。這些數(shù)據(jù)通過抽取、轉(zhuǎn)換和裝載,形成數(shù)據(jù)倉

      庫,并通過 OLAP 和報表,將客戶的整體行為結(jié)果分析等數(shù)據(jù)傳遞給數(shù)據(jù)庫用戶。3.選擇合適的數(shù)據(jù)挖掘工具 如果從上一步的分析中發(fā)現(xiàn),所要解決的問題能用數(shù)據(jù)挖掘比較好地完成,那么需要做的第三步就是選擇合適的數(shù)據(jù)挖掘技術(shù)與方法。將所要解決的問題轉(zhuǎn) 化成一系列數(shù)據(jù)挖掘的任務(wù)。數(shù)據(jù)挖掘主要有五種任務(wù):分類,估值預(yù)測,關(guān)聯(lián) 規(guī)則,聚集,描述。前三種屬于直接的數(shù)據(jù)挖掘。在直接數(shù)據(jù)挖掘中,目標(biāo)是應(yīng) 用可得到的數(shù)據(jù)建立模型,用其它可得到的數(shù)據(jù)來描述感興趣的變量。后兩種屬 于間接數(shù)據(jù)挖掘。在間接數(shù)據(jù)挖掘中,沒有單一的目標(biāo)變量,目標(biāo)是在所有變量 中發(fā)現(xiàn)某些聯(lián)系。4.建立模型 建立模型是選擇合適的方法和算法對數(shù)據(jù)進行分析,得到一個數(shù)據(jù)挖掘模型 的過程。一個好的模型沒必要與已有數(shù)據(jù)完全相符,但模型對未來的數(shù)據(jù)應(yīng)有較 好的預(yù)測。需要仔細考察不同的模型以判斷哪個模型對所需解決的問題最有用。如決策樹模型、聚類模型都是分類模型,它們將一個事件或?qū)ο髿w類?;貧w是通 過具有已知值的變量來預(yù)測其它變量的值。時間序列是用變量過去的值來預(yù)測未 來的值。這一步是數(shù)據(jù)挖掘的核心環(huán)節(jié)。建立模型是一個反復(fù)進行的過程,它需 要不斷地改進或更換算法以尋找對目標(biāo)分析作用最明顯的模型,最后得到一個最 合理、最適用的模型。5.模型評估 為了驗證模型的有效性、可信性和可用性,從而選擇最優(yōu)的模型,需要對模 型進行評估。我們可以將數(shù)據(jù)中的一部分用于模型評估,來測試模型的準(zhǔn)確性,模型是否容易被理解模型的運行速度、輸入結(jié)果的速度、實現(xiàn)代價、復(fù)雜度等。模型的建立和檢驗是一個反復(fù)的過程,通過這個階段階段的工作,能使數(shù)據(jù)以用 戶能理解的方式出現(xiàn),直至找到最優(yōu)或較優(yōu)的模型。6.部署和應(yīng)用 將數(shù)據(jù)挖掘的知識歸檔和報告給需要的群體,根據(jù)數(shù)據(jù)挖掘發(fā)現(xiàn)的知識采取 必要的行動,以及消除與先前知識可能存在的沖突,并將挖掘的知識應(yīng)用于應(yīng)用 系統(tǒng)。在模型的應(yīng)用過程中,也需要不斷地對模型進行評估和檢驗,并做出適當(dāng) 的調(diào)整,以使模型適應(yīng)不斷變化的環(huán)境。參考文獻: [1]羅納德.S.史威福特.客戶關(guān)系管理[M].楊東龍譯.北京:中國經(jīng)濟 出版社,2002 [2]馬剛:客戶關(guān)系管理[M]大連:東北財經(jīng)大學(xué)出版社,2008

      第四篇:數(shù)據(jù)挖掘論文:數(shù)據(jù)挖掘技術(shù)及其在高校教學(xué)系統(tǒng)應(yīng)用的研究

      數(shù)據(jù)挖掘論文:數(shù)據(jù)挖掘技術(shù)及其在高校教學(xué)系統(tǒng)應(yīng)用的研究

      【中文摘要】高校教學(xué)系統(tǒng)作為大學(xué)數(shù)字化教學(xué)的一個重要組成部分,運行多年已經(jīng)積累了大量的數(shù)據(jù),但并沒有得到很好的挖掘和研究。相反,數(shù)據(jù)挖掘在保險、電信、金融等領(lǐng)域卻得到了廣泛的應(yīng)用,取得了良好的收益,而對教育信息的挖掘及知識發(fā)現(xiàn)方面研究及開發(fā)卻很少。為了從大量的的教學(xué)數(shù)據(jù)中獲取有用的知識,更好的為高校教學(xué)、管理及科研等提供服務(wù),本文結(jié)合高校管理系統(tǒng)與數(shù)據(jù)挖掘技術(shù)對教學(xué)質(zhì)量評估及學(xué)生成績分析進行了研究,對相關(guān)算法做了相應(yīng)的改進,并對結(jié)果進行分析,從而獲得有用的信息。本文首先介紹了論文的,國內(nèi)外的研究現(xiàn)狀,然后介紹了數(shù)據(jù)倉庫及數(shù)據(jù)挖掘的基本概念,主要的數(shù)據(jù)挖掘技術(shù),數(shù)據(jù)挖掘的體系結(jié)構(gòu)及運行過程。其次就其在教學(xué)系統(tǒng)中的應(yīng)用進行了分析,提出了教學(xué)質(zhì)量評估、學(xué)生成績分析兩個分析主題,介紹了教學(xué)數(shù)據(jù)倉庫的構(gòu)建,給出了基于SQL Server的數(shù)據(jù)挖掘解決方案,分別運用關(guān)聯(lián)規(guī)則和決策樹方法進行研究,介紹了相關(guān)算法,并進行了優(yōu)化,接著是數(shù)據(jù)挖掘的實現(xiàn)。最后對相關(guān)數(shù)據(jù)進行挖掘,對實驗結(jié)果做出了初步分析,所得出的結(jié)論對高校教學(xué)工作具有一定的指導(dǎo)意義。

      【英文摘要】Higher education management system as an important part of the university digital teaching has accumulated a lot of data for years, but has not been good for

      mining and research.In contrast, data mining in insurance, telecommunications, financial and other fields has been widely used and obtained a good income, while education information mining and knowledge discovery research and development is rarely.In order to obtain useful knowledge from a large number of the teaching data, and provide better services for the university teaching, management and scientific research, this paper combines higher education management system and data mining technology and study teaching quality assessments and student performance analysis, improves interrelated algorithm,analysises the results,acquires interesting information.The article proposes the research background,the domestic and abroad research status,the concepts of data warehouse and data mining, the main data mining technologies, data mining architecture and operation process.Second,analysises data mining application in higher education management system, proposes two analysis themes including teaching quality assessments and student performance analysis, then introduces the education data warehouse, gives based on the SQL Server data mining solution, researches them with association rules and decision tree respectively, introduces and optimize the related algorithms, data mining

      implementation.Finally, mines the relevant data, and makes a preliminary analysis of experimental results, the conclusions of the work have some significance on university teaching.【關(guān)鍵詞】數(shù)據(jù)挖掘 數(shù)據(jù)倉庫 關(guān)聯(lián)規(guī)則 決策樹

      【英文關(guān)鍵詞】Data Mining Data Warehouse Association Rules Decision Tree 【目錄】數(shù)據(jù)挖掘技術(shù)及其在高校教學(xué)系統(tǒng)應(yīng)用的研究4-57-9ABSTRACT5

      目錄6-7

      第一章 緒論

      摘要1.1 課題研究背景7

      7-8

      1.2 數(shù)據(jù)挖掘技術(shù)在高校教

      1.4 學(xué)中應(yīng)用的研究現(xiàn)狀論文的組織結(jié)構(gòu)8-99-18

      1.3 研究內(nèi)容及方法8第二章 數(shù)據(jù)倉庫及數(shù)據(jù)挖掘理論2.1 數(shù)據(jù)倉庫的概念和基本特性92.2 數(shù)據(jù)倉庫開發(fā)模型9-1111-12分類13-15

      2.3 數(shù)據(jù)倉庫系統(tǒng)的設(shè)計和實施

      12-13

      2.5 數(shù)據(jù)挖掘的2.7 數(shù)據(jù)2.4 數(shù)據(jù)挖掘基本概念

      2.6 數(shù)據(jù)挖掘的體系結(jié)構(gòu)15-16挖掘的常用技術(shù)16-18施18-31

      第三章 教學(xué)系統(tǒng)數(shù)據(jù)倉庫的設(shè)計與實

      3.2 高校數(shù)據(jù)倉3.1 數(shù)據(jù)倉庫的應(yīng)用目標(biāo)庫的體系結(jié)構(gòu)18-1919-20實現(xiàn)28-31用31-42的算法32-34

      3.3 數(shù)據(jù)倉庫的需求分析

      3.5 ETL的3.4 數(shù)據(jù)倉庫三層模型的建立20-28

      第四章 關(guān)聯(lián)規(guī)則方法及其在教學(xué)質(zhì)量評估中的應(yīng)4.1 關(guān)聯(lián)規(guī)則挖掘31-32

      4.2 關(guān)聯(lián)規(guī)則挖掘

      4.4

      4.3 關(guān)聯(lián)規(guī)則挖掘算法的改進34-36

      關(guān)聯(lián)規(guī)則在教學(xué)質(zhì)量評估中的應(yīng)用36-42及其在學(xué)生成績分析中的應(yīng)用42-5742-44類45-4646-5757-5860-61 5.2 決策樹的改進44-45

      第五章 決策樹方法5.1 決策樹方法5.3 決策樹算法的分5.4 決策樹方法在學(xué)生成績分析中的應(yīng)用第六章 總結(jié)與展望57-596.2 展望58-59

      6.1 論文總結(jié)

      參考文獻

      致謝59-60

      第五篇:數(shù)據(jù)挖掘技術(shù)在圖書采購中的應(yīng)用初探.專題

      數(shù)據(jù)挖掘技術(shù)在圖書采購中的應(yīng)用初探 湖南理工學(xué)院圖書館 張 暉

      [摘 要]數(shù)據(jù)挖掘是一種新的信息技術(shù),在許多行業(yè)有著廣泛的應(yīng)用。高校圖書館同樣可以成為其應(yīng)用的一個領(lǐng)域。在圖書采購中,可以應(yīng)用數(shù)據(jù)挖掘技術(shù)來提高采購的效率和針對性。

      [關(guān)鍵詞]數(shù)據(jù)挖掘 高校圖書館 圖書采購

      計算機網(wǎng)絡(luò)與數(shù)據(jù)庫技術(shù)的發(fā)展和廣泛應(yīng)用,信息日益成為企業(yè)的一種重要資源,人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,在這些數(shù)據(jù)背后隱藏著極為重要的商業(yè)知識,但是這些商業(yè)知識是隱含的、事先未知的。面對“人們被數(shù)據(jù)淹沒,人們卻饑餓于知識”的挑戰(zhàn),數(shù)據(jù)挖掘技術(shù)應(yīng)運而生,越來越顯示出其強大的生命力。

      1數(shù)據(jù)挖掘技術(shù)概述

      數(shù)據(jù)挖掘(D ata M in ing是一種新的信息處理技術(shù),其主要特點是對單位、企業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析和其他模型化處理,以從中提取輔助管理決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘是一門交叉學(xué)科,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。常用的數(shù)據(jù)挖掘技術(shù)主要有以下幾種: 1.1人工神經(jīng)網(wǎng)絡(luò)

      仿照生理神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的非線性預(yù)測模型,主要由“神經(jīng)元”的互聯(lián),或按層組織的節(jié)點構(gòu)成,通常由輸入層、中間層和輸出層三個層次組成,在每個神經(jīng)元求得輸入值后,再匯總計算輸入值;由過濾機制比較輸入值,確定網(wǎng)絡(luò)的輸出值。

      1.2決策樹

      決策樹是一個類似流程圖的樹型結(jié)構(gòu),其中每個內(nèi)部節(jié)點表示在一個屬性上的測試,每個分枝代表1個測試輸出,而每個樹葉點代表類或類分布。樹的最頂層節(jié)點是根節(jié)點。目前,在數(shù)據(jù)挖掘中使用的決策樹方法有多種,典型的在國際上影響較大的決策樹方法是Q n in lan研制的I D3算法。

      1.3遺傳算法

      遺傳算法是模擬生物進化過程的計算模型,是自然遺傳學(xué)與計算機科學(xué)相互結(jié)合滲透的計算方法。遺傳分析應(yīng)用搜索技術(shù),先找出兩個合適的父樣本,通過“交叉”“變異”等帶有生物遺傳特點的操作產(chǎn)生下一代樣本,對子樣本反復(fù)“交叉”“變異”操作直到子樣本收斂為此,再找另外兩個合適的父樣本重復(fù)上述過程,就能得到下一代的樣本集。由此得到當(dāng)前樣本集較可能的發(fā)展方向。

      1.4近鄰算法

      用該方法進行預(yù)測的基本概念就是相互之間“接近”的對象具有相似的預(yù)測值。如果知道其中一個對象的預(yù)測值后,可以預(yù)測其最近的鄰居對象。

      1.5規(guī)則推導(dǎo)

      根據(jù)統(tǒng)計意義上對數(shù)據(jù)中的規(guī)則“如果條件怎么樣、怎么樣,那么結(jié)果或情況就怎么樣”,對給定的一組項目和一個記錄集合,通過分析記錄集合,推導(dǎo)出項目間的相關(guān)性。

      1.6聚類方法

      聚類分析方法按一定的距離或相似性測度將數(shù)據(jù)分成系列相互區(qū)分的組,它是不需要預(yù)定義知識而直接發(fā)現(xiàn)一些有意義的結(jié)構(gòu)與模式??刹捎猛負浣Y(jié)構(gòu)分析、空間緩沖區(qū)及距離分析、覆蓋分析等方法,旨在發(fā)現(xiàn)目標(biāo)在空間上的相連、相鄰和共生等關(guān)聯(lián)關(guān)系。

      1.7可視化技術(shù)

      可視化技術(shù)在數(shù)據(jù)挖掘過程中的數(shù)據(jù)準(zhǔn)備階段是非常重要的,它能夠幫助人們進行快速直觀地分析數(shù)據(jù)。利用可視化方法,很容易找到數(shù)據(jù)之間可能存在的模式、關(guān)系和異常情況等。

      2高校圖書館可以成為數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域

      目前,在很多領(lǐng)域,數(shù)據(jù)挖掘都是一個很時髦的詞,尤其是在銀行、電信、保險、交通、零售(如超級市場等商業(yè)領(lǐng)域。同樣,數(shù)據(jù)挖掘技術(shù)在高校圖書館中的應(yīng)用,將為圖書館在數(shù)字資源的組織和管理、服務(wù)質(zhì)量的提升和服務(wù)方式的拓展等方面提供技術(shù)支持,并顯示出強大的生命力。高校圖書館可以成為數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域,理由如下: 2.1高校圖書館管理的需要

      在信息化社會中,圖書館的生存與發(fā)展和先進技術(shù)的運用是密不可分的。目前,高校圖書館利用的信息管理系統(tǒng)可以高效地實現(xiàn)傳統(tǒng)圖書館信息管理中的數(shù)據(jù)的錄入、查詢、統(tǒng)計、流通借閱等功能,相對于從前的手工加工管理時代,可以說是一次飛躍,但圖書情報部門的工作仍然主要是對信息的載體進行管理,以提供信息的外在特征服務(wù)為主,無法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測未來的發(fā)展趨勢。高校圖書館作為學(xué)術(shù)性、科研性、服務(wù)性機構(gòu),在高等教育中承擔(dān)著重要角色,特別是在向數(shù)字化圖書館轉(zhuǎn)型過程中,迫切需要應(yīng)用分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、W eb網(wǎng)頁挖掘等技術(shù)手段對信息進行深加工,以推動圖書館業(yè)務(wù)與管理的全面進步。運用數(shù)據(jù)挖掘技術(shù),實現(xiàn)海量數(shù)據(jù)的存儲和利用,支持圖書館各種層次的科學(xué)決策,促進圖書館管理的發(fā)展。

      2.2圖書館物質(zhì)基礎(chǔ)的形成

      在現(xiàn)代科學(xué)技術(shù)推動下,高校圖書館正朝著自動化、數(shù)字化和信息化的方向發(fā)展。一方面,我國的圖書館系統(tǒng)經(jīng)過多年的自動化建設(shè),已具備相當(dāng)?shù)奈镔|(zhì)條件和人才儲備,并積累了大量數(shù)據(jù),為數(shù)據(jù)挖掘應(yīng)用奠定了一定的物質(zhì)基礎(chǔ)。另一方面,圖書

      館的數(shù)字化發(fā)展是我國信息化建設(shè)的重要組成部分,國家對此給予了高度的重視并提供了大量政策上和經(jīng)濟上的支持,為行業(yè)

      — 8 5 1 —

      性數(shù)據(jù)挖掘的實施提供了良好的政策環(huán)境和經(jīng)濟保障。2.3實現(xiàn)技術(shù)的成熟

      數(shù)據(jù)挖掘在經(jīng)過多年的發(fā)展之后已經(jīng)形成相對成熟的技術(shù)體系,特別是在數(shù)據(jù)挖掘設(shè)計、數(shù)據(jù)抽取以及聯(lián)機分析處理技術(shù)等方面都取得了令人滿意的進展,為數(shù)據(jù)挖掘的應(yīng)用奠定了技術(shù)基礎(chǔ)。另外,數(shù)據(jù)挖掘技術(shù)在發(fā)達國家的電信、制造、零售、金融等領(lǐng)域已有較深程度的應(yīng)用,并取得了巨大的回報,這些成功應(yīng)用的例子為我們提供了可資借鑒的寶貴經(jīng)驗。

      3應(yīng)用數(shù)據(jù)挖掘技術(shù)開展圖書采購工作

      目前,國際上已經(jīng)將圖書館的信息服務(wù)納入了電子商務(wù)之中,數(shù)據(jù)挖掘技術(shù)不僅在商業(yè)界倍受青睞,它在現(xiàn)代化圖書館中的應(yīng)用前景也十分廣闊,而圖書采購則是數(shù)據(jù)挖掘技術(shù)在高校圖書館應(yīng)用中的一個典型領(lǐng)域?;跀?shù)據(jù)挖掘技術(shù)的圖書采購策略的基本思路是:利用計算機圖書管理數(shù)據(jù)庫積累的圖書借閱流通資料,利用數(shù)據(jù)挖掘技術(shù)得到讀者借閱頻率較高的圖書類型的關(guān)鍵詞、出版社、編著者信息,考慮缺書比例較大的圖書,依此決定采購策略。

      3.1讀者信息資源的收集

      采訪部門職能發(fā)揮的好壞關(guān)系到圖書館資金及資源利用率的高低,如何采購高質(zhì)量的書刊是圖書館工作的重中之重。因此,準(zhǔn)確地定位讀者對象的需求就成為提高資源利用率的一個主要因素。根據(jù)流通數(shù)據(jù)庫的集成數(shù)據(jù)進行數(shù)據(jù)挖掘,能夠得到讀者對圖書資源的使用頻率表,對讀者進行分類的同時對適合不同類別的讀者的圖書資源進行聚類,可以快速而精確地得到訂書單。通過收集整理圖書館網(wǎng)站上的在線調(diào)查、留言簿等數(shù)據(jù),或是設(shè)計讀者調(diào)查表,包括讀者的基本情況、閱讀興趣、查閱資料的途徑及對國內(nèi)外文獻資源的需求情況等,將這些元數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)的結(jié)構(gòu)化數(shù)據(jù)庫,利用數(shù)據(jù)挖掘方法分析讀者行為傾向,發(fā)現(xiàn)用戶興趣模式,就能動態(tài)的調(diào)整采購策略,有針對性地應(yīng)對需求。

      3.2確定采購的重點

      圖書館每年的文獻購置費是有限的,各門學(xué)科之間如何分配、各種文獻載體形式如何均衡才能使這些經(jīng)費最好地發(fā)揮效益,這是一件令人頭疼的事。隨著出版物的數(shù)量日益增多,載體日益豐富,高校圖書館信息結(jié)構(gòu)、讀者需求與資金利用的平衡問題越來越不易把握,也令采購工作的決策變得更加復(fù)雜。數(shù)據(jù)挖掘技術(shù)可以對流通數(shù)據(jù)庫和采訪數(shù)據(jù)庫中的歷史記錄數(shù)據(jù)進行關(guān)聯(lián)性分析和序列分析,可以輕松地統(tǒng)計出文獻的拒借集合和頻繁借閱集合,科學(xué)分析各類文獻的利用率,為采購文獻提供科學(xué)合理的各種分析報告及預(yù)測信息,從而指導(dǎo)采訪人員對文獻種類進行科學(xué)地篩選,合理地確定各種文獻所需的復(fù)本量,及時補充短缺的文獻,剔除過時的文獻,幫助采購人員確定采購重點,保障圖書館信息資源體系的科學(xué)性和合理性。

      3.3訂購渠道的管理

      圖書訂購是圖書館采訪部門的主要工作,它是圖書館工作鏈的開端,也是現(xiàn)代化圖書館資源建設(shè)的開始。傳統(tǒng)圖書館的訂購信息大多來源于出版社和書商,信息量有限,這樣會導(dǎo)致重復(fù)訂購和館藏資源不足的矛盾現(xiàn)象出現(xiàn)。隨著信息技術(shù)的發(fā)展,圖書訂購渠道已呈現(xiàn)多樣化,包括專家訂書、光盤檢索、電子文獻、借閱數(shù)據(jù)庫查詢等。通過數(shù)據(jù)挖掘技術(shù)可以為圖書采購提供科學(xué)的、合理的分析和預(yù)測,從而實

      現(xiàn)訂購渠道的管理,選擇合適的訂購渠道,為圖書館節(jié)省可貴的經(jīng)費,買到最適用的圖書。

      3.4確定圖書的學(xué)科比例

      圖書館要全面兼顧不同類型的讀者,考慮各個學(xué)科內(nèi)容的完整搭配組合。即使最近一段時間武俠小說非常流行,也不能全部只購買武俠小說。大學(xué)的圖書館必須結(jié)合學(xué)校的專業(yè)設(shè)置,為各個專業(yè)的教學(xué)科研配備參考書,不能顧此失彼。應(yīng)當(dāng)結(jié)合館藏圖書的學(xué)科專業(yè)分布、發(fā)展趨勢以及現(xiàn)有藏書量,控制不同學(xué)科的圖書占總采購金額的比例。對于館藏數(shù)量少,而根據(jù)發(fā)展趨勢急需加強的學(xué)科需要擴大比例。通過流通、采訪系統(tǒng)數(shù)據(jù)進行如關(guān)聯(lián)性分析、序列分析等挖掘方法得到的結(jié)果,可以分析出文獻的利用率,及時補充短缺的文獻,剔除過時的文獻信息,為采購文獻提供科學(xué)合理的各種分析報告及預(yù)測信息,指導(dǎo)采訪人員對購書的種類、所需復(fù)本數(shù)量等進行科學(xué)的篩選,優(yōu)化館藏結(jié)構(gòu),合理確定各學(xué)科的圖書比例。

      3.5采購經(jīng)費的管理

      傳統(tǒng)圖書館信息采集多由專門采訪人員獨自確定或與少數(shù)專家商討決定,不可避免的帶有極大的主觀性以及個人喜好;而且圖書館每年的文獻購置費是有限的,各門學(xué)科之間如何分配,各種文獻載體形式如何均衡才能使這些經(jīng)費最好地發(fā)揮效益,這是一件令人頭疼的事。而運用數(shù)據(jù)挖掘技術(shù)可以通過對圖書館的借閱流通記錄、檢索請求進行分析、挖掘,有針對性的補充和豐富信息資源,并可以籍此分析出文獻的利用率,從而實現(xiàn)采購經(jīng)費的合理管理,區(qū)分輕重緩急,“好鋼用在刀刃上”。

      參考文獻

      [1]王向輝等.數(shù)據(jù)挖掘技術(shù)及其在決策支持系統(tǒng)中的應(yīng)用[J]計算技術(shù)與自動化,2004(4 [2]陳瑞雪.數(shù)據(jù)倉儲與數(shù)據(jù)挖掘技術(shù)在現(xiàn)代化圖書館中的應(yīng)用[J].圖書館學(xué)研究,2004(11

      [3]張存祿等.數(shù)據(jù)挖掘在圖書采購中的應(yīng)用[J].情報科學(xué),2004(5 [4]劉曉東.數(shù)據(jù)挖掘在圖書館工作中的應(yīng)用[J].情報雜志,2005(8 [5]鮑翠梅等.數(shù)據(jù)挖掘技術(shù)及其在圖書館中的應(yīng)用[J].情報雜志,2004(9 — 9 5 1 —

      下載淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用教育論文word格式文檔
      下載淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用教育論文.doc
      將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
      點此處下載文檔

      文檔為doc格式


      聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻自行上傳,本網(wǎng)站不擁有所有權(quán),未作人工編輯處理,也不承擔(dān)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)有涉嫌版權(quán)的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進行舉報,并提供相關(guān)證據(jù),工作人員會在5個工作日內(nèi)聯(lián)系你,一經(jīng)查實,本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

      相關(guān)范文推薦

        數(shù)據(jù)挖掘在房地產(chǎn)營銷中的應(yīng)用

        文章摘要:信息資源的分析、整合在房地產(chǎn)行業(yè)的競爭中起著越來越重要的作用。數(shù)據(jù)挖掘作為一種系統(tǒng)地檢查和理解大量數(shù)據(jù)的工具,能有效地幫助房地產(chǎn)企業(yè)從不斷積累與更新的數(shù)據(jù)......

        在現(xiàn)代檔案信息管理系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù)論文

        計算機技術(shù)的不斷發(fā)展,信息技術(shù)不斷加強,在社會新的發(fā)展趨勢下,以往的傳統(tǒng)管理模式落后于現(xiàn)代化發(fā)展的管理水平。為了創(chuàng)新檔案管理的模式,提高檔案管理的質(zhì)量,在現(xiàn)代檔案信息管理......

        電力企業(yè)文本數(shù)據(jù)挖掘技術(shù)探究教學(xué)論文

        摘要:在國家電網(wǎng)公司信息化工程的建設(shè)過程中,積累了大量的文本數(shù)據(jù)。如何挖掘文本數(shù)據(jù)中蘊含的有價值信息將成為電力企業(yè)大數(shù)據(jù)挖掘方向研究的重點對象。文章結(jié)合電力行業(yè)目前......

        高校管理中數(shù)據(jù)挖掘技術(shù)的研究論文

        摘要:近年來,數(shù)據(jù)庫挖掘技術(shù)的普遍應(yīng)用,使數(shù)據(jù)價值實現(xiàn)最大化,在我國金融、商業(yè)、市場營銷等領(lǐng)域得到廣泛應(yīng)用。然而在我國高校管理中并沒有得到推廣,為使高校管理系統(tǒng)中的數(shù)據(jù)充......

        關(guān)于數(shù)據(jù)挖掘在出口退稅中的應(yīng)用

        關(guān)于數(shù)據(jù)挖掘在出口退稅中的應(yīng)用1 引言 出口貨物退(免)稅,簡稱 出口退稅 ,其基本含義是一個國家或地區(qū)對已報送離境的出口貨物,由稅務(wù)機關(guān)將其在出口前的生產(chǎn)和流通的各環(huán)節(jié)已經(jīng)......

        數(shù)據(jù)挖掘在企業(yè)競爭情報系統(tǒng)中的應(yīng)用

        數(shù)據(jù)挖掘在企業(yè)競爭情報系統(tǒng)中的應(yīng)用摘要:本文主要概述了數(shù)據(jù)挖掘技術(shù)的發(fā)展歷史和研究現(xiàn)狀。并將數(shù)據(jù)挖掘技術(shù)在企業(yè)競爭情報系統(tǒng)中的應(yīng)用狀況分別從國內(nèi)和國外兩方面作了介......

        大數(shù)據(jù)時代數(shù)據(jù)挖掘技術(shù)教學(xué)研究論文

        摘要:隨著大數(shù)據(jù)時代的到來,在大數(shù)據(jù)觀念不斷提出的今天,加強數(shù)據(jù)大數(shù)據(jù)挖掘及時的應(yīng)用已成為大勢所趨。那么在大數(shù)據(jù)教學(xué)過程中,我們必須掌握大數(shù)據(jù)與數(shù)據(jù)挖掘的內(nèi)涵,并對數(shù)據(jù)......

        數(shù)據(jù)挖掘在情報信息方面的應(yīng)用

        數(shù)據(jù)挖掘在情報信息方面的應(yīng)用 [ 標(biāo)簽:數(shù)據(jù)挖掘, 情報信息 ] 歐陽烽 2011-07-14 12:57 滿意答案 呵呵,這個我舉個例子來說明:四人幫那時候,新聞標(biāo)題都是毛主席說什么什么,后面會......