前言:本站為你精心整理了分析數(shù)據(jù)挖掘課程的教學(xué)思路和方法范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢。
闡明了主成分分析在數(shù)據(jù)降維的同時(shí)能夠保持原始數(shù)據(jù)的絕大部分能量信息沒(méi)有損失,是一種最優(yōu)的數(shù)據(jù)描述和表示方法。通過(guò)對(duì)主成份分析理論基礎(chǔ)的講述,讓學(xué)生不僅掌握了主成分分析的內(nèi)容和作用,搞清楚了相關(guān)的計(jì)算過(guò)程,這也對(duì)學(xué)生更好地實(shí)現(xiàn)主成分分析的程序設(shè)計(jì)和應(yīng)用情況有了清楚的認(rèn)識(shí)。對(duì)于教材中一些簡(jiǎn)單的內(nèi)容,比如數(shù)據(jù)分箱、K近鄰分類等,我們要求學(xué)生自己理解,然后隨機(jī)抽取學(xué)生為其他同學(xué)講授,這樣可以提高學(xué)生的主動(dòng)性,加深學(xué)生的理解。對(duì)于一些簡(jiǎn)單的問(wèn)題,如K-means聚類的類別中心為各類樣本的均值,我們可以讓學(xué)生自己證明,提高他們的理解力。在講授其他一些內(nèi)容時(shí),比如說(shuō)聚類分析,我們可以將聚類分析的各個(gè)過(guò)程用圖的形式表示出來(lái),用空間中的點(diǎn)表示聚類樣本,這樣就大大增強(qiáng)了學(xué)生的理解。
我們?cè)诮虒W(xué)的過(guò)程中,也比較比較注重案例教學(xué)。例如,在講授神經(jīng)網(wǎng)絡(luò)時(shí),我們可以用上海證券交易所中股市中股票隨時(shí)間變化的數(shù)據(jù)為例,讓學(xué)生討論如何應(yīng)用神經(jīng)網(wǎng)絡(luò)對(duì)股票價(jià)格進(jìn)行預(yù)測(cè)。人工神經(jīng)網(wǎng)絡(luò)是一種模仿自然界動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型,能夠較好地處理具有一定復(fù)雜性的數(shù)據(jù),在預(yù)測(cè)、擬合等方面取得了很好的應(yīng)用效果。讓學(xué)生采用神經(jīng)網(wǎng)絡(luò)進(jìn)行實(shí)際數(shù)據(jù)分析和處理,可以增強(qiáng)他們學(xué)習(xí)的積極性,更主動(dòng)地投入到學(xué)習(xí)中去。我們也要求他們使用回歸分析的方法對(duì)股票價(jià)格進(jìn)行預(yù)測(cè),然后和神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的結(jié)果進(jìn)行比較。通過(guò)這個(gè)過(guò)程,可以使學(xué)生們不但了解了神經(jīng)網(wǎng)絡(luò)與回歸分析算法的異同,加深他們對(duì)神經(jīng)網(wǎng)絡(luò)的認(rèn)識(shí)。
加強(qiáng)實(shí)驗(yàn)教學(xué),增強(qiáng)學(xué)生動(dòng)手能力
信息與計(jì)算科學(xué)專業(yè)是以信息領(lǐng)域?yàn)楸尘埃瑪?shù)學(xué)與信息、管理相結(jié)合的交叉學(xué)科專業(yè)。該專業(yè)培養(yǎng)的學(xué)生具有良好的數(shù)學(xué)基礎(chǔ),能熟練地使用計(jì)算機(jī),初步具備在信息與計(jì)算科學(xué)領(lǐng)域的某個(gè)方向上從事科學(xué)研究,解決實(shí)際問(wèn)題,設(shè)計(jì)開(kāi)發(fā)有關(guān)軟件的能力。畢業(yè)生適合到企事業(yè)單位、高科技部門、高等院校、行政管理和經(jīng)濟(jì)管理部門,從事科研、教學(xué)和計(jì)算機(jī)應(yīng)用軟件的開(kāi)發(fā)和管理工作,也可以繼續(xù)攻讀信息與計(jì)算科學(xué)及相關(guān)學(xué)科的碩士學(xué)位。從信息與計(jì)算科學(xué)專業(yè)的培養(yǎng)目標(biāo)可以看出信息與計(jì)算科學(xué)專業(yè)的本科生不但需要掌握理論知識(shí),還需要具有將所學(xué)知識(shí)用來(lái)解決實(shí)際問(wèn)題的能力。數(shù)據(jù)挖掘作為一門應(yīng)用性較強(qiáng)的課程,需要學(xué)生能夠運(yùn)用數(shù)據(jù)挖掘知識(shí)分析和解決實(shí)際問(wèn)題,要求學(xué)生能夠熟練掌握數(shù)據(jù)挖掘的程序設(shè)計(jì),以便在將來(lái)的就業(yè)中具有更好的適應(yīng)性,因此實(shí)驗(yàn)環(huán)節(jié)的教學(xué)有著其必要性。基于這些原因,我們?cè)谶@門課中引入實(shí)驗(yàn)環(huán)節(jié),并將其納入考核要求。我們實(shí)驗(yàn)所用的基本軟件是SAS統(tǒng)計(jì)分析軟件。SAS軟件是一個(gè)集統(tǒng)計(jì)分析、報(bào)表圖形、信息系統(tǒng)開(kāi)發(fā)和大型數(shù)據(jù)庫(kù)管理等多種強(qiáng)大功能為一體的大型軟件系統(tǒng),是目前國(guó)際上主流的統(tǒng)計(jì)分析軟件之一。我們信息專業(yè)在大三時(shí)開(kāi)設(shè)這門課程,之前已經(jīng)學(xué)過(guò)C語(yǔ)言和JAVA等程序設(shè)計(jì)方法,有了一定的編程基礎(chǔ),因此學(xué)習(xí)使用SAS軟件并不是特別困難。而且,在SAS軟件中,系統(tǒng)自帶了許多數(shù)據(jù)挖掘函數(shù),這方便了同學(xué)們的使用。我們?cè)谄綍r(shí)的學(xué)習(xí)中,將一些SAS軟件的基本程序設(shè)計(jì)基礎(chǔ)知識(shí)先發(fā)給同學(xué)們,讓他們利用課后時(shí)間自己在個(gè)人電腦上進(jìn)行熟悉,從而使得他們熟悉基本SAS程序設(shè)計(jì)方法,這樣可以在實(shí)驗(yàn)課上直接運(yùn)用SAS軟件進(jìn)行數(shù)據(jù)挖掘程序的編寫。在實(shí)驗(yàn)課上,我們主要將要實(shí)驗(yàn)的內(nèi)容和相關(guān)數(shù)據(jù)資料提供給同學(xué),要求同學(xué)自己用數(shù)據(jù)挖掘的知識(shí)和SAS軟件進(jìn)行編程實(shí)現(xiàn),并寫出實(shí)驗(yàn)分析和小結(jié)。另外,在實(shí)驗(yàn)中,我們也要求學(xué)生盡可能將一些實(shí)驗(yàn)結(jié)果用圖表的形式如崖底碎石圖等表示出來(lái),以利于進(jìn)一步分析。對(duì)于少部分學(xué)有余力的同學(xué),我們也引導(dǎo)他們自編相關(guān)的程序。比如說(shuō)在SAS軟件中進(jìn)行K-均值聚類用fastclus這個(gè)函數(shù)就可以了,但是學(xué)生對(duì)程序具體實(shí)現(xiàn)過(guò)程可能不是很清楚。如果學(xué)生能夠?qū)⒊绦騅-均值聚類詳細(xì)程序步驟自己編寫出來(lái),就可以表明學(xué)生對(duì)所K-均值聚類算法也有了較清楚的認(rèn)識(shí)。另外,對(duì)于屬于數(shù)學(xué)建模協(xié)會(huì)的同學(xué),我們也引導(dǎo)他們將數(shù)據(jù)挖掘的知識(shí)和數(shù)學(xué)建模中某些問(wèn)題相結(jié)合起來(lái),對(duì)于以往出現(xiàn)的一些可以利用數(shù)據(jù)挖掘知識(shí)分析的問(wèn)題讓他們利用相關(guān)的數(shù)據(jù)挖掘知識(shí)對(duì)其進(jìn)行分析和求解,通過(guò)這樣的方式,可以這樣拓展這些同學(xué)的思路,也為數(shù)學(xué)建模培養(yǎng)了人才。
靈活的課后作業(yè)形式,提高學(xué)生的綜合能力
對(duì)于我們講授的課題,每學(xué)完一個(gè)算法,我們要求學(xué)生在網(wǎng)絡(luò)上搜索該方法的運(yùn)用領(lǐng)域和技術(shù)要點(diǎn),加深對(duì)該算法的理解。然后,我們讓每一個(gè)同學(xué)自己挑選一個(gè)該算法可以解決的問(wèn)題,在網(wǎng)上搜集相關(guān)數(shù)據(jù),寫出實(shí)現(xiàn)程序,并寫出相應(yīng)的小論文。這也可以鍛煉學(xué)生的搜索、整理和分析處理數(shù)據(jù)的能力。對(duì)于課程中的某些案例,我們要求學(xué)生進(jìn)行重新總結(jié)思考。比如在運(yùn)用主成分分析進(jìn)行入侵檢測(cè)的這個(gè)案例,案例中的主要指標(biāo)是運(yùn)用兩類樣本協(xié)方差特征根的差異進(jìn)行分析和比較。我們讓學(xué)生思考該處理方法的優(yōu)缺點(diǎn),同時(shí)讓學(xué)生思考有沒(méi)有其他的思路,比如按照模式分類的思想來(lái)實(shí)現(xiàn)。即首先主成份分析進(jìn)行降維,然后運(yùn)用K-近鄰分類方法進(jìn)行分類。另外,也讓學(xué)生思考有沒(méi)有其他的思路,比如特征降維是否可以采用其他方法,如線性鑒別分析等;而分類方法是否可以采用BP神經(jīng)網(wǎng)絡(luò)等。進(jìn)一步,我們可以讓學(xué)生比較主成份分析和線性鑒別分析有什么異同之處;K-近鄰分類和BP神經(jīng)網(wǎng)絡(luò)運(yùn)用于分類時(shí)執(zhí)行過(guò)程有什么異同之處。讓學(xué)生對(duì)這些算法的理解更加透徹。另外,在課本的作業(yè)之外,我們也會(huì)自編一些題目,讓學(xué)生自己進(jìn)行思考分析。比如,對(duì)于圖1雙圈圖,我們可以設(shè)置這樣的問(wèn)題:將圖形的描點(diǎn)數(shù)據(jù)給大家,要求他們繪出圖形,說(shuō)明形狀。然后要求他們運(yùn)用K-means聚類聚為兩類,并且根據(jù)聚類的結(jié)果畫出圖形。然后將所得的圖形跟原始圖形進(jìn)行比較,說(shuō)明差異之處。通過(guò)這樣的問(wèn)題,既可以使得學(xué)生對(duì)數(shù)據(jù)整理、畫圖等有一定的掌握,還使得他們熟悉了K-means聚類算法的編程過(guò)程。另外,使得他們不僅了解了K-means聚類算法的優(yōu)點(diǎn),也使得他們理解K-means聚類算法作為一種線性方法的局限之處。四、小結(jié)綜上所述,“數(shù)據(jù)挖掘”課的教學(xué)既要注重基本理論與方法的講解,使得學(xué)生能夠掌握數(shù)據(jù)挖掘的基本理論和知識(shí);又要培養(yǎng)學(xué)生的思考和分析能力,提高他們運(yùn)用數(shù)據(jù)挖掘的相關(guān)程序解決實(shí)際問(wèn)題的能力。從而使得所學(xué)的知識(shí)能夠真正運(yùn)用于實(shí)踐中,提高學(xué)生的綜合能力。本文嘗試對(duì)本科數(shù)據(jù)挖掘教學(xué)做一些總結(jié),如何更好地提高《數(shù)據(jù)挖掘》這門課的教學(xué)質(zhì)量,期待更多的同行共同探討。
作者:徐春明單位:鹽城師范學(xué)院數(shù)學(xué)科學(xué)學(xué)院