網(wǎng)絡(luò)教育學(xué)院
《數(shù)據(jù)挖掘》課 程 大 作 業(yè)
題 目:
姓 名:
學(xué)習(xí)中心:
第一大題:講述自己在完成大作業(yè)過程中遇到的困難,解決問題的思路,以及相關(guān)感想,或者對(duì)這個(gè)項(xiàng)目的認(rèn)識(shí),或者對(duì)Python與數(shù)據(jù)挖掘的認(rèn)識(shí)等等,300-500字。
第二大題:完成下面一項(xiàng)大作業(yè)題目。
《數(shù)據(jù)挖掘》課程大作業(yè)
注意:從以下5個(gè)題目中任選其一作答。
題目一:Knn算法原理以及python實(shí)現(xiàn)
要 求:文檔用使用word撰寫即可。
主要內(nèi)容必須包括:
(1)算法介紹。
(2)算法流程。
(3)python實(shí)現(xiàn)算法以及預(yù)測(cè)。
(4)整個(gè)word文件名為 [姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP )
作業(yè)提交:
大作業(yè)上交時(shí)文件名寫法為:[姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如:戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP)
以附件形式上交離線作業(yè)(附件的大小限制在10M以內(nèi)),選擇已完成的作業(yè)(注意命名),點(diǎn)提交即可。如下圖所示。
。
注意事項(xiàng):
獨(dú)立完成作業(yè),不準(zhǔn)抄襲其他人或者請(qǐng)人代做,如有雷同作業(yè),成績(jī)以零分計(jì)!
題目二:樸素貝葉斯算法原理以及python實(shí)現(xiàn)
要 求:文檔用使用word撰寫即可。
主要內(nèi)容必須包括:
(1)算法介紹。
(2)算法流程。
(3)python實(shí)現(xiàn)算法以及預(yù)測(cè)。
(4)整個(gè)word文件名為 [姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP )
作業(yè)提交:
大作業(yè)上交時(shí)文件名寫法為:[姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如:戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP)
以附件形式上交離線作業(yè)(附件的大小限制在10M以內(nèi)),選擇已完成的作業(yè)(注意命名),點(diǎn)提交即可。如下圖所示。
。
注意事項(xiàng):
獨(dú)立完成作業(yè),不準(zhǔn)抄襲其他人或者請(qǐng)人代做,如有雷同作業(yè),成績(jī)以零分計(jì)!
題目三:SVM算法原理以及python實(shí)現(xiàn)
要 求:文檔用使用word撰寫即可。
主要內(nèi)容必須包括:
(1)算法介紹。
(2)算法流程。
(3)python實(shí)現(xiàn)算法以及預(yù)測(cè)。
(4)整個(gè)word文件名為 [姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP )
作業(yè)提交:
大作業(yè)上交時(shí)文件名寫法為:[姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如:戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP)
以附件形式上交離線作業(yè)(附件的大小限制在10M以內(nèi)),選擇已完成的作業(yè)(注意命名),點(diǎn)提交即可。如下圖所示。
。
注意事項(xiàng):
獨(dú)立完成作業(yè),不準(zhǔn)抄襲其他人或者請(qǐng)人代做,如有雷同作業(yè),成績(jī)以零分計(jì)!
題目四:中華古詩(shī)詞分析
要 求:編寫程序爬取中華古詩(shī)詞網(wǎng)站
https://so.gushiwen.org/authors/上詩(shī)人的詩(shī)詞信息,至少500首詩(shī)詞,抽取詩(shī)詞信息的詩(shī)人名字、朝代、詩(shī)詞標(biāo)題、詩(shī)詞內(nèi)容存儲(chǔ)在json文件中,自選某一角度完成對(duì)詩(shī)詞的處理分析。如:
(1)杜甫、李白的詩(shī)詞用字、用詞的對(duì)比分析;
(2)唐宋代表性詩(shī)詞的用詞對(duì)比分析;
(3)使用sklearn對(duì)不同詩(shī)人的詩(shī)詞進(jìn)行訓(xùn)練,訓(xùn)練得到的模型能用于對(duì)詩(shī)詞的作者的判別。對(duì)比不同算法判別的準(zhǔn)確率。
(4)整個(gè)word文件名為 [姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP )
作業(yè)提交:
大作業(yè)上交時(shí)文件名寫法為:[姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如:戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP)
以附件形式上交離線作業(yè)(附件的大小限制在10M以內(nèi)),選擇已完成的作業(yè)(注意命名),點(diǎn)提交即可。如下圖所示。
注意事項(xiàng):
獨(dú)立完成作業(yè),不準(zhǔn)抄襲其他人或者請(qǐng)人代做,如有雷同作業(yè),成績(jī)以零分計(jì)!
題目五:歌詞分析
要 求:自選有音樂歌詞的網(wǎng)站,編寫爬蟲程序下載不同類型的歌曲歌詞,至少3種以上類型,每種類型至少100首歌曲,抽取其中的歌曲名稱、歌曲類型、歌詞信息存儲(chǔ)在json文件中,自選某一角度對(duì)歌詞進(jìn)行處理分析。如:
(1)不同類型的歌曲用詞分析,如下圖所示(自行學(xué)習(xí)使用jieba庫(kù)和wordcloud庫(kù)的使用)。
(2)使用sklearn庫(kù)對(duì)不同類型的歌詞進(jìn)行訓(xùn)練,訓(xùn)練得到的模型能用于對(duì)歌詞類型的判別。對(duì)比不同算法判別的準(zhǔn)確率。
(3)整個(gè)word文件名為 [姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP )
作業(yè)提交:
大作業(yè)上交時(shí)文件名寫法為:[姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如:戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP)
以附件形式上交離線作業(yè)(附件的大小限制在10M以內(nèi)),選擇已完成的作業(yè)(注意命名),點(diǎn)提交即可。如下圖所示。
注意事項(xiàng):
獨(dú)立完成作業(yè),不準(zhǔn)抄襲其他人或者請(qǐng)人代做,如有雷同作業(yè),成績(jī)以零分計(jì)!
奧鵬,國(guó)開,廣開,電大在線,各省平臺(tái),新疆一體化等平臺(tái)學(xué)習(xí)
詳情請(qǐng)咨詢QQ : 3230981406或微信:aopopenfd777