前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇測量學試題及答案范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
一年級數(shù)學
(滿分100分,考試時間60分)
得分:
一、填空。
(11分)
1、(1)上圖中一共有(
)個圖形,從左邊數(shù),長方形排在第(
)個,第(
)個和第(
)個是三角形。
(2)從右邊數(shù),第(
)個和第(
)個是正方形。
2、一個數(shù)的個位上是8,十位上1,這個數(shù)是(
)。
3、紅紅今年10歲,去年她(
)歲,明年她(
)歲。
4、有個數(shù)比12大,比16小,它可以分成兩個相同的數(shù),這個數(shù)是(
)。
3、在計數(shù)器上,從右邊起第一位是(
)位,第二位是(
)位。
4、-8>6,
最小是(
),16-
>6,
最大是(
)。
5、找規(guī)律填數(shù)。
①、
、14、16、
、
、20。
②、19、
、15、
、11、9。
③、3、6、9、_____、_____。
二、計算。
(30分)
12-8=
16-7=
13-5=
13-7=
19-0=
14-7=
16-9=
15-6=
12-3=
11-4=
13-6=
9+7=
15-9=
14-5=
12-9=
15-7=
13-9=
8+9=
16-8=
14-9=
14-9-2=
12-7+6=
7+6-8=
6+3+4=
8+8-7=
11-5+8=
7+4-6=
7+9-8=
5+7-6=
7+8-6=
三、在里填上“<”
“>”
或“=”
。(10分)
168+7
18-98
11-312-3
14-614-8
14-87
11-57
16-914-7
15-814-9
15-7+815
89+5-6
四、在下面的方格紙上畫一個三角形、一個正方形和一個長方形。
(6分)
五、數(shù)一數(shù),填一填。
(6+4分)
1、(
)個長方形
(
)個正方形
(
)個三角形
(
)個
(
)個
(
)個
(
)個
2、六、填表。(6分)
原有
16箱
13箱
(
)箱
賣出
9箱
(
)箱
8箱
還剩
(
)箱
5箱
6箱
七、看圖列式計算。
(6分)
1.
?個
2.
13個
?個
=
=
八、在每個圖形里畫一條直線、分一分。
(6分)
(1)分成兩個長方形
(2)分成兩個三角形
(3)分成兩個三角形
九、解決實際問題。
(15分)
1、班級圖書角有17本故事書,借給小朋友8本,還剩多少本?
(本)
2、小紅做了16面
,送給幼兒園小朋友一些后,還剩7面,送走了多少面?
(面)
我已經(jīng)看了9頁,還有9頁沒有看。
3、這本書一共有多少頁?
(頁)
4、雞有13只,鴨有7只,鵝有4只。
⑴、鴨和鵝一共有多少只?
(只)
⑵、公雞有9只,母雞有幾只?
(只)
足球和籃球一共
有12個。
5、⑴、籃球最少有(
)個。
一、當前學業(yè)成就測評所面臨的技術難題
隨著基礎教育改革的不斷深入,對學生學業(yè)成就的測評工作已經(jīng)取得很大進展,但我們?nèi)匀粺o法忽視其中存在的問題:一是現(xiàn)行的學業(yè)成就測評仍然擺脫不了對學生進行排隊的嫌疑,通過測評所挖掘的學生的信息仍然不夠深,從而導致對學生的能力不能很好地診斷和指導[2];二是囿于測評技術的發(fā)展局限,現(xiàn)行的學業(yè)成就測評還是主要考查學生對知識的掌握程度,對學生能力的掌握還不夠深;三是學業(yè)成就測量與評價的非標準化,導致了測評內(nèi)容缺乏客觀性。盡管我們打破了傳統(tǒng)的材一統(tǒng)天下的局面,制定了一個共同的課程標準,但現(xiàn)行的考試制度還是抹不去學業(yè)成就測驗內(nèi)容選擇的主觀色彩;四是學科專家和心理測量學專家之間的聯(lián)系不夠緊密,導致學科專家在成就測評的實施過程中,缺乏心理測量學的理論指導,而心理測量學專家對學科知識和課程標準也吃不透;五是在我國現(xiàn)狀下,大規(guī)模的學業(yè)成就測評的形式非常單一,主要采取紙筆的形式,這也導致人們對測評的客觀性和公正性存有質(zhì)疑。綜合上述五個問題的出現(xiàn),分析其根本原因,主要原因還是心理測量學的基本理論還沒有完全融入到學業(yè)成就測量與評價的實踐中去,所以,要解決學業(yè)成就測評面臨的問題,還得從心理測量學的理論與技術的實施中尋找答案,加強心理測量學專家與學科專家之間的聯(lián)系與交流,從而做到學業(yè)成就測評的客觀、公正與公平,促進學生能力的發(fā)展。
二、學業(yè)成就測評的經(jīng)典測量學基礎
經(jīng)典測量理論(Classical test theory,CTT)起始于20世紀中葉之前,其主要特點是以真值理論為基礎,以信度、效度、難度和區(qū)分度為指標,它的基本假設是考生的分數(shù)并不是一個絕對的值,而是其真實能力或技能的反映與測量誤差的和,所以稱為真值理論。根據(jù)經(jīng)典測量理論,人們逐步建立并完善了測驗發(fā)展的標準化程序,通過標準化的程序提高所編制的測驗的信度和效度。
自2001年國家教育部提出課程改革以來,教育心理學工作者和學科專家在新課程下學業(yè)成就測評工具的研發(fā)上,下了不少工夫。經(jīng)典測量理論在學業(yè)成就測評中也得到了一定的應用。某地區(qū)初中數(shù)學成就測驗在編制過程中,首先是依據(jù)初中數(shù)學課程標準,確定初中數(shù)學涉及4個領域的內(nèi)容:數(shù)與代數(shù)、空間與圖形、統(tǒng)計與概率以及綜合應用。同時結合美國教育學家B.S.Bloom的教育目標分類法,選擇記憶能力、理解能力、運算能力、推理能力、綜合應用能力為教育目標,確定測量目標。根據(jù)教學內(nèi)容和教學目標,制定了雙向細目表,之后對該區(qū)的數(shù)學教學專家進行了訪談,確定了項目以及項目所占的權重,然后組成兩套平行題本。根據(jù)題本通過小樣本預試,用難度、區(qū)分度的指標來篩選題目,最后確定正式施測題本。采取分層整群抽樣,進行施測收集數(shù)據(jù),分析數(shù)據(jù),從而根據(jù)數(shù)據(jù)分析的結果來評價學生學會了什么,對什么是了解、知道、理解、應用[3]。
在大規(guī)模的學業(yè)測評中,試題往往要全面覆蓋基礎教育的各個學科,測試題目非常多,如果要將這些題目讓全部學生作答,測試的時間會大大超過學生所能承受的限度,這也是不可能實現(xiàn)的,矩陣取樣技術化解了這個難題。將覆蓋多個學科的所有題目按照一定原則分配到多套測驗中,學生隨機分配,每個學生只需完成一套測驗中的試題,這樣的設計叫做完全矩陣取樣設計。采用這種設計解決了測驗時長的問題,但是不同學生測試結果的比較又成了新的問題。針對這一問題,發(fā)展出不完全矩陣取樣設計,就是每一個題本中都有一部分共同題,利用學生在共同題部分作答的情況,將學生在整個題本中的作答結構等值到同一個量尺上,就可以解決個體之間的比較問題。
即便如此,經(jīng)典測量理論下的學業(yè)成就測驗,采用總分指標來評價能力,對個體在總體中的相對位置進行排序,不能指出被試具體掌握了哪些內(nèi)容,更無法診斷其題目作答錯誤的原因,仍然擺脫不了還只是對學生知識點考查的怪圈,在注重能力培養(yǎng)的素質(zhì)教育背景下,它缺乏對學生能力的掌握;用難度與區(qū)分度的指標來分析學生的反應,保留了一些反映學生能力的題目;在實際的教學過程中,教師一般也都是自出題目,對題目的難度和區(qū)分度只做一個主觀的估計,同時,它也缺乏避免曝光的理論技術指導,從而造成學業(yè)成就測驗的標準化程度很低;另外,如果涉及到語文成就測驗時,主觀題目的設計以及結果的分析又會面臨統(tǒng)計學的難題。
三、學業(yè)成就測評的現(xiàn)代測量學指導
基于經(jīng)典測量理論下成就測驗只能測查知識點的致命缺點,教育與心理學工作者圍繞經(jīng)典測量理論的一些問題展開了討論,促進了測量理論的新發(fā)展,注重表現(xiàn)學生能力的項目反應理論(Itemresponse theory,IRT)產(chǎn)生了,該理論起始于20世紀60年代,其特點是:采用嚴格的數(shù)學模型來反映不同能力水平的測試者對測試題目的反應模式。項目反應理論相對于經(jīng)典測量理論來說取得了巨大的進步,但也并非沒有缺點[4],它的3個基本假設非常嚴格——(1)單一維度假設,即假定測驗的所有題目只測查同一種能力或潛在特質(zhì)。但實際上,很少有測驗只測查單一的能力或特質(zhì)。(2)局部獨立性假設,即當控制所測量的能力或特質(zhì)之后,被試在不同題目上的反應是相互獨立的。換一句話講,就是被試對題目的反應只受該題目所測的能力的影響。(3)單調(diào)遞增假設,即被試對題目正確反應的概率隨其能力水平的增加而單調(diào)遞增。這3條非常嚴格的假設,使其應用受到很大的限制。
從20世紀90年代至今,圍繞項目反應理論產(chǎn)生了很多新的研究和新的動向,如:多維項目反應理論(Multi-dimensional IRT,MIRT)、非參數(shù)項目反應理論(Non-parametric IRT,NIRT)等。多維項目反應理論為成就測驗中所涉及的每個維度引入能力和項目區(qū)分度參數(shù),進而模擬測驗題目和被試之間的交互作用,它是一個非線性的用來表征題目參數(shù)、被試的多維潛在能力以及其正確作答概率之間關系的數(shù)學函數(shù),通過這個模型,我們可以對被試的多個特質(zhì)進行分別推斷。換一句話說,利用多維項目反應模型能同時估計被試在多個維度上的能力參數(shù),并且考慮各能力維度之間的關系,因此,如果測驗數(shù)據(jù)是多維的,則多維模型就能更有效地估計被試及項目參數(shù)。這使我們能更深入地了解被試,結合多方面的信息,為對被試的評估或診斷提供幫助。在實際應用中,一個總的學業(yè)成就測驗可以分為多個子測驗,如果子測驗測量了不同的內(nèi)容領域或認知技能,則這些項目就有可能代表了不同的維度,這時,對每個項目能夠正確作答所需要的內(nèi)容領域或認知技能進行分析是非常必要的,在傳統(tǒng)測驗中一個知識點的考查可能涉及到對多個能力的考查,用經(jīng)典測量理論的假設,一個題目對應一個能力,這顯然是有很大的誤差。另外,多維項目反應理論能夠提供項目在每個能力維度上的區(qū)分度參數(shù),可以據(jù)此來選擇對多維能力差異具有敏感性的項目。在教育中,課堂上學科教師給學生出的小測驗比比皆是,這種測驗不僅題目少,而且受測的對象也僅僅是本班的學生,即樣本小,這時,非參數(shù)項目反應理論就給我們提供了模型,這至少削弱了我們對經(jīng)典測驗中樣本分布正態(tài)和在參數(shù)項目反應理論中關于特質(zhì)分布正態(tài)假設的依賴。
四、學業(yè)成就測評的認知診斷技術前沿
認知診斷理論(Cognitively diagnostic theory)非常值得我們關注。隨著認知心理學的發(fā)展,關于知識與技能的認知理論為我們研發(fā)成就測驗工具提供了理論基礎。認知診斷理論就是以現(xiàn)代測量學為基礎,結合認知科學對學習理論的研究與發(fā)現(xiàn),采用更精致的數(shù)學模型,來研究如下問題,(1)學生在答題時,經(jīng)歷哪些認知過程?(2)這些認知過程如何發(fā)展?以及能力高的學生與能力低的學生在這些方面有哪些差異?認知診斷可以通過學生對試題的作答反應,推論出其認知過程與知識結構的可能狀態(tài)。
在學業(yè)成就測評中,經(jīng)典測量理論和項目反應理論,都是根據(jù)理論中的一些指標來篩選題目,將學生按順序排列在特定能力(或特質(zhì))的連續(xù)體上。這并不能給學生或教師有用的診斷信息,不能幫助學生或教師理解需要學習或教學的知識與技能。而運用認知診斷理論,我們能更深入地理解隱含在考生總分背后其認知技能之間的差異。這為我們深入挖掘受測者信息提供了一個有力的工具。
認知診斷理論中比較有代表性的有Mislevy的以概率為基礎的推理(the probability based inference)、Corbett和Anderson等人的學生思維模擬(student modeling)、Britton和Tidwell的認知結構診斷(cognitive structure testing)以及Tatsuoka的規(guī)則空間模型(rule space model)[5]。Tatsuoka的規(guī)則空間模型最初是用來診斷小學生在解決四則運算問題時答對或者答錯的原因,進而發(fā)現(xiàn)學生使用錯誤的規(guī)則來解題,因此會產(chǎn)生系統(tǒng)化的錯誤,這種系統(tǒng)化的錯誤,他們稱之為“失誤”。該模型的方法包括兩個階段[6]:第一階段是抽取某個領域的認知特征并根據(jù)這些認知特征確定潛在的知識結構;第二個階段是把學生的反應模式劃分到所確定的各個知識結構中去,并且計算被試的屬性掌握概率。在構建規(guī)則空間的過程中使用了項目反應理論中參數(shù)估計的方法,所以嚴格來講,規(guī)則空間模型的建構方法是項目反應理論的繼承與發(fā)展。用規(guī)則空間模型的方法編制成就測驗時,通過可達到矩陣的距離來澄清各屬性之間的關系,使得矩陣中的項目屬性關系清晰且符合邏輯。同時,由于屬性間的邏輯關系很清晰,所以在項目的反應上就能很清楚地知道學生掌握了哪些屬性,或者未掌握哪些屬性,或者是因為失誤而造成的反應錯誤,這樣就能給教師和學生提供更深層的信息,從而進行補救性的教學[7]。
在實際工作中開展認知診斷測評,需要進行一系列的系統(tǒng)化工作:(1)確定診斷目標。必須明確要診斷的具體學科內(nèi)容,如小學數(shù)學分數(shù)診斷,中學語文句法診斷等。(2)確定診斷目標所涉及的認知屬性及屬性間的階層關系。這項工作需要認知心理學家、學科專家和教育測量學專家共同完成。(3)根據(jù)已經(jīng)確定的屬性和屬性層級關系選擇適當?shù)哪P?,如?guī)則空間模型就是一種。(4)預測驗與正式測驗,獲取模型參數(shù)。(5)診斷結果報告和有針對性的補救教學措施的制作。
認知診斷測評技術的發(fā)展使形成性評價的實施得以可能。在課程改革的背景下,教育的主題是關心人的發(fā)展,全面提高人的素養(yǎng),同樣,學業(yè)測評的功能也就從過去關注結果的評價逐漸轉(zhuǎn)向注重過程的評價,強調(diào)通過評價改進教學活動,促進學生發(fā)展。“為了學習的評價”(Assessment for Learning,AFL)理念就應運而生,其核心目的是促進學生的學習,同時,該理念還提出了教育政策制定者過于強調(diào)大尺度教育評價對教育的影響而忽視了課堂上的評價。事實上,過程性評價是課堂上應該選擇的最有效的評價方式,因為,在課堂教學活動過程中,為了促進教學活動而不是鑒定學生能力,教師和學生需要共同對學習過程進行監(jiān)控和評價。這樣,教學活動得到及時反饋,教師可以根據(jù)評價結果來調(diào)整教學;同時,學生得到學業(yè)評價的反饋,也提高了學業(yè)監(jiān)控能力。
五、學業(yè)測評技術的理論發(fā)展與反思
通過心理測量理論的歷史發(fā)展這條主線,對其在學業(yè)成就測評中的應用進行回顧,體現(xiàn)了測量理論在學業(yè)成就測評中的意義與價值,同時,這也體現(xiàn)了學業(yè)成就測評的測量學取向。從經(jīng)典測量理論下學業(yè)成就測驗對知識的測查,到項目反應理論下學業(yè)成就測驗對能力的靜態(tài)刻畫,再到認知診斷理論下學業(yè)成就測驗對能力的動態(tài)診斷,從而使教育者從反應行為的面紗下揭開能力的形成過程,對學生能力能進行更好的診斷、評價以及實施補救性的個性化教學。從學業(yè)成就測評的測量學取向的發(fā)展來看,隨著認知科學、教學研究和心理統(tǒng)計學的發(fā)展,以認知理論為基礎的新的測量方法和測驗設計方法也會得到進一步發(fā)展,從而更好地指導學業(yè)成就的測評工作。
在對測評理論發(fā)展趨勢的展望下,我們也應該有所反思。傳統(tǒng)的學業(yè)測評中,更多地強調(diào)對學生學業(yè)水平和能力的衡量,但是認知診斷技術的發(fā)展趨勢告訴我們,對學業(yè)的測評不僅僅是為了對學生進行考量,更應該是對教師改進教學質(zhì)量提供信息,為教育質(zhì)量的提高提供信息。另外,增值性評價的提出,提倡學生本身的縱向比較,更關注學生個體的發(fā)展與提高,使教育更人性化。這也更順應了《基礎教育課程改革綱要(試行)》中指出的,改革課程評價過分強調(diào)甄別和選拔的功能,發(fā)揮評價促進學生發(fā)展、教師提高和改進教學實踐的功能。
參考文獻
[1] Lewis R Aiken.心理測驗與考試——能力和行為表現(xiàn)的測量.張厚粲,譯.北京:中國工業(yè)出版社,2002.
[2] 辛濤.新課程背景下的學業(yè)評價:測量理論的價值.北京師范大學學報(社科版),2006.
[3] 柴彩霞.7~9年級數(shù)學成就測驗的初步編制.湖南師范大學,2005.
[4] 辛濤.項目反應理論研究的新進展.中國考試,2005(7).
[5] 余娜,辛濤.規(guī)則空間模型的簡介與述評.中國考試,2007(9).
關鍵詞 高中生物 學習興趣 量表
中圖分類號 G633.91 文獻標志碼 B
1 問題的提出
興趣是影響學生學習積極性的重要因素。提高學生的學習興趣既是生物教育的手段,也是生物教育的重要目標。對學生進行學習興趣量化評估,需要設計一個兼顧信度和效度的量表。本文參照心理測量中自陳表的設計方法,設計了可進行批量測試的量表,并進行了試測和分析。
2 生物學習興趣量表的設計
要測量學生的生物學學習興趣度,首先要明確哪些特征可以反映學生對生物的興趣。筆者在廣泛參閱心理學、教育學理論,結合生物教學的特點和近年來對高中生的觀察分析,瀘縣二中生物教研組經(jīng)過討論,并列出了能夠反映學生生物學習興趣度的典型特征,用于量表中的設問。下面所用興趣度量表是一種自陳量表,是心理學測量人格常用的方法。在量表中包括一系列陳述語句或問題,每個句子或問題描述一種行為特征,要求受試者做出該描述是否與個人情況相符的回答。
本量表的編制,特別注意對以下幾個方面的理解:
(1) 生物學習興趣是學生對生物學有關概念、原理、生物學實驗、生命現(xiàn)象等教學內(nèi)容各方面的趣味程度的綜合考量。
(2) 生物學習興趣是學生在各學習環(huán)節(jié)中表現(xiàn)出的興趣,不僅指在校內(nèi)課堂學習時段的環(huán)節(jié),也包括在平時生活中對生物學科相關知識的興趣表現(xiàn)。
(3) 生物學習興趣除了表現(xiàn)為對生命現(xiàn)象的好奇、疑問,還體現(xiàn)為力圖探求生命現(xiàn)象的原理,生命現(xiàn)象的發(fā)展,并且渴望了解生命科學的探索歷程。
(4) 興趣既是外在的行為取向,也是內(nèi)在的心理傾向。因此,在讓學生報告其有關的行為表現(xiàn)的同時,還應讓學生報告自己的心理感受和體驗。
(5) 問卷的題目要與被試的年齡階段、生活閱歷相吻合。
經(jīng)過多次修改,用于高一新生的初始興趣度測量的試題共包括30個陳述句見附錄部分,每個句子描述一種學生對生物感興趣或者不感興趣的典型行為、心理感受。要求被試者如實做出是否與自身情況相符的回答。30個題中,1、5、11、17、24、25、30題每個題選“否”得興趣分1分,選“是”得興趣分0分,其余23個題中選“是”得興趣分1分,選“否”得興趣分0分。最后將全卷分數(shù)總和作為該生的興趣分,滿分30分。
效度量表包括完美性檢驗和對偶檢驗兩部分。在完美性測試中,31~36題回答“是”的得1分,37~40題回答“否”的得1分。完美性測試總分≥3分者視為說謊,作為無效卷處理。問卷中設計了6對對偶檢驗題(41題與5題,42題與18題,43題與19題,44題與3題,45題與1題,46題與28題)。對偶檢驗中若出現(xiàn)說謊分≥3分,則該卷視為無效卷。
3 量表的試測與質(zhì)量分析
2013年9月對瀘縣二中高2016屆B部全體學生(1 378人)進行了測試。由于對測試結果的讀取、統(tǒng)計分析工作量非常大,利用機讀卡光電閱讀機(懷宇OMR2140B標準型),快速將學生的選擇結果設計為電子表格中的選項(表1),再將學生的選擇結果轉(zhuǎn)化為興趣度分,這樣大大減輕了數(shù)據(jù)的統(tǒng)計工作量。另外,運用IBM SPSS statistics 19軟件進行每道題的區(qū)分度的分析、變量之間的相關度分析,提升了本研究的科學性。
測試的標準差為6.72,表明針對同一測試對象,測試具有較大的穩(wěn)定性;測試中除了18、22題區(qū)分度為“尚可”,其余題目都表現(xiàn)為“很好”;測試所得Cronbach's Alpha系數(shù)分別為0.89,Guttman折半信度分別為0.89。學者DeVellis認為,信度系數(shù)r為0.60~0.65(最好不要);0.65~0.70(最小可接受值);0.70~0.80(相當好);0.80~0.90(非常好)。心理測量學上最理想的信度系數(shù)為r=1.00,但這是辦不到的,在性格、興趣、態(tài)度等人格測量中信度系數(shù)通常在0.80~0.85之間。故本測試均有較高的內(nèi)部一致性,信度相當好。
4 測試各題分值分析
本研究設計的量表滿分為30分,在測試中,全體學生的總體平均分18.13分,表明學生的整體基礎學習興趣還是較高的。瀘縣二中是國家級示范性普通高中,由于報考的學生數(shù)量大,經(jīng)過多番選拔,錄取進校的生源自然基礎成績較高,相應的初始興趣度也較高。初始興趣度測試中,得分人數(shù)最多的分值是15分,其次是16分、17分,與全體分數(shù)的中值比較接近。
4.1 得分最低的5道題
測試得分最低的前5道題依次是第7、2、8、27、29題(表2),具體分析如下:
7題:通過測試學生是否了解生物學科的分支來判斷學生平時是否關注了更深層次的生物學知識。這道題的得分需要學生在課堂之外對生物學及其分支學科有所了解,從這道題0.52的區(qū)分度來看,這也是一道易于區(qū)分學生興趣度高低的題。
26題:此題說明初中階段的學生對生物課堂所講的知識深入程度是不夠的,當前在四川省初中生物大都被視為“小學科”,在許多學校中生物學科課時少。在當前教學條件下,教師對學生深入了解生物知識的引導還做得不夠,并且對于教師在課堂中所講的知識,學生消化、理解的時間不足,所以在這道題上學生的得分率很低。
8、27、29題:都是在通過考查學生是否留意了身邊的生物及生命現(xiàn)象,是否懷著興趣去探究生物知識,是否有了解生物知識、應用生物知識的愿望來表征生物學習興趣。這幾道題體現(xiàn)出學生對生活和環(huán)境觀察得不夠深入,這可能跟學生的生活環(huán)境、學習條件有關。
4.2 得分最高的5道題
得分最高的5道題是18、22、23、19、1題(表2)。分析分別如下:
18題:此題的得分最高,反映出當前高中生對能夠自己動手的機會非常珍惜,操作的主動性很強。給教師的啟示是:生物課堂應該增加學生動手操作的機會。例如:演示實驗可以讓學生做;對于學生操作的實驗在考慮分工合作的同時,也應該充分保障每個人的動手機會。
22題:此題也涉及學生自己“動手”的問題,許多生物科學家做過的實驗,在教材中往往以“生物科學史”“小資料”“背景資料”等形式呈現(xiàn),詳盡的操作過程在高中教材中并未呈現(xiàn)。而其中蘊含的科學研究思路及方法,對培養(yǎng)學生的生物科學素養(yǎng)具有很高的價值。此題也反映出初中階段的實驗操作的普及面與學生的實際需求存在差距。
23、19、1題:三題反映出許多學生對身邊的生物學原理具有較強的了解愿望,對應的措施可以是給予學生更多接觸生物科普知識的途徑。教師可以通過開展課外讀書交流活動、生物奧賽知識講座等,為學生提供這種途徑。
附 中學生物學習興趣量表
親愛的同學,為了了解你的生物學科學習情況,我們邀請你參與本次問卷調(diào)查。下面每個問題中敘述了一種行為或感受,請你如實地評判。
如果該敘述與你的情況相符,請在機讀卡上相應題號涂A項,如果不符,請涂B項。問卷的任何選項都沒有好與壞之分,也沒有“正確”答案。如果你覺得在不同的情境里,兩個答案或許都能反映你的傾向,請選擇一個對于你的行為方式來說最自然、最順暢和最從容的答案。
最后,請記得在考號欄涂上你的理科綜合周練考號。
( )1.上生物課我經(jīng)常希望快些下課。
( )2.課余時間我經(jīng)常翻閱生物課本。
( )3.我經(jīng)常在生物老師上課之前預習。
( )4.我會仔細地看一遍老師批改之后的生物作業(yè)。
( )5.我覺得生物課是枯燥乏味的。
( )6.課后我喜歡和同學們討論生物老師當堂課所講的問題。
( )7.我知道遺傳學、生態(tài)學、分子生物學、細胞生物學、動物學、植物學等都屬于生物學的范疇。
( )8.我能說出許多花草樹木的名字。
( )9.生物教材上老師沒有講或者略講的內(nèi)容,我會自己去閱讀。
( )10.我曾多次借閱有關生物學的課外書。
( )11.我對生物學沒有什么好感。
( )12.生物課上老師提出問題時,我能積極思考。
( )13.我在生活中經(jīng)常注意到課堂所學的生物學現(xiàn)象。
( )14.我能用所學知識解釋生活中的許多生物學現(xiàn)象。
( )15.我喜歡做生物測試題。
( )16.我希望能參加生物知識競賽。
( )17.我沒有認真解剖、觀察過花朵的結構。
( )18.生物實驗中我經(jīng)常爭取自己動手。
( )19.我經(jīng)常就學習生物時遇到的疑問請教老師和同學。
( )20.如果發(fā)現(xiàn)下一節(jié)課是生物課我會比較開心。
( )21.如果高考不考生物,我還是會對生物很感興趣。
( )22.我很想親自動手做一做教材上那些生物科學家們做過的實驗。
( )23.生活中遇到一些生物學現(xiàn)象時,我希望自己能知曉其中的道理。
( )24.我希望生物學科不布置作業(yè)。
( )25.我希望生物學科每周少上一節(jié)或者兩節(jié)課。
( )26.我希望老師就某些生物知識講得更深一些。
( )27.我喜歡種點花草樹木,觀察他們的生長。
( )28.我經(jīng)??匆粌蓚€有關生物、有關自然的電視節(jié)目。
( )29.我很想知道自己身邊的常見植物叫什么名字。
( )30.我做生物作業(yè)時會去想其他事情。
( )31.每次生物考試我都能考出最好水平。
( )32.我的生物老師的每堂課都是非常成功的。
( )33.我上生物課從不走神發(fā)呆。
( )34.我喜歡教過我的每一個老師。
( )35.每次的生物作業(yè)我都會完成得非常認真。
( )36.我從來不會放棄沒弄明白的生物知識。
( )37.有時我也會說假話。
( )38.我的生物作業(yè)也有完不成的時候。
( )39.生物教材上不是每個章節(jié)我都學懂了。
( )40.我有時會拖延完成學習任務的時間。
( )41.生物課是有趣的。
( )42.做生物實驗時我更愿意看著別人做。
( )43.我沒有主動問過老師問題。
( )44.我經(jīng)常預習生物教材。
( )45.在生物上,我經(jīng)常盼著下課。
( )46.我看過一些有關動、植物或自然類的節(jié)目。
參考文獻:
[1] 中華人民共和國科學技術部等.國家中長期生物技術人才發(fā)展規(guī)劃(2010-2020年)[Z].2011-12-26.
[2] 江.中學生生物學習興趣的研究[D].北京:首都師范大學,2011.
【關鍵詞】選擇題 高考英語 試題
一、引言
選擇題是各類測試中常用的一種題型,它由題干和三個或三個以上的選項構成,要求受試者根據(jù)題干提供的信息從選項中做出恰當?shù)倪x擇。選擇題答案固定,不需要評分人員的主觀判斷,易于給分,能夠保持很高的評分信度。現(xiàn)在采用光電閱讀器來讀答題卡,更省力,速度更快。
二、選擇題的發(fā)展
1.選擇題的引入。1965年,高考試卷中出現(xiàn)了一道五選一的多項選擇題,這標志著我國高考英語試卷中開始引入選擇題。從形式上看,當時我國對選擇題還處于引入階段,出題技巧欠缺,試題質(zhì)量較差,這道選擇題的題干無法提供完整的信息,考點比較模糊,只能說是選擇題的雛形,還不完整。在這道選擇題出現(xiàn)之前,都是主觀測試,這說明我國的英語測試一直以來都是受寫作翻譯測試法的影響。從1965年出現(xiàn)這道選擇題,我國開始引入結構主義心理測量法。選擇題是結構主義測量法的代表題型之一,由于當時的理論水平還不夠,題型的質(zhì)量尚不如人意。
2.選擇題的發(fā)展?;謴透呖己螅?978年的試卷中出現(xiàn)了65年用過的選擇題,采用三選一的形式,當時稱為選擇法填空,共30小題,占30分。同時,閱讀理解題也開始采用四選一的選擇題,跟現(xiàn)在采用的閱讀測試方法相同,只是當年只有一段二百多字的短文,短文后有四個小題,每小題5分。可以看出我國當時對選擇題的重視,表明結構主義心理測量法已經(jīng)被中國的測試專家所接收。選擇題評分客觀,信度高,正好符合人們對高考成績公平、公正的時代要求,受到教育界及廣大考生的高度認可。只是由于當時對它的認識還不是很充分,所以79和80年的高考試卷中,四選一的選擇題只有20個小題,占20分。此外,79和80年的閱讀理解采用了兩種題型,即填空題和選擇題,選擇題每小題3分,采用三選一的形式,降低了選擇題的難度和分值。這都說明了我國測試學專家在結構主義心理測量學的測試方法上不斷的摸索,從最初只用于測試語法到慢慢向閱讀技能的延伸。82年的題型做了重要的改革,在往年題型的基礎上,新增加了考查語音知識的單詞辯音。直到80年代中期,我國對選擇題的研究從理論上的探討發(fā)展到相當?shù)囊?guī)模,標志著結構主義心理測量法在我國高考英語測試的實際應用中有了長足的發(fā)展。
3.選擇題的成熟。從1987年起,短文填空由原來的填空形式改為四選一的完形填空,這標志著我國在測試學理論上又有了新的發(fā)展。完型填空是綜合測試法的典型題型,所以完型填空在高考中的引入,標志著我國測試學在理論上的又一大進步,完形填空法的產(chǎn)生與格式塔心理學有著密切的關系。在此之前,受結構主義心理測量法的影響,選則題是單純地考查知識點,雖然是句子或?qū)υ?,但沒有語篇,語境難以創(chuàng)設,而且題干和選項的選定非常主觀,提供的不一定是正確輸入,更不是真實的交流,考查不出考生語言理解能力。然而,多項選擇完型填空題的出現(xiàn),使這一現(xiàn)象得到了改善,將語言基礎知識的考查和語篇結合在一起,可以通過一個小題的回答綜合判斷學生多方面的能力,這也符合當時綜合測試法的觀點。綜合式測試主張通過一次測試全面評價被試總體語言水平,被試者需要綜合運用各種語言知識或技能。在此期間選擇題的使用空前廣泛,最高時占試卷總分的80%,除了對語法、閱讀能力的考查,還出現(xiàn)了單詞辨音、補全對話等形式。
4.選擇題的飛躍。97年閱讀理解增加了考察交際能力的選擇題,這標志著我國高考英語的發(fā)展進入了全新的階段,此時的高考不僅重視語篇及語言應用,更加重視學生交際能力的檢測,這與當時交際理論的盛行是密不可分的。理論上交際理論和選擇題是矛盾的,但語言測試專家Heaton[3]23認為選擇題與交際語言測試并非是非此即彼的關系,在很多交際測試中仍可限制性地使用此題型,特別是測試閱讀和聽力時。2000年,教育部考試中心在當年的4種高考試卷中,有3種試卷增加了聽力,雖然在這3種試卷中聽力所占的分值不同,但我們看到了國家對學生交際能力的重視。2003年高考英語聽力測試在全國普及,促進了基礎教育階段學生的聽力水平,因引入了聽力,高考去掉了沿用多年的單詞辨音這種20世紀中葉結構主義語言觀時流行的分立型間接測試題。2004年是我國高考歷史上改革幅度最大的一年。同往年相比,2004 年的試題更加突出語言的交際性,更加強調(diào)英語知識的靈活運用??梢哉f,2004年高考英語測試已成功地實行了從知識型向能力型的過渡,這也體現(xiàn)了后來高考英語命題的走向。到目前為止,高考英語考試中選擇題的題型基本趨于穩(wěn)定,只是由于聽力測試施考的難度較大,所以有些省市對聽力有不同的做法,仍有個別省份不考聽力,有些省份不把聽力成績計入總分,但未來的發(fā)展,聽力一定是高考口語考試中必不可少的一部分。
三、總結
作為標準化的測試題型,選擇題具有試題設計規(guī)范、試題答案唯一、可用機器閱卷等特點,被公認為是一種信度極高的考試題型,仍將是未來高考英語測試及其他測試中主要的題型之一。
參考文獻:
[1]胡春洞,王才仁.英語測試論[M].南寧:廣西教育出版社,1996.
數(shù)學診斷性測驗難度信度效度1引言
在基礎教育課程改革逐步完善的過程中,傳統(tǒng)測驗的局限性在新課程改革中猶為凸顯。單一的分數(shù)不能反映學生使用的認知成分或技能,也不能診斷出學生答錯題目的原因,更不能挖掘考試信息的深度。《基礎教育課程改革綱要(試行)》明確指出:“建立促進學生全面發(fā)展的評價體系。評價不僅要關注學生的學業(yè)成績,而且要發(fā)現(xiàn)和發(fā)展學生多方面的潛能,了解學生發(fā)展中的需求,幫助學生認識自我,建立自信。發(fā)揮評價的教育功能,促進學生在原有水平上的發(fā)展?!倍\斷性測驗(diagnostic test)是診斷性評價使用的工具,是運用測量手段,考查學生在學習上的困難而編制的一種測驗。一般在學期末或?qū)W期前,即實施新的教學計劃之前進行,目的是了解、評價、分析學生所具有的基礎知識基本技能掌握情況,以鑒別學生接受教學的能力并為補救教學提供參考。國內(nèi)外學者的研究為診斷測驗的編制與開發(fā)提供了許多理論與方法,從不同角度為診斷測驗編制做出了努力,值得參考借鑒。但這些研究提出的理論比較局限,不夠精準,實踐性欠佳,因此未能被廣泛推廣應用。
八年級數(shù)學是初中數(shù)學學習的關鍵,也是轉(zhuǎn)折點。這一階段學生知識掌握與否,直接影響他能否順利進入高中階段學習。本研究以義務教育新課程標準為依據(jù),編制八年級數(shù)學診斷性測驗,目的在于了解學生知識水平掌握情況,以鑒別學生能否順利進入九年級學習提供參考。同時,教師通過數(shù)學診斷性測驗,全面了解學生數(shù)學知識、能力等方面的基礎和發(fā)展狀況,以把握學生的學習起點,恰當?shù)卮_定教學目標,選擇教學策略,并通過診斷報告獲得有關學生數(shù)學學習情況的評價信息,掌握學生數(shù)學學習目標的達成情況和他們在數(shù)學學習中出現(xiàn)的問題和困難,以便有針對性地提出適應整體和個別需要的教學策略和措施,達到因材施教的目的,改進數(shù)學教學,提高學生的學習效果,并為其它研究人員進行更廣泛的診斷性教育研究提供測量工具和方法。
2研究方法
2.1測驗的編制
2.1.1測驗內(nèi)容的確定
本研究的內(nèi)容為八年級數(shù)學診斷性測驗,用團體施測的紙筆測驗形式。參考國內(nèi)外診斷性測驗的樣本,本測驗題型分為四選一的選擇題、填空題、計算題三大部分。以義務教育新課標準為依據(jù),并參照多位從事中學數(shù)學教學的一線教師經(jīng)驗選擇初步編制題本,一級目標10個,二級子目標63個,題目總數(shù)204。學生知識能力掌握情況分為三種水平。尚未掌握:是指不具備或不完全具備學習新知識的條件;基本掌握:是指已基本具備了學習新知識的條件;完全掌握:是指完全具備了學習新知識的條件。每個子目標的題目設置一般為三個,少部分5個。標準定為:題目設置為3個,3個全對則為完全掌握;2個全對,基本掌握;對1個或0個,則為尚未掌握。題目設置為5個,5個全對則為完全掌握;4個或3個全對,基本掌握;對2個或1個或0個,則為尚未掌握。選擇、填空題答對則滿分,否則0分,計算題按參考答案酌情給分,完全答對計滿分。
2.2測驗的實施
2.2.1預測
在贛州市信豐四中隨機選取了八年級一個班(60人)樣本,進行當堂施測,每次90分鐘,分10個時間段完成全部測驗?;厥沼行柧?0份。將難度系數(shù) 0.30以下和 0.95以上、區(qū)分度 0.19以下的試題刪除,并結合專家意見進行修改、增刪。測試題的二級子目標減少至53個,題目總數(shù)減至176個。
2.2.2正式施測
選取贛州市信豐四中剛升入九年級的三個班學生。1班60人,2班58人,3班60人。剔除無效問卷176份,回收有效問卷總計1574份。16、17章施測各為45分鐘,其它每章施測為90分鐘。
2.2.3統(tǒng)計方法
對數(shù)據(jù)采用SPSS20.0進行統(tǒng)計處理。
3結果
3.1難度分析
主觀題的難度用平均分除以滿分來表示。選擇題計算矯正難度系數(shù)CP。本研究把項目的難度分為五個等級,分別是小于0.20、0.20~0.39、0.40~0.59、0.60~0.79、大于0.80,對應的依次是最難、較難、中等、較易、最易。測驗難度以百分比或通過率表示,是等級量表,因此轉(zhuǎn)化成等距量表,查出Z分數(shù),Z分數(shù)就視為該題的標準難度。各分測驗的難度等級分布為:最難項目測驗13有2個,測驗11、14、15、16、18、19各有1個。最易項目測驗11、15、17各有2個,測驗13、16、18、19、20各有1個,測驗12有3個,測驗14有5個。1個分測驗試題難度分布在0.2~0.39之間,7個分測驗試題難度分布在0.4~0.59之間,分測驗12,14試題難度分布在0.6~0.79之間。各分測驗樣本難度分布在0.640~0.994之間。
3.2測驗項目區(qū)分度分析
鑒別度指數(shù)分為四個等級,小于0.20認為區(qū)分度很差,區(qū)分度尚可:0.20~0.29,區(qū)分度較好:0.30~0.39,區(qū)分度很好:大于0.40。各分測驗鑒別度指數(shù)分布0.47~0.62,即各分測驗項目區(qū)分度很好。
采用相關法對項目的區(qū)分度進行分析,分測驗以及總分的相關區(qū)分度見表1。
表1表明,十個分測驗與總分的相關在0.350~0.799之間,且均在0.01上顯著。與鑒別指數(shù)法所分析的各分測驗的區(qū)分度結果一致。
3.3信效度分析
采用克龍巴赫系數(shù)方法來估計測驗的內(nèi)部一致性系數(shù)。各分測驗的α系數(shù)在0.614~0.744之間,各分測驗間較同質(zhì)(表2)。
用測量標準誤對信度分析得到各分測驗的測量標準誤在1.496~2.145分測驗的測量標準誤均在三個標準差內(nèi),說明測驗信度較好。
本測驗編制按照八年級數(shù)學教學大綱,以義務教育新課程標準為依據(jù),從大量試題集中精選有代表性的題目編制成測驗試題,初步編制成題本后,還進行了一次小樣本施測,將難度系數(shù)0.30以下和0.95以上、區(qū)分度0.19以下的試題刪除。并請從事中學數(shù)學教學且有豐富教學經(jīng)驗的一線教師和數(shù)學教研員,結合相關教材、測驗目標、教學大綱,參考各教學單元時數(shù)的基礎就題本呈現(xiàn)的內(nèi)容、形式進行調(diào)整。最后,測驗的二級目標減少至53個,題目總數(shù)減至176。因此,整個過程保證了此測驗具有良好的內(nèi)容效度。
并用探索性因素分析對測驗結構進行了分析(表3)。
經(jīng)KMO統(tǒng)計量檢驗,各測驗的KMO在0.607~0.860,Bartlett' s球形檢驗結果在0.001水平顯著性。說明各分測驗適合用探索性因素分析。
以主成分法進行初始分析,采用方差最大化正交旋轉(zhuǎn)法,進行因素分析。測驗十一能得到兩個大于1的特征根,能解釋總變異的75.918%;測驗十二能得到兩個大于1的特征根,能解釋總變異的76.007%;測驗十三能得到兩個大于1的特征根,能解釋總變異的68.626%;測驗十四能得到兩個大于1的特征根,能解釋總變異的80.174%;測驗十五能得到兩個大于1的特征根,能解釋總變異的81.758%;測驗十六能得到一個大于1的特征根,能解釋總方差的67.006%;測驗十七能得到一個大于1的特征根,能解釋總方差的63.540%;測驗十八能得到兩個大于1的特征根能解釋總變異的73.181%;測驗十九能得到兩個大于1的特征根,能解釋總變異的67.206%。;測驗二十能得到兩個大于1的特征根能解釋總變異的64.008%。結果表明本測驗符合構想。
4討論
4.1測驗的內(nèi)容
診斷性測驗旨在運用測量手段,考查學生基礎知識掌握情況,所以測驗的編制必須配合學校的課程。本測驗編制以全日制義務教育數(shù)學課程標準為依據(jù),參照中學數(shù)學實驗教科書內(nèi)容編寫。對新舊版本教材進行比較研究。它們之間的內(nèi)容基本是相同的,主要是代數(shù)知識、幾何知識,只是內(nèi)容呈現(xiàn)的先后順序稍有不一致,這也為編制測驗時提供參考的依據(jù)。老版本的教材八年級才設置幾何知識教學;新版本的幾何知識在七年級就以生活中常見的圖形向?qū)W生加以介紹,這樣不僅易于學習,還能和實踐相結合。除此之外,新教材把統(tǒng)計和概率的初步知識以及推理知識也納入到課本中來。
本研究編制測驗的目的是診斷學生的基本技能、知識掌握情況。編制的數(shù)學診斷性測驗包括十個分測驗。分式、反比例函數(shù)由于在數(shù)學課程標準中規(guī)定掌握的知識點很少,在測驗中題量相對較少。實測時,因條件限制,只在一所中學選取研究對象。就代表性來看,范圍應該更廣泛些。從測驗結果分析,總測驗包含10個分測驗,每個分測驗題目在總測驗當中的量不能太大,測驗時間又有限制,題目代表性的問題在后續(xù)研究中尚需完善。
4.2測驗的項目分析
測驗的項目分析從主要是對項目難度、區(qū)分度等進行分析。理論上來說,項目難度值在0.5左右較好,但診斷性測驗旨在測查學生基礎知識掌握情況,試題難度小,則說明學生掌握良好,大則說明大部分學生沒掌握,因此對難度系數(shù)要求不高。從各分測驗結果來看,除了第20章平均難度系數(shù)為0.365,其它各章平均難度系數(shù)分布在0.509~0.804之間;從總測驗題量分析,最難的題目占總題量的4.5%,較少。大部分題目難度系數(shù)落在0.4~0.79之間,總測驗的難度系數(shù)為0.628??梢姕y驗題目屬于中等偏易,試題難度分布符合測驗要求。
項目區(qū)分度用鑒別指數(shù)法和相關法進行了分析。各分測驗的平均鑒別指數(shù)(D)在0.47~0.62之間,各分測驗中項目鑒別指數(shù)大于0.4的項目均占最大比重。區(qū)分度小于0.2的項目占總題量的10.2%。采用相關法對項目的區(qū)分度進行分析,區(qū)分度越高,越能將不同水平的被試區(qū)分開來。用相關法計算分測驗以及總分的相關區(qū)分度,十個分測驗的區(qū)分度都達到了非常顯著水平,區(qū)分度較好。從測驗區(qū)分度結果來看,試題總體達標。
4.3測驗的信效度分析
內(nèi)部一致性信度我們采用克龍巴赫系數(shù)。各分測驗的α系數(shù)在0.614~0.744之間,可見所測內(nèi)容較為一致。各分測驗的測量標準誤在1.496~2.145之間,總測驗的測量標準誤為1.267,都在3個標準差以內(nèi),說明測驗分數(shù)與真實分數(shù)之間的誤差比較小。從這兩種信度估計的結果來看,本測驗的信度系數(shù)比較高,測量標準誤比較小,符合測量學的計量標準。
在結構效度考察上,采用探索性因素分析,根據(jù)所得各分測驗的因素負荷矩陣,來評量問卷的結構是否符合。經(jīng)KMO統(tǒng)計量檢驗,各測驗的KMO在0.607~0.860,Bartlett's球形檢驗結果在0.001水平達到統(tǒng)計顯著性,說明適合做探索性因素分析。其中8個測驗都得到兩個大于1的特征根,2個測驗得到一個大于1的特征根,且解釋測驗的總變異都達到了50%以上。說明本測驗符合構想。
參考文獻:
[1]劉經(jīng)蘭,戴海琦.小學四年級數(shù)學診斷性測驗的編制與研究[J].心理學探新,2003,(3).
[2]孟瑛如,蘇肖好,簡吟文.澳門地區(qū)小學學生數(shù)學診斷測驗之建置與發(fā)展[J].特教論壇,1997,6(4):56-68.
[3]楊曉輝,張?zhí)m英.診斷性測驗在生物學概念教學中的應用[J].生物學通報,1992,(4).