Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Skip to main content
Computer Adaptive Multistage Testing (ca-MST), which take the advantage of computer technology and adaptive test form, are widely used, and are now a popular issue of assessment and evaluation. This study aims at analyzing the effect of... more
Computer Adaptive Multistage Testing (ca-MST), which take the advantage of computer technology and adaptive test form, are widely used, and are now a popular issue of assessment and evaluation. This study aims at analyzing the effect of different panel designs, module lengths, and different sequence of a parameter value across stages and change in b parameter range on measurement precision in ca-MST implementations. The study has been carried out as a simulation. MSTGen simulation software tool was used for that purpose. 5000 simulees derived from normal distribution (N (0,1)) were simulated. 60 different conditions (two panel designs (1-3-3; 1-2-2), three module lengths (10-15-20), 5 different a parameter sequences ("0.8; 0.8; 0.8"-"1.4; 0.8; 0.8"-"0.8;1.4; 0.8"-"0.8; 0.8;1,4"-"1.4; 1,4; 1.4") and two b parameter difference (small; large) conditions) were taken into consideration during analysis. Correlation, RMSE and AAD values of conditions were calculated. Conditional RMSE values corresponding to each ability level are given in a graph. Dissimilar to other studies in the literature, this study examines b parameter difference condition in three-stage tests and its interaction with a parameter sequence. Study results show that measurement precision increases as the number and length of the modules increase. Errors in measurement decrease as item discrimination values increase in all stages. Including items with a high value of item discrimination in the second or last stage contributes to measurement precision. In extreme ability levels, large difficulty difference condition produces lower error values when compared to small difficulty difference condition.
The aim of this research was to analyze and compare analytic rubric and general impression scoring in peer assessment. A total of 66 university students participated in the study and six of them were chosen as peer raters on a voluntary... more
The aim of this research was to analyze and compare analytic rubric and general impression scoring in peer assessment. A total of 66 university students participated in the study and six of them were chosen as peer raters on a voluntary basis. In the research, students were supposed to prepare a sample study within the scope of scientific research methods course and were also expected to present their studies in class. While the students were giving a presentation, their course instructor and peer raters conducted scoring, firstly by using the analytic rubric and subsequently by using general impressions. Collected data were analyzed using the Rasch model. Consequently, it was found that students were distinguished from one another at a highly reliable rate using both scoring methods. Additionally, it was discovered that the differences between students' ability levels were better revealed when analytic rubric was used. It was ascertained that there was a high level positive correlation between the ability estimations obtained from the scores performed by the peers and the instructor, regardless of the scoring method used. Finally, it was determined that ability estimations, corresponding peer raters' analytic rubric and general impression scoring, held a positive and highly strong relation.
Forming an item pool for computerized adaptive testing requires a long and demanding process that may be challenging, both in terms of time and cost. Therefore, one may come across such questions as 'How should an optimal item pool be?'... more
Forming an item pool for computerized adaptive testing requires a long and demanding process that may be challenging, both in terms of time and cost. Therefore, one may come across such questions as 'How should an optimal item pool be?' and/or 'How many items should exist in an item pool?' Although research with regard to the features to exist in an optimal item pool vary, there has been no consensus reached about how big the item pool size should be. In the current study, the effect of different item pool size and item distribution on ability estimation and item pool utilization was analysed. 36 different item pools were generated through SimulCAT software. Using 1,000 simulees, single session CAT environments were simulated and two different termination rules were used in the study. Findings of the study indicated that as the size of the item pool increased to a specific size, the precision of measurement increased and the number of unused items decreased. By examining the results according to b parameter, it was found that the effect of b parameter distribution over the results decreased.
Research Interests:
Research Interests:
Research Interests:
This study aims to establish a model proposal for solving problems in the use of performance tasks at the high school level. The study which adopted qualitative research method was planned in two stages. First, the problems faced by high... more
This study aims to establish a model proposal for solving problems in the use of performance tasks at the high school level. The study which adopted qualitative research method was planned in two stages. First, the problems faced by high school teachers (n = 40) using performance tasks were determined, and for the second stage the opinions of academicians (n = 8) related to the solution of the determined problems were consulted. Three stakeholders were identified in solving the problems identified during the first step of the study; those being the university, the Ministry of National Education (MoNE), and the teachers. Although the perceptions of the teachers' use of performance tasks in general were positive, it was seen that there problems were experienced in their application. Emphasis was placed on the importance of communication between the university, the MoNE and the teachers in order to overcome these problems. For the effective function of performance tasks, points such as diversity in classroom practices, attention to the characteristics of students and environmental conditions, and the use of rubrics were emphasised.
Research Interests:
This is a post-hoc simulation study which investigates the effect of different item difficulty distributions, sample sizes, and test lengths on measurement precision while estimating the examinee parameters in right and left-skewed... more
This is a post-hoc simulation study which investigates the effect of different item difficulty distributions, sample sizes, and test lengths on measurement precision while estimating the examinee parameters in right and left-skewed distributions. First of all, the examinee parameters were obtained from 20-item real test results for the right-skewed and left-skewed sample groups of 500, 1000, 2500, 5000, and 10000. In the second phase of the study, four different tests were formed according to the b parameter values: normal, uniform, left skewed and right skewed distributions. A total of 80 conditions were formed within the scope of this research by selecting 20-item and 30-item condition as the test length variable. In determining the measurement precision, the RMSE and AAD values were calculated. The results were evaluated in terms of the item difficulty distributions, sample sizes, and test lengths. As a result, in right-skewed examinee distribution, the highest measurement precision was obtained at the normal b distribution and the lowest measurement precision was obtained at the right skewed b distribution. A higher measurement precision was obtained in the 30-item test, however, it was observed that the change in the sample size didn't affect the measurement precision significantly in right-skewed examinee distribution. In the left skewed distribution, the highest measurement precision was obtained at the normal b distribution and the lowest measurement precision was obtained at the left-skewed b distribution. Also it was observed that the change in the sample size and test length didn't affect the measurement precision significantly in the left-skewed distribution.
Research Interests:
Öz Bu araştırmada öğretmen adaylarının öz-akran ve öğretmen değerlendirme-sine ilişkin görüşlerini ortaya çıkarmak amaçlanmıştır. Araştırma nitel araştırma yaklaşımına uygun olarak tasarlanmıştır. Araştırmanın çalışma grubunu bir devlet... more
Öz Bu araştırmada öğretmen adaylarının öz-akran ve öğretmen değerlendirme-sine ilişkin görüşlerini ortaya çıkarmak amaçlanmıştır. Araştırma nitel araştırma yaklaşımına uygun olarak tasarlanmıştır. Araştırmanın çalışma grubunu bir devlet üniversitesinde öğrenim gören 37 öğretmen adayı oluşturmaktadır. Araştırmada öğretmen adaylarının öz, akran ve öğretmen değerlendirmesine ilişkin görüşleri alınmıştır. Veri analiz yöntemi olarak içerik analizi kullanılmıştır. Araştırmanın bulgularına göre öz, akran ve öğretmen değerlendirmesinin üstün yanına ilişkin sırasıyla üç, dört, altı olmak üzere toplam on üç, sınırlı yanına ilişkin sırasıyla iki, üç, iki olmak üzere toplam yedi tane alt kategori belirlenmiştir. Abstract In this study, it was aimed to reveal the opinions of preservice teachers on self-,peer-and teacher assessments. Qualitative research design was used in this study. The study group of the research consisted of 37 preservice teachers at a public university. The preservice teachers' opinions about self, peer and teacher assessments were examined.Content analysis method was used to analyze data. According to the findings of the research, regarding the superior side of self, peer and teacher evaluation thirteen subcategories were determined and these categories was three, four and six, respectively. In relation to the limited side, seven subcategories were determined and these categories two, three and two, respectively.
Research Interests:
Bu araştırmanın amacı okul iklimi (öğretmenin odağı ve morali, okul iklimini etkileyen öğrenciyle ve öğretmenle ilişkili faktörler)ve kaynaklarının (okulun eğitimsel kaynaklarının kalitesi, fiziksel altyapının kalitesi) Türkiye’deki 15... more
Bu araştırmanın amacı okul iklimi (öğretmenin odağı ve morali, okul iklimini etkileyen öğrenciyle ve öğretmenle ilişkili faktörler)ve kaynaklarının (okulun eğitimsel kaynaklarının kalitesi, fiziksel altyapının kalitesi) Türkiye’deki 15 yaş grubu öğrencilerin PISA 2012 matematik okuryazarlığına etkisini incelemektir ve araştırma ilişkisel bir araştırmadır. Araştırmanın çalışma grubunu PISA 2012’ye Türkiye’den katılan 170 okul ve 4848 öğrenci oluşturmaktadır. Araştırma, PISA 2012 Türkiye uygulaması kapsamında 15 yaş grubundaki öğrencilere uygulanan matematik okuryazarlığı testi ve okul yöneticilerine uygulanan okul anketinden elde edilen veriler üzerinden yürütülmüştür. Veri analizinde robust maximum likelihood parametre kestirim yöntemine dayalı yol analizi ve LISREL 8.8 programı kullanılmıştır. Kurulan modelde en yüksek yol katsayının okul iklimiyle ilişkili öğretmen faktörleri indeksi ve okul iklimiyle ilişkili öğrenci faktörleri indeksi arasında olduğu; en düşük katsayının ise öğretmenin odağı indeksi ve okul iklimini etkileyen öğretmen faktörleri indeksi arasında olduğu gözlenmiştir ve tüm yol katsayıları pozitif ve anlamlı bulunmuştur. Ayrıca bu yol katsayılarının orta ve yüksek etki büyüklüğüne sahip olduğu görülmüştür. Modele ilişkin uyum indeksleri mükemmel uyuma işaret etmektedir. Bu bağlamda modele dayalı olarak okul iklimi ve okul kaynakları indekslerinin matematik okuryazarlığında etkili olduğu sonucuna varılmıştır.
Research Interests:
Bu çalışmada eğitim alanında geliştirilmiş ölçeklerin “ölçek geliştirme süreçlerinin” belirli ölçütler açısından incelenmesi amaçlanmıştır. Çalışma kapsamına 2010-2016 yılları arasında Türkiye’de eğitim alanında yayınlanmış olan 7... more
Bu çalışmada eğitim alanında geliştirilmiş ölçeklerin “ölçek geliştirme
süreçlerinin” belirli ölçütler açısından incelenmesi amaçlanmıştır.
Çalışma kapsamına 2010-2016 yılları arasında Türkiye’de eğitim alanında
yayınlanmış olan 7 dergideki 72 makale dâhil edilmiştir. Makalelerin
incelenmesinde “Ölçek Geliştirme Süreci Kontrol Formu” kullanılmıştır.
Elde edilen bulgulara göre; makalelerde ölçülen yapının kuramsal temelleri tanımlanmakta ve ölçme aracının amacı belirtilmektedir. Ölçek maddelerin yazılma sürecinde kaynak tarama sıklıkla tercih edilirken neredeyse tüm çalışmalarda konu alanı uzmanlarından uzman görüşüne başvurulmuştur. Madde havuzu oluşturulurken olumsuz maddelere yer verildiği belirtilen makale sayısı az olmakla birlikte, hiçbir makalede kontrol maddelerine yer verilmesiyle ilgili bilgiye rastlanmamıştır. Yapı geçerliğinin belirlenmesinde AFA ve DFA genellikle beraber kullanılırken ölçüt geçerliği neredeyse hiç incelenmemiştir. Güvenirliğin kestirilmesinde ise tüm çalışmalarda iç tutarlılık anlamında güvenirlik belirlenirken, katsayı olarak ise Cronbach α katsayısı tercih edilmiştir
Research Interests:
Giftedness/talentedness is one of the areas that is not fully defined yet, and its meaning and scope are highly debated in parallel with the concept of intelligence. Discussions about how gifted-ness/talentedness can be conceptualized,... more
Giftedness/talentedness is one of the areas that is not fully defined yet, and its meaning and scope are highly debated in parallel with the concept of intelligence. Discussions about how gifted-ness/talentedness can be conceptualized, identified, supported and predicted are still ongoing. The concept of giftedness/talentedness and the initial studies on the education of talented and gifted pupils seem to extend to Plato. In this study, firstly the definitions of leading names in the field about giftedness were examined and then field-specific terms were tried to be described. Many documents especially The Constitution of Turkish Republic, laws, decree laws, by laws, circulars and the Convention on the Rights of the Child have been examined in relation to the topic. In terms of the practices in the field of education, the Ottoman Empire period was briefly reviewed and information about the practices in Turkey was given. As a result, despite all the work mentioned, it has been found that there are various problems in the education of gifted and talented children and in supporting their skills. In order to solve the problems experienced by talented and gifted children in Turkey, it is necessary to develop a government policy regarding the education of talented and gifted children.
Research objective is comparing the objective methods often used in literature for determination of differential item functioning (DIF) and the subjective method based on the opinions of the experts which are not used so often in... more
Research objective is comparing the objective methods often used in literature for determination of differential item functioning (DIF) and the subjective method based on the opinions of the experts which are not used so often in literature. Mantel-Haenszel (MH), Logistic Regression (LR) and SIBTEST are chosen as objective methods. While the data of an extensive examination in Turkey applied for objective methods, the data that are obtained from Expert Opinions Form used to evaluate the items of the same examination. The data obtained from 5077 female and 5271 male students are used for the objective methods, and 23 experts' opinions are used for subjective method. The concordance between the objective and subjective methods is calculated by using the compatibility rate and Cohen's kappa coefficient in the research. While the highest concordance related to the existence of DIF is obtained between MH and SIBTEST methods (.90; κ=0,79) and the lowest concordance is between LR and SIBTEST methods (.75; κ=0,50) in objective methods, When the concordance of the objective method with the subjective methods is examined, at least moderate concordance (.75; κ=0,47) is obtained in the decision. When items which have DIF is examined according to DIF level, three items indicate low level of DIF and one item indicates moderate or high level of DIF for both methods. In addition, in subjective method, a decision study is made on the number of the experts presenting opinion within the generalizability theory and the acceptable reliability value is reached with 13 experts' opinions.
ÖZET Bireyselleştirilmiş testlerde, geleneksel testlerden farklı olarak test algoritması söz konusudur. Test algoritması; teste başlama, devam etme ve testi sonlandırma olmak üzere üç bölümden oluşmaktadır. Bu çalışmanın amacı,... more
ÖZET Bireyselleştirilmiş testlerde, geleneksel testlerden farklı olarak test algoritması söz konusudur. Test algoritması; teste başlama, devam etme ve testi sonlandırma olmak üzere üç bölümden oluşmaktadır. Bu çalışmanın amacı, bireyselleştirilmiş bilgisayarlı test (BBT) uygulamalarında farklı sonlandırma kurallarının kullanılmasının ölçme kesinliğine ve test uzunluğuna etkisini incelemek ve birbirleri ile karşılaştırmaktır. Araştırma simülasyon çalışması olarak yürütülmüştür. Araştırma kapsamında sabit uzunluk, standart hata, standart hata-en az madde, theta yakınsama ve theta yakınsama-en az madde olmak üzere beş farklı sonlandırma kuralı kullanılmıştır. Her bir sonlandırma kuralında farklı koşullar söz konusu olup toplam 12 koşul birbiriyle karşılaştırılmıştır. Ayrıca sonlandırma kurallarının karşılaştırılmasında BBT'de test algoritmasında önemli yere sahip olan farklı madde havuzu büyüklükleri (250 ve 500 madde) ve yetenek kestirim yöntemleri (Maksimum Olabilirlik Kestirimi ve Beklenen Sonsal Dağılım) seçilmiştir. Her bir BBT uygulamasında ölçme kesinliği için RMSE, yanlılık ve 1 Bu makale aynı başlıklı doktora tezinden üretilmiştir.
In this study, it is aimed to examine the effect of classroom assessment on science and mathematics achievements. For this purpose, hierarchical linear modeling (HLM) is performed using variables of like learning science/maths, engage... more
In this study, it is aimed to examine the effect of classroom assessment on science and mathematics achievements. For this purpose, hierarchical linear modeling (HLM) is performed using variables of like learning science/maths, engage teaching in science/maths, confidence in science/ maths, and home resources for learning variables at the student level, and experience, education level, homework, and assessment at the teacher level. The sample of the study consists of 4th grade students who participated in TIMSS 2015 in Turkey. According to the findings; 36% of variance in science achievement, and 40% of variance in mathematics achievement are due to variability between classes. In a random coefficient model, all student variables were found to be statistically significant predictors of science and mathematics achievement. Among these variables, the greatest effect size is self-confidence variability. Only the teacher variables are added according to the Means as the outcome model; the teacher's experience and emphasis to national achievement tests of monitoring students' progress had a statistically significant effect on science and mathematics achievement. Finally, according to the intercept and slopes of the outcomes model, the most important variable is the emphasis to national achievement tests of monitoring students' progress in both science and mathematics.
Research Interests:
This study analyses peer assessment through many facet Rasch model (MFRM). The research was performed with 91 undergraduate students and with lecturer teaching the course. The research data were collected with holistic rubric employed by... more
This study analyses peer assessment through many facet Rasch model (MFRM). The research was performed with 91 undergraduate students and with lecturer teaching the course. The research data were collected with holistic rubric employed by 6 peers and the lecturer in rating the projects prepared by 85 students taking the course. This study analyses raters, measurements for students who are rated, criteria used in rating and extent to which rubrics fulfil their function. Moreover, it also investigates effects of peers' levels of achievement on the process. In consequence, it was found that raters differed in the levels of strictness and generosity in rating, and that students were distinguished adequately in terms of the property measured. Besides, a very high level of reliability value was estimated in relation to the criteria in the study. This was interpreted as that they functioned in a reliable way in distinguishing between students' performances. It was found in the analyses of achievement levels of peers taking part in peer assessment that ratings made by students with high levels of achievement differed significantly from those made by students with medium or low level of achievement. Finally, the views about peer assessment were generally positive. Keywords: peer assessment, many facet Rasch model, levels of peer achievement, rubric
ÖZET: Bu çalmada, " Newton'un Hareket Yasalar " ünitesinde örencilerin baarlar ölçmek için kullanlan kavram haritas ve yaplandlm gridin geçerlik ve güvenirlikleri aralmr. Çalma grubunu, 2009-2010 öretim nda Fen Bilgisi Öretmenlii ve Fizik... more
ÖZET: Bu çalmada, " Newton'un Hareket Yasalar " ünitesinde örencilerin baarlar ölçmek için kullanlan kavram haritas ve yaplandlm gridin geçerlik ve güvenirlikleri aralmr. Çalma grubunu, 2009-2010 öretim nda Fen Bilgisi Öretmenlii ve Fizik Öretmenlii program 1. sfta okuyan 102 örenci oluturmaktadr. Kavram haritas ve yaplandlm gridin geçerlii için ölçüt olarak ayn konuda gelitirilen ksa cevapl bir test kullanlmr. Kavram haritasndan ve ksa cevapl testten elde edilen puanlar arasndaki Pearson korelasyon katsay 0.57 bulunmutur (p<0.05). Kavram haritasn iç tutarlk anlamnda güvenirlik katsay olan Cronbach alfa katsay 0.69'dur. Yaplandlm gridden elde edilen puanlar ile ksa cevapl testten elde edilen puanlar arasndaki iliki 0.69'dur (p<0.05). Yaplandlm gridin güvenirlii için Cronbach alfa katsay hesaplanm ve 0.77 bulunmutur. Kavram haritas ve yaplandlm grid arasnda pozitif yönde, orta düzeyde ve anlaml bir iliki olduu görülmütür (0.51; p<0.05). Anahtar sözcükler: kavram haritas, yaplandlm grid, tamamlay ölçme araçlar, geçerlik, güvenirlik ABSTRACT: This study aims to research on the validity and reliability of concept maps and structured communication grids used to assess students' achievement regarding the unit called " Newton's Laws of Motion ". The sampling consisted of 102 students studying in their Year One at Science Teaching and Physics teaching departments during 2009 – 2010 academic year. The responses to the short-answer test consisted of the main measure in checking the validity of the concept map and the structured communication grid. The Pearson Correlation Coefficient between the scores of the short-answer test and the concept map was calculated to be 0.57. In order to find the reliability state of the concept map, the calculation concluded as 0.69. The degree of the relationship between structured communication grid and short answer test scores was calculated (0.69; p<0.05). For the reliability of the structured communication grid, Cronbach Alpha was calculated 0.77. A positive, medium level and significant relationship was observed between the structured communication grid and the concept map (0.51; p<0.05).
Research Interests:
In this study, the effectiveness of peer assessment, which has an important role in measurement and evaluation, was attempted to be defined. For this purpose, performance task, which is one of the alternative assessment techniques, was... more
In this study, the effectiveness of peer assessment, which has an important role in measurement and evaluation, was attempted to be defined. For this purpose, performance task, which is one of the alternative assessment techniques, was evaluated with the help of a scoring rubric prepared by the researchers. As a basic research, the working group was 41 sophomore students and their instructor. Three of 41 students were acted as rater and they rated their 38 peers' performances with the instructor. The analysis of the data was carried out by using fully crossed two-facet design (sxtxr) of generalizability theory in three steps: G-studies for peer and peers-instructor ratings and D-study for peer ratings. According to the results of the G studies, the reliability coefficient obtained from the peer ratings and peer-instructor ratings were quite high (0.86 and 0.82 respectively). According to the result of the D study of peer ratings, just two peer raters are enough for getting high reliability coefficient. With the help of the gained results, it is suggested that peer assessment, which is effective on learning and decision making processes of students, should be used more often in education systems.
Bu araştırmanın amacı PISA 2012 Türkiye örnekleminde matematiksel davranış ve matematik okuryazarlığını etkilediği düşünülen araçsal motivasyon, matematik benlik kavramı, matematik özyeterliği, matematik kaygısı, matematik ilgisi... more
Bu araştırmanın amacı PISA 2012 Türkiye örnekleminde matematiksel davranış ve matematik okuryazarlığını etkilediği düşünülen araçsal motivasyon, matematik benlik kavramı, matematik özyeterliği, matematik kaygısı, matematik ilgisi değişkenleri ile birlikte tanımlanan hibrit modeli test etmek ve modelin cinsiyet ve okul türü (genel lise, anadolu lisesi, meslek lisesi) açısından farklılaşıp farklılaşmadığını incelemektir. Bu doğrultuda yapılan ilişkisel araştırmanın evrenini PISA 2012’ye Türkiye’den katılan 4848 öğrenci, örneklemini ise Öğrenci Anketi’nin B formunu alan 15 yaş grubu 1441 öğrenci oluşturmaktadır. Araştırmada veri toplama aracı olarak PISA 2012 “Öğrenci Anketi-B formu” ve “Matematik Okuryazarlığı Testi” kullanılmıştır. Uyum indeksleri incelendiğinde ilk aşamada kurulan hibrit model ve her bir grup için model-veri uyumunun sağlandığı ve cinsiyet ile okul türü açısından modelin farklılaşmadığı görülmüştür. Ayrıca yol katsayıları incelendiğinde matematik okuryazarlığı değişkeninin en iyi yordayıcısının matematik özyeterliği olduğu ve matematiksel davranış değişkeninin en iyi yordayıcısının matematik ilgisi olduğu görülmüştür. Matematik özyeterliğinin matematik okuryazarlığını yordamada ve matematik ilgisinin ise matematiksel davranışı yordamada pozitif düzeyde büyük etkiye sahip olduğu gözlemlenmiştir. Araştırmanın sonucunda kurulan modelin matematiksel davranışın %44’ünü, matematik okuryazarlığının ise %39’unu açıkladığı görülmüştür.
Bu çalışmanın amacı eğitim alanında yapılmış ölçek uyarlama makalelerinin belirli ölçütler açısından incelenmesidir. Çalışmada 2005-2014 yılları arasında SSCI ve/veya ULAKBİM’de indekslenen 10 dergide yayınlanmış toplam 108 makale... more
Bu çalışmanın amacı eğitim alanında yapılmış ölçek uyarlama makalelerinin belirli ölçütler açısından incelenmesidir. Çalışmada 2005-2014 yılları arasında SSCI ve/veya ULAKBİM’de indekslenen 10 dergide yayınlanmış toplam 108 makale incelenmiştir. Makalelerin incelenmesinde araştırmacılar tarafından geliştirilen “Ölçek Uyarlama Süreci Kontrol Formu” kullanılmıştır.
Çalışmanın sonuçlarına göre; ölçek uyarlama çalışmalarında ölçme aracının amacının belirtildiği ve ölçülen yapının kuramsal temellerinin tanıtıldığı görülmüştür. Dilsel eşdeğerlik çalışmalarında genellikle geri çeviri yöntemi tercih edilirken, çevrilen hedef form genellikle sadece hedef gruba uygulanmıştır. Yapı geçerliğinin belirlenmesinde AFA ve DFA’nın araştırmaların çoğunda beraber kullanıldığı, ölçüt geçerliğinin ise genellikle incelenmediği sonucuna ulaşılmıştır. Uyarlanan ölçeğin güvenirliği hesaplanırken sıklıkla iç tutarlılık yöntemi tercih edilmiştir.
Çalışmaların bulgularında ise yapı geçerliğinin genellikle orijinal ölçek ile benzerlik gösterdiği, ölçekten madde çıkarıldığı durumlarda yerine yeni maddelerin önerilmediği görülmüştür.
This study aims at reviewing the articles written on scale adaptation in the field of education based on certain criteria. A total of 108 articles published in 10 journals indexed in SSCI and/or ULAKBIM during 2005–2014 were analyzed for this study. The “Scale Adaptation Process Check Form” developed by researchers was used in the analysis of the articles.
The results demonstrated that the purpose of the tools of measurement was stated and that the theoretical bases of the structures to be measured were described in the studies of scale adaptation. Conversely, in studies of linguistic equivalence, while the back translation method was normally used, the translated target forms were usually administered only to the target groups. It was concluded that the EFA and CFA were used in combination in most of the studies for determining the construct validity, whereas the criterion validity was not studied generally. The method of internal consistency was usually preferred in calculating the reliability of the scale adapted.
It was observed that the construct validity was generally similar to the one in the original scale, and that when an item was removed from the scale, no item was recommended as replacement for the removed item.
Research Interests:
Öz Bu araştırmanın amacı, öğretmen adaylarının değerlendirilme tercihlerinin sıralama yargılarına dayalı olarak ölçeklendirilmesi yöntemiyle belirlenmesidir. Çalışmada veri toplama aracı olarak, eğitim fakültesi öğrencilerinin... more
Öz Bu araştırmanın amacı, öğretmen adaylarının değerlendirilme tercihlerinin sıralama yargılarına dayalı olarak ölçeklendirilmesi yöntemiyle belirlenmesidir. Çalışmada veri toplama aracı olarak, eğitim fakültesi öğrencilerinin başarılarının değerlendirilmesinde tercih ettikleri ölçme araçlarını belirlemeye yönelik geliştirilen araç kullanılmıştır. Bu araç ile öğretmen adaylarının sekiz tane ölçme aracına ilişkin tercihlerini belirtmeleri istenmiştir. Araştırmaya, 2010-2011 öğretim yılı güz döneminde Hacettepe Üniversitesi Eğitim Fakültesi'nin beş farklı bölümünde öğrenim gören 163 öğrenci katılmıştır. Araştırma sonuçlarına göre öğretmen adaylarının en çok doğru-yanlış testlerini, en az ise performans görevlerini tercih ettikleri belirlenmiştir. Sonuçlar daha detaylı incelendiğinde ise geleneksel yaklaşımların tamamlayıcı yaklaşımlara göre daha üst sıralarda tercih edildiği bulgusuna ulaşılmıştır. Anahtar Kelimeler: değerlendirme tercihleri, ölçme araçları, ölçekleme, sıralama yargıları yöntemi Abstract The aim of this study is to determine the measurement tool preferences of pre-service teachers for the evaluation of their achievement via sorting judgments scaling method. In the study, an instrument was developed and used to collect data about the education faculty students' assessment preferences. By using this instrument, pre-service teachers were asked to state their assessment preferences among the eight measurement tools given to them. The sample of the study was 163 pre-service students from five different departments of Faculty of Education of Hacettepe University in 2010-2011 academic year. According to the results of the study, it was concluded that the true-false test were the most preferred tools; on the other hand, performance tasks were the least preferred ones. When the results of the study examined deeply, it was found that the classical measurement tools were preferred more than the alternative tools.
Research Interests:
ÖZ: Bu çalışmanın amacı, Türkiye'deki 15 yaş öğrencilerinin Uluslararası Öğrenci Başarı Belirleme Programındaki (PISA) okuma becerisini etkilediği düşünülen öğrenme stratejilerinin incelenmesidir. Çalışmada öğrenme stratejileri arasında;... more
ÖZ: Bu çalışmanın amacı, Türkiye'deki 15 yaş öğrencilerinin Uluslararası Öğrenci Başarı Belirleme Programındaki (PISA) okuma becerisini etkilediği düşünülen öğrenme stratejilerinin incelenmesidir. Çalışmada öğrenme stratejileri arasında; keşfetme, kontrol ve ezberleme stratejileri yer almaktadır. Bu değişkenler yapısal eşitlik modeli analizlerinde kullanılmıştır. Çalışma kapsamında oluşturulan model için elde edilen analiz çıktıları, standart değerlerden yola çıkılarak uyum iyiliği değerleri bakımından karşılaştırılmış ve model-veri uyumunun sağlandığı görülmüştür. Araştırma sonuçlarına göre keşfetme, kontrol ve ezberleme stratejileri değişkenleri ve okuma becerisine ait başarı değişkeni arasındaki ilişkilerin tümü anlamlı çıkmış olup bu değişkenler okuma becerisi başarısının %30'unu açıklamıştır. Anahtar sözcükler: uluslararası öğrenci başarı belirleme programı (PISA), okuma becerisi, öğrenme stratejileri, yapısal eşitlik modeli (YEM) ABSTRACT: The purpose of this study is to investigate the learning strategies that affect reading literacy of 15-year-old Turkish students in Programme for International Student Assessment (PISA). Elaboration, control, and memorization strategies are defined as learning strategies. These variables are used to conduct structural equation modeling. In the study, the designed model's goodness of fit indexes are good enough according to standard values of fit indexes. According to research results, all the relations between elaboration, control, and memorization strategies and reading literacy are meaningful. The findings of the study indicate that 30% of the reading literacy could be explained by these observed variables. Keywords: programme for international student assessment (PISA), reading literacy, learning strategies, structural equation modeling (SEM) 1. GİRİŞ Bilim ve teknolojideki gelişmeler bireylerde olması beklenen nitelikleri hızla değiştirmektedir. Bu niteliklere temel oluşturacak beceriler ise büyük bir oranda eğitim sürecinde kazandırılabilir. Bu kazanımları belirleyebilmek adına ülkeler ulusal boyutta yürüttükleri öğrenci başarısı belirleme çalışmalarını uluslararası boyutta da sürdürmek, kendi öğrencilerinin başarı düzeylerini ve eğitim sistemini diğer ülkelerin verileri ile karşılaştırarak güçlü ve iyileştirmeye açık yönlerini belirlemek için uluslararası çalışmalara katılmaktadırlar. Bu çalışmalardan biri de Uluslararası Öğrenci Değerlendirme Programı'dır (The Programme for International Student Assessment– PISA). Ekonomik İşbirliği ve Kalkınma Teşkilâtı (Organization for Economic CoOperation and Development-OECD) tarafından düzenlenen PISA, öğrencilerin, okuma becerileri, matematik ve fen okuryazarlığı alanlarındaki bilgi ve becerilerinin değerlendirildiği uluslararası büyük çaplı eğitim araştırmalarından biridir. Üç yılda bir yapılan bu araştırmayla, OECD üyesi ülkeler ve diğer katılımcı ülkelerdeki (dünya ekonomisinin yaklaşık olarak %90'ı) 15 yaş grubu öğrencilerin modern toplumda yerlerini alabilmeleri için gereken temel bilgi ve becerilere ne ölçüde sahip oldukları değerlendirilmektedir (MEB, 2010). PISA projesinde her dönem okuma becerileri, matematik ve fen okuryazarlığı alanlarından sadece birine temel alan olarak ağırlık verilmektedir. Bununla birlikte, diğer iki alan da yapılan
Research Interests:
Ölçme ve değerlendirme yöntemlerinin sınıf içi uygulamalarda etkili biçimde kullanılması, büyük ölçüde öğretmenlerin bu konudaki bilgi ve yeterliliğine bağlıdır. Bu nedenle öğretmen adaylarının bu konudaki bilgi ve yeterliliklerinin... more
Ölçme ve değerlendirme yöntemlerinin sınıf içi uygulamalarda etkili biçimde kullanılması, büyük ölçüde öğretmenlerin bu konudaki bilgi ve yeterliliğine bağlıdır. Bu nedenle öğretmen adaylarının bu konudaki bilgi ve yeterliliklerinin incelenmesi önem taşımaktadır. Bu çalışmada; üniversitelerin ilköğretim bölümleri ile ortaöğretim fen ve matematik alanlar eğitimi bölümlerinde öğrenim görmekte olan öğrencilerin ölçme ve değerlendirme yaklaşımlarına ilişkin yeterlilikleri incelenmiştir. Bu amaçla öğretmen adaylarına, ölçme ve değerlendirme yöntemleri hazırlama, uygulama ve puanlaması hakkındaki yeterliklerini sorgulayan bir anket uygulanarak, yeterlikleri belirlenmiştir. Elde edilen sonuçlara göre; öğretmen adaylarının yeni uygulanmaya başlanan ölçme yöntemlerine ilişkin yeterlik algılarının geleneksel yöntemlere göre daha düşük olduğu tespit edilmiştir.
Measurement and evaluation methods are effectively used in classroom practices that largely depend on teachers " knowledge and competence on this issue. For this reason, the investigation of pre-services teachers " knowledge and competence are critically important in this respect. In this study, the research group are the students studying primary departments and secondary education in science and mathematics education departments at universities, their attitudes to measurement and evaluation are examined. For this purpose, the pre-service teachers " competencies have been identified by the way of conducting a survey that questions about their proficiency perception of the preparation methods of measurement and evaluation, application and grading. It is indicated that proficiency perceptions of pre-service teachers on modern measurement methods are more distant in accordance with the classical methods according to the research results.
Research Interests: