Principes de base de la théorie classique des tests. Bases des tests

Description de la présentation par diapositives individuelles :

1 diapositive

Description de la diapositive :

2 diapositives

Description de la diapositive :

Les qualités physiques sont généralement appelées qualités morphofonctionnelles congénitales (héréditaires), grâce auxquelles l'activité humaine physique (exprimée matériellement) est possible, qui reçoit sa pleine manifestation dans une activité motrice ciblée. Les principales qualités physiques sont la force, la vitesse, l’endurance, la flexibilité et l’agilité.

3 diapositives

Description de la diapositive :

Les capacités motrices sont des caractéristiques individuelles qui déterminent le niveau des capacités motrices d'une personne (V.I. Lyakh, 1996). La base des capacités motrices d’une personne réside dans les qualités physiques, et la forme de manifestation est constituée par les capacités et les compétences motrices. Les capacités motrices comprennent la force, la vitesse, la force-vitesse, les capacités de coordination motrice, l'endurance générale et spécifique.

4 diapositives

Description de la diapositive :

Schéma de systématisation des capacités physiques (motrices) Capacités physiques (motrices) Conditionnelle (énergie) Force Combinaisons de capacités de conditionnement Endurance Vitesse Flexibilité Coordination (informations) CS liées à des groupes individuels d'actions motrices, CS spéciales CS spécifiques Combinaisons de capacités de coordination Combinaisons de capacités de conditionnement et de coordination

5 diapositives

Description de la diapositive :

VOUS POUVEZ OBTENIR DES INFORMATIONS PRÉCISES SUR LE NIVEAU DE DÉVELOPPEMENT DES CAPACITÉS MOTRICES /élevé, moyen, faible/ À L'AIDE DE TESTS /ou d'exercices de contrôle/.

6 diapositives

Description de la diapositive :

A l'aide de tests de contrôle (tests), il est possible d'identifier des indicateurs absolus (explicites) et relatifs (cachés, latents) de ces capacités. Les indicateurs absolus caractérisent le niveau de développement de certaines capacités motrices sans tenir compte de leur influence les unes sur les autres. Des indicateurs relatifs permettent de juger de la manifestation des capacités motrices en tenant compte de cette influence.

7 diapositives

Description de la diapositive :

Les capacités physiques mentionnées ci-dessus peuvent être représentées comme existant potentiellement, c'est-à-dire avant le début de toute activité motrice ou activité (elles peuvent être appelées capacités potentielles) et comme se manifestant réellement au début (y compris lors de la réalisation de tests moteurs) et dans le processus d'exécution de ces activités (capacités physiques actuelles).

8 diapositives

Description de la diapositive :

Avec un certain degré de convention, on peut parler de capacités physiques ÉLÉMENTAIRES et de capacités physiques COMPLEXES.

Diapositive 9

Description de la diapositive :

LES RÉSULTATS DE LA RECHERCHE PERMETTENT DE DISTINCTER LES APTITUDES PHYSIQUES SUIVANTES SPÉCIFIQUES SPÉCIFIQUES KS GÉNÉRALES

10 diapositives

Description de la diapositive :

Les capacités physiques particulières font référence à des groupes homogènes d'actions ou d'activités motrices intégrales : course, acrobatie et exercices de gymnastique sur des projectiles, lancer des actions motrices, jeux sportifs(basket-ball, volley-ball).

11 diapositive

Description de la diapositive :

Nous pouvons parler de manifestations spécifiques des capacités physiques en tant que composants qui constituent leur structure interne.

12 diapositives

Description de la diapositive :

Ainsi, les principales composantes des capacités de coordination d’une personne sont : la capacité de naviguer, d’équilibrer, de réagir, de différencier les paramètres de mouvement ; capacité de rythme, réarrangement des actions motrices, stabilité vestibulaire, relaxation musculaire volontaire. Ces capacités sont spécifiques.

Diapositive 13

Description de la diapositive :

Les principaux composants de la structure des capacités de vitesse sont considérés comme la vitesse de réponse, la vitesse d'un seul mouvement, la fréquence des mouvements et la vitesse manifestée dans les actions motrices intégrales.

Diapositive 14

Description de la diapositive :

Les manifestations des capacités de force comprennent : la force statique (isométrique), la force dynamique (isotonique) - force explosive et absorbant les chocs.

15 diapositives

Description de la diapositive :

La structure de l'endurance est très complexe : aérobie, nécessitant des sources d'oxygène pour sa manifestation ; anaérobie (sources d'énergie glycolytique, créatine phosphate - sans participation d'oxygène); endurance de divers groupes musculaires dans des poses statiques - endurance statique ; endurance dans des exercices dynamiques effectués à une vitesse de 20 à 90 % du maximum.

16 diapositives

Description de la diapositive :

Les manifestations (formes) de flexibilité sont moins complexes, où l'on distingue flexibilité active et passive.

Diapositive 17

Description de la diapositive :

Les capacités physiques générales doivent être comprises comme les capacités potentielles et réalisées d'une personne, qui déterminent sa volonté d'effectuer avec succès des actions motrices d'origines et de significations diverses. Les capacités physiques particulières sont les capacités d’une personne qui déterminent sa capacité à réaliser avec succès des actions motrices d’origine et de signification similaires. Par conséquent, les tests fournissent principalement des informations sur le degré de formation de capacités physiques particulières et spécifiques (vitesse, coordination, force, endurance, flexibilité).

18 diapositives

Description de la diapositive :

Les capacités physiques particulières sont les capacités d’une personne qui déterminent sa capacité à réaliser avec succès des actions motrices d’origine et de signification similaires. Par conséquent, les tests fournissent principalement des informations sur le degré de formation de capacités physiques particulières et spécifiques (vitesse, coordination, force, endurance, flexibilité).

Diapositive 19

Description de la diapositive :

Les objectifs des tests sont d'identifier les niveaux de développement des capacités de conditionnement et de coordination, d'évaluer la qualité de la préparation technique et tactique. Sur la base des résultats des tests, vous pouvez : comparer l'état de préparation d'étudiants individuels et de groupes entiers vivant dans différentes régions et pays ; procéder à une sélection sportive pour la pratique de l'un ou l'autre sport, pour la participation à des compétitions ; exercer un contrôle largement objectif sur l'éducation (la formation) des écoliers et des jeunes sportifs ; identifier les avantages et les inconvénients des moyens utilisés, des méthodes pédagogiques et des formes d'organisation des cours ; enfin, justifier les normes (par âge, individuelles) pour la condition physique des enfants et des adolescents.

20 diapositives

Description de la diapositive :

Parallèlement aux tâches ci-dessus dans la pratique différents pays les objectifs des tests se résument à ce qui suit : apprendre eux-mêmes aux écoliers à déterminer leur niveau de forme physique et à planifier eux-mêmes les complexes nécessaires exercice physique; inciter les élèves à améliorer davantage leur condition physique (forme) ; connaître non pas tant le niveau initial de développement de la capacité motrice, mais comment il évolue au fil du temps certaine heure; encourager les étudiants qui ont obtenu des résultats élevés, mais pas tant pour un niveau élevé, mais pour une augmentation planifiée des résultats personnels.

21 diapositives

Description de la diapositive :

Un test est une mesure ou un test effectué pour déterminer la capacité ou l'état d'une personne.

22 diapositives

Description de la diapositive :

Seuls les tests (échantillons) qui répondent à des exigences particulières peuvent être utilisés comme tests : le but de l'utilisation de tout test (ou tests) doit être déterminé ; Une méthodologie de mesure et une procédure de test standardisées doivent être développées ; il est nécessaire de déterminer la fiabilité et le contenu informatif des tests ; les résultats des tests peuvent être présentés dans le système d'évaluation approprié

Diapositive 23

Description de la diapositive :

Test. Essai. Résultat des tests Le système d'utilisation des tests conformément à la tâche, l'organisation des conditions, l'exécution des tests par sujets, l'évaluation et l'analyse des résultats est appelé test. La valeur numérique obtenue lors des mesures est le résultat d'un test (test).

24 diapositives

Description de la diapositive :

Les tests utilisés en éducation physique sont basés sur des actions motrices (exercices physiques, tâches motrices). De tels tests sont appelés tests de mouvement ou tests moteurs.

25 diapositives

Description de la diapositive :

Il existe une classification connue des tests selon leur structure et, selon leurs indications principales, on distingue les tests simples et complexes. Un seul test est utilisé pour mesurer et évaluer un trait (capacité de coordination ou de conditionnement).

26 diapositives

Description de la diapositive :

Diapositive 27

Description de la diapositive :

À l'aide d'un test complexe, plusieurs signes ou composantes de capacités différentes ou identiques sont évalués. par exemple, sauter d'un endroit (avec un mouvement des bras, sans un mouvement des bras, jusqu'à une hauteur donnée).

28 diapositives

Description de la diapositive :

Diapositive 29

Description de la diapositive :

Les TESTS peuvent être des tests de conditionnement pour évaluer les capacités de force et l'endurance ; évaluer les capacités de vitesse; pour évaluer la flexibilité, des tests de coordination pour évaluer les capacités de coordination liées aux groupes indépendants actions motrices qui mesurent les capacités spéciales de coordination ; pour évaluer des capacités de coordination spécifiques - capacité d'équilibre, orientation spatiale, réponse, différenciation des paramètres de mouvement, rythme, réarrangement des actions motrices, coordination (communication), stabilité vestibulaire, relaxation musculaire volontaire).

30 diapositives

Description de la diapositive :

Chaque classification est une sorte de lignes directrices pour sélectionner (ou créer) le type de tests le plus cohérent avec les tâches de test.

31 diapositives

Description de la diapositive :

CRITÈRES DE QUALITÉ POUR LES TESTS AUTOMOBILES La notion de « test moteur » atteint son objectif lorsque le test satisfait aux critères de base pertinents : fiabilité, stabilité, équivalence, objectivité, caractère informatif (validité), ainsi qu'à des critères supplémentaires : standardisation, comparabilité et économie. Les tests qui répondent aux exigences de fiabilité et de contenu informatif sont dits bons ou authentiques (fiables).

32 diapositive

Description de la diapositive :

La fiabilité d'un test fait référence au degré de précision avec lequel il évalue une capacité motrice spécifique, quelles que soient les exigences de la personne qui l'évalue. La fiabilité est la mesure dans laquelle les résultats sont cohérents lorsque les mêmes personnes sont testées à plusieurs reprises dans les mêmes conditions ; est la stabilité ou la durabilité du résultat du test d'un individu lorsqu'il est répété exercice de contrôle. En d'autres termes, un enfant dans un groupe de matières, sur la base des résultats de tests répétés (par exemple, performances de saut, temps de course, distance de lancer), conserve systématiquement sa place dans le classement. La fiabilité du test est déterminée à l'aide d'une analyse statistique de corrélation en calculant le coefficient de fiabilité. Dans ce cas, ils utilisent différentes manières, sur la base duquel la fiabilité du test est jugée.

Diapositive 33

Description de la diapositive :

La stabilité du test repose sur le rapport entre la première et la deuxième tentative, répétées après un certain temps dans les mêmes conditions par le même expérimentateur. La méthode de tests répétés pour déterminer la fiabilité est appelée retest. La stabilité du test dépend du type de test, de l’âge et du sexe des sujets, ainsi que de l’intervalle de temps entre le test et le retest. Par exemple, les performances aux tests de conditionnement ou caractéristiques morphologiquesà de courts intervalles de temps, ils sont plus stables que les résultats des tests de coordination ; chez les enfants plus âgés, les résultats sont plus stables que chez les plus jeunes. Un nouveau test est généralement effectué au plus tard une semaine plus tard. À des intervalles plus longs (par exemple, après un mois), la stabilité même de tests tels que la course de 1 000 m ou le saut en longueur debout devient sensiblement inférieure.

Diapositive 34

Description de la diapositive :

Équivalence des tests L'équivalence des tests est la corrélation du résultat du test avec les résultats d'autres tests du même type. Par exemple, lorsqu'il faut choisir quel test reflète le mieux les capacités de vitesse : courir 30, 50, 60 ou 100 m. L'attitude envers les tests équivalents (homogènes) dépend de nombreuses raisons. S'il est nécessaire d'augmenter la fiabilité des évaluations ou des conclusions de l'étude, il est alors conseillé d'utiliser deux ou plusieurs tests équivalents. Et si la tâche est de créer une batterie contenant un minimum de tests, alors un seul des tests équivalents doit être utilisé. Comme indiqué, une telle batterie est hétérogène, car les tests qu'elle contient mesurent différentes capacités motrices. Un exemple de batterie hétérogène de tests est la course de 30 m, la traction, le virage avant et la course de 1 000 m.

35 diapositives

Description de la diapositive :

La fiabilité des tests est également déterminée en comparant les scores moyens des tentatives paires et impaires incluses dans le test. Par exemple, la précision moyenne des tirs cadrés de 1, 3, 5, 7 et 9 tentatives est comparée à la précision moyenne des tirs de 2, 4, 6, 8 et 10 tentatives. Cette méthode d'évaluation de la fiabilité est appelée méthode de doublement, ou division. Il est utilisé principalement lors de l'évaluation des capacités de coordination et dans le cas où le nombre de tentatives qui constituent le résultat du test est d'au moins six.

36 diapositive

Description de la diapositive :

Sous l'objectivité (cohérence) du test L'objectivité (cohérence) du test s'entend comme le degré de cohérence des résultats obtenus sur les mêmes sujets par différents expérimentateurs (enseignants, juges, experts). Pour augmenter l'objectivité des tests, il est nécessaire de respecter les conditions de test standards : heure, lieu, météo; support matériel et matériel unifié ; facteurs psychophysiologiques (volume et intensité de charge, motivation) ; présentation des informations (énoncé verbal précis de la tâche de test, explication et démonstration). C'est ce qu'on appelle l'objectivité du test. Ils parlent également d'objectivité interprétative, qui concerne le degré d'indépendance dans l'interprétation des résultats des tests par différents expérimentateurs.

Diapositive 37

Description de la diapositive :

En général, comme le notent les experts, la fiabilité des tests peut être augmentée de diverses manières : une standardisation plus stricte des tests, une augmentation du nombre de tentatives, la meilleure motivation matières, une augmentation du nombre d'évaluateurs (juges, experts), une augmentation de la cohérence de leurs avis et une augmentation du nombre d'épreuves équivalentes. Il n'existe pas de valeurs fixes pour les indicateurs de fiabilité des tests. Dans la plupart des cas, les recommandations suivantes sont utilisées : 0,95 - 0,99 - excellente fiabilité ; 0,90 -- 0,94 -- bon ; 0,80 -- 0,89 -- acceptable ; 0,70 - 0,79 - mauvais ; 0,60 - 0,69 - douteux pour les évaluations individuelles, le test ne convient que pour caractériser un groupe de sujets.

Diapositive 38

Description de la diapositive :

La validité d'un test est le degré de précision avec lequel il mesure la capacité motrice ou l'habileté évaluée. Dans la littérature étrangère (et nationale), au lieu du mot « caractère informatif », le terme « validité » est utilisé (de l'anglaisvalidité - validité, validité, légalité). En fait, lorsqu'il parle du contenu de l'information, le chercheur répond à deux questions : que mesure ce test particulier (batterie de tests) et quel est le degré de précision des mesures. Il existe plusieurs types de validité : logique (substantielle), empirique (basée sur des données expérimentales) et prédictive.

Diapositive 39

Description de la diapositive :

Comme indiqué, d'autres critères de test importants sont la normalisation, la comparabilité et l'efficacité. L'essence de la normalisation est que, sur la base des résultats des tests, il est possible de créer des normes particulièrement importantes pour la pratique. La comparabilité des tests est la capacité de comparer les résultats obtenus à partir d'une ou plusieurs formes de tests parallèles (homogènes). En termes pratiques, l'utilisation de tests moteurs comparables réduit la probabilité qu'en raison de l'utilisation régulière du même test, le degré de compétence soit évalué non seulement et pas tant que le niveau de capacité. Dans le même temps, des résultats de tests comparables augmentent la fiabilité des conclusions. L'essence de l'économie en tant que critère de qualité d'un test est que la réalisation du test ne nécessite pas beaucoup de temps, des coûts matériels importants et la participation de nombreux assistants.

40 diapositives

Description de la diapositive :

ORGANISATION DES TESTS DE PRÉPARATION DES ENFANTS D'ÂGE SCOLAIRE Le deuxième problème important des tests d'aptitudes motrices (rappelons que le premier est la sélection des tests informatifs) est l'organisation de leur utilisation. La culture physique doit déterminer : quel est le meilleur moment pour organiser les tests, comment les réaliser en classe et à quelle fréquence les tests doivent être effectués. Les dates des tests sont conformes à programme scolaire, qui prévoit un test obligatoire de la condition physique des élèves deux fois par jour.

41 diapositives

Description de la diapositive :

La connaissance des changements annuels dans le développement des capacités motrices des enfants permet à l'enseignant de procéder aux ajustements appropriés au processus d'éducation physique pour l'année scolaire suivante. Cependant, l'enseignant doit et peut effectuer des tests plus fréquents, mener ce qu'on appelle contrôle opérationnel. Il est conseillé de le faire afin de déterminer, par exemple, l'évolution du niveau de vitesse, des capacités de force et d'endurance sous l'influence des cours d'athlétisme au cours du premier trimestre. À cette fin, l'enseignant peut utiliser des tests pour évaluer les capacités de coordination des enfants au début et à la fin de la maîtrise du matériel du programme, par exemple dans les jeux sportifs, afin d'identifier les changements dans les indicateurs de développement de ces capacités.

42 diapositive

Description de la diapositive :

Il convient de prendre en compte que la variété des problèmes pédagogiques résolus ne permet pas de fournir à l'enseignant une méthodologie de test unifiée, les mêmes règles pour mener les tests et évaluer les résultats des tests. Cela nécessite que les expérimentateurs (enseignants) fassent preuve d'indépendance dans la résolution des problèmes de tests théoriques, méthodologiques et organisationnels. Les tests dans une leçon doivent être liés à son contenu. En d'autres termes, le ou les tests utilisés, sous réserve des exigences appropriées (en tant que méthode de recherche), doivent être organiquement inclus dans les exercices physiques prévus. Si, par exemple, les enfants ont besoin de déterminer le niveau de développement des capacités de vitesse ou d'endurance, les tests nécessaires doivent être planifiés dans la partie de la leçon dans laquelle les tâches de développement des capacités physiques correspondantes seront résolues.

43 diapositive

Description de la diapositive :

La fréquence des tests est largement déterminée par le taux de développement de capacités physiques spécifiques, l'âge, le sexe et caractéristiques individuelles leur développement. Par exemple, il faut plusieurs mois pour obtenir des gains significatifs en vitesse, en endurance ou en force. cours réguliers(entraînement). Dans le même temps, afin d'obtenir une augmentation significative de la flexibilité ou des capacités de coordination individuelles, seuls 4 à 12 entraînements sont nécessaires. Parvenir à une amélioration qualité physique, si vous partez de zéro, vous pouvez le faire pour plus court terme. Et afin d'améliorer cette même qualité lorsqu'un enfant en est atteint haut niveau, cela prend plus de temps. À cet égard, l'enseignant doit étudier plus en profondeur les caractéristiques du développement et de l'amélioration de diverses capacités motrices chez les enfants de différentes périodes d'âge et de sexe.

44 diapositives

Description de la diapositive :

Lors de l'évaluation de la condition physique générale des enfants, vous pouvez utiliser une grande variété de batteries de tests, dont le choix dépend des objectifs spécifiques des tests et de la disponibilité. conditions nécessaires. Cependant, étant donné que les résultats des tests obtenus ne peuvent être évalués que par comparaison, il est conseillé de choisir des tests largement représentés dans la théorie et la pratique de l'éducation physique des enfants. Par exemple, fiez-vous à ceux recommandés dans le programme FC. Pour comparer le niveau général de condition physique d'un étudiant ou d'un groupe d'étudiants à l'aide d'un ensemble de tests, ils ont recours à la conversion des résultats des tests en points ou en points. L'évolution du nombre de points lors de tests répétés permet de juger des progrès à la fois d'un enfant individuel et d'un groupe d'enfants.

Diapositive 49

Description de la diapositive :

Un aspect important des tests est le problème du choix d'un test pour évaluer un capacité physique et la condition physique générale.

50 diapositives

Description de la diapositive :

Recommandations pratiques et des conseils. IMPORTANT : Déterminer (sélectionner) la batterie (ou l'ensemble) de tests nécessaires avec une description détaillée de tous les détails de leur mise en œuvre ; Fixer les dates des tests (mieux - 2-3 semaines de septembre - 1er test, 2-3 semaines de mai - 2ème test) ; Conformément à la recommandation, déterminer avec précision l'âge des enfants au jour du test et leur sexe ; Développer des protocoles d’enregistrement de données unifiés (éventuellement basés sur l’utilisation des TIC) ; Déterminer le cercle des assistants et effectuer lui-même la procédure de test ; Effectuer immédiatement le traitement mathématique des données de test - calcul des paramètres statistiques de base (moyenne arithmétique, erreur de moyenne arithmétique, écart type, coefficient de variation et évaluation de la fiabilité des différences entre les moyennes arithmétiques, par exemple, classes parallèles identiques et différentes écoles d'enfants d'un certain âge et sexe ); L'une des étapes importantes du travail peut être la traduction des résultats des tests en points ou points. Avec des tests réguliers (2 fois par an, pendant plusieurs années), cela permettra à l'enseignant d'avoir une idée de l'évolution des résultats.

51 diapositives

Description de la diapositive :

Moscou « Lumières » 2007 Le livre contient les tests moteurs les plus courants pour évaluer les capacités de conditionnement et de coordination des élèves. Le manuel prévoit une approche individuelle du professeur d'éducation physique envers chaque élève spécifique, en tenant compte de son âge et de son physique.

CHAPITRE 3. TRAITEMENT STATISTIQUE DES RÉSULTATS DES TESTS

Le traitement statistique des résultats des tests permet, d'une part, de déterminer objectivement les résultats des sujets, d'autre part, d'évaluer la qualité du test lui-même, des tâches de test, en particulier, d'évaluer sa fiabilité. Le problème de la fiabilité a reçu beaucoup d'attention dans théorie classique essais. Cette théorie n'a pas perdu de sa pertinence aujourd'hui. Malgré l’émergence de théories plus modernes, la théorie classique continue de maintenir sa position.

3.1. DISPOSITIONS DE BASE DE LA THÉORIE CLASSIQUE DES TESTS

3.2. MATRICE DES RÉSULTATS DES TESTS

3.3. REPRÉSENTATION GRAPHIQUE DU SCORE DU TEST

3.4. MESURES DE TENDANCE CENTRALE

3.5. DISTRIBUTION NORMALE

3.6. VARIATION DES RÉSULTATS DES TESTS DES SUJETS

3.7. MATRICE DE CORRÉLATION

3.8. FIABILITÉ DES TESTS

3.9. VALIDITÉ DES TESTS

LITTÉRATURE

DISPOSITIONS DE BASE DE LA THÉORIE CLASSIQUE DES TESTS

Le créateur de la théorie classique des tests mentaux est le célèbre psychologue britannique, auteur de l'analyse factorielle, Charles Edward Spearman (1863-1945) 1. Il est né le 10 septembre 1863 et a servi dans l'armée britannique pendant un quart de sa vie. C’est pour cette raison qu’il n’a obtenu son doctorat qu’à l’âge de 41 ans2. Charles Spearman a mené sa thèse au Laboratoire de psychologie expérimentale de Leipzig sous la direction de Wilhelm Wundt. A cette époque, sur Ch. Spearman Forte influence contribué aux travaux de Francis Galton sur les tests de l'intelligence humaine. Les étudiants de Charles Spearman étaient R. Cattell et D. Wechsler. Parmi ses disciples figurent A. Anastasi, J. P. Guilford, P. Vernon, C. Burt, A. Jensen.

Lewis Guttman (1916-1987) a apporté une contribution majeure au développement de la théorie classique des tests.

La théorie classique des tests a été présentée pour la première fois de manière exhaustive et complète dans l'ouvrage fondamental d'Harold Gulliksen (Gulliksen H., 1950) 4 . Depuis lors, la théorie a été quelque peu modifiée, en particulier l'appareil mathématique a été amélioré. La théorie classique des tests dans une présentation moderne est donnée dans le livre Crocker L., Aligna J. (1986) 5. Parmi les chercheurs nationaux, V. Avanesov (1989) 6 a été le premier à décrire cette théorie. Dans l'œuvre de Chelyshkova M.B. (2002) 7 fournit des informations sur la justification statistique de la qualité du test.

La théorie classique des tests repose sur les cinq principes de base suivants.

1. Le résultat de mesure obtenu empiriquement (X) est la somme du résultat de mesure réel (T) et de l'erreur de mesure (E) 8 :

X = T + E (3.1.1)

Les valeurs de T et E sont généralement inconnues.

2. Le résultat réel de la mesure peut être exprimé sous la forme de l'espérance mathématique E(X) :

3. La corrélation des composantes vraies et fausses sur l’ensemble des sujets est nulle, c’est-à-dire ρ TE = 0.

4. Les composantes erronées de deux tests ne correspondent pas :

5. Les composants erronés d’un test ne correspondent pas aux composants réels d’un autre test :

De plus, la base de la théorie classique des tests est constituée de deux définitions : les tests parallèles et équivalents.

Les tests PARALLÈLES doivent répondre aux exigences (1-5), les vraies composantes d'un test (T 1) doivent être égales aux vraies composantes de l'autre test (T 2) dans chaque échantillon de sujets répondant aux deux tests. On suppose que T 1 =T 2 et, en plus, sont égaux à la variance s 1 2 = s 2 2.

Les tests équivalents doivent répondre à toutes les exigences des tests parallèles à une exception près : les véritables composantes d'un test ne doivent pas nécessairement être égales aux vraies composantes d'un autre test parallèle, mais elles doivent différer de la même constante. Avec.

La condition d’équivalence de deux tests s’écrit ainsi :

où c 12 est la constante entre les résultats du premier et du deuxième tests.

Sur la base des dispositions ci-dessus, une théorie de la fiabilité des tests a été construite 9,10.

c'est-à-dire que la variance des résultats des tests résultants est égale à la somme des variances des composantes vraie et erreur.

Réécrivons cette expression comme suit :

(3.1.3)

Le côté droit de cette égalité représente la fiabilité du test ( r). Ainsi, la fiabilité du test peut s’écrire :

Sur la base de cette formule, diverses expressions ont ensuite été proposées pour trouver le coefficient de fiabilité du test. La fiabilité d'un test réside dans son la caractéristique la plus importante. Si la fiabilité est inconnue, les résultats des tests ne peuvent pas être interprétés. La fiabilité d'un test caractérise sa précision en tant qu'instrument de mesure. Une fiabilité élevée signifie une répétabilité élevée des résultats de test dans les mêmes conditions.

Dans la théorie classique des tests, le problème le plus important consiste à déterminer le véritable score du sujet (T). La note du test empirique (X) dépend de nombreuses conditions - le niveau de difficulté des tâches, le niveau de préparation des candidats, le nombre de tâches, les conditions de test, etc. Dans un groupe de sujets forts et bien préparés, les résultats des tests seront généralement meilleurs. que dans un groupe de sujets mal entraînés. À cet égard, la question reste ouverte quant à l’ampleur de la mesure de la difficulté des tâches pour la population générale des sujets. Le problème est que les données empiriques réelles sont obtenues à partir d’échantillons de sujets complètement aléatoires. En règle générale, il s'agit de groupes d'étude qui représentent une multitude d'étudiants qui interagissent assez fortement les uns avec les autres dans le processus d'apprentissage et étudient dans des conditions qui ne sont souvent pas répétées pour les autres groupes.

Nous trouverons sE de l'équation (3.1.4)

Ici, la dépendance de la précision de mesure sur l'écart type est explicitement montrée X et sur la fiabilité du test r.

Envoyer votre bon travail dans la base de connaissances est simple. Utilisez le formulaire ci-dessous

Bon travail sur le site">

Les étudiants, étudiants diplômés, jeunes scientifiques qui utilisent la base de connaissances dans leurs études et leur travail vous en seront très reconnaissants.

Posté sur http://www.allbest.ru/

1. CONCEPTS DE BASE

Un test est une mesure ou un test effectué pour déterminer la condition ou la capacité d'un athlète. Le processus de test est appelé test : la valeur numérique qui en résulte est le résultat du test (ou résultat du test). Par exemple, la course de 100 m est un test, la procédure de conduite des courses et le chronométrage est un test, le temps de course est le résultat du test.

Les tests basés sur des tâches motrices sont appelés tests moteurs (ou moteurs). Dans ces tests, les résultats peuvent être soit des acquis moteurs (temps pour parcourir la distance, nombre de répétitions, distance parcourue, etc.), soit des indicateurs physiologiques et biochimiques. En fonction de cela, ainsi que de la tâche du sujet, on distingue trois groupes de tests moteurs (tableau A).

Tableau A. Types d'essais moteurs.

Nom du test

Tâche pour l'athlète

Résultats de test

Exercices de test

Réalisation motrice

Course de 1 500 m, durée de course

Tests fonctionnels standards

Le même pour tout le monde, dosé soit : a) selon la quantité de travail effectué, soit : b) selon l'ampleur des changements physiologiques

Indicateurs physiologiques ou biochimiques lors d'un travail standard Indicateurs moteurs lors d'un nombre standard de changements physiologiques

Enregistrement de la fréquence cardiaque pendant un travail standard 1000 km/min Vitesse de course à la fréquence cardiaque 160 battements/min, échantillon PVC (170)

Tests fonctionnels maximaux

Afficher le résultat maximum

Indicateurs physiologiques ou biochimiques

Détermination de la dette maximale en oxygène ou de la consommation maximale d'oxygène

Parfois, on utilise non pas un, mais plusieurs tests qui ont un seul objectif final (par exemple, évaluer la condition de l'athlète pendant la période d'entraînement compétitif). Un tel groupe est appelé complexe ou batterie de tests. Toutes les mesures ne peuvent pas être utilisées comme tests. Pour ce faire, ils doivent répondre à des exigences particulières. Ceux-ci incluent : 1) la fiabilité des tests ; 2) le contenu informatif du test ; 3) la présence d'un système de notation (voir chapitre suivant) ; 4) normalisation - la procédure et les conditions d'essai doivent être les mêmes dans tous les cas d'application de l'essai. Les tests qui répondent aux exigences de fiabilité et de contenu informatif sont appelés tests bons ou authentiques.

2. TEST DE FIABILITÉ

2.1 Notion de fiabilité des tests

test physique sur tapis roulant

La fiabilité des tests est le degré de concordance des résultats lors de tests répétés sur les mêmes personnes (ou d'autres objets) dans les mêmes conditions. Idéalement, le même test administré aux mêmes sujets dans les mêmes conditions devrait produire les mêmes résultats. Cependant, même avec la standardisation la plus stricte des tests et un équipement précis, les résultats des tests varient toujours quelque peu. Par exemple, un athlète qui vient de faire un développé couché de 55 kg sur un dynamomètre au poignet n'affichera que 50 kg en quelques minutes. Une telle variation est appelée variation intra-individuelle ou (en utilisant la terminologie plus générale des statistiques mathématiques) variation intra-classe. Elle est causée par quatre raisons principales :

changement de l'état des sujets (fatigue, entraînement, apprentissage, changement de motivation, concentration, etc.) ;

changements incontrôlés des conditions extérieures et des équipements (température et humidité, tension d'alimentation, présence de personnes non autorisées, vent, etc.) ;

changement de l'état de la personne effectuant ou évaluant le test, remplacement d'un expérimentateur ou d'un juge par un autre ;

imperfection du test (il existe des tests qui ne sont évidemment pas fiables, par exemple les lancers francs dans un panier de basket jusqu'au premier échec ; même un athlète qui a pourcentage élevé coups, peut accidentellement se tromper lors des premiers lancers).

L'exemple simplifié suivant aidera à comprendre l'idée des méthodes utilisées pour juger de la fiabilité des tests. Supposons qu'ils souhaitent comparer les résultats du saut en longueur debout de deux athlètes sur la base de deux tentatives effectuées. Si vous souhaitez tirer des conclusions précises, vous ne pouvez pas vous limiter à enregistrer uniquement les meilleurs résultats. Supposons que les résultats de chacun des athlètes varient de ± 10 cm par rapport à la valeur moyenne et soient respectivement égaux à 220 ± 10 cm (soit 210 et 230 cm) et 320 ± 10 cm (soit 310 et 330 cm). Dans ce cas, la conclusion, bien entendu, sera totalement sans ambiguïté : le deuxième athlète est supérieur au premier. La différence entre les résultats (320 cm - 220 cm = 100 cm) est nettement supérieure aux fluctuations aléatoires (± 10 cm). Ce sera beaucoup moins sûr

Riz. 1. Le rapport de variation inter- et intraclasse avec une fiabilité élevée (en haut) et faible (en bas).

Traits verticaux courts - données de tentatives individuelles, X et A" 2, X 3 - résultats moyens de trois sujets

conclusion si, pour une même variation intraclasse (égale à ±10 cm), la différence entre sujets (variation interclasse) sera faible. Disons que les valeurs moyennes seront de 220 cm (dans une tentative 210 cm, dans une autre 230 cm) et 222 (212 et 232 cm). Il peut alors arriver, par exemple, que lors de la première tentative, le premier athlète saute 230 cm et le second seulement 212, et l'impression sera créée que le premier est nettement plus fort que le second.

L’exemple montre que la principale signification n’est pas la variabilité intraclasse elle-même, mais sa relation avec les différences interclasses. Une même variation intraclasse donne une fiabilité différente avec des différences différentes entre classes (dans le cas particulier des sujets, Fig. 1).

La théorie de la fiabilité des tests repose sur le fait que le résultat de toute mesure effectuée sur une personne - X ( - est la somme de deux grandeurs :

X^Hoo + Hé, (1)

où X x est le soi-disant résultat vrai qu'ils souhaitent enregistrer ;

X e - une erreur provoquée par une variation incontrôlée de l'état du sujet, introduite par un appareil de mesure, etc.

Par définition, le vrai résultat s’entend comme la valeur moyenne de X^ pour un nombre infini d’observations dans des conditions identiques (c’est pourquoi le signe infini oo est mis en X).

Si les erreurs sont aléatoires (leur somme est nulle et dans différentes tentatives elles ne dépendent pas les unes des autres), alors des statistiques mathématiques il résulte :

O/ = OooT<З е,

c'est-à-dire que la dispersion des résultats enregistrés dans l'expérience (st/ 2) est égale à la somme des dispersions des vrais résultats ((Xm 2) et des erreurs (0 e 2).

Ooo 2 caractérise la variation interclasse idéalisée (c'est-à-dire sans erreur), et e 2 caractérise la variation intraclasse. L'influence de o e 2 modifie la distribution des résultats des tests (Fig. 2).

Par définition, le coefficient de fiabilité (Hz) est égal au rapport de la variance vraie à la variance enregistrée dans l'expérience :

En d’autres termes, r p est simplement la proportion de variation réelle dans la variation enregistrée dans l’expérience.

En plus du coefficient de fiabilité, l'indice de fiabilité est également utilisé :

qui est considéré comme un coefficient de corrélation théorique entre les valeurs de test enregistrées et les vraies. Ils utilisent également le concept d'erreur type de fiabilité, qui s'entend comme l'écart type des résultats de tests enregistrés (X () par rapport à la droite de régression reliant la valeur de X g aux vrais résultats (X") - Fig. 3.

2.2 Évaluation de la fiabilité basée sur des données expérimentales

Le concept de véritable résultat de test est une abstraction. La houe ne peut être mesurée expérimentalement (après tout, il est impossible en réalité de réaliser un nombre infini d'observations dans des conditions identiques). Nous devons donc utiliser des méthodes indirectes.

La méthode la plus préférable pour évaluer la fiabilité est l'analyse de la variance suivie du calcul des coefficients de corrélation dits intraclasses.

L'analyse de variance, comme on le sait, permet de décomposer la variation enregistrée expérimentalement dans les résultats des tests en composantes dues à l'influence de facteurs individuels. Par exemple, si nous enregistrons les résultats des sujets dans n'importe quel test, en répétant ce test à des jours différents et en faisant plusieurs tentatives chaque jour, en changeant périodiquement d'expérimentateur, alors une variation se produira :

a) de sujet à sujet (variation interindividuelle),

b) de jour en jour,

c) d'expérimentateur à expérimentateur,

d) de tentative en tentative.

L'analyse de variance permet d'isoler et d'évaluer les variations provoquées par ces facteurs.

Un exemple simplifié montre comment cela se fait. Supposons que les résultats de deux tentatives aient été mesurés chez 5 sujets (k = 5, n = 2)

Les résultats de l'analyse de variance (voir le cours de statistiques mathématiques, ainsi que l'annexe 1 de la première partie de l'ouvrage) sont donnés sous la forme traditionnelle sous forme de tableau. 2.

Tableau 2

La fiabilité est évaluée à l'aide du coefficient de corrélation dit intraclasse :

où r "i est le coefficient de corrélation intraclasse (coefficient de fiabilité qui, afin de le distinguer du coefficient de corrélation habituel (r), est noté par un nombre premier supplémentaire (r")\

n -- nombre de tentatives utilisées dans le test ;

n" - le nombre de tentatives pour lesquelles l'évaluation de la fiabilité est effectuée.

Par exemple, s'ils souhaitent estimer la fiabilité de la moyenne de deux tentatives sur la base des données fournies dans l'exemple, alors

Si l'on se limite à une seule tentative, alors la fiabilité sera égale à :

et si vous augmentez le nombre de tentatives à quatre, le coefficient de fiabilité augmentera également légèrement :

Ainsi, afin d'évaluer la fiabilité, il faut, d'une part, réaliser une analyse de variance et, d'autre part, calculer le coefficient de corrélation intraclasse (coefficient de fiabilité).

Certaines difficultés surviennent lorsqu'il existe ce qu'on appelle une tendance, c'est-à-dire une augmentation ou une diminution systématique des résultats d'une tentative à l'autre (Fig. 4). Dans ce cas, des méthodes plus complexes d'évaluation de la fiabilité sont utilisées (elles ne sont pas décrites dans ce livre).

Dans le cas de deux tentatives et en l'absence de tendance, les valeurs du coefficient de corrélation intraclasse coïncident pratiquement avec les valeurs du coefficient de corrélation habituel entre les résultats de la première et de la deuxième tentatives. Par conséquent, dans de telles situations, le coefficient de corrélation habituel peut être utilisé pour évaluer la fiabilité (il estime la fiabilité d’une tentative plutôt que de deux). Toutefois, si le nombre de tentatives dans un test est supérieur à deux, et notamment si des conceptions de test complexes sont utilisées,

Riz. 4. Une série de six tentatives, dont les trois premières (à gauche) ou les trois dernières (à droite) sont soumises à la tendance

(par exemple 2 tentatives par jour pendant deux jours), le calcul du coefficient intraclasse est nécessaire.

Le coefficient de fiabilité n'est pas un indicateur absolu caractérisant le test. Ce coefficient peut varier en fonction de la population de sujets (par exemple, il peut être différent pour les athlètes débutants et expérimentés), des conditions de test (si les tentatives répétées sont effectuées les unes après les autres ou, disons, à intervalles d'une semaine) et d'autres raisons. . Il est donc toujours nécessaire de décrire comment et sur qui le test a été réalisé.

2.3 Fiabilité dans la pratique des tests

Le manque de fiabilité des données expérimentales réduit l'ampleur des estimations des coefficients de corrélation. Puisqu'aucun test ne peut être plus corrélé avec un autre test qu'avec lui-même, la limite supérieure pour estimer ici le coefficient de corrélation n'est plus ±1,00, mais l'indice de fiabilité

g (oo = Y~g et

Pour passer de l'estimation des coefficients de corrélation entre des données empiriques à l'estimation de la corrélation entre des valeurs vraies, vous pouvez utiliser l'expression

où r xy est la corrélation entre les vraies valeurs de X et Y ;

1~xy -- corrélation entre les données empiriques ; HzI^ - évaluation de la fiabilité de X et Y.

Par exemple, si r xy = 0,60, r xx = 0,80 et r yy = 0,90, alors la corrélation entre les vraies valeurs est de 0,707.

La formule donnée (6) est appelée correction de réduction (ou formule de Spearman-Brown), elle est constamment utilisée dans la pratique.

Il n’existe pas de valeur de fiabilité fixe pour qu’un test soit considéré comme acceptable. Tout dépend de l'importance des conclusions tirées de l'application du test. Et pourtant, dans la plupart des cas sportifs, les lignes directrices approximatives suivantes peuvent être utilisées : 0,95--0,99 --¦ excellente fiabilité, 0,90-^0,94 - - bon, 0,80--0,89 - acceptable, 0,70--0,79 - mauvais, 0,60--0,69 - douteux pour les évaluations individuelles, le test ne convient que pour caractériser un groupe de sujets.

Vous pouvez améliorer la fiabilité des tests en augmentant le nombre de tentatives. Voici comment, par exemple, dans l'expérience, la fiabilité du test (lancer une grenade de 350 g avec un départ courant) augmentait avec le nombre de tentatives : 1 tentative - 0,53, 2 tentatives - 0,72, 3 tentatives - 0,78, 4 tentatives -- 0,80, 5 tentatives -- 0,82, 6 tentatives -- 0,84. L'exemple montre que si au début la fiabilité augmente rapidement, après 3-4 tentatives, l'augmentation ralentit considérablement.

Avec plusieurs tentatives répétées, les résultats peuvent être déterminés de différentes manières : a) par la meilleure tentative, b) par la moyenne arithmétique, c) par la médiane, d) par la moyenne de deux ou trois meilleures tentatives, etc. a montré que dans la plupart des cas, la moyenne arithmétique est la plus fiable, la médiane est un peu moins fiable et la meilleure tentative est encore moins fiable.

Lorsqu'on parle de fiabilité des tests, une distinction est faite entre leur stabilité (reproductibilité), leur cohérence et leur équivalence.

2.4 Stabilité des tests

La stabilité des tests fait référence à la reproductibilité des résultats lorsqu'ils sont répétés après un certain temps dans les mêmes conditions. Des tests répétés sont généralement appelés un nouveau test. Le schéma d'évaluation de la stabilité des tests est le suivant : 1

Dans ce cas, deux cas sont distingués. Dans l'un, un contre-test est effectué afin d'obtenir des données fiables sur l'état du sujet pendant tout l'intervalle de temps entre le test et le contre-test (par exemple, pour obtenir des données fiables sur les capacités fonctionnelles des skieurs en juin, elles sont mesurées deux fois à une semaine d'intervalle). Dans ce cas, des résultats de test précis sont importants et la fiabilité doit être évaluée à l’aide d’une analyse de variance.

Dans un autre cas, il peut s'agir uniquement de préserver l'ordre des sujets dans le groupe (que le premier reste premier, le dernier reste parmi les derniers). Dans ce cas, la stabilité est évaluée par le coefficient de corrélation entre test et retest.

La stabilité du test dépend :

type d'examen

contingent de sujets,

intervalle de temps entre le test et le retest. Par exemple, les caractéristiques morphologiques des petits

les intervalles de temps sont très stables ; les tests de précision des mouvements (par exemple, lancer sur une cible) ont le moins de stabilité.

Chez les adultes, les résultats des tests sont plus stables que chez les enfants ; parmi les athlètes, ils sont plus stables que parmi ceux qui ne pratiquent pas de sport.

À mesure que l’intervalle de temps entre le test et le retest augmente, la stabilité du test diminue (Tableau 3).

2.5 Cohérence des tests

La cohérence du test est caractérisée par l'indépendance des résultats du test par rapport aux qualités personnelles de la personne effectuant ou évaluant le test. " La cohérence est déterminée par le degré d'accord des résultats obtenus sur les mêmes sujets par différents expérimentateurs, juges, et des experts. Dans ce cas, deux options sont possibles :

La personne qui administre le test évalue uniquement les résultats du test sans influencer sa performance. Par exemple, différents examinateurs peuvent évaluer différemment le même travail écrit. Les évaluations des juges en gymnastique, en patinage artistique, en boxe, les indicateurs de chronométrage manuels, les évaluations par électrocardiogramme ou radiographie par différents médecins, etc. diffèrent souvent.

La personne effectuant le test influence les résultats. Par exemple, certains expérimentateurs sont plus persistants et exigeants que d’autres et parviennent mieux à motiver les sujets. Cela affecte les résultats (qui peuvent eux-mêmes être mesurés de manière assez objective).

La cohérence du test est essentiellement la fiabilité des résultats du test lorsque différentes personnes administrent le test.

1 Au lieu du terme « cohérence », le terme « objectivité » est souvent utilisé. Cette utilisation des mots est regrettable, car la coïncidence des résultats de différents expérimentateurs ou juges (experts) n'indique pas du tout leur objectivité. Ensemble, ils peuvent, consciemment ou inconsciemment, commettre des erreurs, déformant ainsi la vérité objective.

2.6 Équivalence des tests

Souvent, un test est le résultat d’une sélection parmi un certain nombre de tests similaires.

Par exemple, lancer un panier de basket peut être effectué à partir de différents points, le sprint peut être effectué sur une distance de 50, 60 ou 100 m, par exemple, les tractions peuvent être effectuées sur des anneaux ou une barre, avec une prise en main ou en dessous. , etc.

Dans de tels cas, la méthode dite des formes parallèles peut être utilisée, lorsque les sujets sont invités à effectuer deux versions du même test et que le degré de concordance entre les résultats est ensuite évalué. Le schéma de test ici est le suivant :

Le coefficient de corrélation calculé entre les résultats des tests est appelé coefficient d'équivalence. L'attitude envers l'équivalence des tests dépend de la situation spécifique. D'une part, si deux ou plusieurs tests sont équivalents, leur utilisation combinée augmente la fiabilité des estimations ; d'un autre côté, il peut être utile de ne laisser qu'un seul test équivalent dans la batterie - cela simplifiera les tests et ne réduira que légèrement le contenu informatif de l'ensemble de tests. La solution à ce problème dépend de raisons telles que la complexité et la lourdeur des tests, le degré de précision des tests requis, etc.

Si tous les tests inclus dans une suite de tests sont hautement équivalents, on dit qu’elle est homogène. L’ensemble de ce complexe mesure une propriété de la motricité humaine. Disons qu'un complexe composé de sauts en longueur debout, verticaux et triples est susceptible d'être homogène. Au contraire, s'il n'y a pas de tests équivalents dans le complexe, alors tous les tests qu'il contient mesurent des propriétés différentes. Un tel complexe est dit hétérogène. Exemple d'une batterie de tests hétérogène : tractions sur la barre, flexion en avant (pour tester la souplesse), course à pied de 1500 m.

2.7 Moyens d'améliorer la fiabilité des tests

La fiabilité des tests peut être augmentée dans une certaine mesure par :

a) une standardisation plus stricte des tests,

b) augmenter le nombre de tentatives,

c) augmenter le nombre d'évaluateurs (juges, experts) et accroître la cohérence de leurs avis,

d) augmenter le nombre de tests équivalents,

e) meilleure motivation des sujets.

3. TESTS INFORMATIFS

3.1 Notions de base

Le caractère informatif d'un test est le degré de précision avec lequel il mesure la propriété (qualité, capacité, caractéristique, etc.) qu'il est utilisé pour évaluer. Le caractère informatif est souvent aussi appelé validité (de l'anglais uaNaNu - validité, validité, légalité). Supposons que pour déterminer le niveau de préparation particulière en force des sprinteurs - coureurs et nageurs - ils souhaitent utiliser les indicateurs suivants : 1) dynamométrie carpienne, 2) force de flexion plantaire du pied, 3) force des extenseurs de l'épaule articulation (ces muscles supportent une charge importante lors de la nage en crawl) , 4) force des muscles extenseurs du cou. Sur la base de ces tests, il est proposé de gérer le processus d'entraînement, notamment pour détecter les maillons faibles du système moteur et les renforcer volontairement. Les tests choisis sont-ils bons ? Sont-ils informatifs ? Même sans mener d'expériences particulières, on peut deviner que le deuxième test est probablement informatif pour les sprinteurs et les coureurs, le troisième pour les nageurs, et le premier et le quatrième, probablement, ne montreront rien d'intéressant ni pour les nageurs ni pour les coureurs (bien qu'ils puissent être très utile dans d'autres sports, comme la lutte). Dans différents cas, les mêmes tests peuvent avoir un contenu informatif différent.

La question sur le caractère informatif du test est divisée en 2 questions spécifiques :

Que mesure ce test ?

Comment fait-il cela exactement ?

Par exemple, est-il possible de juger de la condition physique des coureurs de fond sur la base d'un indicateur tel que la consommation maximale d'oxygène (MOC), et si oui, avec quel degré de précision ? En d’autres termes, quel est le contenu informatif de l’IPC chez les séjours ? Ce test peut-il être utilisé dans le processus de contrôle ?

Si le test est utilisé pour déterminer (diagnostiquer) l’état de l’athlète au moment de l’examen, on parle alors d’information diagnostique. Si, sur la base des résultats du test, ils souhaitent tirer une conclusion sur les performances futures possibles de l’athlète, le test doit contenir des informations prédictives. Un test peut être informatif sur le plan diagnostique, mais pas sur le plan pronostique, et vice versa.

Le degré de contenu de l'information peut être caractérisé quantitativement - sur la base de données expérimentales (le soi-disant contenu de l'information empirique) et qualitativement - sur la base d'une analyse significative de la situation (contenu de l'information substantiel ou logique).

3.2 Contenu de l'information empirique (premier cas : il existe un critère mesurable)

L'idée de déterminer le contenu de l'information empirique est que les résultats des tests sont comparés à un certain critère. Pour cela, calculez le coefficient de corrélation entre le critère et le test (ce coefficient est appelé coefficient d'informativité et est noté r gk, où I est la première lettre du mot « test », k dans le mot « critère »).

Le critère est considéré comme un indicateur qui reflète de manière évidente et incontestable la propriété qui va être mesurée à l'aide du test.

Il arrive souvent qu'il existe un critère bien défini avec lequel le test proposé peut être comparé. Par exemple, lors de l'évaluation de la préparation particulière des athlètes dans des sports avec des résultats mesurés objectivement, le résultat lui-même sert généralement de critère : le test dont la corrélation avec le résultat sportif est la plus élevée est plus informatif. Dans le cas de la détermination du contenu de l'information pronostique, le critère est l'indicateur dont la prévision doit être effectuée (par exemple, si la longueur du corps d'un enfant est prédite, le critère est la longueur de son corps à l'âge adulte).

Les critères les plus courants en métrologie du sport sont :

Résultat sportif.

Toute caractéristique quantitative d'un exercice sportif de base (par exemple, longueur de foulée en course, force de poussée en saut, réussite des combats sous le panneau au basket-ball, service au tennis ou au volley-ball, pourcentage de passes longues précises au football).

Les résultats d'un autre test dont le contenu informatif a été prouvé (ceci est fait si la réalisation d'un test de critère est lourde et difficile et que vous pouvez sélectionner un autre test tout aussi informatif, mais plus simple. Par exemple, au lieu d'un échange gazeux, déterminez la fréquence cardiaque). Ce cas particulier, où le critère est un autre test, est appelé contenu informationnel compétitif.

Appartenir à un groupe spécifique. Par exemple, vous pouvez comparer les membres de l'équipe nationale, les maîtres du sport et les athlètes de premier ordre ; l'appartenance à l'un de ces groupes est un critère. Dans ce cas, des types spéciaux d'analyse de corrélation sont utilisés.

Le critère dit composite, par exemple la somme des points au concours général. Dans ce cas, les tableaux globaux de types et de points peuvent être soit généralement acceptés, soit nouvellement compilés par l'expérimentateur (pour savoir comment les tableaux sont compilés, voir le chapitre suivant). Un critère composite est utilisé lorsqu'il n'existe pas de critère unique (par exemple, s'il s'agit d'évaluer la condition physique générale, l'habileté d'un joueur dans les jeux sportifs, etc., aucun indicateur pris à lui seul ne peut servir de critère).

Un exemple de détermination du contenu informatif d'un même test - vitesse de course de 30 m en mouvement pour les hommes - avec différents critères est donné dans le tableau 4.

La question du choix d'un critère est essentiellement la plus importante pour déterminer le sens réel et le caractère informatif du test. Par exemple, si la tâche consiste à déterminer le contenu informatif d'un test tel que le saut en longueur debout des sprinteurs, vous pouvez alors choisir différents critères : le résultat de la course de 100 m, la longueur du pas, le rapport entre la longueur du pas et la longueur des jambes. ou à la hauteur, etc. Le contenu informatif du test changera dans ce cas (dans l'exemple donné, il est passé de 0,558 pour la vitesse de course à 0,781 pour le rapport « longueur de pas/longueur de jambe »).

Dans les sports où il est impossible de mesurer objectivement l'esprit sportif, on tente de contourner cette difficulté en introduisant des critères artificiels. Par exemple, dans les jeux de sports d’équipe, les experts classent tous les joueurs en fonction de leurs compétences dans un certain ordre (c’est-à-dire qu’ils dressent des listes des 20, 50 ou, disons, 100 joueurs les plus forts). La place occupée par l'athlète (comme on dit, son rang) est considérée comme un critère avec lequel les résultats des tests sont comparés afin de déterminer leur contenu informatif.

La question se pose : pourquoi recourir à des tests si le critère est connu ? Par exemple, n'est-il pas plus facile d'organiser des compétitions de contrôle et de déterminer des résultats sportifs que de déterminer les réalisations lors d'exercices de contrôle ? L'utilisation de tests présente les avantages suivants :

un résultat sportif n'est pas toujours possible ou conseillé à déterminer (par exemple, les compétitions de marathon ne peuvent pas être organisées souvent ; en hiver, il est généralement impossible d'enregistrer un résultat au lancer du javelot et en été au ski de fond) ;

un résultat sportif dépend de nombreuses raisons (facteurs), comme la force, l'endurance, la technique, etc. de l'athlète. L'utilisation de tests permet de déterminer les forces et les faiblesses d'un athlète et d'évaluer chacun de ces facteurs séparément.

3.3 Caractère informatif empirique (deuxième cas - il n'y a pas de critère unique ; caractère informatif factoriel)

Il arrive souvent qu'il n'existe pas de critère unique avec lequel comparer les résultats des tests proposés. Disons qu’ils veulent trouver les tests les plus informatifs pour évaluer la préparation physique des jeunes. Que préférer : les tractions à la barre ou les pompes, les squats avec une barre, les rangées d'haltères ou le fait de s'accroupir en décubitus dorsal ? Quel pourrait être le critère pour choisir le bon test ici ?

Vous pouvez proposer aux sujets une large batterie de tests de résistance divers, puis sélectionner parmi eux ceux qui donnent la plus grande corrélation avec les résultats de l'ensemble du complexe (après tout, vous ne pouvez pas utiliser systématiquement l'ensemble du complexe - c'est trop lourd et peu pratique). Ces tests seront les plus informatifs : ils fourniront des informations sur les résultats possibles des sujets pour l'ensemble de la série initiale de tests. Mais les résultats d’un ensemble de tests ne sont pas exprimés en un seul chiffre. Il est bien entendu possible de former une sorte de critère composite (par exemple, pour déterminer le nombre de points marqués sur une certaine échelle). Cependant, une autre méthode, basée sur les idées de l’analyse factorielle, est beaucoup plus efficace.

L'analyse factorielle est l'une des méthodes de statistiques multivariées (le mot « multidimensionnel » indique que de nombreux indicateurs différents sont étudiés simultanément, par exemple les résultats des sujets à de nombreux tests). Il s'agit d'une méthode assez complexe, il convient donc ici de se limiter à présenter uniquement son idée principale.

L'analyse factorielle part du fait que le résultat de tout test est une conséquence de l'action simultanée d'un certain nombre de facteurs directement inobservables (autrement appelés latents). Par exemple, les résultats en course à pied sur 100, 800 et 5 000 m dépendent de la vitesse, de la force, de l’endurance, etc. de l’athlète. L’importance de ces facteurs pour chaque distance n’est pas la même. Si vous choisissez deux tests influencés à peu près également par les mêmes facteurs, les résultats de ces tests seront alors fortement corrélés les uns aux autres (par exemple, en courant à des distances de 800 et 1 000 m). Si les tests n'ont pas de facteurs communs ou s'ils ont peu d'influence sur les résultats, la corrélation entre ces tests sera faible (par exemple, la corrélation entre les performances au 100 m et au 5000 m). Lorsqu'un grand nombre de tests différents sont effectués et que des coefficients de corrélation entre eux sont calculés, l'analyse factorielle permet de déterminer combien de facteurs agissent ensemble sur ces tests et quel est le degré de leur contribution à chaque test. Et puis, il est facile de sélectionner des tests (ou des combinaisons de ceux-ci) qui évaluent le plus précisément le niveau de facteurs individuels. C'est l'idée du contenu informationnel factoriel des tests. L’exemple suivant d’une expérience spécifique montre comment cela est réalisé.

La tâche consistait à trouver les tests les plus informatifs pour évaluer la préparation générale en force des étudiants-athlètes de troisième et première classe impliqués dans différents sports. A cet effet, il a été examiné. (N.V. Averkovich, V.M. Zatsiorsky, 1966) selon 15 tests, 108 personnes. À la suite de l'analyse factorielle, trois facteurs ont été identifiés : 1) la force des membres supérieurs, 2) la force des membres inférieurs, 3) la force des muscles abdominaux et des fléchisseurs de la hanche. Les tests les plus informatifs parmi ceux testés étaient : pour le premier facteur - des pompes, pour le second - un saut en longueur debout, pour le troisième - lever les jambes droites en suspension et le nombre maximum de transitions vers un squat à partir d'une position couchée sur le dos. 1 minute . Si nous nous limitons à un seul test, le plus informatif était le retournement de force sur la barre transversale (le nombre de répétitions a été évalué).

3.4 L'informatique empirique dans les travaux pratiques

Lors de l'utilisation pratique d'indicateurs empiriques d'informativité, il convient de garder à l'esprit qu'ils ne sont valables que par rapport aux sujets et aux conditions pour lesquels ils sont calculés. Un test informatif dans un groupe de débutants peut s'avérer totalement non informatif si vous essayez de l'utiliser dans un groupe de maîtres du sport.

Le contenu informatif du test n’est pas le même selon les groupes. En particulier, dans les groupes dont la composition est plus homogène, le test est généralement moins informatif. Si le contenu informatif d'un test dans n'importe quel groupe est déterminé et que les plus forts d'entre eux sont inclus dans l'équipe nationale, alors le contenu informatif du même test dans l'équipe nationale sera nettement inférieur. Les raisons de cela ressortent clairement de la Fig. 5 : la sélection réduit la variance globale des résultats dans le groupe et réduit l’ampleur du coefficient de corrélation. Par exemple, si nous déterminons le contenu informatif d'un test tel que le MPC de nageurs de 400 m qui ont des résultats très différents (disons, de 3,55 à 6,30), alors le coefficient de contenu informatif sera très élevé (Y 4e>0,90) ; si nous effectuons les mêmes mesures dans un groupe de nageurs avec des résultats de 3,55 à 4,30, le nombre de g en valeur absolue ne dépassera pas 0,4--0,6 ; si l'on détermine le même indicateur parmi les nageurs les plus forts du monde (3,53>, 5=4,00), le coefficient de contenu informatif en général ""peut être égal à zéro : à l'aide de ce seul test, il sera impossible de distinguer entre les nageurs nageant, disons, 3,55 et 3,59 : et ceux-là et d'autres ont des valeurs MIC. sera élevé et à peu près le même.

Les coefficients de caractère informatif dépendent dans une large mesure de la fiabilité du test et du critère. Un test à faible fiabilité n'est toujours pas très informatif, cela n'a donc aucun sens de vérifier le contenu informatif des tests à faible fiabilité. Une fiabilité insuffisante du critère entraîne également une diminution des coefficients d'informativité. Cependant, dans ce cas, ce serait une erreur de négliger le test comme étant non informatif - après tout, la limite supérieure de la corrélation possible d'un test n'est pas ±1, mais son indice de fiabilité. Il est donc nécessaire de comparer le coefficient de contenu informationnel avec cet indice. Le contenu réel de l'information (ajusté du manque de fiabilité du critère) est calculé à l'aide de la formule :

Ainsi, dans l'un des ouvrages, le rang d'un athlète de water-polo (le rang était considéré comme un critère d'habileté) a été établi sur la base des appréciations de 4 experts. La fiabilité (cohérence) du critère, déterminée à l'aide du coefficient de corrélation intraclasse, était de 0,64. Le coefficient d'information était de 0,56. Le coefficient réel de contenu informationnel (ajusté du manque de fiabilité du critère) est égal à :

Le concept de sa capacité discriminative est étroitement lié au caractère informatif et à la fiabilité du test, qui est compris comme la différence minimale entre les sujets diagnostiqués à l'aide du test (ce concept a un sens similaire à celui de la sensibilité de l'appareil). . Le pouvoir discriminant du test dépend :

Variation interindividuelle des résultats. Par exemple, un test tel que « nombre maximum de lancers répétés d'un ballon de basket contre un mur à une distance de 4 m en 10 secondes » est bon pour les débutants, mais ne convient pas aux basketteurs expérimentés, car ils montrent tous à peu près le même résultat et devenir indiscernable. Dans de nombreux cas, la variation entre évaluateurs (variation interclasse) peut être augmentée en augmentant la difficulté du test. Par exemple, si vous faites passer à des athlètes de différentes qualifications un test fonctionnel qui leur est facile (par exemple, 20 squats ou travailler sur un vélo ergométrique d'une puissance de 200 kgm/min), alors l'ampleur des changements physiologiques chez chacun sera d'environ la même chose et il sera impossible d’évaluer le degré de préparation. Si vous leur proposez une tâche difficile, les différences entre les athlètes deviendront importantes et, sur la base des résultats des tests, il sera possible de juger de l'état de préparation des athlètes.

Fiabilité (c'est-à-dire la relation entre la variation inter- et intra-individuelle) du test et du critère. Si les résultats du même sujet au saut en longueur debout varient, disons :

Dans les cas de ±10 cm, bien que la longueur du saut puisse être déterminée avec une précision de ±1 cm, il est impossible de distinguer avec certitude les sujets dont les « vrais » résultats sont de 315 et 316 cm.

Il n'y a pas de valeur fixe pour le contenu informatif d'un test, après quoi le test peut être considéré comme approprié. Cela dépend beaucoup de la situation spécifique : la précision souhaitée de la prévision, la nécessité d'obtenir au moins quelques informations supplémentaires sur l'athlète, etc. Dans la pratique, les tests sont utilisés pour les diagnostics dont le contenu informatif n'est pas inférieur à 0,3. Pour une prévision, en règle générale, un contenu informatif plus élevé est nécessaire - au moins 0,6.

Le contenu informatif d’une batterie de tests est naturellement supérieur au contenu informatif d’un seul test. Il arrive souvent que le contenu informatif d'un test individuel soit trop faible pour utiliser ce test. Le contenu informatif d’une batterie de tests peut être tout à fait suffisant.

Le contenu informatif d'un test ne peut pas toujours être déterminé à l'aide d'une expérience et d'un traitement mathématique de ses résultats. Par exemple, si la tâche consiste à élaborer des tickets pour des examens ou des sujets de mémoire (il s'agit également d'un type de test), il est nécessaire de sélectionner les questions les plus informatives, grâce auxquelles vous pouvez évaluer le plus précisément possible les connaissances des diplômés et leur préparation aux travaux pratiques. Jusqu’à présent, dans de tels cas, ils s’appuient uniquement sur une analyse logique et significative de la situation.

Il arrive parfois que le contenu informatif d'un test soit clair sans aucune expérimentation, surtout lorsque le test fait simplement partie des actions qu'un athlète effectue lors des compétitions. Les expériences ne sont guère nécessaires pour prouver le caractère informatif d'indicateurs tels que le temps nécessaire pour effectuer des virages en natation, la vitesse dans les dernières étapes de l'élan au saut en longueur, le pourcentage de lancers francs en basket-ball, la qualité du servir au tennis ou au volley-ball.

Cependant, tous ces tests ne sont pas également informatifs. Par exemple, une touche dans le football, bien qu'un élément du jeu, peut difficilement être considérée comme l'un des indicateurs les plus importants de l'habileté des joueurs de football. S'il existe de nombreux tests de ce type et que vous devez sélectionner les plus informatifs, vous ne pouvez pas vous passer des méthodes mathématiques de théorie des tests.

L'analyse du contenu informatif du test et sa justification expérimentale et mathématique doivent se compléter. Aucune de ces approches, prise à elle seule, n’est suffisante. En particulier, si à la suite d'une expérience un coefficient élevé de contenu informatif d'un test est déterminé, il est nécessaire de vérifier si cela n'est pas une conséquence de ce que l'on appelle une fausse corrélation. On sait que de fausses corrélations apparaissent lorsque les résultats des deux caractéristiques corrélées sont influencés par un troisième indicateur, qui en soi ne représente pas

intérêt. Par exemple, parmi les élèves du secondaire, on peut trouver une corrélation significative entre le résultat de la course à pied de 100 m et la connaissance de la géométrie, car, par rapport aux élèves du primaire, ils montreront en moyenne des performances plus élevées en course à pied et en connaissance de la géométrie. La troisième caractéristique étrangère qui a provoqué l’émergence d’une corrélation était l’âge des sujets. Bien entendu, le chercheur qui ne s'en serait pas rendu compte et aurait recommandé l'examen de géométrie comme test pour les coureurs de 100 m se tromperait. Afin d'éviter de commettre de telles erreurs, il est nécessaire d'analyser les relations de cause à effet qui ont provoqué l'apparition de ce phénomène. corrélation entre le critère et le test. Il est notamment utile d’imaginer ce qui se passerait si les résultats aux tests s’amélioraient. Cela entraînera-t-il une augmentation des résultats des critères ? Dans l'exemple ci-dessus, cela signifie : si l'élève connaît mieux la géométrie, sera-t-il plus rapide sur 100 m ? La réponse négative évidente conduit à une conclusion naturelle : la connaissance de la géométrie ne peut pas servir de test aux sprinteurs. La corrélation trouvée est fausse. Bien entendu, les situations réelles sont bien plus complexes que cet exemple délibérément stupide.

Un cas particulier de caractère informatif significatif des tests est le caractère informatif par définition. Dans ce cas, ils se mettent simplement d'accord sur le sens qu'il faut donner à tel ou tel mot (terme). Par exemple, ils disent : « un saut en hauteur debout se caractérise par la capacité de sauter. » Il serait plus juste de dire ceci : « convenons d’appeler capacité de saut ce qui est mesuré par le résultat d’un saut d’un endroit ». Un tel accord mutuel est nécessaire, car il évite des malentendus inutiles (après tout, quelqu'un peut comprendre, par capacité de saut, les résultats d'un saut dix fois sur une jambe, et envisager un saut en hauteur debout, par exemple, un test de force « explosive » des jambes. ).

56.0 Standardisation des tests

La normalisation des tests de condition physique pour évaluer la performance aérobie humaine est réalisée en adhérant aux principes suivants.

La méthodologie de test doit permettre des mesures directes ou un calcul indirect de la consommation maximale d'oxygène du corps (capacité aérobie), puisque cet indicateur physiologique de la condition physique humaine est le plus important. Il sera désigné par le symbole gpax1ggsht U 0g et exprimé en millilitres par kilogramme de poids du sujet par minute (ml/kg-min.).

En général, la méthodologie de test doit être la même pour les mesures en laboratoire et sur le terrain, cependant :

1. Dans des conditions de laboratoire (laboratoires fixes et mobiles), la performance aérobie d'une personne peut être directement déterminée à l'aide d'un équipement assez complexe et d'un grand nombre de mesures.

2. Sur le terrain, la performance aérobie est évaluée indirectement sur la base d'un nombre limité de mesures physiologiques.

La méthodologie de test doit permettre de comparer leurs résultats.

Les tests doivent être effectués en une journée et de préférence sans interruption. Cela permettra de répartir judicieusement le temps, l’équipement et les efforts lors des tests initiaux et ultérieurs.

La méthodologie de test doit être suffisamment flexible pour permettre de tester des groupes de personnes ayant des capacités physiques différentes, des âges, des sexes, des niveaux d'activité différents, etc.

57,0. Sélection d'équipement

Tous les principes ci-dessus des tests physiologiques peuvent être observés, tout d'abord, sous réserve de la sélection correcte des moyens techniques suivants :

tapis roulant,

ergomètre de vélo,

stepergomètre,

équipement auxiliaire nécessaire pouvant être utilisé dans tout type de test.

57.1. Le tapis roulant peut être utilisé dans une grande variété d’études. Cependant, cet appareil est le plus cher. Même la plus petite version est trop volumineuse pour être largement utilisée sur le terrain. Le tapis roulant doit permettre des vitesses de 3 à (au moins) 8 km/h (2-5 mph) et des inclinaisons de 0 à 30 %. L'inclinaison d'un tapis roulant est définie comme le pourcentage d'élévation verticale par rapport à la distance horizontale parcourue."

La distance et l'élévation verticale doivent être exprimées en mètres, la vitesse en mètres par seconde (m/sec) ou en kilomètres par heure (km/h).

57.2. Vélo ergomètre. Cet appareil est facile à utiliser aussi bien en laboratoire que sur le terrain. Il est assez polyvalent, il peut être utilisé pour effectuer un travail d'intensité variable - du niveau minimal au niveau maximum.

Le vélo ergomètre dispose d'un système de freinage mécanique ou électrique. Le système de freinage électrique peut être alimenté soit par une source externe, soit par un générateur situé sur l'ergomètre.

La résistance mécanique réglable est exprimée en kilogrammes mètres par minute (kgm/min) et en watts. Les kilomètres par minute sont convertis en watts à l'aide de la formule :

1 watt = 6 kgm/min. 2

Le vélo ergomètre doit avoir un siège fixe mobile afin que la hauteur de sa position puisse être ajustée pour chaque personne. Lors des tests, le siège est installé de manière à ce que la personne assise dessus puisse atteindre la pédale inférieure avec une jambe presque complètement tendue. En moyenne, la distance entre le siège et la pédale dans la position abaissée maximale doit être égale à 109 % de la longueur de la jambe du sujet testé.

Il existe différents modèles de vélo ergomètre. Cependant, le type d'ergomètre n'affecte pas les résultats de l'expérience si la résistance spécifiée en watts ou en kilogrammes par minute correspond exactement à la charge externe totale.

Stepergomètre. Il s'agit d'un appareil relativement peu coûteux avec des hauteurs de marche réglables de 0 à 50 cm. Comme un ergomètre pour vélo, il peut être facilement utilisé aussi bien en laboratoire que sur le terrain.

Comparaison de trois options de test. Chacun de ces instruments présente ses propres avantages et inconvénients (selon qu'il est utilisé en laboratoire ou sur le terrain). Habituellement, lorsque vous travaillez sur un tapis roulant, la valeur de max1ggsht U07 est légèrement supérieure à celle lorsque vous travaillez sur un ergomètre pour vélo ; à leur tour, les lectures sur l'ergomètre à vélo dépassent les lectures sur le stepergomètre.

Le niveau de dépense énergétique des sujets au repos ou effectuant une tâche pour vaincre la gravité est directement proportionnel à leur poids. Par conséquent, les exercices sur tapis roulant et stepergomètre créent pour tous les sujets la même charge de travail relative de levage (de leur corps. - NDLR) à une hauteur donnée : à une vitesse et une inclinaison données du tapis roulant, une fréquence de pas et une hauteur de pas sur le stepergomètre, la hauteur du corps sera soulevée - est la même (mais le travail effectué est différent. - NDLR). En revanche, un vélo ergomètre à une valeur fixe de charge donnée nécessite quasiment la même dépense énergétique, quels que soient le sexe et l'âge du sujet.

58.0, Notes générales sur les procédures de test

Pour appliquer des tests à de grands groupes de personnes, des méthodes de test simples et rapides sont nécessaires. Cependant, pour une étude plus détaillée des caractéristiques physiologiques du sujet, des tests plus approfondis et plus laborieux sont nécessaires. Pour valoriser davantage les tests et les utiliser de manière plus flexible, il est nécessaire de trouver le compromis optimal entre ces deux exigences.

58.1. Intensité du travail. Les tests doivent commencer par de petites charges que les sujets les plus faibles peuvent supporter. L'évaluation des capacités d'adaptation des systèmes cardiovasculaire et respiratoire doit être effectuée lors de travaux avec des charges progressivement croissantes. Les limites fonctionnelles doivent donc être établies avec suffisamment de précision. Des considérations pratiques suggèrent de prendre le taux métabolique de base (c'est-à-dire le taux métabolique au repos) comme unité de mesure de la quantité d'énergie requise pour effectuer une activité donnée. La charge initiale et ses étapes ultérieures sont exprimées en Meta, multiples du taux métabolique d'une personne en état de repos complet. Les indicateurs physiologiques qui sous-tendent Meta sont la quantité d'oxygène (en millilitres par minute) consommée par une personne au repos, ou son équivalent calorique (en kilocalories par minute).

Pour surveiller les charges en unités Met ou les valeurs de consommation d'oxygène équivalentes directement pendant les tests, il faut un équipement informatique électronique complexe, qui est actuellement encore relativement inaccessible. Par conséquent, lors de la détermination de la quantité d'oxygène nécessaire au corps pour effectuer des charges d'un certain type et d'une certaine intensité, il est pratiquement pratique d'utiliser des formules empiriques. Les valeurs prédites (basées sur des formules empiriques. - Ed.) de la consommation d'oxygène lors du travail sur un tapis roulant - par vitesse et inclinaison, lors d'un test de pas - par hauteur et fréquence de pas sont en bon accord avec les résultats de mesures directes et peut être utilisé comme l'équivalent physiologique de l'effort physique, avec lequel sont corrélés tous les indicateurs physiologiques obtenus lors des tests.

58.2. Durée des épreuves. La volonté de raccourcir le processus de test ne doit pas se faire au détriment des buts et objectifs du test. Des tests trop courts ne produiront pas de résultats suffisamment distincts et leurs capacités discriminantes seront faibles ; des tests trop longs activent davantage les mécanismes de thermorégulation, ce qui interfère avec l'établissement de performances aérobies maximales. Dans la procédure de test recommandée, chaque niveau de charge est maintenu pendant 2 minutes. La durée moyenne du test est de 10 à 16 minutes.

58.3. Indications pour arrêter le test. Les tests doivent être arrêtés sauf :

la pression différentielle chute régulièrement malgré une charge de travail accrue ;

la pression artérielle systolique dépasse 240-250 mmHg. Art.;

la pression artérielle diastolique dépasse 125 mm Hg. Art.;

des symptômes de malaise apparaissent, tels qu'une douleur thoracique croissante, un essoufflement sévère, une claudication intermittente ;

des signes cliniques d'anoxie apparaissent : pâleur ou cyanose du visage, vertiges, phénomènes psychotiques, absence de réponse à l'irritation ;

Les lectures de l'électrocardiogramme indiquent une arythmie paroxystique superventriculaire ou ventriculaire, l'apparition de complexes extrasystoliques ventriculaires qui surviennent avant la fin de l'onde T, des troubles de la conduction, à l'exception d'un léger blocage du VG, une diminution du type /?--5G horizontal ou descendant de plus de 0,3 mV. .;";, -

58.4. Des mesures de précaution.

Santé du sujet. Avant d'être examiné, le sujet doit subir un examen médical et recevoir un certificat attestant qu'il est en bonne santé. Il est fortement conseillé de faire un électrocardiogramme (au moins une dérivation thoracique). Pour les hommes de plus de 40 ans, un électrocardiogramme est obligatoire. Des mesures de tension artérielle régulièrement répétées doivent faire partie intégrante de l’ensemble de la procédure de test. À la fin du test, les sujets doivent être informés des mesures visant à prévenir une accumulation dangereuse de sang dans les membres inférieurs.

Contre-indications. Le sujet n'est pas autorisé à passer des tests dans les cas suivants :

absence d'autorisation d'un médecin pour participer à des tests avec des charges maximales ;

la température buccale dépasse 37,5°C ;

la fréquence cardiaque après un long repos est supérieure à 100 battements/min ;

déclin évident de l'activité cardiaque;

un cas d'infarctus du myocarde ou de myocardite au cours des 3 derniers mois ; symptômes et lectures d'électrocardiogramme indiquant la présence de ces maladies ; signes d'angine de poitrine;

maladies infectieuses, y compris le rhume.

Les menstruations ne constituent pas une contre-indication à la participation aux tests. Cependant, dans certains cas, il est conseillé de modifier le calendrier de leur détention.

B. ESSAIS NORMES

59,0. Description de la principale méthodologie de conduite des normes

Dans les trois types d’exercices, et que le test soit effectué à une charge maximale ou sous-maximale, la procédure de base du test est la même.

Le sujet arrive au laboratoire en tenue de sport légère et chaussures souples. Dans les 2 heures. Avant de commencer le test, il ne doit pas manger, boire du café ou fumer.

Repos. L'épreuve est précédée d'une période de repos d'une durée de 15 minutes. Pendant ce temps, pendant l'installation des instruments de mesures physiologiques, le sujet est assis confortablement sur une chaise.

Période d'hébergement. Le tout premier test de n'importe quel sujet, comme tous les tests répétés, donnera des résultats assez fiables si le test principal est précédé d'une courte période d'exercice avec une faible charge - une période d'accommodation. Cela dure 3 minutes. et répond aux objectifs suivants :

familiariser le sujet avec l'équipement et le type de travail qu'il doit effectuer ;

étude préliminaire de la réponse physiologique du sujet à une charge d'environ 4 Meta, ce qui correspond à une fréquence cardiaque d'environ 100 battements/min ;

accélérer l’adaptation du corps à l’épreuve elle-même.

Repos. La période d'hébergement est suivie d'une courte période de repos (2 minutes); le sujet est assis confortablement sur une chaise pendant que l'expérimentateur effectue les préparations techniques nécessaires.

Test. Au début du test, une charge égale à la charge de la période d'accommodation est fixée, et le sujet effectue les exercices sans interruption jusqu'à la fin du test. Toutes les 2 minutes. la charge de travail augmente de 1 mètre.

Le test s'arrête lorsque l'une des conditions suivantes se produit :

le sujet est incapable de continuer à accomplir la tâche ;

il existe des signes de décompensation physiologique (voir 58.3) ;

les données obtenues à la dernière étape de la charge permettent l'extrapolation de la performance aérobie maximale sur la base de mesures physiologiques séquentielles (effectuées lors des tests. - NDLR).

59.5. Des mesures. La consommation maximale d'oxygène en millilitres par kilogramme par minute est mesurée directement ou calculée. Les méthodes de détermination de la consommation d'oxygène sont très diverses, tout comme les techniques complémentaires utilisées pour analyser les capacités physiologiques de chaque individu. Ce sera discuté plus en détails plus tard.

59.6. Récupération. A la fin de l'expérience, l'observation physiologique se poursuit pendant au moins 3 minutes. Le sujet repose à nouveau sur une chaise, levant légèrement les jambes.

Note. La technique de test décrite fournit des données physiologiques comparables obtenues avec la même séquence de charge croissante sur un tapis roulant, un ergomètre pour vélo et un stepergomètre. Ci-dessous, la méthodologie de test est décrite séparément pour chacun des trois appareils.

60,0. Test sur tapis roulant

Équipement. Tapis roulant et équipement auxiliaire nécessaire.

Description. Les procédures de test de base décrites en 59.0 sont soigneusement suivies.

La vitesse du tapis roulant lorsque le sujet marche dessus est de 80 m/min (4,8 km/h ou 3 mph). À cette vitesse, l’énergie nécessaire pour se déplacer horizontalement est d’environ 3 Meta ; Chaque augmentation de 2,5 % de la pente ajoute une unité de taux métabolique initial, soit 1 Met, à la dépense énergétique. À la fin des 2 premières minutes. l'inclinaison du tapis roulant augmente rapidement jusqu'à 5 %, au bout des 2 minutes suivantes - jusqu'à 7,5 %, puis jusqu'à 10 %, 12,5 %, etc. Le schéma complet est donné dans le tableau. 1.

Documents similaires

    Effectuer des tests de contrôle à l'aide d'exercices de contrôle ou de tests pour déterminer l'état de préparation à l'exercice physique. Le problème de la standardisation des tests. Validité externe et interne des tests. Maintenir un protocole d'examen de contrôle.

    résumé, ajouté le 12/11/2009

    Caractéristiques des capacités motrices et méthodes pour développer la flexibilité, l'endurance, l'agilité, la force et la vitesse. Tester les capacités motrices des écoliers lors des cours d'éducation physique. Application des tests moteurs dans les activités pratiques.

    thèse, ajoutée le 25/02/2011

    Évaluer la dynamique d'évolution des données anthropométriques chez les écoliers systématiquement impliqués dans l'athlétisme et les écoliers qui ne participent pas aux sections sportives. Élaboration de tests pour déterminer la condition physique générale ; analyse des résultats.

    thèse, ajoutée le 07/07/2015

    Les grands domaines d'utilisation des tests, leur classification. Tests de sélection en lutte. Méthodes d'évaluation des réalisations sportives. Tester l'endurance particulière d'un lutteur. La relation entre les indicateurs de test et les compétences techniques des lutteurs libres.

    thèse, ajoutée le 03/03/2012

    Évaluer l’endurance particulière d’un nageur à l’aide d’exercices de contrôle. Adaptabilité des réactions fondamentales des systèmes physiologiques en milieu aquatique. Développement de principes d'évaluation des indicateurs médicaux et biologiques utilisés lors du test d'un nageur.

    article, ajouté le 03/08/2009

    Considération d’une énergie saine comme base fondamentale de la santé. Familiarisation avec les caractéristiques des exercices de gymnastique selon le système qigong. Sélection d'une série d'exercices pour les exercices à domicile. Réaliser des tests pour tirer des conclusions sur le travail effectué.

    thèse, ajoutée le 07/07/2015

    La métrologie du sport est l'étude des grandeurs physiques dans l'éducation physique et le sport. Bases de la mesure, théorie des tests, évaluations et normes. Méthodes d'obtention d'informations sur l'évaluation quantitative de la qualité des indicateurs ; qualimétrie. Éléments de statistiques mathématiques.

    présentation, ajouté le 12/02/2012

    L'essence et l'importance du contrôle dans l'éducation physique et ses types. Test et évaluation des capacités motrices acquises lors des cours d'éducation physique. Tester le niveau de condition physique. Suivi de l'état fonctionnel des étudiants.

    travail de cours, ajouté le 06/06/2014

    Calcul des erreurs de mesure absolues et relatives. Conversion des résultats des tests en scores à l'aide d'échelles régressives et proportionnelles. Classement des résultats des tests. Changements dans les placements en groupe par rapport aux évaluations précédentes.

    test, ajouté le 11/02/2013

    Mode activité motrice. Le rôle des facteurs déterminant la performance physique des joueurs de football à différentes étapes de l'entraînement de longue durée. Types d'aides ergogéniques. Méthodologie de réalisation de tests pour déterminer le niveau de performance physique.

RAPPORT

étudiant 137 gr. Ivanova I.

sur le test de l'efficacité des méthodes de formation
utiliser des méthodes de statistiques mathématiques

Des sections du rapport sont rédigées conformément aux exemples donnés dans ce manuel à la fin de chaque étape du jeu. Les rapports complétés sont conservés au Département de Biomécanique jusqu'à leur consultation avant l'examen. Les étudiants qui ne se sont pas présentés pour le travail effectué et n'ont pas remis le cahier avec le rapport à l'enseignant ne sont pas autorisés à passer l'examen de métrologie du sport.


Étape I du jeu d'entreprise
Contrôle et mesure dans le sport

Cible:

1. Se familiariser avec les fondements théoriques du contrôle et de la mesure dans le sport et l'éducation physique.

2. Acquérir des compétences dans la mesure des indicateurs de performance de vitesse chez les athlètes.

1. Contrôle physique
éducation et sport

L'éducation physique et l'entraînement sportif ne sont pas un processus spontané mais contrôlé. À chaque instant, une personne se trouve dans un certain état physique, qui est déterminé principalement par la santé (conformité des signes vitaux à la norme, le degré de résistance du corps aux influences soudaines défavorables), le physique et l'état des fonctions physiques. .

Il est conseillé de gérer la condition physique d’une personne en la modifiant dans le bon sens. Cette prise en charge s'effectue au moyen de l'éducation physique et du sport, qui comprennent notamment des exercices physiques.

Il semble seulement que l'enseignant (ou l'entraîneur) contrôle l'état physique, influençant le comportement de l'athlète, c'est-à-dire proposer certains exercices physiques, ainsi que contrôler l'exactitude de leur mise en œuvre et les résultats obtenus. En réalité, le comportement de l’athlète n’est pas contrôlé par l’entraîneur, mais par l’athlète lui-même. Lors de l'entraînement sportif, le système autonome (le corps humain) est influencé. Les différences individuelles dans l'état des athlètes ne garantissent pas que le même impact provoquera la même réponse. La question du feedback est donc pertinente : informations sur l’état de l’athlète reçues par l’entraîneur lors du contrôle du processus d’entraînement.

Le contrôle en éducation physique et sportive repose sur la mesure d'indicateurs, la sélection des plus significatifs et leur traitement mathématique.

La gestion du processus d'éducation et de formation comprend trois étapes :

1) collecte d'informations ;

2) son analyse ;

3) prise de décision (planification).

La collecte d'informations s'effectue généralement lors d'un contrôle global dont les objets sont :

1) activité compétitive ;

2) charges d'entraînement ;

3) l’état de l’athlète.



Il existe (V.A. Zaporozhanov) trois types d’états de l’athlète en fonction de la durée de l’intervalle nécessaire au passage d’un état à un autre.

1. Mise en scèneétat (permanent). Enregistré relativement long – semaines ou mois. Une caractéristique complexe de l'état par étapes d'un athlète, reflétant sa capacité à démontrer des réalisations sportives, est appelée préparation, et l'état de préparation optimal (meilleur pour un cycle d'entraînement donné) est appelé uniforme de sport. Évidemment, un état de forme ne peut être atteint ou perdu en un ou plusieurs jours.

2. ActuelÉtat. Changements sous l'influence d'un ou plusieurs cours. Souvent, les conséquences de la participation à des concours ou des travaux de formation effectués dans l'une des classes s'éternisent sur plusieurs jours. Dans ce cas, l'athlète constate généralement des phénomènes à la fois défavorables (par exemple, des douleurs musculaires) et positifs (par exemple, un état de performance accrue). De tels changements sont appelés effet d'entraînement retardé.

L'état actuel de l'athlète détermine la nature des prochaines séances d'entraînement et l'ampleur des charges qu'elles contiennent. Un cas particulier de l'état actuel, caractérisé par la volonté de réaliser un exercice compétitif dans les prochains jours avec un résultat proche du maximum, est appelé état de préparation actuel.

3. OpérationnelÉtat. Changements sous l'influence exécution unique exercice physique et est temporaire (par exemple, fatigue causée par une course unique sur une distance ; augmentation temporaire des performances après un échauffement). L'état opérationnel de l'athlète change au cours de la séance d'entraînement et doit être pris en compte lors de la planification des intervalles de repos entre les approches, les courses répétées, lors de la décision sur l'opportunité d'un échauffement supplémentaire, etc. Un cas particulier d'état opérationnel, caractérisé par une volonté immédiate d'effectuer un exercice compétitif avec un résultat proche du maximum, est appelé préparation opérationnelle.

Conformément à la classification ci-dessus, il existe trois grands types de suivi de l’état du sportif :

1) contrôle de scène. Son objectif est d'évaluer l'état de préparation (préparation) de l'athlète ;

2) contrôle actuel. Sa tâche principale est de déterminer les fluctuations quotidiennes (actuelles) de l’état de l’athlète ;

3) contrôle opérationnel. Son objectif est une évaluation rapide de l’état actuel de l’athlète.

Une mesure ou un test effectué pour déterminer la condition ou la capacité d'un athlète est appelé test. La procédure de mesure ou de test est appelée test.

Tout test implique une mesure. Mais toutes les mesures ne servent pas de test. Seuls ceux qui satisfont aux exigences métrologiques suivantes peuvent être utilisés comme essais : exigences:

2) normalisation ;

3) la présence d'un système de notation ;

4) fiabilité et contenu informatif (facteur de qualité) des tests ;

5) type de contrôle (étape par étape, courant ou opérationnel).

Un test basé sur des tâches motrices est appelé moteur. Il existe trois groupes de tests moteurs :

1. Exercices de contrôle dans lesquels l'athlète est chargé de montrer des résultats optimaux. Le résultat du test est une réussite motrice. Par exemple, le temps qu’il faut à un athlète pour parcourir une distance de 100 m.

2. Des tests fonctionnels standards, au cours desquels la tâche, la même pour tous, est dosée soit en fonction de la quantité de travail effectué, soit en fonction de l'ampleur des changements physiologiques. Le résultat du test est constitué d'indicateurs physiologiques ou biochimiques lors d'un travail standard ou de réalisations motrices avec un nombre standard de changements physiologiques. Par exemple, le pourcentage d'augmentation de la fréquence cardiaque après 20 squats ou la vitesse à laquelle un athlète court avec une fréquence cardiaque fixe de 160 battements par minute.

3. Tests fonctionnels maximaux, au cours desquels l'athlète doit montrer des résultats optimaux. Le résultat du test est constitué d'indicateurs physiologiques ou biochimiques au travail maximum. Par exemple, consommation maximale d’oxygène ou dette maximale en oxygène.

Les tests de haute qualité nécessitent une connaissance de la théorie de la mesure.

bases de la théorie des tests

Concepts de base de la théorie des tests

Une mesure ou un test effectué pour déterminer la condition ou la capacité d'un athlète est appelé test .

Toutes les mesures ne peuvent pas être utilisées comme tests, mais uniquement celles qui répondent à des exigences particulières. Ceux-ci inclus:

1. standardisation (la procédure et les conditions d'essai doivent être les mêmes dans tous les cas d'application de l'essai) ;
2. fiabilité ;
3. contenu informatif ;
4. Disponibilité d'un système de notation.

Les tests qui répondent aux exigences de fiabilité et de contenu informatif sont appelés solide ou authentique (grec Authentico – de manière fiable).

Le processus de test est appelé essai ; la valeur numérique obtenue à la suite de la mesure - résultat du test (ou résultat du test). Par exemple, la course de 100 m est un test, la procédure de conduite des courses et le chronométrage sont des tests et le temps de la course est le résultat du test.

Les tests basés sur des tâches motrices sont appelés moteur ou moteur . Leurs résultats peuvent être soit des acquis moteurs (temps pour parcourir la distance, nombre de répétitions, distance parcourue, etc.), soit des indicateurs physiologiques et biochimiques.

Parfois, on utilise non pas un, mais plusieurs tests qui ont un seul objectif final (par exemple, évaluer la condition de l'athlète pendant la période d'entraînement compétitif). Ce groupe de tests est appelé complexe ou batterie de tests .

Le même test, appliqué aux mêmes sujets, devrait donner des résultats identiques dans les mêmes conditions (sauf si les sujets eux-mêmes ont changé). Cependant, même avec la normalisation la plus stricte et un équipement précis, les résultats des tests varient toujours quelque peu. Par exemple, un sujet qui vient d'afficher un résultat de 215 kg lors d'un test dynamométrique de soulevé de terre, n'affiche que 190 kg lors de la répétition.

2. Testez la fiabilité et les moyens de la déterminer

Fiabilité Le test est le degré d'accord entre les résultats lors de tests répétés sur les mêmes personnes (ou d'autres objets) dans les mêmes conditions.

La variation des résultats test-retest est appelée au sein d’un individu, ou au sein d’un groupe, ou au sein d’une classe.

Quatre raisons principales provoquent cette variation :

1. Changement de l'état des sujets (fatigue, entraînement, apprentissage, changement de motivation, concentration, etc.).
2. Modifications incontrôlées des conditions et équipements externes (température, vent, humidité, tension d'alimentation, présence de personnes non autorisées, etc.), c'est-à-dire tout ce qui est réuni par le terme « erreur de mesure aléatoire ».
3. Changer l'état de la personne qui effectue ou évalue le test (et, bien sûr, remplacer un expérimentateur ou un juge par un autre).
4. Imperfection du test (il existe des tests qui ne sont évidemment pas fiables. Par exemple, si les sujets effectuent des lancers francs dans un panier de basket, alors même un basketteur avec un pourcentage élevé de coups sûrs peut accidentellement se tromper lors des premiers lancers ).

La principale différence entre la théorie de la fiabilité des tests et la théorie des erreurs de mesure réside dans le fait que dans la théorie des erreurs, la valeur mesurée est supposée constante, tandis que dans la théorie de la fiabilité des tests, on suppose qu'elle change d'une mesure à l'autre. Par exemple, s'il est nécessaire de mesurer le résultat d'une tentative terminée lors d'un saut en longueur, il est alors tout à fait précis et ne peut pas changer de manière significative au fil du temps. Bien entendu, pour des raisons aléatoires (par exemple, tension inégale du ruban à mesurer), il est impossible de mesurer ce résultat avec une précision idéale (disons jusqu'à 0,0001 mm). Cependant, en utilisant un outil de mesure plus précis (comme un compteur laser), leur précision peut être augmentée jusqu'au niveau requis. Dans le même temps, si la tâche consiste à déterminer l'état de préparation d'un sauteur à différentes étapes du cycle d'entraînement annuel, alors la mesure la plus précise des résultats qu'il montre ne sera d'aucune utilité : après tout, ils changeront d'une tentative à l'autre. tenter.

Pour comprendre l'idée des méthodes utilisées pour juger de la fiabilité des tests, regardons un exemple simplifié. Supposons qu'il soit nécessaire de comparer les résultats du saut en longueur debout de deux athlètes sur la base de deux tentatives effectuées. Supposons que les résultats de chacun des athlètes varient de ± 10 cm par rapport à la valeur moyenne et soient respectivement égaux à 230 ± 10 cm (soit 220 et 240 cm) et 280 ± 10 cm (soit 270 et 290 cm). Dans ce cas, la conclusion, bien entendu, sera sans ambiguïté : le deuxième athlète est supérieur au premier (les différences entre les moyennes de 50 cm sont nettement supérieures aux fluctuations aléatoires de ± 10 cm). Si, avec la même variation intragroupe (± 10 cm), la différence entre les valeurs moyennes des sujets (variation intergroupe) est faible, alors il sera beaucoup plus difficile de tirer une conclusion. Supposons que les valeurs moyennes seront d'environ 220 cm (dans une tentative - 210, dans l'autre - 230 cm) et 222 cm (212 et 232 cm). Dans ce cas, le premier sujet saute de 230 cm lors de la première tentative et le second de seulement 212 cm ; et il semble que le premier soit nettement plus fort que le second. Cet exemple montre clairement que la principale signification n’est pas la variabilité intraclasse elle-même, mais sa relation avec les différences interclasses. La même variabilité intraclasse donne des fiabilités différentes avec des différences égales entre classes (dans le cas particulier entre celles étudiées, Fig. 14).

Riz. 14. Le rapport de variation inter- et intraclasse avec une fiabilité élevée (en haut) et faible (en bas) :

traits verticaux courts - données de tentatives individuelles ;

Résultats moyens de trois matières.

La théorie de la fiabilité des tests repose sur le fait que le résultat de toute mesure effectuée sur une personne est la somme de deux valeurs :

où : - le résultat dit vrai qu'ils souhaitent enregistrer ;

Erreur causée par des changements incontrôlés dans l'état du sujet et des erreurs de mesure aléatoires.

Le vrai résultat s'entend comme la valeur moyenne de x pour un nombre infini d'observations dans les mêmes conditions (pour cette raison, le signe est mis en x).

Si les erreurs sont aléatoires (leur somme est nulle et, à tentatives égales, elles ne dépendent pas les unes des autres), alors des statistiques mathématiques il résulte :

ceux. La variance des résultats enregistrés dans l'expérience est égale à la somme des variances des vrais résultats et des erreurs.

Facteur de fiabilité est appelé le rapport entre la dispersion réelle et la dispersion enregistrée dans l'expérience :

En plus du coefficient de fiabilité, ils utilisent également indice de fiabilité:

qui est considéré comme un coefficient de corrélation théorique entre les valeurs de test enregistrées et les vraies.

Le concept de véritable résultat de test est une abstraction (il ne peut pas être mesuré expérimentalement). Nous devons donc utiliser des méthodes indirectes. La méthode la plus préférable pour évaluer la fiabilité est l’analyse de la variance suivie du calcul des coefficients de corrélation intraclasse. L'analyse de variance permet de décomposer la variation enregistrée expérimentalement dans les résultats des tests en composantes déterminées par l'influence de facteurs individuels. Par exemple, si nous enregistrons les résultats des sujets dans n'importe quel test, en répétant ce test à des jours différents et en faisant plusieurs tentatives chaque jour, en changeant périodiquement d'expérimentateur, alors des variations se produiront :

a) de sujet à sujet ;

b) au jour le jour ;

c) d'expérimentateur à expérimentateur ;

d) de tentative en tentative.

L'analyse de variance permet d'isoler et d'évaluer ces variations.

Ainsi, afin d'évaluer la fiabilité pratique du test, il faut, d'une part, réaliser une analyse de variance, et d'autre part, calculer le coefficient de corrélation intraclasse (coefficient de fiabilité).

Avec deux tentatives, la valeur du coefficient de corrélation intraclasse coïncide pratiquement avec les valeurs du coefficient de corrélation habituel entre les résultats de la première et de la deuxième tentatives. Par conséquent, dans de telles situations, le coefficient de corrélation habituel peut être utilisé pour évaluer la fiabilité (il estime la fiabilité d’une tentative plutôt que de deux).

Concernant la fiabilité des tests, il faut distinguer leur stabilité (reproductibilité), leur cohérence et leur équivalence.

Sous la stabilité Le test comprend la reproductibilité des résultats lorsqu'ils sont répétés après un certain temps dans les mêmes conditions. Le nouveau test est généralement appelé retester.

Cohérence Le test se caractérise par l'indépendance des résultats du test par rapport aux qualités personnelles de la personne qui effectue ou évalue le test.

Lors de la sélection d'une épreuve parmi un certain nombre d'épreuves similaires (par exemple sprint à 30, 60 et 100 m), le degré de concordance des résultats est évalué selon la méthode des formes parallèles. Le coefficient de corrélation calculé entre les résultats est appelé coefficient d'équivalence.

Si tous les tests inclus dans une suite de tests sont hautement équivalents, on l'appelle homogène. L'ensemble de ce complexe mesure une propriété particulière de la motricité humaine (par exemple, un complexe composé de sauts debout, debout et triples ; le niveau de développement des qualités vitesse-force est évalué). S'il n'y a pas de tests équivalents dans le complexe, c'est-à-dire que les tests qui y sont inclus mesurent des propriétés différentes, alors on l'appelle hétérogène (par exemple, un complexe composé de dynamométrie de soulevé de terre, saut d'Abalakov, course de 100 m).

La fiabilité des tests peut être augmentée dans une certaine mesure par :

a) une normalisation plus stricte des tests ;

b) augmenter le nombre de tentatives ;

c) augmenter le nombre d'évaluateurs (juges, expérimentateurs) et accroître la cohérence de leurs avis ;

d) augmenter le nombre de tests équivalents ;

e) meilleure motivation des sujets.

Exemple 10.1.

Pour déterminer la fiabilité du triple saut debout, il faut évaluer les capacités de vitesse et de force des sprinteurs, si les exemples de données sont les suivants :

Solution:

1. Saisissez les résultats du test dans la feuille de calcul :

2. Remplacez les résultats obtenus dans la formule de calcul du coefficient de corrélation de rang :

3. Déterminez le nombre de degrés de liberté à l'aide de la formule :

Conclusion: la valeur calculée obtenue Par conséquent, avec confiance en 99% on peut dire que le test du triple saut debout est fiable.