Vidéo

Blog

MaisonMaison / Blog / Vidéo

May 13, 2024

Vidéo

Scientific Reports volume 13, Numéro d'article : 1038 (2023) Citer cet article 1400 Accès 1 Détails d'Altmetric Metrics Pour garantir des résultats cliniques satisfaisants, l'évaluation des compétences chirurgicales doit être

Rapports scientifiques volume 13, Numéro d'article : 1038 (2023) Citer cet article

1400 accès

1 Altmétrique

Détails des métriques

Pour garantir des résultats cliniques satisfaisants, l’évaluation des compétences chirurgicales doit être objective, rapide et de préférence automatisée, ce qui n’est actuellement pas réalisable. L'évaluation vidéo (VBA) est déployée dans des contextes peropératoires et de simulation pour évaluer l'exécution des compétences techniques. Cependant, VBA est manuel, prend beaucoup de temps et est sujet à une interprétation subjective et à une faible fiabilité inter-évaluateurs. Nous proposons ici un modèle d'apprentissage profond (DL) qui peut fournir automatiquement et objectivement une évaluation sommative à enjeux élevés de l'exécution des compétences chirurgicales basée sur des flux vidéo et une évaluation formative à faibles enjeux pour guider l'acquisition de compétences chirurgicales. L'évaluation formative est générée à l'aide de cartes thermiques de caractéristiques visuelles en corrélation avec les performances chirurgicales. Par conséquent, le modèle DL ouvre la voie à l’évaluation quantitative et reproductible des tâches chirurgicales à partir de vidéos avec le potentiel d’une large diffusion dans la formation chirurgicale, la certification et l’accréditation.

La compétence du chirurgien est le facteur déterminant le plus important du succès d’une intervention chirurgicale1. L'évaluation des compétences chirurgicales peut être formative ou sommative. L’évaluation formative présente de faibles enjeux. Les experts le fournissent généralement à titre indicatif pendant la chirurgie. D’un autre côté, l’évaluation sommative est utilisée dans les certifications ou accréditations à enjeux élevés et est généralement associée à un score quantitatif calculé par les surveillants. Bien que l’observation directe des chirurgiens en salle d’opération ou sur un simulateur reste la référence actuelle en matière d’évaluation des compétences chirurgicales, l’évaluation par vidéo (VBA) fait l’objet d’une attention croissante2,3,4. L'American Board of Surgery (ABS) étudie VBA en tant que composante du programme de certification continue pour les chirurgiens généralistes et les spécialités connexes5. Cependant, en tant que procédure post-hoc, VBA est une procédure manuelle et chronophage, subjective et sujette à une faible fiabilité inter-évaluateurs2,3. De plus, les méthodologies VBA impliquent souvent d'éditer les vidéos en extraits pour réduire la charge de travail3, favorisant la subjectivité en raison du parti pris de l'éditeur2,3. En outre, de nombreuses études ont fait état de preuves de validité inférieure et de prédictions de scores gonflées via des vidéos montées par rapport à des vidéos complètes3. Une autre limite est que le VBA est presque exclusivement formatif, c'est-à-dire à faibles enjeux, et il existe une lacune notable dans la littérature concernant l'utilisation du VBA pour une évaluation sommative, c'est-à-dire à enjeux élevés3, comme les principes fondamentaux de la chirurgie laparoscopique (FLS). Il est donc nécessaire de développer une approche objective, efficace et automatisée pour VBA.

Plusieurs modèles d'apprentissage profond (DL) ont été développés pour l'évaluation automatisée et objective des compétences6, dont la plupart reposent sur l'obtention de données cinématiques basées sur des capteurs auprès des chirurgiens. Cela demande du temps et du travail et peut interférer avec la tâche chirurgicale. En revanche, des vidéos sont collectées régulièrement dans le cadre de la plupart des interventions chirurgicales2, ce qui rend possible la collecte de données à grande échelle. Les modèles DL vidéo existants utilisent l’édition pour simplifier le problème7,8. De plus, ces modèles utilisent des extraits de code préservant les étiquettes dans lesquels chaque extrait partage l'étiquette de la vidéo complète. Cela pose problème car les étiquettes de la vidéo entière peuvent ne pas s'appliquer à des extraits individuels. Enfin, les modèles DL actuels ne fournissent pas de moyens pour évaluer les caractéristiques saillantes qui caractérisent la performance. Les techniques d’intelligence artificielle explicable (XAI)9,10, telles que les cartes d’activation de classe (CAM)11, peuvent résoudre ce problème10,12. Néanmoins, il n’a pas été démontré qu’ils fournissent une évaluation formative fiable.

Pour remédier à ces limitations, nous proposons un modèle DL, le Video-Based Assessment Network (VBA-Net), qui peut utiliser des séquences vidéo chirurgicales complètes pour fournir des scores chirurgicaux sommatifs et générer des commentaires formatifs basés sur la performance chirurgicale. La figure 1 illustre l’aperçu de l’étude. Deux ensembles de données impliquant la découpe de modèles chirurgicaux (PC) ont été utilisés pour développer le VBA-Net (Fig. 1a). De plus, pour élucider la généralisabilité de notre modèle, nous l'avons comparé à l'ensemble de données publiques le plus couramment utilisé, JIGSAWS6,13. Enfin, nous avons fourni un retour formatif via les CAM et présenté un outil statistique indépendant du modèle pour valider leur importance.