外傷患者の病院死亡予測: さまざまな SMOTE の比較
BMC Medical Research Methodology volume 23、記事番号: 101 (2023) この記事を引用
1026 アクセス
1 引用
1 オルトメトリック
メトリクスの詳細
トラウマは世界中で最も重大な公衆衛生問題の 1 つであり、死亡や障害につながり、あらゆる年齢層に影響を及ぼします。 したがって、ICU に入院した外傷患者の死亡率を予測するモデルに大きな関心が集まっています。 本研究の主な目的は、不均衡なデータを使用して外傷患者の院内死亡率を予測するための SMOTE ベースの機械学習ツールを開発および評価することです。
この後ろ向きコホート研究は、2020年3月から2021年3月まで、イラン西部ハマダーン州のベサット病院の集中治療室に入院した外傷患者126人を対象に実施された。データは患者の医療情報記録から抽出された。 データの不均衡な特性に従って、SMOTE 技術、つまり SMOTE、Borderline-SMOTE1、Borderline-SMOTE2、SMOTE-NC、および SVM-SMOTE が一次前処理に使用されました。 次に、ディシジョン ツリー (DT)、ランダム フォレスト (RF)、ナイーブ ベイズ (NB)、人工ニューラル ネットワーク (ANN)、サポート ベクター マシン (SVM)、極端勾配ブースティング (XGBoost) 手法を使用して、患者の入院先を予測しました。外傷による死亡率。 使用されたメソッドのパフォーマンスは、感度、特異度、陽性的中率 (PPV)、陰性的中率 (NPV)、精度、曲線下面積 (AUC)、幾何平均 (G 平均)、F1 スコア、および P によって評価されました。 -マクネマー検定の値。
ICUに入院した126人の患者のうち、117人(92.9%)が生き残り、9人(7.1%)が死亡した。 外傷の日から転帰の日までの平均追跡期間は 3.98 ± 4.65 日でした。 ML アルゴリズムのパフォーマンスは、データが不均衡であると良好ではありませんが、SMOTE ベースの ML アルゴリズムのパフォーマンスは大幅に向上します。 すべての SMOTE ベースのモデルの ROC 曲線下面積 (AUC) の平均は 91% 以上でした。 データセットのバランスをとる前の F1 スコアと G 平均は、ANN を除くすべての ML モデルで 70% 未満でした。 対照的に、バランスのとれたデータセットの F1 スコアと G 平均は、すべての SMOTE ベースのモデルで 90% 以上に達しました。 すべての SMOTE ベースの ML 手法の中で、SMOTE に基づく RF と ANN、および SMOTE-NC に基づく XGBoost が、すべての評価基準で最高の値を達成しました。
この研究では、SMOTE ベースの ML アルゴリズムの方が、ML アルゴリズムよりも外傷性損傷の結果をより正確に予測できることが示されました。 これらは、ICU 医師が臨床上の意思決定を行うのを支援する可能性があります。
査読レポート
トラウマは世界で最も重大な公衆衛生問題の 1 つであり、死亡や障害につながり、あらゆる年齢層に影響を及ぼします [1]。 外傷は、人生の最初の 40 年間における死亡の主な原因です [2]。 トラウマにより年間 440 万人が死亡しており、世界中の死亡者数のほぼ 8% を占めています [1、3]。 この点において、外傷の影響と外傷による死亡者数を減らすための解決策を見つけることが重要です。 たとえば、外傷患者の転帰を高精度で予測する能力を向上させ、患者の転帰に影響を与える重要な要因を特定することは、外傷医療チームが外傷患者を治療する迅速な取り組みに役立つ可能性があります。
これまでの多くの研究では、外傷に影響を与える要因を特定するために、ロジスティック回帰モデルやポアソン回帰モデルなどの伝統的な方法が使用されてきました[4、5、6]。 多くの研究では、最も一般的なモデルの 1 つとして外傷傷害重症度スコア (TRISS) も使用されています。このモデルは、ロジスティック回帰 (LR) に基づいており、単一施設の小規模コホートを使用して外傷性疾患患者の生存確率を予測しています。怪我[7]。 しかし、TRISS とそのさまざまな修正は証拠に基づいたツールであり、いくつかの研究結果は、それらが患者の状態を誤って分類することによって医師を誤解させる可能性があることを示しています [8]。 それにもかかわらず、共線性、不均一分散性、高次相互作用、および変数間の非線形関係が存在する場合、両方のカテゴリーのモデルのパフォーマンスが低下しました [9、10、11]。 したがって、より良い患者転帰を達成し、リソースを最大限に活用するには、これらの仮定に限定されない、より価値があり正確な予後ツールが必要です。