banner
ニュース センター
魅力的なデザイン

医療上の意思決定に情報を提供する臨床データマイニング用のモーメント カーネル マシン

Jun 03, 2023

Scientific Reports volume 13、記事番号: 10459 (2023) この記事を引用

362 アクセス

4 オルトメトリック

メトリクスの詳細

機械学習を活用した医療意思決定には、モデルの節約の達成、信頼できる予測の確保、高い計算効率によるリアルタイムの推奨事項の提供という 3 つの大きな課題があります。 この論文では、医療上の意思決定を分類問題として定式化し、これらの課題に取り組むモーメント カーネル マシン (MKM) を開発します。 私たちのアプローチの主なアイデアは、各患者の臨床データを確率分布として扱い、これらの分布のモーメント表現を活用して MKM を構築することです。MKM は、重要な情報を保持しながら高次元の臨床データを低次元の表現に変換します。 次に、このマシンをさまざまな術前臨床データセットに適用して、手術結果を予測し、医療上の意思決定に情報を提供します。これにより、分類に必要な計算能力と時間が大幅に削減され、既存の方法と比較して良好なパフォーマンスが得られます。 さらに、合成データセットを利用して、開発されたモーメントベースのデータマイニングフレームワークがノイズや欠損データに対して堅牢であり、個別化された医療意思決定を支援する満足のいく予測を生成する効率的な方法を提供するモデルの節約を実現することを実証します。

主要な医療介入としての手術は、通常、他の治療法では満足のいく結果が得られなかった場合に検討されます。 電子医療記録 (EHR) データなどの患者の術前臨床データに基づいて手術後の有害事象を予測することは、医師と患者の両方に意思決定の情報を提供する上で非常に重要です 1,2。 近年、臨床データの可用性とコンピューティング能力の向上により、臨床データから情報を抽出するための機械学習 (ML) 技術の開発が大幅に刺激されました。 特に、ML アルゴリズムは、EHR による術後結果の術前予測のための AI 支援医療処置において大きな進歩を遂げました 3,4。 一般的な ML 問題は、各入力データ点 \({\textbf{X}}\) を目的の出力 \({\textbf{y}}\) にマッピングする適切な関数 f を見つけることに重点を置いています。

このタスクは、診断、治療、バイタルサイン、検査値など、サイズが大きく、さまざまな種類のデータが混在する臨床記録を含むデータセットの場合は特に困難です5。

過去 10 年間、術後事象の予測を通じて医療上の意思決定を支援するために、ML を利用した多数の方法が提案されてきました。 たとえば、減量手術の場合、注目すべき貢献には、再入院率を推定するためのロジスティック回帰 (LR) とポアソン回帰 (PR) の適用6、再入院率を予測するためのニューラル ネットワーク (NN) と勾配ブースティング マシン (GBM) の利用が含まれます。胃腸漏出と静脈血栓塞栓症7,8、肥満手術後の30日間の再入院のリスクを予測するスーパー学習アルゴリズムの開発9,10。 可能性のある術後イベントの評価に加えて、ML 手法は、前癌病変や前癌病変などの医療画像の異常を特定するために広く適用されています 11、12、13、14。 主な例は、冠状動脈性心疾患および心不全患者の死亡率予測のための深層学習アプローチ 15 から、冠状動脈疾患が疑われる患者の早期血行再建の予後を予測するための定量的画像特徴抽出方法 16 まで多岐にわたります。 アルゴリズム的には、ディープ ニューラル ネットワークは、大規模なデータセット内の隠れた構造を発見できる能力により、適切な条件下で満足のいく結果を達成する可能性が高いため、医学研究者や医療従事者にとって魅力的でした 17。 これらの研究の中で、医学研究への ML 技術の統合は、多くの点で成功していますが、通常、疎性や不規則性などの不均質な構造と、臨床データのサイズが大きいため、計算効率が低いという問題があります 18。 一般に、ML アルゴリズムの複雑さは、時間とメモリ使用量がデータ サイズの関数として指数関数的に増大します。 さらに、より良いパフォーマンスを生み出すために、ディープ ニューラル ネットワークは、計算効率に加えて、ノイズに対する堅牢性とモデルの節約性をさらに犠牲にします19。

0\) is a constant controlling the sparsity of the solution. Moreover, \(\bar{{\textbf{K}}}^{(j)} = \Gamma {\textbf{K}}^{(j)} \Gamma\) and \(\bar{{\textbf{L}}} = \Gamma {\textbf{L}} \Gamma\) are centered Gram matrices with the entries \({\textbf{K}}_{m,n}^{(j)} = k(p_{j,m},p_{j,n})\) and \({\textbf{L}}_{m,n} = l(y_m,y_n)\) defined by using some kernel functions k and l, where \(y_i\) denotes the class label of the \(i^{\textrm{th}}\) patient and \(\Gamma = {\textbf{I}}_N - \frac{1}{N} {\textbf{1}}_N {\textbf{1}}^{\top }_N\) is the centering matrix. Moreover, for memory and computational efficiency, we use Block HSIC Lasso24 in our experiments./p>