سرطان حنجره (voice box) یکی از انواع نادر اما جدی سرطان است که در سال 2021 حدود 1.1 میلیون مورد در سراسر جهان تشخیص داده شد و تقریباً 100 هزار مرگ مرتبط با آن ثبت شد. تشخیص کنونی این بیماری معمولاً توسط متخصصان انجام میشود و شامل روشهای تهاجمی مثل اندوسکوپی بینی-حنجره و نمونهبرداری (بیوپسی) است. پژوهشهای نوین به دنبال راههایی کمتهاجمیتر برای غربالگری اولیه هستند؛ یکی از این رویکردها تحلیل دیجیتال ضبط صدای بیمار و استخراج نشانگرهای صوتی بهعنوان نشانهای زیستی (digital biomarkers) است.
روش تحقیق و جزئیات آزمایشی
در این پژوهش، محققان دانشگاههای Oregon Health & Science و Portland State بیش از 12,523 نمونه ضبط صدا از 306 شرکتکننده در آمریکای شمالی را بررسی کردند. هدف شناسایی ویژگیهای صوتی مرتبط با ضایعات تارهای صوتی (vocal fold lesions) بود که میتوانند خوشخیم یا سرطانی باشند. تحلیل روی پارامترهای آکوستیکی انجام شد و الگوریتمهای یادگیری ماشین (machine learning) برای تفکیک الگوهای صوتی بهکار رفتند.
ویژگیهای کلیدی صوتی
یکی از پارامترهای مهم که تفاوتها را آشکار کرد نسبت هارمونیک به نویز (harmonic-to-noise ratio یا HNR) بود؛ این معیار نسبت انرژی تونال (تن) به بخشهای نویزی صدا را میسنجد و نشاندهنده کیفیت تولید صوت است. در مردان، HNR و چند شاخص آکوستیکی دیگر توانستند بین صداهای مربوط به ضایعات سرطانی، ضایعات خوشخیم و سایر اختلالات صوتی تمایز قائل شوند. با این حال، در دادههای فعلی پژوهش، الگوهای قابلاعتنایی برای صداهای زنان پیدا نشد که محققان آن را به محدودیت اندازه نمونه و تنوع داده نسبت میدهند.
یافتهها، نقلقول از پژوهشگر و چشمانداز فناوری
نتیجهٔ اصلی این مطالعه نشان میدهد که تغییرات ظریف در صدا که با گوش انسان قابلتشخیص نیست، توسط مدلهای یادگیری ماشین قابلافتراقاند. فیلین جولینکس (Phillip Jenkins)، انفورماتیکپژوه بالینی در Oregon Health & Science، میگوید: «برای تبدیل این مطالعه به یک ابزار واقعی مبتنی بر هوش مصنوعی، باید مدلها را با مجموعههای بزرگتر از ضبطهای صدا که توسط متخصصان برچسبگذاری شدهاند آموزش دهیم و سپس سیستم را از نظر عملکرد برای زنان و مردان بهطور جداگانه اعتبارسنجی کنیم.»
ابزارهای مبتنی بر صدا برای ارزیابی سلامت در حال حاضر در حالت پایلوت قرار دارند. با افزایش حجم دادهها و اعتبارسنجی بالینی، امکان دارد این نوع ابزارها طی چندسال آینده به آزمایشهای پایلوت بالینی وارد شوند. تکنولوژیهای مرتبط شامل اپلیکیشنهای موبایل برای جمعآوری ضبط صدا، پردازش ابری و مدلهای یادگیری عمیق برای استخراج ویژگیهای آکوستیکی و ساختارهای تصمیمگیری بالینی است.
ملاحظات و محدودیتها
پژوهش فعلی محدودیتهایی دارد: اندازه نمونه نسبت به نیازهای توسعه بالینی کوچک است، و عدم یافتن نشانگرهای قوی در صداهای زنان نشان میدهد که مدلها باید دادههای متنوعتری شامل سن، لهجه، وضعیت پزشکی همراه و تجهیزات ضبط مختلف را بپذیرند. همچنین اعتبار بالینی و اخلاقی استفاده از دادههای صوتی نیاز به آزمونهای گسترده و حفاظت از حریم خصوصی دارد.
Conclusion
پژوهش نشان میدهد که تحلیل صوت با کمک یادگیری ماشین میتواند نشانهای ظریف ضایعات تار صوتی را شناسایی کند و به تشخیص زودهنگام سرطان حنجره کمک نماید. برای کاربرد بالینی، نیاز به مجموعهدادههای بزرگتر، برچسبگذاری تخصصی و آزمایشهای اعتبارسنجی دقیق است. ابزارهای تشخیصی مبتنی بر صدا میتوانند به پزشکان غیرمتخصص کمک کنند بیماران پرخطر را سریعتر شناسایی و به مراکز تخصصی ارجاع دهند، اما تحقق این چشمانداز مستلزم تحقیقات بیشتر، حفاظت دادهها و آزمونهای بالینی است.




