نقش پنهان صدا در تشخیص زودهنگام سرطان حنجره: هوش مصنوعی صدای انسان را می‌خواند

سرطان حنجره (voice box) یکی از انواع نادر اما جدی سرطان است که در سال 2021 حدود 1.1 میلیون مورد در سراسر جهان تشخیص داده شد و تقریباً 100 هزار مرگ مرتبط با آن ثبت شد. تشخیص کنونی این بیماری معمولاً توسط متخصصان انجام می‌شود و شامل روش‌های تهاجمی مثل اندوسکوپی بینی-حنجره و نمونه‌برداری (بیوپسی) است. پژوهش‌های نوین به دنبال راه‌هایی کم‌تهاجمی‌تر برای غربالگری اولیه هستند؛ یکی از این رویکردها تحلیل دیجیتال ضبط صدای بیمار و استخراج نشانگرهای صوتی به‌عنوان نشان‌های زیستی (digital biomarkers) است.

روش تحقیق و جزئیات آزمایشی

در این پژوهش، محققان دانشگاه‌های Oregon Health & Science و Portland State بیش از 12,523 نمونه ضبط صدا از 306 شرکت‌کننده در آمریکای شمالی را بررسی کردند. هدف شناسایی ویژگی‌های صوتی مرتبط با ضایعات تارهای صوتی (vocal fold lesions) بود که می‌توانند خوش‌خیم یا سرطانی باشند. تحلیل روی پارامترهای آکوستیکی انجام شد و الگوریتم‌های یادگیری ماشین (machine learning) برای تفکیک الگوهای صوتی به‌کار رفتند.

ویژگی‌های کلیدی صوتی

یکی از پارامترهای مهم که تفاوت‌ها را آشکار کرد نسبت هارمونیک به نویز (harmonic-to-noise ratio یا HNR) بود؛ این معیار نسبت انرژی تونال (تن) به بخش‌های نویزی صدا را می‌سنجد و نشان‌دهنده کیفیت تولید صوت است. در مردان، HNR و چند شاخص آکوستیکی دیگر توانستند بین صداهای مربوط به ضایعات سرطانی، ضایعات خوش‌خیم و سایر اختلالات صوتی تمایز قائل شوند. با این حال، در داده‌های فعلی پژوهش، الگوهای قابل‌اعتنایی برای صداهای زنان پیدا نشد که محققان آن را به محدودیت اندازه نمونه و تنوع داده نسبت می‌دهند.

یافته‌ها، نقل‌قول از پژوهشگر و چشم‌انداز فناوری

نتیجهٔ اصلی این مطالعه نشان می‌دهد که تغییرات ظریف در صدا که با گوش انسان قابل‌تشخیص نیست، توسط مدل‌های یادگیری ماشین قابل‌افتراق‌اند. فیلین جولینکس (Phillip Jenkins)، انفورماتیک‌پژوه بالینی در Oregon Health & Science، می‌گوید: «برای تبدیل این مطالعه به یک ابزار واقعی مبتنی بر هوش مصنوعی، باید مدل‌ها را با مجموعه‌های بزرگ‌تر از ضبط‌های صدا که توسط متخصصان برچسب‌گذاری شده‌اند آموزش دهیم و سپس سیستم را از نظر عملکرد برای زنان و مردان به‌طور جداگانه اعتبارسنجی کنیم.»

ابزارهای مبتنی بر صدا برای ارزیابی سلامت در حال حاضر در حالت پایلوت قرار دارند. با افزایش حجم داده‌ها و اعتبارسنجی بالینی، امکان دارد این نوع ابزارها طی چندسال آینده به آزمایش‌های پایلوت بالینی وارد شوند. تکنولوژی‌های مرتبط شامل اپلیکیشن‌های موبایل برای جمع‌آوری ضبط صدا، پردازش ابری و مدل‌های یادگیری عمیق برای استخراج ویژگی‌های آکوستیکی و ساختارهای تصمیم‌گیری بالینی است.

ملاحظات و محدودیت‌ها

پژوهش فعلی محدودیت‌هایی دارد: اندازه نمونه نسبت به نیازهای توسعه بالینی کوچک است، و عدم یافتن نشانگرهای قوی در صداهای زنان نشان می‌دهد که مدل‌ها باید داده‌های متنوع‌تری شامل سن، لهجه، وضعیت پزشکی همراه و تجهیزات ضبط مختلف را بپذیرند. همچنین اعتبار بالینی و اخلاقی استفاده از داده‌های صوتی نیاز به آزمون‌های گسترده و حفاظت از حریم خصوصی دارد.

Conclusion

پژوهش نشان می‌دهد که تحلیل صوت با کمک یادگیری ماشین می‌تواند نشان‌های ظریف ضایعات تار صوتی را شناسایی کند و به تشخیص زودهنگام سرطان حنجره کمک نماید. برای کاربرد بالینی، نیاز به مجموعه‌داده‌های بزرگ‌تر، برچسب‌گذاری تخصصی و آزمایش‌های اعتبارسنجی دقیق است. ابزارهای تشخیصی مبتنی بر صدا می‌توانند به پزشکان غیرمتخصص کمک کنند بیماران پرخطر را سریع‌تر شناسایی و به مراکز تخصصی ارجاع دهند، اما تحقق این چشم‌انداز مستلزم تحقیقات بیشتر، حفاظت داده‌ها و آزمون‌های بالینی است.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

به بالا بروید