دکتر سید سلمان فاطمی . نورولوژیست, [01/21/2023 08:31 ب.ظ]
پروتز عصبی، از فعالیت مغز برای رمزگشایی گفتار، استفاده می کند.
19 ژانویه 2023
خلاصه: یک مدل جدید و توسعه یافته ی یادگیری ماشین، میتواند کلماتی را- که فرد میخواهد صحبت کند، بر اساس فعالیت عصبیاش که توسط یک دستگاه پروتز عصبی با تهاجم کم ثبت شده است- پیشبینی کند.
منبع: HSE
(هوش مصنوعی میتواند ببیند و درک کند و بر اساس یافته های خود، به بهترین شکل، پیشبینی نماید و با قرار گرفتن در جایی دور از دسترس مثلا درون جمجمه ی فرد، بسیار تاثیر گذار باشد. درستی نتایج و پیشگویی مشاهداتی- که بر اساس ده یا بیست مورد، شکل میگیرد- کمتر از نتایجی است که از روی هزاران داده، جمع آوری میشود و هوش مصنوعی امکان تحلیل هزاران داده را در یک زمان می دهد.
هر چند درستی نتایج به دست آمده از هوش مصنوعی، هنوز میتواند مورد تردید باشد چون هیچ یاقته ای در جهان ما قطعی نیست، ولی دریا با قطره ای از دریا، یکسان نیست.
هوش مصنوعی، امروز میتواند هزاران داده را در کسری از ثانیه تحلیل کند و این قدرتی بزرگ به آن میدهد. آمار و تحلیل با استفاده از گیرنده های مصنوعی- که میتواند به سرعت ثبت و تحلیل کند- بسیار آسان شده است و باید از این توانایی بهره برد.)
هوش مصنوعی از عروسک های بازی تا کمک به انسان در تولیدات و سلامت تا زیان های آن بر جسم و روح انسان- قسمت چهل و شش
محققان دانشگاه HSE و دانشگاه دولتی پزشکی و دندانپزشکی مسکو، یک مدل یادگیری ماشین، ایجاد کردهاند که میتواند بر اساس فعالیت عصبی فرد- که با مجموعه کوچکی از الکترودهای با تهاجم کم، ثبت شده است- کلمهای را که قرار است گفته شود، پیشبینی کند.
مقاله رمزگشایی گفتار از مجموعه ی کوچکی از الکترودهای EEG داخل جمجمه ای با حداقل تهاجم فضایی با یک شبکه عصبی فشرده و قابل تفسیر در مجله ی مهندسی عصبی، منتشر شده است.
میلیون ها نفر در سراسر جهان دچار اختلالات گفتاری هستند و توانایی آنها را برای برقراری ارتباط محدود می کند. علل از دست دادن گفتار، می تواند متفاوت باشد و شامل سکته ی مغزی و برخی بیماری های مادرزادی است.
امروزه فناوری برای بازگرداندن عملکرد ارتباطی چنین بیمارانی در دسترس است، از جمله رابطهای «گفتار بیصدا»- که با ردیابی حرکت ماهیچههای مفصلی در حالی که شخص کلمات را بدون ایجاد صدا به زبان میآورد- گفتار را تشخیص میدهد.(به مقاله یصدایی که در ویدیو شنیده میشود شبیه سازی صدای او به وسیله ی سیستم هوش مصنوعی است.و مقاله ی تا به حال به این فکر کرده اید که فردی مانند استیفن هاوکینگ چگونه می تواند با افراد و محیط اطرافش ارتباط برقرار کند؟ ....در همین کانال مراجعه شود.)
چنین دستگاهی به برخی از بیماران کمک می کند، اما به دیگران کمک نمی کند، مانند افراد مبتلا به فلج عضلات صورت.
پروتزهای عصبی گفتاری - رابط های مغز و رایانه که قادر به رمزگشایی گفتار بر اساس فعالیت مغز هستند - می توانند راه حلی قابل دسترس و قابل اعتماد برای بازگرداندن ارتباط با چنین بیمارانی ارائه دهند.
برخلاف رایانه های شخصی، دستگاه های دارای رابط مغز و رایانه (brain computer interface : BCI) مستقیماً توسط مغز و بدون نیاز به صفحه کلید یا میکروفون، کنترل می شوند.
مانع اصلی برای استفاده گسترده تر از BCI در پروتز گفتار، این است که این فناوری، به جراحی بسیار تهاجمی برای کاشت الکترود در بافت مغز، نیاز دارد.
دقیق ترین تشخیص گفتار توسط پروتزهای عصبی با الکترودهایی- که سطح وسیعی از سطح قشر مغز را پوشش می دهند- به دست می آید.
با این حال، این راه حل، برای خواندن فعالیت مغز، برای استفاده ی طولانی مدت در نظر گرفته نشده است و خطرات قابل توجهی برای بیماران ایجاد می کند.
محققان مرکز HSE و دانشگاه دولتی پزشکی و دندانپزشکی مسکو امکان ایجاد یک پروتز عصبی کارآمد را- که قادر به رمزگشایی گفتار با دقت قابلقبول با خواندن فعالیت مغز از مجموعه ی کوچکی از الکترودهای کاشتهشده در یک ناحیه ی محدود قشر مغز است- بررسی کردهاند.
نویسندگان پیشنهاد می کنند که در آینده، این روش با تهاجم کم، حتی می تواند تحت بی حسی موضعی انجام شود. در مطالعه ی حاضر، محققان دادههایی را از دو بیمار مبتلا به صرع- که قبلاً الکترودهای داخل جمجمهای در آنها کاشته شده بود- جمعآوری کردند تا نقشهبرداری قبل از جراحی برای تعیین مناطق شروع تشنج، انجام شود.
در بیمار اول به صورت دوطرفه، مجموعا پنج لوله ی sEEG با شش تماس در هر یک، و در بیمار دوم، نه نوار الکتروکورتیکوگرافی (ECoG) با هشت تماس در هر یک، کاشته شد.
برخلاف ECoG، الکترودهای sEEG را می توان بدون کرانیوتومی کامل از طریق سوراخ مته در جمجمه کاشت. در این مطالعه، تنها از شش تماس یک شفت sEEG در یک بیمار و هشت تماس یک نوار ECoG در دیگری برای رمزگشایی فعالیت عصبی، استفاده شد.
دکتر سید سلمان فاطمی . نورولوژیست, [01/21/2023 08:31 ب.ظ]
از این افراد، خواسته شد که شش جمله را با صدای بلند بخوانند که هر کدام، 30 تا 60 بار به ترتیب تصادفی ارائه شده بود. جملات از نظر ساختار، متفاوت بودند و اکثر کلمات در یک جمله با همان حرف شروع می شدند.
جملات در مجموع شامل 26 کلمه ی مختلف بودند. هنگامی که افراد، مشغول خواندن بودند، الکترودها فعالیت مغز آنها را ثبت کردند.
سپس این دادهها با سیگنالهای صوتی همتراز شدند تا ۲۷ کلاس، شامل ۲۶ کلمه و یک کلاس سکوت را تشکیل دهند. مجموعه داده آموزشی حاصل (شامل سیگنال های ثبت شده در 40 دقیقه اول آزمایش) به یک مدل یادگیری ماشینی با ساختاری مبتنی بر شبکه ی عصبی وارد شد.
وظیفه ی یادگیری شبکه ی عصبی، پیشبینی کلمه ی بعدی (کلاس) بر اساس دادههای فعالیت عصبی قبل از بیان آن بود.
در طراحی معماری شبکه عصبی، محققان می خواستند آن را ساده، فشرده و به راحتی قابل تفسیر کنند. آنها یک معماری دو مرحله ای ارائه کردند که ابتدا بازنمایی گفتار داخلی را از داده های فعالیت مغزی ضبط شده، استخراج می کرد و ضرایب طیفی log-mel را تولید می کرد و سپس یک کلاس خاص، یعنی یک کلمه یا سکوت را پیش بینی می کرد.
به این ترتیب، شبکه ی عصبی با استفاده از تنها شش کانال داده ی ثبت شده توسط یک الکترود sEEG در بیمار اول، به دقت 55 درصد و تنها با استفاده از هشت کانال داده ثبت شده توسط نوار ECoG در بیمار دوم، 70 درصد دقت را به دست آورد.
چنین دقتی با آنچه در مطالعات دیگر با استفاده از وسایلی که نیاز به کاشت الکترود در کل سطح قشر مغز نشان داده شده است، قابل مقایسه است.
مدل قابل تفسیر به دست آمده این امکان را فراهم می کند که در اصطلاح نوروفیزیولوژیک، توضیح دهیم کدام اطلاعات عصبی، بیشترین کمک را در پیش بینی کلمه ای که قرار است گفته شود دارد.
محققان سیگنالهایی را که از شبکه های عصبی مختلف میآمدند، بررسی کردند تا مشخص کنند کدام یک از آنها برای کار مهم هستند.
یافتههای آنها با نتایج نقشهبرداری گفتار، سازگار بود، و نشان میدهد که این مدل، از سیگنالهای عصبی استفاده میکند که محوری هستند و میتوانند برای رمزگشایی گفتار خیالی، استفاده شوند.
مزیت دیگر این راه حل این است که نیازی به مهندسی ویژگی های دستی ندارد. این مدل یاد گرفته است که بازنمایی گفتار را مستقیماً از دادههای فعالیت مغز، استخراج کند.
تفسیرپذیری نتایج همچنین نشان میدهد که شبکه، سیگنالهای مغز را به جای هر فعالیت همزمان، مانند سیگنالهای الکتریکی از ماهیچههای مفصلی یا ناشی از اثر میکروفون، رمزگشایی میکند.
محققان تاکید میکنند که پیشبینی همیشه بر اساس دادههای فعالیت عصبی قبل از گفته، بود. آنها استدلال می کنند که این اطمینان می دهد قانون تصمیم گیری از پاسخ قشر شنوایی به گفتاری- که قبلاً گفته شده است- استفاده نمی کند.
استفاده از چنین واسط هایی حداقل خطرات را برای بیمار به همراه دارد. اگر همه چیز درست باشد، می توان گفتار خیالی را از فعالیت عصبی ضبط شده، توسط تعداد کمی از الکترودهای کم تهاجمی که در یک محیط سرپایی با بی حسی موضعی کاشته شده اند رمزگشایی کرد.
نویسنده: Ksenia Bregadze
منبع: HSE
تماس: Ksenia Bregadze
رمزگشایی گفتار از مجموعه کوچکی از الکترودهای EEG داخل جمجمه ای با تهاجم کم جداسازی شده با یک شبکه ی عصبی فشرده و قابل تفسیر توسط الکسی اوسادچی و همکاران.
هدف: رمزگشایی گفتار، یکی از جذابترین برنامههای رابط مغز و رایانه، فرصتهای فراوانی را از توانبخشی بیماران تا ارتباط مستقیم و یکپارچه بین گونههای انسانی باز میکند. راه حل های معمولی به ثبت های تهاجمی با تعداد زیادی الکترود توزیع شده- که از طریق کرانیوتومی کاشته می شوند- تکیه دارند. در اینجا ما امکان ایجاد پروتز گفتار را در یک محیط کم تهاجم با تعداد کمی از الکترودهای داخل جمجمه ای جدا شده از نظر فضایی بررسی کردیم.
ما یک ساعت داده (از دو جلسه) را در دو بیمار- که الکترودهای تهاجمی در آنها کاشته شده بود- جمع آوری کردیم. سپس ما فقط از تماس هایی استفاده کردیم که مربوط به یک شفت الکتروانسفالوگرافی استریوتاکتیک (sEEG) یا نوار الکتروکورتیکوگرافی (ECoG) بود تا فعالیت عصبی را در 26 کلمه و یک کلاس سکوت، رمزگشایی کنیم. ما از یک معماری مبتنی بر شبکه پیچشی فشرده، استفاده کردیم که وزن فیلتر فضایی و زمانی آن، انجام یک تفسیر قابل قبول فیزیولوژیکی را امکان پذیر می کند.
نتایج اصلی: ما به طور متوسط 55 درصد دقت را با استفاده از تنها شش کانال داده ی ثبت شده، با یک الکترود sEEG کم تهاجم در بیمار اول و 70 درصد دقت را با استفاده از تنها هشت کانال داده ی ثبت شده، برای یک نوار ECoG در بیمار دوم در طبقه بندی 26+1 به دست آوردیم. کلمات آشکارا تلفظ شده ی معماری فشرده ی ما نیازی به استفاده از ویژگیهای از پیش مهندسیشده نداشت، به سرعت یاد گرفته میشد و منجر به یک قاعده ی تصمیمگیری پایدار، قابل تفسیر و فیزیولوژیکی معنیدار شد که با موفقیت روی یک مجموعه داده ی پیوسته جمعآوری شده در یک بازه زمانی متفاوت از آنچه برای آموزش استفاده میشد، عمل کرد. ویژگیهای فضایی جمعیتهای عصبی محوری با نتایج نقشهبرداری گفتار فعال و غیرفعال تأیید میشود و رابطه معکوس فضا-فرکانس مشخصه فعالیت عصبی را نشان میدهد.
اهمیت: ما امکان ساخت یک پروتز گفتار را با تعداد کمی الکترود و بر اساس یک رمزگشایی رایگان مهندسی با ویژگی های فشرده- که از مقدار کمی از داده های آموزشی مشتق شده است- به نمایش می گذاریم.
https://neurosciencenews.com/speech-decoding.../
https://www.nejm.org/doi/full/10.1056/nejmoa2027540
آدرس مطب : اصفهان ، خیابان آمادگاه ، روبروی داروخانه سپاهان ، مجتمع اطبا ، طبقه اول
تلفن : 32223328 - 031