تبليغاتX
پردازش زبان های طبیعی - پردازش واژگان

واژگان

در کل هر قسمتی از زبان، لاجرم از مجموعه‌ای از واژگان ساخته شده است و مسایلی مهمی فراخور آن قرار می‌گیرند. از مسایل مهم در دایره پردازش واژگانی می‌توان به املای کلمه، ریخت‌شناسی و تلفظ و نیز به مسایل واژگان در دنیای واقع مانند بازشناسی خودکار گفتار1 و تبدیل نوشتار به گفتار و خطایابی املایی2؛ اشاره کرد.

روش‌‌ها و آتاماتای بسیاری در مورد پردازش واژگانی وجود دارد که از این امور می‌توان به چهار ماشین آتاماتای متناهی3، عبارات منظم، گذردهنده‌های متناهی4 و الگوی مخفی مارکوف5 اشاره کرد. روش n-gram هم برای یافتن تواتر واژگانِ یک متن، روشی مرسوم است.

                                         

پی‌نوشت:

1.        Automatic Speech Recognition (ASR)

2.        Text-To-Speech Synthesis (TSS)

3.        Finite-State Automata (FSA)

4.        Finite-State Transducers (FST)

5.        Hidden  Markov Model (HMM)

 

+ نوشته شده در  جمعه دوم شهریور 1386ساعت 10:41  توسط محمّد صادق رسولی  |