مقدمه
بطور کلی کاربردهای پردازش زبان طبیعی در زندگی روزمره ما، محیطهای آموزشی، درمان و صنعت را میتوان به چند دسته، مطابق ذیل، تقسیمبندی نمود:
- پردازش گفتار
- پردازش تصویر
- پردازش متن
کاربردهای پردازش گفتار :
- دستیار شخصی (Personal assistants) : هدف این برنامههای هوشمند اجرای فرامین صوتی انسان در گوشی هوشمند یا کامیپوتر است. مانند: Apple Siri، Amazon Alexa، Google Assistant، Microsoft Cortana، Samsung Bixby و دستیار صوتی فارسی رایمون
- تبدیل گفتار به نوشتار (Speech to Text) : هدف این ابزار تبدیل صدا به متن معادل با صحبتهای گوینده است. برای زبان فارسی استفاده از صفحه کلید گوگل برای گوشی هوشمند و نرمافزار نویسا توصیه میشود. سایر موتورهای تبدیل گفتار به نوشتار معروف میتوان به wit.ai ،Google Speech و Yandex SpeechKit را نام برد.
- تبدیل نوشتار به گفتار (Text to Speech) : درست برخلاف ابزار قبل، اینجا هدف تبدیل متن به کلام است. این ابزار برای خواندن متن پیام بطور صوتی در بسیاری از نرمافزارها و سیستمهای نوبتدهی و … استفاده میشود. مانند: نرمافزار فارسی آریانا
- مترجمهای صوتی (Translator) : که کار ترجمه برخط صدای گوینده از یک زبان به زبان دیگر را انجام میدهند. مانند: Google Translate
- کاربردهای دیگر پردازش گفتار کمتر در زیرشاخه علم پردازش زبان طبیعی قرار میگیرند. برای سایر کاربردهای پردازش گفتار میتوان به موارد استفاده آن در صنعت مخابرات و ارتباطات، تشخیص شخص گوینده از روی صدا (برای کاربردهای امنیتی)، تشخیص حس گوینده (یا میزان راستگویی گوینده) و … اشاره نمود.
کاربردهای پردازش تصویر :
- نویسه خوان نوری (Optical Character Recognition/Reader) یا بصورت مخفف OCR: عبارت است از تشخیص (recognition) خودکار متون موجود در تصاویر اسناد و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانه.
- مترجمهای تصویری (Translator) : که کار استخراج متن از درون تصویر و ترجمه آن به زبان دیگر را انجام میدهند. مانند: Google Translate
- شرح تصاویر (Image Captioning) : توضیح عناصر و اتفاقات درون تصویر که معمولاً بوسیله تکنیکهای یادگیری عمیق انجام میشود. مثلاً: با دریافت یک تصویر خروجی مینویسد که «دو پرنده بر روی یک شاخه درخت نشستهاند»
کاربردهای پردازش متن (کاربردهای متن کاوی) و بازیابی اطلاعات :
- نظرکاوی (تحلیل حسی متن): برای تحلیل میزان رضایت عمومی مردم، کاربران یا مشتریان در انتخابات (و سایر موضوعات سیاسی)، فروشگاهها، مراکز خدمترسانی و …
- خلاصهسازی خودکار: کم کردن حجم متن با حفظ مفاهیم (موضوع) و پیوستگی (خوانایی) متن اصلی. با کاربردهایی از قبیل خلاصه اخبار، خلاصه محتوای سایت در نتیجه موتورهای جستجو و …
- ترجمه ماشینی متن: ترجمه جملات درون متن از زبان مبدا به زبان مقصد
- تشابهیابی و ابهام زدایی کلمات در متن
- تشخیص تقلب ادبی (علمی)
- تشخیص شخص نویسنده (یا جنسیت نویسنده) متن از روی سبک نوشتار
- تولید زبان: تبدیل یا بیان اطلاعات درون پایگاه داده به زبان انسان توسط ماشین
- غنیسازی متن: حاشیهنویسی، ارزش افزوده در متن برای موتورهای جستجو و سایر تحلیلهای معنایی متنی
- سامانههای پرسش و پاسخ و چتباتها
- موتور جستجو: تولید و بهینهسازی اجزای مختلف موتورهای جستجو برای حجم بالای داده
- استخراج اطلاعات: کشف موجودیتها و روابط بین آنها در متن
- استخراج کلمات کلیدی: با هدف برچسبزنی یا تگزنی موضوعی خودکار متن
- دستهبندی و خوشهبندی متون: گروهبندی (باناظر یا بدون ناظر) مجموعه متون با کاربردهایی از قبیل تشخیص موضوع متن (هر گروه از متون)، نمایهزنی خودکار متن، گروهبندی متون (اخبار) مشابه با هدف شناسایی مسائل/رویدادها/… مهم در انبوه متون شبکههای اجتماعی یا اخبار
- ابزارهای پایه پردازش زبان طبیعی (شبکه واژگان، پارسر، برچسب زن معنایی کلمات، کشف مرجع ضمایر، تشخیص و طبقه بندی اسامی)
- عملیات پایه بازیابی اطلاعات (تبدیل متن به بردارهای عددی، تعیین معیار فاصله یا شباهت متنی، مهندسی ویژگیها)
استفاده از این مقاله با ذکر منبع (سامانه متن کاوی فارسییار)، بلامانع است.