کاربردهای پردازش زبان طبیعی

مقدمه

بطور کلی کاربردهای پردازش زبان طبیعی در زندگی روزمره ما، محیط‌های آموزشی، درمان و صنعت را می‌توان به چند دسته، مطابق ذیل، تقسیم‌بندی نمود:

  • پردازش گفتار
  • پردازش تصویر
  • پردازش متن

کاربردهای پردازش گفتار :

  • دستیار شخصی (Personal assistants) : هدف این برنامه‌های هوشمند اجرای فرامین صوتی انسان در گوشی هوشمند یا کامیپوتر است. مانند: Apple Siri، Amazon Alexa، Google Assistant، Microsoft Cortana، Samsung Bixby و دستیار صوتی فارسی رایمون
  • تبدیل گفتار به نوشتار (Speech to Text) : هدف این ابزار تبدیل صدا به متن معادل با صحبت‌های گوینده است. برای زبان فارسی استفاده از صفحه کلید گوگل برای گوشی هوشمند و نرم‌افزار نویسا توصیه می‌شود. سایر موتورهای تبدیل گفتار به نوشتار معروف می‌توان به wit.ai ،Google Speech و Yandex SpeechKit را نام برد.
  • تبدیل نوشتار به گفتار (Text to Speech) : درست برخلاف ابزار قبل، اینجا هدف تبدیل متن به کلام است. این ابزار برای خواندن متن پیام بطور صوتی در بسیاری از نرم‌افزارها و سیستم‌های نوبت‌دهی و … استفاده می‌شود. مانند: نرم‌افزار فارسی آریانا
  • مترجم‌های صوتی (Translator) : که کار ترجمه برخط صدای گوینده از یک زبان به زبان دیگر را انجام می‌دهند. مانند: Google Translate
  • کاربردهای دیگر پردازش گفتار کمتر در زیرشاخه علم پردازش زبان طبیعی قرار می‌گیرند. برای سایر کاربردهای پردازش گفتار می‌توان به موارد استفاده آن در صنعت مخابرات و ارتباطات، تشخیص شخص گوینده از روی صدا (برای کاربردهای امنیتی)، تشخیص حس گوینده (یا میزان راستگویی گوینده) و … اشاره نمود.

کاربردهای پردازش تصویر :

  • نویسه خوان نوری (Optical Character Recognition/Reader) یا بصورت مخفف OCR: عبارت است از تشخیص (recognition) خودکار متون موجود در تصاویر اسناد و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانه.
  • مترجم‌های تصویری (Translator) : که کار استخراج متن از درون تصویر و ترجمه آن به زبان دیگر را انجام می‌دهند. مانند: Google Translate
  • شرح تصاویر (Image Captioning) : توضیح عناصر و اتفاقات درون تصویر که معمولاً بوسیله تکنیک‌های یادگیری عمیق انجام می‌شود. مثلاً: با دریافت یک تصویر خروجی می‌نویسد که «دو پرنده بر روی یک شاخه درخت نشسته‌اند»

کاربردهای پردازش متن (کاربردهای متن کاوی) و بازیابی اطلاعات :

  • نظرکاوی (تحلیل حسی متن): برای تحلیل میزان رضایت عمومی مردم، کاربران یا مشتریان در انتخابات (و سایر موضوعات سیاسی)، فروشگاه‌ها، مراکز خدمت‌رسانی و …
  • خلاصه‌سازی خودکار: کم کردن حجم متن با حفظ مفاهیم (موضوع) و پیوستگی (خوانایی) متن اصلی. با کاربردهایی از قبیل خلاصه اخبار، خلاصه محتوای سایت در نتیجه موتورهای جستجو و …
  • ترجمه ماشینی متن: ترجمه جملات درون متن از زبان مبدا به زبان مقصد
  • تشابه‌یابی و ابهام زدایی کلمات در متن
  • تشخیص تقلب ادبی (علمی)
  • تشخیص شخص نویسنده (یا جنسیت نویسنده) متن از روی سبک نوشتار
  • تولید زبان: تبدیل یا بیان اطلاعات درون پایگاه داده به زبان انسان توسط ماشین
  • غنی‌سازی متن: حاشیه‌نویسی، ارزش افزوده در متن برای موتورهای جستجو و سایر تحلیل‌های معنایی متنی
  • سامانه‌های پرسش و پاسخ و چت‌بات‌ها
  • موتور جستجو: تولید و بهینه‌سازی اجزای مختلف موتورهای جستجو برای حجم بالای داده‌
  • استخراج اطلاعات: کشف موجودیت‌ها و روابط بین آنها در متن
  • استخراج کلمات کلیدی: با هدف برچسب‌زنی یا تگ‌زنی موضوعی خودکار متن
  • دسته‌بندی و خوشه‌بندی متون: گروه‌بندی (باناظر یا بدون ناظر) مجموعه متون با کاربردهایی از قبیل تشخیص موضوع متن (هر گروه از متون)، نمایه‌زنی خودکار متن، گروه‌بندی متون (اخبار) مشابه با هدف شناسایی مسائل/رویدادها/… مهم در انبوه متون شبکه‌های اجتماعی یا اخبار
  • ابزارهای پایه پردازش زبان طبیعی (شبکه واژگان، پارسر، برچسب زن معنایی کلمات، کشف مرجع ضمایر، تشخیص و طبقه بندی اسامی)
  • عملیات پایه بازیابی اطلاعات (تبدیل متن به بردارهای عددی، تعیین معیار فاصله یا شباهت متنی، مهندسی ویژگی‌ها)

استفاده از این مقاله با ذکر منبع (سامانه متن کاوی فارسی‌یار)، بلامانع است.

احسان عسکریان دکترای نرم افزار و مدیر گروه متن کاوی فارسی یار هستم

دیدگاه خود را بنویسید:

آدرس ایمیل شما نمایش داده نخواهد شد.