Natural Language Processing (NLP), kompüterlərin
insan dilini başa düşməsini, yaratmasını və manipulyasiya etməsini təmin edən
süni intellekt (AI) sahəsinin bir qoludur. NLP, hesablama
linqvistikasını(computational linguistics) - insan dilinin qaydalara əsaslanan
modelləşdirilməsini- statistika, machine
learning və deep learning modelləri ilə kombinasiya edir. Bu texnologiyalar
kompüterlərə insan dilini mətn və ya səs məlumatları şəklində emal etməyə və
onun tam mənasının başa düşülməsinə imkan verir. NLP, mətni bir dildən digərinə
tərcümə edən, şifahi əmrlərə (spoken commands) cavab verən və geniş mətnləri
qısa zaman ərzində ümumiləşdirən kompüter proqramlarını idarə edir. NLP həmçinin
biznes əməliyyatlarını asanlaşdırmağa, işçilərin məhsuldarlığını artırmağa və
kritik iş proseslərini sadələşdirməyə kömək edən korporativ həllərdə böyük rol
oynayır.
NLP iki sahəyə bölünür: Natural Language
Understanding (NLU) və Natural Language Generation (NLG). NLU mətnin nəzərdə tutulmuş mənasını təyin etməyə
və ya semantik təhlilə fokuslanan, NLG isə maşın (machine) tərəfindən mətnin
yaradılmasına fokuslanan bir sahədir.
NLP, gündəlik həyatın ayrılmaz bir hissəsidir
və pərakəndə satış (məsələn, müştəri xidmətləri chatbotları) və tibb (elektron
sağlamlıq qeydlərini tərcümə etmək və ya qısa təsvir etmək) kimi çeşidli sahələrdə
tətbiq edildikcə daha da əhəmiyyətli olur. Amazon'un Alexa və Apple'ın Siri
kimi rəqəmsal asistentləri istifadəçi sorğularını dinləmək və cavab tapmaq üçün
NLP-dən istifadə edirlər. Google öz axtarış nəticələrini yaxşılaşdırmaq üçün
NLP-dən istifadə edir, həmçinin Facebook kimi sosial şəbəkələrdə hate speech'i (insanların
dininə, irqinə, cinsinə qarşı yönəlmiş xoşagəlməz ifadələr və s.) aşkar etmək və
filtrləmək üçün də tətbiq edilir.
Bir sıra NLP tapşırığı (NLP tasks) insanlar tərəfindən daxil edilmiş mətnləri və səs məlumatlarını kompüterin anlamağına kömək edəcək şəkildə hissələrə bölür. Bu vəzifələrdən bəzilərinə aşağıdakılar daxildir:
·
Nitq tanınması – həmçinin
nitqdən mətnə (speech-to-text) də adlandırılır, səs məlumatlarını mətn məlumatlarına
çevirmə vəzifəsidir.
·
Söz mənasında qeyri-müəyyənlik
– müəyyən semantik təhlil nəticəsində bir neçə mənası olan sözün kontekstə
uyğun gələn mənasının seçilməsidir.
·
Sentiment təhlili
– sarkazm, çaşqınlıq, şübhə və s. kimi subyektiv keyfiyyətləri mətndən çıxarmağa
çalışır.
·
Spam aşkarlanması: Spam
aşkarlama texnologiyaları spam və ya fişinq
xarakterli e-maillərin skan edilməsi üçün NLP-nin mətn təsnifat imkanlarından
istifadə edir.
·
Tərcümə proqramları:
NLP vasitəsilə bir sıra tərcümə proqramları qrammatik cəhətdən düzgün nəticələr
təqdim edə bilirlər. Bu da öz növbəsində başqa dildən olan insanlarla ünsiyyət
qurmaqda yaşanan problemləri aradan qaldırır.
·
Smart assistantlar və chatbotlar:
Apple'ın Siri və Amazon'un Alexa kimi rəqəmsal köməkçiləri səsin tanınması
funksiyasından istifadə edərək deyiləni anlayır, məna çıxarır və kontekst əsasında
müvafiq cavablar verir. Chatbotlar yazılan mətnlərə əsasən eyni funksiyanı
yerinə yetirirlər.
·
Sosial media sentiment analizi:
NLP sosial media hesablarından gizli məlumatların aşkarlanması üçün vacib bir
iş alətinə çevrilib. Sentiment analizi sosial media postlarında, rəylərdə və s.
istifadə olunan dili təhlil edərək məhsullara, promosyonlara və hadisələrə
münasibət bildirmək üçün tətbiq edilə bilər. Həmçinin informasiya şirkətləri məhsul
dizaynlarında, reklam kompaniyalarında və s. istifadə edə bilirlər.
·
Mətnin xülasəsi (text
summarization): Mətnin xülasəsi irihəcmli rəqəmsal
mətni anlamaq və indekslər, tədqiqat databazaları və ya bütöv mətni oxumağa
vaxtı olmayan insanlar üçün mətnin qısa xülasəsini yaratmaq məqsədilə NLP-dən
istifadə edən bir sahədir. Bir sıra mətn xülasəsi tətbiqləri xülasələrə faydalı
kontekst və nəticələr əlavə etmək üçün semantik əsaslandırma və Natural Language
Generation(NLG) tətbiq edir.
·
Səhiyyə:
Dünya üzərində bir çox səhiyyə sistemlərində elektron tibbi qeydlərə keçdikcə
strukturlaşdırılmamış məlumatlarla qarşılaşılır. Belə olan təqdirdə sağlamlıq
qeydlərini təhlil etmək və yeni fikirlər əldə etmək üçün NLP-nin istifadəsi həyata
keçirilir.
·
Maliyyə:
Maliyyə dünyası sürətlə inkişaf edir və rəqabət üstünlüyü vacibdir. Maliyyə sahəsindəki
insanlar öz portfoliolarına və ticarətlərinə aid məlumatları çıxarmaq üçün
korporativ sənədlərdən və xəbər buraxılışlarından avtomatik olaraq məlumat əldə
etmək üçün NLP texnologiyasını tətbiq edir.
·
Sığorta:
Böyük sığorta şirkətlərində işin görülməsini asanlaşdırmaq üçün sənədləri və
hesabatları yoxlamaq məqsədilə NLP köməkçi rol oynayır.
·
Python:
NLP Kitabxanaları Python-da mövcuddur və bu səbəbdən indiyə qədər NLP layihələrinin
əksəriyyəti Python-da hazırlanmışdır. Python-un interaktiv inkişaf mühiti yeni
kodun hazırlanmasını və sınaqdan keçirilməsini asanlaşdırır.
·
Java və C++:
Böyük həcmli məlumatların işlənməsi üçün daha səmərəli kodu dəstəkləyə bilmə
baxımından çox vaxt C++ və Java dillərinə üstünlük verilir.