Skip to content

Модули барнома барои муайян кардани калимаҳои калидии матни ношинос дар забони тоҷикӣ дар забони барномарезии C#. Дар модули мазкур барои муайян кардани калимаҳои калидӣ аз алгоритми KEA ва метрикаи TF-IDF истифода бурда шудааст.

Notifications You must be signed in to change notification settings

komdil/Tajik-Keyword-Extractor

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

54 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Tajik Keyword Extractor

Модули барнома барои муайян кардани калимаҳои калидии матни ношинос дар забони тоҷикӣ дар забони барномарезии C#. Дар модули мазкур барои муайян кардани калимаҳои калидӣ аз алгоритми KEA ва метрикаи TF-IDF истифода бурда шудааст.


Имкониятҳои модул:

Муайян кардани калимаҳои калидӣ дар матни ношинос

Муайян кардани калимаҳои калидӣ дар матни ношинос вобаста ба категория

Ҳисоб кардани TF

Ҳисоб кардани IDF

Ҳисоб кардани TF-IDF


Базаи маълумоти калимаҳо

Лоиҳаи TajikKEA бо истифода аз интерфейсҳо сохта шудааст. Он имконият медиҳад, ки Шумо бо структураи муайяни базаи маълумот базаи маълумоти калимаҳои худро тартиб диҳед. Дар лоиҳаи TajikKEAJsonContext намунаи базаи маълумоти калимаҳо оварда шудааст. Дар он беш аз 50,000 калима ва бузургии муҳимияти он коркард карда шудааст. Инчунин баъзе аз категорияҳо низ оварда шудаанд. Базаи маълумот ба намуди JSON сабт шудааст. Намунаи муайян кардани бузургии муҳимияти калима аз рӯи кетегорияҳои гуногун дар лоиҳаи https://github.com/komdil/TajikKEAHelpers нишон дода шудааст.


Истифодабарии модул

  1. Насб кардани модул аз Nuget: https://www.nuget.org/packages/TajikKEA/

  2. Насб кардани базаи маълумот. Масалан лоиҳаи TajikKEAJsonContext

  3. Пеш аз истифода бурдан бояд танзимоти базаи маълумот насб карда шавад:

TajikKEAContext jsonContext = new TajikKEAContext();
KEAGlobal.InitiateKEAGlobal(jsonContext);
  1. Истифодабарӣ:

Муайян кардани калимаҳои калидӣ дар матни ношинос

  var keyWords = KEAGlobal.KEAManager.GetKeywords(InputText, 20);

Муайян кардани калимаҳои калидӣ дар матни ношинос вобаста ба категория

var category = KEAGlobal.Context.Categories.Single(s => s.Name == "Сиёсӣ"); 
var keyWords = KEAGlobal.KEAManager.GetKeywords(InputText, 20, category);
дар ин ҷо category - категория, InputText - матн, 20- миқдори калид-калима, 
keyWords- рӯйхати калид-калимаҳо

Ҳисоб кардани IDF KEAGlobal.TFIDFManager.CalCulateIDF()

Ҳисоб кардани TF KEAGlobal.TFIDFManager.CalCulateTF()

Ҳисоб кардани TF-IDF KEAGlobal.TFIDFManager.CalculateTFIDF()


Саҳми худро гузоред (Contributing)

Лоиҳаи мазкур барои ислоҳ кардан ва ҳамроҳ кардани имкониятҳо нав озод аст

  1. Гирифтани лоиҳа (Fork)
  2. Сохтани шоха (Branch)
  3. Илова намудани тағйиротҳо (Commit)
  4. Сабти тағйиротҳо (Push)
  5. Фиристонидан барои тафтиш (Pull request)

Литсензия

Тибқи литсензияи MIT. Саҳмгузорон (komdil, qosimovabdunabi)


About

Модули барнома барои муайян кардани калимаҳои калидии матни ношинос дар забони тоҷикӣ дар забони барномарезии C#. Дар модули мазкур барои муайян кардани калимаҳои калидӣ аз алгоритми KEA ва метрикаи TF-IDF истифода бурда шудааст.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages