دکتر محمود امین طوسی

دانشیار

  • درباره من
  • انتشارات
  • دروس
  • پایان نامه ها
  • کتب
EN

سرفصل مطالب

سرفصل مطالب
# سرفصل مطالب طرح درس (براساس سرفصل)
1 مفهوم و فرآیند متن کاوی و ارتباط آن با پردازش زبان طبیعی مثال تعبیه کلمات
2 آشنایی با NLP،‌ آموزش HTML
3 عبارات با قاعده، آشنایی با bs4
4 منابع کسب داده‌ها،‌ استخراج متن، پیش پردازش و تمیزسازی داده‌ها
5 کتابخانه NLTK، توکن‌بندی متن،‌اصلاح گرامر، ریشه‌یاب، بن واژه‌یاب و حذف کلمات توقف
6 کتابخانه SpaCy،‌ روشهای طبقه‌بندی داده‌ها، روش‌های ارزیابی طبقه‌بندها
7 خط لوله، استخراج ویژگی، مدلسازی، شیوه‌های سنتی و جدید طبقه‌بندی داده‌های متنی
8 نمایش داده‌ها در فضای برداری فاصله و شباهت بردارها،‌شباهت کسینوسی One-Hot Encoding, BoW, N-Grams
9 TF-IDF, TfidfVectorizer
10 مدلهای تعبیه کلمات کتابخانه Gensim
11 مصورسازی داده‌ها- t-SNE LSA
12 نظرکاوی و تحلیل احساسات
13 SVM, Bayes, CM
14 مدل زبانی
15 خوشه‌بندی داده‌های متنی
16 تشخیص پیوند کتابشناختی
17 خزنده وب
18 روشهای رتبه‌بندی صفحات وب
19 بررسی تکلیف‌های عملی