Aktualizace předmětu Matematické modelování textu (KOL/VMOD)

Milí studenti, rádi bychom vás upozornili na předmět Matematické modelování textu (KOL/VMOD), který bude probíhat vždy v pondělí od 13:15 do 14:45. Prakticky si zde vyzkoušíme základy NLP (neboli strojového zpracování přirozeného jazyka), se kterým se setkáte v kurzu Lingvistické aplikace (KOL/VLAP).

Jeho náplní bude:

1. Pravděpodobnost a trocha matematiky

  • Frekvence & Bayes, náhodný jev, nejistota, entropie, faktory
  • Aplikace ve strojovém učení
  • Cíle, cost funkce, gradienty, derivace, nejmenší úsilí

2. NLP zrychleně

  • Texty, korpusy, zpracování textů od tokenizace ke slovníkům a stromům
  • Jak na texty nahlížet z hlediska modelování: řetězy, stromy, indexy, slovníky

3. Nástroje pro analýzu

  • R, Python, QUITA

4.Aplikace modelování

  • Pomocné vizualizace (MDS)
  • Vztahy vlasností (korelace, FA), redukce dimenzionality (PCA, SVD)
  • Klasifikace (kNN, NB, LDA, SVM + kernely)
  • Neuronové sítě

5. Aplikace a praxe

  • Určování autorství, určování jazyka, detekce spamu, detekce konfliktnosti, T9, emoce v textu a další