Schița de curs

Prezentare generală a pachetelor Python referitoare la NLP

Introducere în NLP (exemple în Python, desigur)

  1. Manipularea simplă a textului
    1. Căutarea textului
    2. Numărarea Words
    3. Divizarea textelor în Words
    4. Dispersia lexicală
  2. Procesarea structurilor complexe
    1. Reprezentarea textului în liste
    2. Indexarea listelor
    3. Colocații
    4. Bigrame
    5. Distribuții de frecvență
    6. Condiționale cu Words
    7. Compararea Words (startswith, endswith, islower, isalpha, etc...)
  3. Înțelegerea limbajului natural
    1. Dezambiguizarea sensului Word
    2. Rezolvarea pronumelor
  4. Traduceri automate (statistice, bazate pe reguli, literale, etc...)
  5. Exerciții

NLP în Python în exemple

  1. Accessing Text Corpora și resurse lexicale
    1. Surse comune pentru corpusuri
    2. Distribuții de frecvență condiționată
    3. Numărarea Words pe genuri
    4. Crearea propriului corpus
    5. Dicționar de pronunție
    6. Lexicoane Shoebox și Toolbox
    7. Simțuri și sinonime
    8. Ierarhii
    9. Relații lexicale: Meronime, Holonime
    10. Similaritate semantică
  2. Prelucrarea textului brut
    1. Scriere
    2. Strunjire
    3. Extragerea părților de șir de caractere
    4. Accessextragerea caracterelor individuale
    5. Căutare, înlocuire, divizare, alăturare, indexare etc...
    6. Utilizarea expresiilor regulate
    7. Detectarea modelelor de cuvinte
    8. Stemming
    9. Tokenizarea
    10. Normalizarea textului
    11. Word Segmentare (în special în chineză)
  3. Categorizare și etichetare Word s
    1. Corpora etichetate
    2. Token-uri etichetate
    3. Set de etichete pentru părți de vorbire
    4. Python Dicționare
    5. Words la corespondența Propertieis
    6. Etichetarea automată
    7. Determinarea categoriei unui Word (morfologică, sintactică, semantică)
  4. Clasificarea textului (Machine Learning)
    1. Clasificare supravegheată
    2. Segmentarea propozițiilor
    3. Validare încrucișată
    4. Arbori de decizie
  5. Extragerea informațiilor din text
    1. Împărțirea în bucăți
    2. Chinking
    3. Etichete vs arbori
  6. Analiza structurii propozițiilor
    1. Gramatică liberă de context
    2. Parseri
  7. Construirea gramaticilor bazate pe caracteristici
    1. Caracteristici gramaticale
    2. Procesarea structurilor caracteristice
  8. Analiza sensului propozițiilor
    1. Semantică și logică
    2. Logica propozițională
    3. Logica primului ordin
    4. Semantica discursului
  9. Gestionarea datelor lingvistice
    1. Formatele datelor (lexicon vs text)
    2. Metadate

Cerințe

Cunoștințe de bază de Python

 28 ore

Numărul de participanți


Pret per participant

Mărturii (1)

Upcoming Courses

Categorii înrudite