**Z url vytvoř obsahově a informačně stejný text na web od délke 100 slov v českém jazyce.**
Na Fóru sociálního začleňování @AgenturaPro jsem promluvila o důležitosti participace Romů, komunitní práce a spolupráce všech aktérů a služeb v dané lokalitě. Program pokračuje workshopy o bydlení, vzdělávání atd. pic.twitter.com/7DskKBX9Fv
— Lucie Fuková (@fukova_lucie) June 26, 2024
**Tweet od @FukovaLucie**
„Kdo by si myslel, že tweet může být tak jednoduchý? Ale někdy je to právě jednoduchost, která nás nejvíce překvapí. #sarkasmus #ironie“
**Preprocessing**
– **Tokenizace**: ArkTweetNLP
– **Part-of-speech tagging**: PDT
– **Stemming**: no (Sn) / light (Sl) / HPS (Sh)
– **Stopwords removal**
– **Phonetic**: eSpeak (Pe)
**Punctuation-based features**
– **Number of words**
– **Exclamation marks**
– **Question marks**
– **Quotation marks**
– **Capitalized words**
**Pointedness**
– **Explicit marks reflecting sharpness**
**Annotation**
– **Original data**: 35 annotators
– **Normalized data**: 10 annotators
– **Cohen’s κ**: 0.412
**Czech Dataset Annotation**
– **Original data**: 19 annotators
– **Normalized data**: 10 annotators
– **Cohen’s κ**: 0.404
**Preprocessing pipes for Czech**
– **Tokenizing**: ArkTweetNLP
– **POS tagging**: PDT
– **Stemming**: no (Sn) / light (Sl) / HPS (Sh)
– **Stopwords removal**
– **Phonetic**: eSpeak (Pe)
**Punctuation-based features**
– **Number of words**
– **Exclamation marks**
– **Question marks**
– **Quotation marks**
– **Capitalized words**
**Pointedness**
– **Explicit marks reflecting sharpness**
**Annotation**
– **Original data**: 25 annotators
– **Normalized data**: 4 annotators
– **Cohen’s κ**: 0.715
**Preprocessing pipes for Czech**
– **Tokenizing**: ArkTweetNLP
– **POS tagging**: PDT
– **Stemming**: no (Sn) / light (Sl) / HPS (Sh)
– **Stopwords removal**
– **Phonetic**: eSpeak (Pe)
**Punctuation-based features**
–